CN103971696A - 语音处理方法、装置及终端设备 - Google Patents
语音处理方法、装置及终端设备 Download PDFInfo
- Publication number
- CN103971696A CN103971696A CN201310036167.9A CN201310036167A CN103971696A CN 103971696 A CN103971696 A CN 103971696A CN 201310036167 A CN201310036167 A CN 201310036167A CN 103971696 A CN103971696 A CN 103971696A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- primary speech
- speech signal
- signal
- described primary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种语音处理方法、装置及终端设备,属于通讯技术领域。所述方法包括:获取原始语音信号;对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。采用本发明实施例的技术方案,通过在语音处理过程中结合声纹识别技术,提高了针对性人群的语音清晰度,实现了对特定人员的语音进行加强的目的,完善并提高语音通话降噪的水平。
Description
技术领域
本发明涉及通讯技术领域,特别涉及一种语音处理方法、装置及终端设备。
背景技术
随着通讯技术的发展,对通话过程中手机所获取的语音的处理一般包括降噪处理、增益处理等。目前,多数手机支持双麦克风(MIC)降噪或者单MIC的降噪技术和语音增益技术,只要是在降噪范围以外的部分声音都会被削减,不能针对某些特定人员进行语音加强。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种语音处理方法、装置及终端设备。所述技术方案如下:
第一方面,本发明实施例提供了一种语音处理方法,所述方法包括:
获取原始语音信号;
对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
结合第一方面,在本发明实施例的第一种可能实现方式中,根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号之前,所述方法还包括:
获取预设人员的语音信号;
对所述预设人员语音信号进行声纹分析处理,获取所述预设人员语音信号的声纹信息。
结合第一种可能实现方式,在本发明实施例的第二种可能实现方式中,根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号之后,所述方法还包括:
当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,根据所述预设人员语音信号的声纹信息,对所述原始语音信号进行声纹滤波,获取仅包含所述预设人员语音信号的第二语音信号。
结合第一种可能实现方式,在本发明实施例的第三种可能实现方式中,根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号之后,所述方法还包括:
当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,对所述原始语音信号进行语音增益处理,获得第三语音信号。
结合第一种可能实现方式,在本发明实施例的第四种可能实现方式中,根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号,包括:
根据所述原始语音信号的声纹信息和预设人员语音信号的声纹信息进行比较,当所述原始语音信号的声纹信息包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中包括预设人员语音信号;当所述原始语音信号的声纹信息不包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中不包括预设人员语音信号。
第二方面,本发明实施例提供了一种语音处理装置,所述装置包括:
语音获取模块,用于获取原始语音信号;
声纹分析模块,用于对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
判断模块,用于根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
第一语音信号获取模块,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
结合第二方面,在本发明实施例的第一种可能实现方式中,所述装置还包括:
预设人员语音信号获取模块,用于获取预设人员语音信号;
预设人员语音信号分析模块,用于对所述预设人员语音信号进行声纹分析处理,获取所述预设人员语音信号的声纹信息。
结合第一种可能实现方式,在本发明实施例的第二种可能实现方式中,所述装置还包括:
声纹滤波模块,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,根据所述预设人员语音信号的声纹信息,对所述原始语音信号进行声纹滤波,获取仅包含所述预设人员语音信号的第二语音信号。
结合第一种可能实现方式,在本发明实施例的第三种可能实现方式中,所述装置还包括:
语音增益模块,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,对所述原始语音信号进行语音增益处理,获得第三语音信号。
结合第一种可能实现方式,在本发明实施例的第四种可能实现方式中,所述声纹识别模块用于根据所述原始语音信号的声纹信息和预设人员语音信号的声纹信息进行比较,当所述原始语音信号的声纹信息包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中包括预设人员语音信号;当所述原始语音信号的声纹信息不包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中不包括预设人员语音信号。
第三方面,本发明实施例提供了一种终端设备,所述终端设备包括:
接收器,用于获取原始语音信号;
处理器,用于对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
所述处理器还用于根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
所述处理器还用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
本发明实施例提供的一种语音处理方法、装置及终端设备,通过获取原始语音信号;对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。采用本发明实施例的技术方案,通过在语音处理过程中结合声纹识别技术,提高了针对性人群的语音清晰度,实现了对特定人员的语音进行加强的目的,完善并提高语音通话降噪的水平。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种语音处理方法的流程图;
图2是本发明实施例提供的一种语音处理方法的流程图;
图3是本发明实施例提供的一种语音处理装置的结构示意图;
图4是本发明实施例提供的一种终端设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例中,终端设备指向用户提供语音和/或数据连通性的设备,包括无线终端或有线终端。无线终端可以是具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备,经无线接入网与一个或多个核心网进行通信的移动终端。例如,无线终端可以是移动电话(或称为“蜂窝”电话)和具有移动终端的计算机。又如,无线终端也可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置。
图1是本发明实施例提供的一种语音处理方法的流程图。该实施例的执行主体为终端设备,参见图1,该实施例具体包括:
101、获取原始语音信号;
其中,该原始语音信号是指终端设备的麦克风接收到的语音信号,该语音信号尚未经过降噪、增益等处理。
在另一发明实施例中,该原始语音信号还可以是该终端设备的通信对端通过语音通道发送,经过语音通道传输,而由终端设备的射频单元接收到的语音信号。
102、对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
103、根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
上述步骤102和103可以整体被看做是对原始语音信号进行声纹识别,以便确定该原始语音信号中是否包括预设人员的语音信号的过程。根据语音信号进行声纹分析以获取声纹信息,并根据声纹信息进行声纹识别是现有技术中公知的技术,主要通过特征提取技术、模式匹配准则及模型训练技术等实现,在此不再赘述。
104、当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
环境噪音信号可以是原始语音信号中预设人员以外人员的信号,该环境噪音信号中还可以包含其他音源的信号,如人员对话中的背景音等,在本发明实施例中不对环境噪音信号的具体构成进行限定。
本发明实施例提供的方法,通过在语音处理过程中结合声纹识别技术,排除了环境噪音信号对预设人员语音信号的干扰,实现了对特定人员的语音进行加强的目的,完善并提高语音通话降噪的水平。
图2是本发明实施例提供的一种语音处理方法的流程图。该实施例的执行主体为终端设备,参见图2,该实施例具体包括:
201、终端设备获取预设人员语音信号;
终端设备用户可以录制一段预设人员语音信号,保存在终端设备上;或,终端设备用户可以从已经存储在终端设备上的语音信号中,获取预设人员语音信号。
本领域技术人员可以获知,优选地,该语音信号需具有一定的长度和声音元素,以便根据该语音信号获取该语音信号的声纹信息。
202、终端设备对所述预设人员语音信号进行声纹分析处理,获取所述预设人员语音信号的声纹信息;
声纹信息是携带言语信息的声波频谱,声纹信息不仅具有特定性,而且有相对稳定性的特点,因此,通过对预设人员语音信号进行声纹分析得到的声纹信息可以用于唯一确定某个特定人员,也正是因为如此,可以通过声纹信息的比较,可以确定语音信号中特定人员的语音信号,从而有针对性的对特定人员的语音信号进行处理。
需要说明的是,在获取预设人员语音信号时,还可以对包含该预设人员语音信号的处理方式进行设置,而当获取到的原始语音信号包括与所述预设人员语音信号相符的语音信号时,按照该设置的处理方式对原始语音信号进行处理。
优选地,处理方式可以包括但不限于:对原始语音信号中预设人员语音信号以外的语音信号进行降噪,得到第一语音信号;对得到的第一语音信号进行声纹滤波,得到第二语音信号;对第二语音信号中的预设人员语音信号进行语音增强等。该降噪、声纹滤波和语音增强可以通过对处理参数的调整实现。
203、终端设备获取原始语音信号;
该原始语音信号可以是终端设备在通话过程中麦克风接收到的语音信号,还可以是通信对端设备用户发来的语音信号。
优选地,该原始语音信号是终端设备通过麦克风接收到语音信号,该原始语音信号经过处理,将通过射频单元发送至通信对端设备。
204、终端设备对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
具体地,对获取到的原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息,可以确定该原始语音信号中是否包括预设人员语音信号,从而确定是否对该原始语音信号进行后续的声纹滤波处理。
205、终端设备根据所述原始语音信号的声纹信息和预设人员语音信号的声纹信息进行比较;
当所述原始语音信号的声纹信息包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中包括预设人员语音信号;当所述原始语音信号的声纹信息不包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中不包括预设人员语音信号;
本领域技术人员可以获知,根据不同语音信号的声纹信息进行比较,以获知语音信号是否包含同一人的语音为现有技术所公开,在此不做赘述。
进一步地,当所述获取到的语音包括与所述预设语音的声纹相符的第一语音时,还可以根据语音中的词语和语气等分析预测语音长度,以确定对后续语音的处理方式,如果通过预测获知该语音的持续时长,则可在该持续时长内不对获取到的语音进行任何处理,或是关闭该调整参数的功能,或是调整默认参数,以降低对语音处理的力度,减少了语音处理阶段的耗电量。
206、当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,终端设备对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号;
具体地,当确定所述原始语音信号中包括预设人员语音信号时,可以有针对性的对原始语音信号中该预设人员语音信号以外的信号进行降噪处理,由于降噪处理可能会导致语音信号的衰减,因此,仅对预设人员语音信号以外的信号进行降噪处理,可以最大程度的保证预设人员语音信号不受影响,保持原始度。降噪处理后的第一语音信号还需进行增益处理和调制解调等处理,该增益处理和调制解调等处理均为现有的语音处理方法,在本发明实施例中不对此进行限定。
如,该原始语音信号中至少包含人员A、B和C的语音信号,而由于移动终端预存了人员A的语音信号,则根据声纹比较可以获知,需要突出A的语音信号,则对A以外的语音信号进行降噪处理。
需要说明的是,该降噪处理还可以是针对原始语音信号整体的,对原始语音信号中的预设人员语音信号,应用第一降噪参数进行降噪处理,而对原始语音信号中预设人员语音信号以外的语音信号,应用第二降噪参数进行降噪处理。其中,第一降噪参数小于第二降噪参数。该第一和第二降噪参数均可以由技术人员在开发时设置,也可以由用户根据自身需求进行设置。
207、终端设备根据所述预设人员语音信号的声纹信息,对所述第一语音信号进行声纹滤波,获取仅包含所述预设人员语音信号的第二语音信号;
具体地,当确定所述原始语音信号中包括预设人员语音信号时,可以有针对性的滤除掉降噪后的第一语音信号中该预设人员语音信号以外的信号,以最大程度的避免环境噪音信号对预设人员语音信号的干扰,因此,根据预设人员语音信号的声纹信息对第一语音信号进行声纹滤波,可以最大程度的保证预设人员语音信号不受影响,而在最大程度滤除掉环境噪音信号。
如,该第一语音信号中至少包含人员A、B和C降噪后的语音信号,而由于移动终端预存了人员A的语音信号,则根据声纹滤波可以滤除大部分B、C以及其他环境噪音信号,以达到突出A的语音信号的目的。
208、终端设备对所述第二语音信号进行语音增强处理,获得第三语音信号。
具体地,当确定所述原始语音信号中包括预设人员语音信号时,可以有针对性的对原始语音信号中该预设人员语音信号进行语音增强处理,由于语音增强处理可以进一步提高预设人员语音信号的质量,因此,仅对预设人员语音信号以外的信号进行语音增强处理,可以最大程度的提高预设人员语音信号的清晰度。
如,该第三语音信号中至少包含人员A的语音信号以及一些环境噪音信号,为了突出A的语音信号,对A的语音信号进行语音增强处理。
需要说明的是,该语音增强处理还可以是针对原始语音信号整体的,对原始语音信号中的预设人员语音信号,应用第一增益参数进行语音增强处理,而对原始语音信号中预设人员语音信号以外的语音信号,应用第二增益参数进行语音增强处理。其中,第一增益参数大于第二增益参数。
通过提高对预设人员语音信号进行语音增强所应用的放大增益参数,达到了有针对性的提高预设人员的语音清晰度的目的,实现了对特定人员的语音进行加强的目的。
该步骤208之后还可以包括:输出该第三语音信号。当该方法应用于通话过程的发送端时,可以是将第三语音信号通过语音通道传输给通信对端,而当该方法应用于通话过程的接收端时,可以是将第三语音信号通过扬声器输出。
另外,在本发明实施例中,仅是以根据原始语音信号经过降噪处理,得到第一语音信号,再根据第一语音信号进行声纹滤波,得到第二语音信号,又根据第二语音信号进行语音增强处理,得到第三语音信号为例进行说明的。而在本发明实施例还可以采用以下任一方式进行:(1)对原始语音信号进行降噪处理、声纹滤波或语音增强中的任一项,以得到处理后的语音信号;(2)对原始语音信号进行降噪处理、声纹滤波或语音增强中的任两项,以得到处理后的语音信号,且该两项处理为顺序处理,其具体前后顺序不限。(3)对原始语音信号进行降噪处理、声纹滤波以及语音增强,则该处理顺序的前后顺序不限。
本发明实施例提供的技术方案,可应用于通话过程的发送端,通过对本端麦克风所获取到的原始语音信号的声纹识别,获知本端麦克风获取到的原始语音信号包含与所述预设人员语音信号的声纹信息相符的语音信号,则对预设人员语音信号进行声纹滤波、语音增强等强化处理,使得通话过程的通信对端接收到的语音中的预设人员的语音清晰度突出,辨识度高。
而本发明实施例提供的技术方案,还可应用于通话过程的接收端,通过对接收到的对端的原始语音信号的声纹识别,获知接收到的原始语音信号包含与所述预设人员语音信号的声纹信息相符的语音信号,则对预设人员语音信号进行声纹滤波、语音增强等强化处理,使得通话过程本端接收到的语音中的预设人员的语音清晰度突出,辨识度高。
进一步地,当所述获取到的原始语音信号不包括与所述预设人员语音信号的声纹信息相符的语音信号时,可以关闭语音降噪处理、声纹滤波以及语音增强等功能,不对所述获取到的原始语音信号进行有区别的降噪处理、声纹滤波以及语音增强等区别处理,而降低了终端设备的耗电量。
采用本发明实施例的技术方案,通过在语音处理过程中结合声纹识别技术,提高了针对性人群的语音清晰度,实现了对特定人员的语音进行加强的目的,完善并提高语音通话降噪的水平。
图3是本发明实施例提供的一种语音处理装置的结构示意图。参见图3,所述装置包括:
语音获取模块301,用于获取原始语音信号;
声纹分析模块302,用于对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
判断模块303,用于根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
第一语音信号获取模块304,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
可选地,所述装置还包括:
预设人员语音信号获取模块,用于获取预设人员语音信号;
预设人员语音信号分析模块,用于对所述预设人员语音信号进行进行声纹分析处理,获取所述预设人员语音信号的声纹信息。
可选地,所述装置还包括:
声纹滤波模块,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,根据所述预设人员语音信号的声纹信息,对所述原始语音信号进行声纹滤波,获取仅包含所述预设人员语音信号的第二语音信号。
可选地,所述装置还包括:
语音增益模块,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,对所述原始语音信号进行语音增益处理,获得第三语音信号。
可选地,所述声纹识别模块用于根据所述原始语音信号的声纹信息和预设人员语音信号的声纹信息进行比较,当所述原始语音信号的声纹信息包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中包括预设人员语音信号;当所述原始语音信号的声纹信息不包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中不包括预设人员语音信号。
需要说明的是:上述实施例提供的语音处理装置在语音处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的语音处理装置与语音处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
图4是本发明实施例提供的一种终端设备的结构示意图。参见图4,所述终端设备包括:
接收器401,用于获取原始语音信号;
处理器402,用于对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
所述处理器402还用于根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
所述处理器402还用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
可选地,所述接收器401还用于获取预设人员语音信号;
所述处理器402还用于对所述预设人员语音信号进行声纹分析处理,获取所述预设人员语音信号的声纹信息。
可选地,所述处理器402还用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,根据所述预设人员语音信号的声纹信息,对所述原始语音信号进行声纹滤波,获取仅包含所述预设人员语音信号的第二语音信号。
可选地,所述处理器402还用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,对所述原始语音信号进行语音增益处理,获得第三语音信号。
可选地,所述处理器402还用于根据所述原始语音信号的声纹信息和预设人员语音信号的声纹信息进行比较,当所述原始语音信号的声纹信息包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中包括预设人员语音信号;当所述原始语音信号的声纹信息不包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中不包括预设人员语音信号。
具体地,该语音处理设备还包括:射频电路、音频电路和电源电路,
所述射频电路,用于建立手机与无线网络的通信,实现手机与无线网络的数据接收和发送;
所述音频电路,用于采集声音并将采集的声音转化为声音数据,以便所述手机通过所述射频电路向无线网络发送所述声音数据,和/或将所述手机通过所述射频电路从无线网络接收的声音数据,还原为声音并向用户播放该声音;
所述电源电路,用于为所述手机的各个电路或器件供电,保证手机的正常工作。
上述终端设备可以为手机、人机交互终端、电子书或其他具有语音识别功能的终端设备。在终端设备为手机的情下,该手机还包括:外壳,电路板、麦克风、和扬声器以便完成手机的基本功能,下面对外壳,电路板、麦克风、和扬声器分别进行介绍:
所述电路板安置在所述外壳内部。
所述麦克风,用于采集声音并将采集的声音转化为声音数据,以便所述手机通过所述射频电路向无线网络发送所述声音数据;
所述扬声器,用于将所述手机通过所述射频电路从无线网络接收的声音数据,还原为声音并向用户播放该声音。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种语音处理方法,其特征在于,所述方法包括:
获取原始语音信号;
对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
2.根据权利要求1所述的方法,其特征在于,根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号之前,所述方法还包括:
获取预设人员的语音信号;
对所述预设人员语音信号进行声纹分析处理,获取所述预设人员语音信号的声纹信息。
3.根据权利要求2所述的方法,其特征在于,根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号之后,所述方法还包括:
当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,根据所述预设人员语音信号的声纹信息,对所述原始语音信号进行声纹滤波,获取仅包含所述预设人员语音信号的第二语音信号。
4.根据权利要求2所述的方法,其特征在于,根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号之后,所述方法还包括:
当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,对所述原始语音信号进行语音增益处理,获得第三语音信号。
5.根据权利要求2所述的方法,其特征在于,根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号,包括:
根据所述原始语音信号的声纹信息和预设人员语音信号的声纹信息进行比较,当所述原始语音信号的声纹信息包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中包括预设人员语音信号;当所述原始语音信号的声纹信息不包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中不包括预设人员语音信号。
6.一种语音处理装置,其特征在于,所述装置包括:
语音获取模块,用于获取原始语音信号;
声纹分析模块,用于对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
判断模块,用于根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
第一语音信号获取模块,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
预设人员语音信号获取模块,用于获取预设人员语音信号;
预设人员语音信号分析模块,用于对所述预设人员语音信号进行声纹分析处理,获取所述预设人员语音信号的声纹信息。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
声纹滤波模块,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,根据所述预设人员语音信号的声纹信息,对所述原始语音信号进行声纹滤波,获取仅包含所述预设人员语音信号的第二语音信号。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
语音增益模块,用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员的语音信号时,对所述原始语音信号进行语音增益处理,获得第三语音信号。
10.根据权利要求7所述的装置,其特征在于,所述声纹识别模块用于根据所述原始语音信号的声纹信息和预设人员语音信号的声纹信息进行比较,当所述原始语音信号的声纹信息包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中包括预设人员语音信号;当所述原始语音信号的声纹信息不包括所述预设人员语音信号的声纹信息时,则确定所述原始语音信号中不包括预设人员语音信号。
11.一种终端设备,其特征在于,所述终端设备包括:
接收器,用于获取原始语音信号;
处理器,用于对所述原始语音信号进行声纹分析处理,获取所述原始语音信号的声纹信息;
所述处理器还用于根据所述原始语音信号的声纹信息,判断所述原始语音信号是否包括预设人员的语音信号;
所述处理器还用于当根据所述原始语音信号的声纹信息确定所述原始语音信号中包括预设人员语音信号时,对所述原始语音信号中所述预设人员语音信号以外的环境噪音信号进行降噪处理,获取第一语音信号。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310036167.9A CN103971696A (zh) | 2013-01-30 | 2013-01-30 | 语音处理方法、装置及终端设备 |
PCT/CN2014/071621 WO2014117722A1 (zh) | 2013-01-30 | 2014-01-28 | 语音处理方法、装置及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310036167.9A CN103971696A (zh) | 2013-01-30 | 2013-01-30 | 语音处理方法、装置及终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103971696A true CN103971696A (zh) | 2014-08-06 |
Family
ID=51241112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310036167.9A Withdrawn CN103971696A (zh) | 2013-01-30 | 2013-01-30 | 语音处理方法、装置及终端设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103971696A (zh) |
WO (1) | WO2014117722A1 (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104811559A (zh) * | 2015-05-05 | 2015-07-29 | 上海青橙实业有限公司 | 降噪方法、通信方法及移动终端 |
CN105374364A (zh) * | 2014-08-25 | 2016-03-02 | 联想(北京)有限公司 | 信号处理方法及电子设备 |
CN105448301A (zh) * | 2015-11-30 | 2016-03-30 | 惠州Tcl移动通信有限公司 | 一种基于声纹识别的音频处理方法及系统 |
CN105719659A (zh) * | 2016-02-03 | 2016-06-29 | 努比亚技术有限公司 | 基于声纹识别的录音文件分离方法及装置 |
CN105979084A (zh) * | 2016-04-29 | 2016-09-28 | 维沃移动通信有限公司 | 一种语音通话处理方法及通信终端 |
WO2017031846A1 (zh) * | 2015-08-25 | 2017-03-02 | 百度在线网络技术(北京)有限公司 | 噪声消除、语音识别方法、装置、设备及非易失性计算机存储介质 |
CN106816155A (zh) * | 2016-12-23 | 2017-06-09 | 维沃移动通信有限公司 | 一种提升语音传输信噪比的方法及装置 |
CN106920559A (zh) * | 2017-03-02 | 2017-07-04 | 奇酷互联网络科技(深圳)有限公司 | 通话音的优化方法、装置及通话终端 |
CN107172256A (zh) * | 2017-07-27 | 2017-09-15 | 广东欧珀移动通信有限公司 | 耳机通话自适应调整方法、装置、移动终端及存储介质 |
CN107979790A (zh) * | 2017-11-28 | 2018-05-01 | 上海与德科技有限公司 | 一种通话降噪方法、装置、设备及介质 |
CN108520751A (zh) * | 2018-03-30 | 2018-09-11 | 四川斐讯信息技术有限公司 | 一种语音智能识别设备及语音智能识别方法 |
CN109065066A (zh) * | 2018-09-29 | 2018-12-21 | 广东小天才科技有限公司 | 一种通话控制方法、装置及设备 |
CN109087661A (zh) * | 2018-10-23 | 2018-12-25 | 南昌努比亚技术有限公司 | 语音处理方法、装置、系统及可读存储介质 |
CN109272996A (zh) * | 2018-11-09 | 2019-01-25 | 广州长嘉电子有限公司 | 一种降噪方法及系统 |
CN110265038A (zh) * | 2019-06-28 | 2019-09-20 | 联想(北京)有限公司 | 一种处理方法及电子设备 |
CN112188019A (zh) * | 2020-09-30 | 2021-01-05 | 联想(北京)有限公司 | 一种处理方法及电子设备 |
CN113724692A (zh) * | 2021-10-08 | 2021-11-30 | 广东电力信息科技有限公司 | 一种基于声纹特征的电话场景音频获取与抗干扰处理方法 |
WO2022253003A1 (zh) * | 2021-05-31 | 2022-12-08 | 华为技术有限公司 | 语音增强方法及相关设备 |
CN115482830A (zh) * | 2021-05-31 | 2022-12-16 | 华为技术有限公司 | 语音增强方法及相关设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108597500A (zh) * | 2018-03-30 | 2018-09-28 | 四川斐讯信息技术有限公司 | 一种智能穿戴设备及基于智能穿戴设备的语音识别方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3512398B2 (ja) * | 2001-09-25 | 2004-03-29 | 独立行政法人電子航法研究所 | 音声処理装置 |
KR100930039B1 (ko) * | 2007-12-18 | 2009-12-07 | 한국전자통신연구원 | 음성 인식기의 성능 평가 장치 및 그 방법 |
CN101472017A (zh) * | 2007-12-27 | 2009-07-01 | 华为技术有限公司 | 实现会议电话通话的方法及网元设备 |
CN102694891A (zh) * | 2011-03-21 | 2012-09-26 | 鸿富锦精密工业(深圳)有限公司 | 通话噪音去除系统及方法 |
CN102270451B (zh) * | 2011-08-18 | 2013-05-29 | 安徽科大讯飞信息科技股份有限公司 | 说话人识别方法及系统 |
-
2013
- 2013-01-30 CN CN201310036167.9A patent/CN103971696A/zh not_active Withdrawn
-
2014
- 2014-01-28 WO PCT/CN2014/071621 patent/WO2014117722A1/zh active Application Filing
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105374364A (zh) * | 2014-08-25 | 2016-03-02 | 联想(北京)有限公司 | 信号处理方法及电子设备 |
CN105374364B (zh) * | 2014-08-25 | 2019-08-27 | 联想(北京)有限公司 | 信号处理方法及电子设备 |
CN104811559B (zh) * | 2015-05-05 | 2018-11-20 | 上海青橙实业有限公司 | 降噪方法、通信方法及移动终端 |
CN104811559A (zh) * | 2015-05-05 | 2015-07-29 | 上海青橙实业有限公司 | 降噪方法、通信方法及移动终端 |
WO2017031846A1 (zh) * | 2015-08-25 | 2017-03-02 | 百度在线网络技术(北京)有限公司 | 噪声消除、语音识别方法、装置、设备及非易失性计算机存储介质 |
CN106486130A (zh) * | 2015-08-25 | 2017-03-08 | 百度在线网络技术(北京)有限公司 | 噪声消除、语音识别方法及装置 |
CN106486130B (zh) * | 2015-08-25 | 2020-03-31 | 百度在线网络技术(北京)有限公司 | 噪声消除、语音识别方法及装置 |
CN105448301A (zh) * | 2015-11-30 | 2016-03-30 | 惠州Tcl移动通信有限公司 | 一种基于声纹识别的音频处理方法及系统 |
CN105719659A (zh) * | 2016-02-03 | 2016-06-29 | 努比亚技术有限公司 | 基于声纹识别的录音文件分离方法及装置 |
CN105979084A (zh) * | 2016-04-29 | 2016-09-28 | 维沃移动通信有限公司 | 一种语音通话处理方法及通信终端 |
CN106816155A (zh) * | 2016-12-23 | 2017-06-09 | 维沃移动通信有限公司 | 一种提升语音传输信噪比的方法及装置 |
CN106816155B (zh) * | 2016-12-23 | 2020-04-24 | 维沃移动通信有限公司 | 一种提升语音传输信噪比的方法及装置 |
CN106920559B (zh) * | 2017-03-02 | 2020-10-30 | 奇酷互联网络科技(深圳)有限公司 | 通话音的优化方法、装置及通话终端 |
CN106920559A (zh) * | 2017-03-02 | 2017-07-04 | 奇酷互联网络科技(深圳)有限公司 | 通话音的优化方法、装置及通话终端 |
CN107172256A (zh) * | 2017-07-27 | 2017-09-15 | 广东欧珀移动通信有限公司 | 耳机通话自适应调整方法、装置、移动终端及存储介质 |
CN107979790A (zh) * | 2017-11-28 | 2018-05-01 | 上海与德科技有限公司 | 一种通话降噪方法、装置、设备及介质 |
CN108520751A (zh) * | 2018-03-30 | 2018-09-11 | 四川斐讯信息技术有限公司 | 一种语音智能识别设备及语音智能识别方法 |
CN109065066A (zh) * | 2018-09-29 | 2018-12-21 | 广东小天才科技有限公司 | 一种通话控制方法、装置及设备 |
CN109065066B (zh) * | 2018-09-29 | 2020-03-31 | 广东小天才科技有限公司 | 一种通话控制方法、装置及设备 |
CN109087661A (zh) * | 2018-10-23 | 2018-12-25 | 南昌努比亚技术有限公司 | 语音处理方法、装置、系统及可读存储介质 |
CN109272996B (zh) * | 2018-11-09 | 2021-11-30 | 广州长嘉电子有限公司 | 一种降噪方法及系统 |
CN109272996A (zh) * | 2018-11-09 | 2019-01-25 | 广州长嘉电子有限公司 | 一种降噪方法及系统 |
CN110265038A (zh) * | 2019-06-28 | 2019-09-20 | 联想(北京)有限公司 | 一种处理方法及电子设备 |
CN112188019B (zh) * | 2020-09-30 | 2021-10-22 | 联想(北京)有限公司 | 一种处理方法及电子设备 |
CN112188019A (zh) * | 2020-09-30 | 2021-01-05 | 联想(北京)有限公司 | 一种处理方法及电子设备 |
WO2022253003A1 (zh) * | 2021-05-31 | 2022-12-08 | 华为技术有限公司 | 语音增强方法及相关设备 |
CN115482830A (zh) * | 2021-05-31 | 2022-12-16 | 华为技术有限公司 | 语音增强方法及相关设备 |
CN113724692A (zh) * | 2021-10-08 | 2021-11-30 | 广东电力信息科技有限公司 | 一种基于声纹特征的电话场景音频获取与抗干扰处理方法 |
CN113724692B (zh) * | 2021-10-08 | 2023-07-14 | 广东电力信息科技有限公司 | 一种基于声纹特征的电话场景音频获取与抗干扰处理方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2014117722A1 (zh) | 2014-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103971696A (zh) | 语音处理方法、装置及终端设备 | |
CN103650533B (zh) | 在电子装置上产生掩蔽信号 | |
CN108597505B (zh) | 语音识别方法、装置及终端设备 | |
CN101668085B (zh) | 一种调节移动终端语音输出的方法及移动终端 | |
CN110049270A (zh) | 多人会议语音转写方法、装置、系统、设备及存储介质 | |
CN107172256B (zh) | 耳机通话自适应调整方法、装置、移动终端及存储介质 | |
CN106486130A (zh) | 噪声消除、语音识别方法及装置 | |
CN108198569A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
CN104980337A (zh) | 一种音频处理的性能提升方法及装置 | |
CN103236263A (zh) | 一种改善通话质量的方法、系统及移动终端 | |
CN107978320A (zh) | 一种通话调整方法、装置、设备及介质 | |
CN110505332A (zh) | 一种降噪方法、装置、移动终端及存储介质 | |
CN107682786A (zh) | 一种麦克风设备抗干扰方法及麦克风设备 | |
CN108494952B (zh) | 语音通话处理方法及相关设备 | |
CN107979790A (zh) | 一种通话降噪方法、装置、设备及介质 | |
CN107301030A (zh) | 一种音量控制方法、装置以及一种终端 | |
CN207603881U (zh) | 一种智能语音无线音箱 | |
CN114187922A (zh) | 一种音频检测方法、装置及终端设备 | |
CN107172313A (zh) | 提高免提通话质量的方法、装置、移动终端及存储介质 | |
CN110191397B (zh) | 一种降噪方法及蓝牙耳机 | |
CN115424629A (zh) | 一种基于车载娱乐系统的车辆内外通话方法、系统和车辆 | |
CN110232909A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
CN103514876A (zh) | 噪音消除方法和装置、以及移动终端 | |
CN106598536A (zh) | 电子设备的录音启动方法、装置及电子设备 | |
CN204117590U (zh) | 语音采集降噪装置以及语音质量评价系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C04 | Withdrawal of patent application after publication (patent law 2001) | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20140806 |