CN106816155A - 一种提升语音传输信噪比的方法及装置 - Google Patents

一种提升语音传输信噪比的方法及装置 Download PDF

Info

Publication number
CN106816155A
CN106816155A CN201611208721.7A CN201611208721A CN106816155A CN 106816155 A CN106816155 A CN 106816155A CN 201611208721 A CN201611208721 A CN 201611208721A CN 106816155 A CN106816155 A CN 106816155A
Authority
CN
China
Prior art keywords
voice signal
frequency range
signal
set user
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611208721.7A
Other languages
English (en)
Other versions
CN106816155B (zh
Inventor
刘彦彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201611208721.7A priority Critical patent/CN106816155B/zh
Publication of CN106816155A publication Critical patent/CN106816155A/zh
Application granted granted Critical
Publication of CN106816155B publication Critical patent/CN106816155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

本发明提供了一种提升语音传输信噪比的方法和装置。所述方法包括:获取第一语音信号;判断所述第一语音信号是否为预设用户的语音信号;若判断结果为是,获取预设用户的频率范围;根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。通过本发明提高了语音信号传输的信噪比,进而提高了语音质量。

Description

一种提升语音传输信噪比的方法及装置
技术领域
本发明涉及信号传输领域,特别是涉及一种提升语音传输信噪比的方法及装置。
背景技术
随着通信技术的发展,移动终端已被广泛使用,移动终端可为用户提供语音通话、视频通话等服务。在通话时,移动终端通常按照4K的语音范围,采用8K的采样率对音频信号进行处理,比如采样、编码或放大,处理完成后传输已处理的音频信号。实际上人声的音频信号的频率范围未达到4K,因此,在对音频信号进行处理时,在4K频率范围内、人声音频信号频率范围以外的声音或者是噪音也同样被采样、编码、放大、传输。
移动终端按照固定语音范围对语音信号进行处理并传输,无用信号占据了一定的比例,导致语音传输信噪比较低,接收端在接收到语音信号后转换成模拟信号的语音质量较差。
发明内容
本发明提供一种提升语音传输信噪比的方法,以解决现有技术中移动终端传输语音信号信噪比较低的问题。
依据本发明的一个方面,提供了一种提升语音传输信噪比的方法,应用于移动终端,所述方法包括:
获取第一语音信号;
判断所述第一语音信号是否为预设用户的语音信号;
若判断结果为是,获取预设用户的频率范围;
根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
根据本发明的另一方面,提供了一种提升语音传输信噪比的装置,部署在移动终端,所述装置包括:
语音信号获取模块,用于获取第一语音信号;
语音信号判断模块,用于判断所述第一语音信号是否为预设用户的语音信号;
频率范围获取模块,用于若判断结果为是,获取预设用户的频率范围;
语音信号输出模块,用于根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
依据本发明实施例,移动终端获取第一语音信号;判断第一语音信号是否为预设用户的语音信号;若判断结果为是,获取预设用户的频率范围;根据频率范围调整滤波参数,输出频率范围以外的频率被抑制的第二语音信号。由于本发明实施例采用的是根据实时语音信号频率范围而不是固定语音信号频率范围对语音信号进行处理,使得语音信号频率范围外的声音或者噪声被抑制,从而提高了语音信号传输的信噪比,进而提高了语音质量。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例一的一种提升语音传输信噪比的方法的流程图;
图2是本发明实施例二的一种提升语音传输信噪比的方法的流程图;
图3是本发明实施例三的一种提升语音传输信噪比的装置的框图;
图4是本发明实施例四的一种提升语音传输信噪比的装置的框图;
图5是本发明实施例五的移动终端的框图;
图6是本发明实施例六的移动终端的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
详细介绍本发明实施例提供的一种提升语音传输信噪比的方法。
参照图1,示出了本发明实施例中的一种提升语音传输信噪比的方法的流程图,应用于移动终端,所述方法包括:
步骤101,获取第一语音信号。
本实施例中,语音信号可以分为上行语音信号和下行语音信号,上行语音信号为移动终端采集并传输的信号,下行语音信号为移动终端接收的对方传输的信号。例如,用户A通过移动终端X与用户B进行通话,对于移动终端X来说,移动终端X采集的用户A的语音信号为上行语音信号,接收的用户B的语音信号为下行语音信号。
在语音信号为上行信号时,移动终端可以通过麦克风等装置获取用户的语音信号;在语音信号为下行信号时,移动终端可以从接收对方语音的装置获取用户的语音信号。
步骤102,判断所述第一语音信号是否为预设用户的语音信号。
本实施例中,获取到第一语音信号后,判断第一语音信号是否为预设用户的语音信号。具体地,可以将第一语音信号与移动终端内预设用户的语音信号进行比对,如果第一语音信号的音频数据中有与预设用户的语音信号相匹配的部分,则第一语音信号是预设用户的语音信号,如果第一语音信号的音频数据中没有与预设用户的语音信号相匹配的部分,则第一语音信号不是预设用户的语音信号。判断第一语音信号是否为预设用户的语音信号还可以采用其他判断方式,本发明实施例对此不作详细限定,可以根据实际情况进行选取。
步骤103,若判断结果为是,获取预设用户的频率范围。
本实施例中,移动终端在存储预设用户的语音信号时,可以预先确定预设用户的频率范围,当获取到的第一语音信号是预设用户的语音信号时,从移动终端中获取预设用户的频率范围。预先确定预设用户的频率范围可以采用多种方式,本发明实施例中对于如何确定频率范围不做详细限定,可以根据实际情况进行设置。
步骤104,根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
本实施例中,移动终端在获取第一语音信号时,不仅获取到用户的语音信号,也获取到了其他声音或者噪声,根据预设用户的频率范围,调整滤波参数,抑制频率范围以外的音频信号,输出频率范围以外的频率被抑制的第二语音信号。由于频率范围以外的音频信号被抑制,无用信号占比较小,所以传输时用户的语音信号与无用信号之比较高,即传输语音信号的信噪比较高。
综上所述,本发明实施例移动终端获取第一语音信号;判断第一语音信号是否为预设用户的语音信号;若判断结果为是,获取预设用户的频率范围;根据频率范围调整滤波参数,输出频率范围以外的频率被抑制的第二语音信号。由于本发明实施例采用的是根据实时语音信号频率范围而不是固定语音信号频率范围对语音信号进行处理,使得语音信号频率范围外的声音或者噪声被抑制,从而提高了语音信号传输的信噪比,进而提高了语音质量。
实施例二
参照图2,示出了本发明另一个实施例中的一种提升语音传输信噪比的方法的流程图。
步骤201,获取第一语音信号。
步骤202,获取预设用户的语音信号。
本实施例中,移动终端可以通过麦克风等装置获取预设用户的语音信号,也可以采用其他方式获取预设用户的语音信号,本发明实施例对此不作详细限定。
步骤203,根据所述语音信号确定所述预设用户的频率范围。
本实施例中,获取到预设用户的语音信号后,根据获取到的语音信号确定所述预设用户的频率范围。确定频率范围的方式有多种,优选地,通过对获取的语音信号进行采样和数字信号处理,得到语音信号的频谱,从而确定语音信号的频率范围,具体步骤如下:
步骤2031,提取所述第一语音信号中设定时域内的语音信号片段。具体地,移动终端获取到语音信号后,根据预先设定的时域从语音信号中提取部分片段。例如,设定时域为10ms,则从语音信号中提取10ms的片段。本发明实施例对于设定时域的长短不作详细限定,可以根据实际情况进行设置。
步骤2032,将所述设定时域内的语音信号通过模数转换采样为时域离散信号。具体地,通过采样的方式,将设定时域内的语音信号从模拟信号转换为数字信号,该数字信号为时域离散信号。
步骤2033,对所述时域离散信号进行傅里叶变换,得到所述时域离散信号的幅度谱。具体地,通过快速傅里叶变换(Fast Fourier Transformation,FFT)将时域离散信号变换到频域,得到信号的频谱,从而可以得到时域离散信号的幅度谱。优选地,将采样后的时域离散信号存储至缓存中,对时域离散信号进行换算时再从缓存中提取时域离散信号。
步骤2034,对所述幅度谱进行积分,得到时域离散信号的能量谱。
步骤2035,在所述能量谱中将能量大于设定阈值的频率范围确定为预设用户的频率范围。具体地,预先设定能量的阈值,将能量大于设定阈值的信号所对应的频率范围确定为预设用户的频率范围。本发明实施例对能量的设定阈值不作详细限定,可以根据实际情况进行设置。
步骤204,保存所述预设用户的语音信号和频率范围。
本实施例中,确定预设用户的频率范围后,将预设用户的语音信号和确定的频率范围对应保存,在判断第一语音信号是否为预设用户的语音信号时,可以从移动终端中提取预设用户的语音信号,当第一语音信号是预设用户的语音信号时,可以对应提取预设用户的频率范围。
优选地,定期更新预设用户的频率范围。由于预设用户随着年龄增长,或者声带结构发生变化,预设用户的频率范围也会随之发生变化,因此可以定期更新预设用户的频率范围。例如,一个月更新一次,或者一年更新一次。本发明实施例对于更新的周期不作详细限定,可以根据实际情况进行设置。更新频率范围的方式可以由移动终端根据设定的更新周期自动更新,也可以通过用户手动更新,本发明实施例对此也不作详细限定,可以根据实际情况进行设置。
步骤205,判断所述第一语音信号是否为预设用户的语音信号。
本实施例中,判断语音信号是否为预设用户的语音信号的作用是,判断所获取的语音信号是否已在移动终端中存储,已在移动终端中存储的语音信号可以直接提取频率范围。
可以通过如下步骤进行判断:
步骤2051,获取当前用户的体征数据,其中,所述体征数据包括声纹数据、指纹数据、虹膜数据、面部特征数据中至少一种。具体地,移动终端可以通过指纹识别传感器或者摄像头、麦克风获取当前用户的体征数据。例如,获取当前用户的指纹数据、虹膜数据、声纹数据等等。
步骤2052,将当前用户的体征数据与预设用户的体征数据进行比对。具体地,将当前用户的体征数据与预设用户的体征数据一一进行比对。例如,将当前用户的指纹数据与预设用户A指纹数据和预设用户B的指纹数据进行比对。
步骤2053,若比对结果一致,则判定所述第一语音信号为预设用户的语音信号。具体地,如果当前用户的体征数据与预设用户中某一个用户的体征数据比对结果一致,则判定所述第一语音信号为预设用户的语音信号。例如,当前用户的指纹数据与预设用户A的指纹数据和预设用户B的指纹数据进行比对,当前用户的指纹数据与预设用户B的指纹数据比对结果一致,说明当前用户为预设用户B,第一语音信号为预设用户B的语音信号。
也可以通过使用同一呼叫号码的用户是否归属于预设用户的方式进行判断。具体地,收集并保存使用同一呼叫号码的用户的声纹数据,将获取的语音信号的声纹数据与使用该呼出号码的用户的声纹数据进行比对,从而判断获取的语音信号是否为预设用户的语音信号。例如,移动终端X中包括呼叫号码M和N,用户A和用户B经常通过呼叫号码M与用户C进行通话,而只有用户A通过呼叫号码N与用户D进行通话,当用户A和B都使用呼叫号码M进行通话时,可以判断出用户A和B的语音信号都是预设用户的语音信号;当用户A和B都使用呼叫号码N进行通话时,可以判断出用户A的语音信号是预设用户的语音信号,而用户B的语音信号不是预设用户的语音信号。
步骤206,若判断结果为否,执行根据所述语音信号确定所述预设用户的频率范围的步骤。
本实施例中,如果经判断第一语音信号不是预设用户的语音信号,则执行本实施例步骤203中根据语音信号确定频率范围的步骤。
步骤207,若判断结果为是,获取预设用户的频率范围。
本实施例中,如果经判断第一语音信号是预设用户的语音信号,根据步骤204从已存储的预设用户的语音信号中提取频率范围。
步骤208,根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
本实施例中,滤波参数用于设置抑制频率的范围,将第一语音信号中预设用户的频率范围以外的信号滤除或者抑制,输出第二语音信号时无用信号所占比例较小,有用信号即人的语音信号所占比例较大。
优选地,若调整滤波参数的时间大于设定时间,可以重新判断第一语音信号是否为预设用户的语音信号。具体地,移动终端预先设定调整滤波参数的时间,大于设定时间后,重新判断是否为预设用户的语音信号,进而重新确定语音信号的频率范围,重新调整滤波参数。例如,设定时间为1min,当用户A和用户B进行通话时,移动终端根据用户A的频率范围调整滤波参数,用户A在通话50s后换用户C与用户B进行通话,移动终端从根据用户A调整滤波参数开始计时,1min后重新判断语音信号,检测到语音信号已变换为用户C,则根据用户C的频率范围重新调整滤波参数。移动终端设定调整滤波参数的时间,可以保证在用户变化后,移动终端可以根据不同用户语音信号的不同实时调整滤波参数,从而保证了语音信号传输的高信噪比。本发明实施例对于设定时间的长短不作详细限定,可以根据实际情况进行设置。
综上所述,本发明实施例移动终端获取第一语音信号和预设用户的语音信号;根据预设用户的语音信号确定预设用户的频率范围,并保存预设用户的语音信号和频率范围;判断第一语音信号是否为预设用户的语音信号,是预设用户的语音信号,则从之前的存储中提取频率范围,不是预设用户的语音信号,则执行确定语音信号频率范围的步骤;根据确定的频率范围调整滤波参数,输出频率范围以外的频率被抑制的第二语音信号。由于本发明实施例采用的是根据实时语音信号频率范围而不是固定语音信号频率范围对语音信号进行处理,使得语音信号频率范围外的声音或者噪声被抑制,从而提高了语音信号传输的信噪比,进而提高了语音质量。
需要说明的是,对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明所必需的。
实施例三
详细介绍本发明实施例提供的一种提升语音传输信噪比的装置。
参照图3,示出了本发明实施例中的一种提升语音传输信噪比的装置的框图,部署在移动终端,其特征在于,所述装置包括语音信号获取模块301、语音信号判断模块302、频率范围获取模块303、语音信号输出模块304:
语音信号获取模块301,用于获取第一语音信号;
语音信号判断模块302,用于判断所述第一语音信号是否为预设用户的语音信号;
频率范围获取模块303,用于若判断结果为是,获取预设用户的频率范围;
语音信号输出模块304,用于根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
综上所述,本发明实施例移动终端获取第一语音信号;判断第一语音信号是否为预设用户的语音信号;若判断结果为是,获取预设用户的频率范围;根据频率范围调整滤波参数,输出频率范围以外的频率被抑制的第二语音信号。由于本发明实施例采用的是根据实时语音信号频率范围而不是固定语音信号频率范围对语音信号进行处理,使得语音信号频率范围外的声音或者噪声被抑制,从而提高了语音信号传输的信噪比,进而提高了语音质量。
实施例四
参照图4,示出了本发明实施例中的一种提升语音传输信噪比的装置的框图,部署在移动终端,所述装置包括语音信号获取模块301、语音信号判断模块302、频率范围获取模块303、语音信号输出模块304:
语音信号获取模块301,用于获取第一语音信号;
语音信号判断模块302,用于判断所述第一语音信号是否为预设用户的语音信号;
频率范围获取模块303,用于若判断结果为是,获取预设用户的频率范围;
语音信号输出模块304,用于根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
本发明实施例中,优选地,在所述语音信号判断模块302之前,所述装置还包括预设语音信号获取模块305、第一频率范围确定模块306、频率范围保存模块307:
预设语音信号获取模块305,用于获取预设用户的语音信号;
第一频率范围确定模块306,用于根据所述语音信号确定所述预设用户的频率范围;
频率范围保存模块307,用于保存所述预设用户的语音信号和频率范围。
本发明实施例中,优选地,所述第一频率范围确定模块306包括片段提取子模块3061、语音信号采样子模块3062、幅度谱计算子模块3063、能量谱计算子模块3064、频率范围确定子模块3065:
片段提取子模块3061,用于提取所述第一语音信号中设定时域内的语音信号片段;
语音信号采样子模块3062,用于将所述设定时域内的语音信号通过模数转换采样为时域离散信号;
幅度谱计算子模块3063,用于对所述时域离散信号进行傅里叶变换,得到所述时域离散信号的幅度谱;
能量谱计算子模块3064,用于对所述幅度谱进行积分,得到所述时域离散信号的能量谱;
频率范围确定子模块3065,用于在所述能量谱中将能量大于设定阈值的频率范围确定为预设用户的频率范围。
本发明实施例中,优选地,所述语音信号判断模块302之后,还包括第二频率范围确定模块308:
第二频率范围确定模块308,用于若判断结果为否,执行根据所述语音信号确定所述预设用户的频率范围的步骤。
本发明实施例中,优选地,所述语音信号判断模块302包括体征数据获取子模块3021、体征数据比对子模块3022、语音信号判定子模块3023:
体征数据获取子模块3021,用于获取当前用户的体征数据,其中,所述体征数据包括声纹数据、指纹数据、虹膜数据、面部特征数据中至少一种;
体征数据比对子模块3022,用于将当前用户的体征数据与预设用户的体征数据进行比对;
语音信号判定子模块3023,用于若比对结果一致,则判定所述第一语音信号为预设用户的语音信号。
综上所述,本发明实施例中移动终端获取第一语音信号和预设用户的语音信号;根据预设用户的语音信号确定预设用户的频率范围,并保存预设用户的语音信号和频率范围;判断第一语音信号是否为预设用户的语音信号,是预设用户的语音信号,则从之前的存储中提取频率范围,不是预设用户的语音信号,则执行确定语音信号频率范围的步骤;根据确定的频率范围调整滤波参数,输出频率范围以外的频率被抑制的第二语音信号。由于本发明实施例采用的是根据实时语音信号频率范围而不是固定语音信号频率范围对语音信号进行处理,使得语音信号频率范围外的声音或者噪声被抑制,从而提高了语音信号传输的信噪比,进而提高了语音质量。
实施例五
图5是本发明另一个实施例的移动终端的框图。图5所示的移动终端500包括:至少一个处理器501、存储器502、至少一个网络接口504和用户接口503。移动终端500中的各个组件通过总线系统505耦合在一起。可理解,总线系统505用于实现这些组件之间的连接通信。总线系统505除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统505。
其中,用户接口503可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者柔性屏等。
可以理解,本发明实施例中的存储器502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(ProgrammableROM,PROM)、可擦除可编程只读存储器(ErasablePROM,EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccessMemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(StaticRAM,SRAM)、动态随机存取存储器(DynamicRAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(SynchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambusRAM,DRRAM)。本发明实施例描述的系统和方法的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器502存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统5021和应用程序5022。
其中,操作系统5021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序5022,包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序5022中。
在本发明实施例中,通过调用存储器502存储的程序或指令,具体的,可以是应用程序5022中存储的程序或指令,处理器501获取第一语音信号;判断所述第一语音信号是否为预设用户的语音信号;若判断结果为是,获取预设用户的频率范围;根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
上述本发明实施例揭示的方法可以应用于处理器501中,或者由处理器501实现。处理器501可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecific IntegratedCircuit,ASIC)、现成可编程门阵列(FieldProgrammable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502,处理器501读取存储器502中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本发明实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecificIntegratedCircuits,ASIC)、数字信号处理器(DigitalSignalProcessing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(ProgrammableLogicDevice,PLD)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本发明实施例所述功能的模块(例如过程、函数等)来实现本发明实施例所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
可选地,处理器501还用于:获取预设用户的语音信号;根据所述语音信号确定所述预设用户的频率范围;保存所述预设用户的语音信号和频率范围。
可选地,处理器501还用于:提取所述第一语音信号中设定时域内的语音信号片段;将所述设定时域内的语音信号通过模数转换采样为时域离散信号;对所述时域离散信号进行傅里叶变换,得到所述时域离散信号的幅度谱;对所述幅度谱进行积分,得到所述时域离散信号的能量谱;在所述能量谱中将能量大于设定阈值的频率范围确定为预设用户的频率范围。
可选地,处理器501还用于:若判断结果为否,执行根据所述语音信号确定所述预设用户的频率范围的步骤。
可选地,处理器501还用于:获取当前用户的体征数据,其中,所述体征数据包括声纹数据、指纹数据、虹膜数据、面部特征数据;将当前用户的体征数据与预设用户的体征数据进行比对;若比对结果一致,则判定所述第一语音信号为预设用户的语音信号。
移动终端500能够实现前述实施例中移动终端实现的各个过程,为避免重复,这里不再赘述。本发明实施例中,移动终端500获取第一语音信号和预设用户的语音信号;根据预设用户的语音信号确定预设用户的频率范围,并保存预设用户的语音信号和频率范围;判断第一语音信号是否为预设用户的语音信号,是预设用户的语音信号,则从之前的存储中提取频率范围,不是预设用户的语音信号,则执行确定语音信号频率范围的步骤;根据确定的频率范围调整滤波参数,输出频率范围以外的频率被抑制的第二语音信号。由于本发明实施例采用的是根据实时语音信号频率范围而不是固定语音信号频率范围对语音信号进行处理,使得语音信号频率范围外的声音或者噪声被抑制,从而提高了语音信号传输的信噪比,进而提高了语音质量。
实施例六
图6是本发明另一个实施例的移动终端的结构示意图。具体地,图6中的移动终端600可以为手机、平板电脑、个人数字助理(PersonalDigital Assistant,PDA)、或车载电脑等。
图6中的移动终端600包括射频(RadioFrequency,RF)电路610、存储器620、输入单元630、显示单元640、处理器660、音频电路670、WiFi(WirelessFidelity)模块680和电源690。
其中,输入单元630可用于接收用户输入的数字或字符信息,以及产生与移动终端600的用户设置以及功能控制有关的信号输入。具体地,本发明实施例中,该输入单元630可以包括触控面板631。触控面板631,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板631上的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板631可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给该处理器660,并能接收处理器660发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板631。除了触控面板631,输入单元630还可以包括其他输入设备632,其他输入设备632可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
其中,显示单元640可用于显示由用户输入的信息或提供给用户的信息以及移动终端600的各种菜单界面。显示单元640可包括显示面板641,可选的,可以采用LCD或有机发光二极管(OrganicLight-EmittingDiode,OLED)等形式来配置显示面板641。
应注意,触控面板631可以覆盖显示面板641,形成触摸显示屏,当该触摸显示屏检测到在其上或附近的触摸操作后,传送给处理器660以确定触摸事件的类型,随后处理器660根据触摸事件的类型在触摸显示屏上提供相应的视觉输出。
触摸显示屏包括应用程序界面显示区及常用控件显示区。该应用程序界面显示区及该常用控件显示区的排列方式并不限定,可以为上下排列、左右排列等可以区分两个显示区的排列方式。该应用程序界面显示区可以用于显示应用程序的界面。每一个界面可以包含至少一个应用程序的图标和/或widget桌面控件等界面元素。该应用程序界面显示区也可以为不包含任何内容的空界面。该常用控件显示区用于显示使用率较高的控件,例如,设置按钮、界面编号、滚动条、电话本图标等应用程序图标等。
其中处理器660是移动终端600的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在第一存储器621内的软件程序和/或模块,以及调用存储在第二存储器622内的数据,执行移动终端600的各种功能和处理数据,从而对移动终端600进行整体监控。可选的,处理器660可包括一个或多个处理单元。
在本发明实施例中,通过调用存储该第一存储器621内的软件程序和/或模块和/或该第二存储器622内的数据,处理器660获取第一语音信号;判断所述第一语音信号是否为预设用户的语音信号;若判断结果为是,获取预设用户的频率范围;根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
可选地,处理器660还用于:获取预设用户的语音信号;根据所述语音信号确定所述预设用户的频率范围;保存所述预设用户的语音信号和频率范围。
可选地,处理器660还用于:提取所述第一语音信号中设定时域内的语音信号片段;将所述设定时域内的语音信号通过模数转换采样为时域离散信号;对所述时域离散信号进行傅里叶变换,得到所述时域离散信号的幅度谱;对所述幅度谱进行积分,得到所述时域离散信号的能量谱;在所述能量谱中将能量大于设定阈值的频率范围确定为预设用户的频率范围。
可选地,处理器660还用于:若判断结果为否,执行根据所述语音信号确定所述预设用户的频率范围的步骤。
可选地,处理器660还用于:获取当前用户的体征数据,其中,所述体征数据包括声纹数据、指纹数据、虹膜数据、面部特征数据;将当前用户的体征数据与预设用户的体征数据进行比对;若比对结果一致,则判定所述第一语音信号为预设用户的语音信号。
可见,本发明实施例中,移动终端600获取第一语音信号和预设用户的语音信号;根据预设用户的语音信号确定预设用户的频率范围,并保存预设用户的语音信号和频率范围;判断第一语音信号是否为预设用户的语音信号,是预设用户的语音信号,则从之前的存储中提取频率范围,不是预设用户的语音信号,则执行确定语音信号频率范围的步骤;根据确定的频率范围调整滤波参数,输出频率范围以外的频率被抑制的第二语音信号。由于本发明实施例采用的是根据实时语音信号频率范围而不是固定语音信号频率范围对语音信号进行处理,使得语音信号频率范围外的声音或者噪声被抑制,从而提高了语音信号传输的信噪比,进而提高了语音质量。
对于上述提升语音传输信噪比的装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此提供的提升语音传输信噪比的方案不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的提升语音传输信噪比的方案中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种提升语音传输信噪比的方法,应用于移动终端,其特征在于,所述方法包括:
获取第一语音信号;
判断所述第一语音信号是否为预设用户的语音信号;
若判断结果为是,获取预设用户的频率范围;
根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
2.根据权利要求1所述的方法,其特征在于,在所述判断所述第一语音信号是否为预设用户的语音信号之前,所述方法还包括:
获取预设用户的语音信号;
根据所述语音信号确定所述预设用户的频率范围;
保存所述预设用户的语音信号和频率范围。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语音信号确定所述预设用户的频率范围包括:
提取所述第一语音信号中设定时域内的语音信号片段;
将所述设定时域内的语音信号通过模数转换采样为时域离散信号;
对所述时域离散信号进行傅里叶变换,得到所述时域离散信号的幅度谱;
对所述幅度谱进行积分,得到所述时域离散信号的能量谱;
在所述能量谱中将能量大于设定阈值的频率范围确定为预设用户的频率范围。
4.根据权利要求2所述的方法,其特征在于,所述判断所述第一语音信号是否为预设用户的语音信号的步骤之后,还包括:
若判断结果为否,执行根据所述语音信号确定所述预设用户的频率范围的步骤。
5.根据权利要求1所述的方法,其特征在于,所述判断所述第一语音信号是否为预设用户的语音信号包括:
获取当前用户的体征数据,其中,所述体征数据包括声纹数据、指纹数据、虹膜数据、面部特征数据中至少一种;
将当前用户的体征数据与预设用户的体征数据进行比对;
若比对结果一致,则判定所述第一语音信号为预设用户的语音信号。
6.一种提升语音传输信噪比的装置,部署在移动终端,其特征在于,所述装置包括:
语音信号获取模块,用于获取第一语音信号;
语音信号判断模块,用于判断所述第一语音信号是否为预设用户的语音信号;
频率范围获取模块,用于若判断结果为是,获取预设用户的频率范围;
语音信号输出模块,用于根据所述频率范围调整滤波参数,输出所述频率范围以外的频率被抑制的第二语音信号。
7.根据权利要求6所述的装置,其特征在于,在所述语音信号判断模块之前,所述装置还包括:
预设语音信号获取模块,用于获取预设用户的语音信号;
第一频率范围确定模块,用于根据所述语音信号确定所述预设用户的频率范围;
频率范围保存模块,用于保存所述预设用户的语音信号和频率范围。
8.根据权利要求7所述的装置,其特征在于,所述第一频率范围确定模块包括:
片段提取子模块,用于提取所述第一语音信号中设定时域内的语音信号片段;
语音信号采样子模块,用于将所述设定时域内的语音信号通过模数转换采样为时域离散信号;
幅度谱计算子模块,用于对所述时域离散信号进行傅里叶变换,得到所述时域离散信号的幅度谱;
能量谱计算子模块,用于对所述幅度谱进行积分,得到所述时域离散信号的能量谱;
频率范围确定子模块,用于在所述能量谱中将能量大于设定阈值的频率范围确定为预设用户的频率范围。
9.根据权利要求7所述的装置,其特征在于,所述语音信号判断模块之后,还包括:
第二频率范围确定模块,用于若判断结果为否,执行根据所述语音信号确定所述预设用户的频率范围的步骤。
10.根据权利要求6所述的装置,其特征在于,所述语音信号判断模块包括:
体征数据获取子模块,用于获取当前用户的体征数据,其中,所述体征数据包括声纹数据、指纹数据、虹膜数据、面部特征数据中至少一种;
体征数据比对子模块,用于将当前用户的体征数据与预设用户的体征数据进行比对;
语音信号判定子模块,用于若比对结果一致,则判定所述第一语音信号为预设用户的语音信号。
CN201611208721.7A 2016-12-23 2016-12-23 一种提升语音传输信噪比的方法及装置 Active CN106816155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611208721.7A CN106816155B (zh) 2016-12-23 2016-12-23 一种提升语音传输信噪比的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611208721.7A CN106816155B (zh) 2016-12-23 2016-12-23 一种提升语音传输信噪比的方法及装置

Publications (2)

Publication Number Publication Date
CN106816155A true CN106816155A (zh) 2017-06-09
CN106816155B CN106816155B (zh) 2020-04-24

Family

ID=59110635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611208721.7A Active CN106816155B (zh) 2016-12-23 2016-12-23 一种提升语音传输信噪比的方法及装置

Country Status (1)

Country Link
CN (1) CN106816155B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107172256A (zh) * 2017-07-27 2017-09-15 广东欧珀移动通信有限公司 耳机通话自适应调整方法、装置、移动终端及存储介质
CN109102816A (zh) * 2018-08-14 2018-12-28 Oppo广东移动通信有限公司 编码控制方法、装置以及电子设备
CN116631456A (zh) * 2023-07-21 2023-08-22 江西红声技术有限公司 一种声控通讯处理方法、耳机、存储介质及计算机

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719517A (zh) * 2005-08-04 2006-01-11 北京中星微电子有限公司 一种动态噪音消除方法及数字滤波器
EP1058236B1 (en) * 1999-05-31 2007-03-07 Nippon Telegraph and Telephone Corporation Speech recognition based database query system
CN103489451A (zh) * 2012-06-13 2014-01-01 百度在线网络技术(北京)有限公司 移动终端的语音处理方法及移动终端
CN103971696A (zh) * 2013-01-30 2014-08-06 华为终端有限公司 语音处理方法、装置及终端设备
CN105975569A (zh) * 2016-05-03 2016-09-28 深圳市金立通信设备有限公司 一种语音处理的方法及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1058236B1 (en) * 1999-05-31 2007-03-07 Nippon Telegraph and Telephone Corporation Speech recognition based database query system
CN1719517A (zh) * 2005-08-04 2006-01-11 北京中星微电子有限公司 一种动态噪音消除方法及数字滤波器
CN103489451A (zh) * 2012-06-13 2014-01-01 百度在线网络技术(北京)有限公司 移动终端的语音处理方法及移动终端
CN103971696A (zh) * 2013-01-30 2014-08-06 华为终端有限公司 语音处理方法、装置及终端设备
CN105975569A (zh) * 2016-05-03 2016-09-28 深圳市金立通信设备有限公司 一种语音处理的方法及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王冲: "《现代信息检索技术基本原理教程》", 30 November 2013, 西安电子科技大学出版社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107172256A (zh) * 2017-07-27 2017-09-15 广东欧珀移动通信有限公司 耳机通话自适应调整方法、装置、移动终端及存储介质
CN109102816A (zh) * 2018-08-14 2018-12-28 Oppo广东移动通信有限公司 编码控制方法、装置以及电子设备
CN116631456A (zh) * 2023-07-21 2023-08-22 江西红声技术有限公司 一种声控通讯处理方法、耳机、存储介质及计算机

Also Published As

Publication number Publication date
CN106816155B (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
CN105549729B (zh) 用于操作传感器面板的方法和用于支持该方法的电子装置
CN105827853B (zh) 一种终端外放音量的输出控制方法及移动终端
CN106816155A (zh) 一种提升语音传输信噪比的方法及装置
CN106101767A (zh) 一种屏幕录制方法及移动终端
CN108073856A (zh) 噪音信号的识别方法及装置
CN107507621A (zh) 一种噪声抑制方法及移动终端
CN106528603A (zh) 应用程序搜索方法及移动终端
CN106502619A (zh) 一种音量控制方法及装置
CN106506801A (zh) 一种调整摄像头变焦倍数的方法及移动终端
CN106953659A (zh) 一种抑制干扰的方法及装置
CN106375048A (zh) 一种无线局域网天线切换的控制方法和装置
CN106686247A (zh) 一种接近传感器检测方法及移动终端
CN106356071B (zh) 一种噪声检测方法,及装置
CN108984092A (zh) 设备控制方法、装置、存储介质及电子设备
CN107483821A (zh) 一种图像处理方法及移动终端
CN108491733A (zh) 隐私应用推荐方法和装置、存储介质、电子设备
CN106385489B (zh) 一种确定上行语音数据的方法及移动终端
CN107608954A (zh) 一种单词信息的显示方法及移动终端
CN107612595A (zh) 一种天线切换方法及移动终端
CN107040638B (zh) 一种噪音的处理方法及移动终端
CN106934848A (zh) 一种图片处理方法及移动终端
CN106991150A (zh) 一种网页数据的显示方法及移动终端
CN107122097A (zh) 一种移动终端壁纸的推荐方法及移动终端
CN107193885A (zh) 一种音乐缓存数据的管理方法及移动终端
CN107643868A (zh) 一种熄屏显示开关切换方法及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant