CN103871417A - 一种移动手机特定连续语音过滤方法及过滤装置 - Google Patents

一种移动手机特定连续语音过滤方法及过滤装置 Download PDF

Info

Publication number
CN103871417A
CN103871417A CN201410112404.XA CN201410112404A CN103871417A CN 103871417 A CN103871417 A CN 103871417A CN 201410112404 A CN201410112404 A CN 201410112404A CN 103871417 A CN103871417 A CN 103871417A
Authority
CN
China
Prior art keywords
voice
fundamental frequency
user
voice signal
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410112404.XA
Other languages
English (en)
Inventor
汪金辉
龙哲华
侯立刚
耿淑琴
彭晓宏
宫娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201410112404.XA priority Critical patent/CN103871417A/zh
Publication of CN103871417A publication Critical patent/CN103871417A/zh
Pending legal-status Critical Current

Links

Images

Abstract

一种移动手机特定连续语音过滤方法及过滤装置,属于通讯方法及设备技术领域。通过使用者使用此功能时,先录入用户语音,在移动手机内记录一个已识别特定语音,建立一个移动手机的语音库;每次使用移动手机进行通话,用户可以选择手机只识别特定语音。通过本发明,在嘈杂的环境下通话,可以有效的解决在这种环境下通话的不便性,也可以保证通话的另一端,能听到高质量的语音通话,当然这个功能使用时,也可以让移动手机只通过用户自己的语音,可以不让身边其他人的话语传递到另一方,在保护用户隐私方面同样有着很广泛的适用性。

Description

一种移动手机特定连续语音过滤方法及过滤装置
技术领域
本发明涉及一种用于移动手机通话识别特定人的连续语音的过滤方法及过滤装置,适用于语音降噪,滤除非目标语音,属于语音通讯技术领域。
背景技术
语音识别技术自诞生以来就对人类的生活方式产生了深远的影响,因此语音识别技术一直以来都是世界各地学者们深入研究的热点。目前语音识别广泛采用动态时间规整(DTW)技术和基于概率统计原理的隐马尔可夫模型(HMM)技术。语音是一个复杂的非线性过程,因此基于非线性理论,具有自适应性、并行性、鲁棒性、容错性和学习性等特点的人工神经网络技术逐渐成为时下语音识别新的研究方向。如今的移动通话,已成为人们生活必不可少的一部分,但是通话环境对于我们的通话质量影响非常明显,尤其在一个特别嘈杂的环境,但需要通话的情况下,移动手机的一个识别特定人的连续语音的功能,就会给用户一个极好的用户体验,是一个被广大用户需要的功能。
语音识别的层次模型和系统模型上分析语音识别的基本原理。语音预处理的整个流程,包括对原始语音信号的采集、预加重、分帧加窗、端点检测和不同语音特征值的获取。移动设备的特定语音识别有着广泛的应用前景和商业价值。鉴于语音识别的重要性,各国都把其当作本国的一个重点项目投入重金加以研究。然而语音信号的声学特征极其复杂,不同国家的人们语言各不相同,同一个国家之间又存在方言的差异,即使是同一个人在不同环境下,不同心里因素下都可能造成语音特征的波动。在语音识别的研究过程中不可避免的会遇到诸多困难,这主要表现在以下几个方面上
(1)噪声的干扰
语音识别系统在最初开发的时候往往是在相对安静的环境下进行,而在实际投入使用的时候,其周围环境往往是难以预料的。在有噪声干扰的情况下,系统识别率往往会受到巨大影响,主要是因为此时系统捕获的声音会发生很大的变化即发生所谓的Lombard效应。目前常采用抑制噪声的方法来进行去噪,主要技术有:环境规整术、建立噪声模型、谱减法和修正识别器模型使之适合噪声
(2)语音信号本身的复杂性和多变性
由于世界各地的人们使用不同的语音,而同一个国家内部又存在着众多的方言,这都对语音特征参数的研究提出了巨大的挑战,因此目前很难实现一个对各种语音能够完全通用的语音识别系统。即便是同一个人在不同时间所说的同一个语音都不是完全一致的,因此语音信号自身的复杂和多变性也制约着语音识别的进一步发展。
(3)语音系统的复杂性
语音识别系统是一项及其复杂的工程,它涉及到众多领域的学科,像语音声学、人工智能学、模式识别、数理统计学、通信学、计算机科学甚至心理学。因此如果这些学科得不到快速的发展,出现了所谓的瓶颈,最终也会制约着语音识别向更高的方向发展。
综上所述,语音识别技术虽然还有一些技术没有很好得到解决,但是语音识别的应用在近年来呈现出较大的增长需求,如在安全领域,相关部门结合相关业务提出了相应的需求;在教育领域,大人群的普通话水平测试与口语评估迫切需要客观的、自动的评估技术;在电信领域,国内外语音识别技术和部门进入了中国市场;在手机、汽车导航等嵌入式市场,对语音识别技术需求也日益增长;在人机交互领域,语音伴侣、移动终端的语音搜索等得到广泛的应用。因此,语音识别技术作为非常重要的人机交互的技术,有着非常广阔的应用领域和市场前景。
发明内容
本发明目的在于提供一种用于移动手机通话识别特定人的连续语音的过滤技术,尤其在嘈杂的环境下通话,可以有效的解决在这种环境下通话的不便性,同时保护用户隐私方面同样有着很广泛的适用性。该移动手机通话特定连续语音识别系统包括:语音信号接受单元、语音信号预处理单元、提取语音信号基音频率单元、基音频率配比单元、语音基音频率库、语音信号输出单元。语音信号接收单元用于检测到语音信号,接受并输入到本发明模块信号链路;语音信号与处理单元用于保证系统获得一个比较理想的对象;提取语音信号特征单元用于提取进入手机的所有语音基音频率;基音频率配比单元用于将已有在语音库里的基音频率和提取到的基音频率进行比较,并把不匹配的基音频率过滤,留下配比成功的基音频率;语音基音频率库,是事先由用户进行语音训练生成的用户特定语音参数的库,用来和通话时进入手机的语音进行配比;语音信号输出单元用于把最终得到的目标语音发送到手机的通信模块。
为了实现上述目的,本发明采用的技术方案如下:
一种移动手机特定连续语音过滤方法,首先建立一个特定用户的语音基音频率库,用来作为用户特定连续语音的特征标记;然后语音通话时对接收到的语音信号,进行特征提取,然后进行基音频率的配比,并把不匹配的基音频率滤除。具体步骤如下:
S1。建立一个特定用户的语音基音频率库Q,基音频率库Q中存储着用户的语音基音频率,在手机开启此功能时,每次语音通话都把接收到的语音进行基音频率配比,滤除不匹配的基音频率。
S2。对接收到的所有语音进行预处理,处理过程是预滤波、采样和量化、加窗和分帧、端点检测等等。这样可以让系统获取一个比较理想的对象,以利于后续工作的展开。对于语音识别系统,信号预处理的好坏直接关系到最后系统的识别率。
S3。将预处理后的语音信号进行基音频率提取,基音频率指的是发浊音时声带振动所引起的周期性特征,基音周期的倒数即为基因频率。基音频率提取包括两个主要过程谱平整和基因轨迹平滑,把经过预处理后的信号先进行谱平整,然后进行基音轨迹平滑。这样就可以把不同语音的基因频率分离出来,滤除所有非目标语音的基因频率
S4。对提取到的基音频率和语音基音频率库中已有的基音频率进行配比,因为每个人的基因频率都是不一样的,然后将与基音频率库中不一致的基音频率滤除,使配比后的基音频率作为最终得到的用户语音发送到后续的单元。
S5。滤除了语音信号中的非目标语音就可以得到用户的语音,作为手机后续的通信信号发送出去,从而实现在不同语音环境下,用户都能进行通畅的通话,并只发送用户的语音,也可以在保护用户隐私方面有着重要应用。
为了实现上述步骤,该移动手机通话识别特定人的连续语音的过滤系统各个单元的功能如下:
1.语音信号接受单元:用于检测到环境中语音信号,并作为移动手机设备的语音信号接收端,将信号接入到设备中。
2.语音信号预处理单元:用于将已接收到的语音信号进行预处理包括预滤波、采样和量化、加窗和分帧、端点检测等等,保证系统能获取一个比较理想的对象,以利于后续工作的展开。
3.提取语音信号基音频率单元:将预处理后的语音信号进行基音频率提取,将语音中所有被接受到的声音基音频率都提取出来,以进行后续基音频率配比。
4.基音频率配比单元:将接收到语音信号提取到的基音频率与已经建立的语音基音频率库中的基音频率进行配比,并将不匹配的基音频率滤除,得到匹配的基音频率,已达到目标语音识别,非目标语音滤除的功能。
5.语音基音频率库:在用户开启语音识别功能时,进行特定用户的语音训练,从而生成的语音基音频率库,用于和通话接收到的语音进行配比,是实现语音识别的标杆。
6.语音信号输出单元:将识别后的语音基音频率,进行信号处理,并作为移动手机语音通信模块最终要处理的信号。
总体而言,与现有技术相比,本发明可以获得如下有益效果:对于用户可能会处于不同通话环境,并且可能会严重影响用户的通话语音信号质量,从而给用户带来通话的不便性;通过本发明的特定连续语音过滤方法,可以有效的解决嘈杂环境下通话的不便性,并且开启此功能,用户还可以只通过自己语音信号,滤除环境中其他人的语音,可以达到某些保护隐私的功能,这些都是达到使用户语音通话更方便。
附图说明
图1为特定连续语音过滤技术的总体系统图;
图2为用户特定语音特征提取,特征参数匹配过程图;
图3为语音训练及生成语音特征参数库过程图;
图4为移动手机特定语音过滤模块,功能划分图;
图5为特定连续语音过滤技术流程示意图。
图中:M1、M2、M3、M4、M5、M6——语音环境中的6个人;
A1、A2、A3、A4、A5、A6——6个人各自发出的语音信号;
P1——移动手机;
A6——目标语音信号;
C1——通信网络;
Q1——语音信号接收单元;
Q2——语音信号预处理单元;
Q3——提取语音信号特征单元;
Q4——特征参数配比单元;
Q5——语音信号输出单元;
Q6——语音信号特征参数库;
具体实施方式
以下结合附图对本发明作进一步说明。
如图1所示,为特定连续语音的过滤系统的总体框图,该框图包括语音环境中M1、M2、M3、M4、M5和M6一共六个人;A1、A2、A3、A4、A5和A6分别为M1、M2、M3、M4、M5和M6发出的六种不同的语音信号;P1用户的移动手机;M6目标语音;C1通信网络;
如图4所示,就是图1中P1具备的本发明模块,包括6个单元,分别为语音信号接受单元、语音信号预处理单元、提取语音信号特征单元、特征参数配比单元、语音特征参数库、语音信号输出单元。
如图2所示,语音特定参数配比过程,将接收到语音信号提取到的特征参数与已经建立的语音特征参数库中的参数进行配比,并将不匹配的参数滤除,得到匹配的参数,以达到目标语音识别,非目标语音滤除的功能。
如图3所示,特定语音库的建立,在用户开启语音识别功能时,进行特定用户的语音训练,从而生成的语音特征参数库,用于和通话接收到的语音进行配比,是实现语音识别的标杆。整个语音识别模块,如图4所示,移动手机的语音识别系统具体的6个模块语音信号接受单元、语音信号预处理单元、提取语音信号特征单元、特征参数配比单元、语音特征参数库、语音信号输出单元。
以下是本发明的具体实施步骤:
信号在识别模块中先后经过6个模块如图5所示,通过语音信号接受单元进入移动手机;经过语音信号预处理单元获取一个比较理想的对象;再由提取语音信号特征单元获得接收语音的所有特征参数,在特征参数配比单元,语音信号特征单元获得所有特征语音参数和语音特征参数库中的参数进行匹配,如图2所示;滤除不匹配的特征参数,得到目标语音,从而实现特定语音识别,滤除非目标语音的功能。语音特征数据库的生成过程如图3所示。

Claims (2)

1.一种移动手机特定连续语音过滤方法,其特征在于:首先建立一个特定用户的语音基音频率库,用来作为用户特定连续语音的特征标记;然后语音通话时对接收到的语音信号,进行特征提取,然后进行基音频率的配比,并把不匹配的基音频率滤除;具体步骤如下:
S1建立一个特定用户的语音基音频率库Q,基音频率库Q中存储着用户的语音基音频率,在手机开启此功能时,每次语音通话都把接收到的语音进行基音频率配比,滤除不匹配的基音频率;
S2对接收到的所有语音进行预处理,处理过程是预滤波、采样和量化、加窗和分帧、端点检测;
S3将预处理后的语音信号进行基音频率提取,基音频率指的是发浊音时声带振动所引起的周期性特征,基音周期的倒数即为基因频率;基音频率提取包括两个主要过程即谱平整和基因轨迹平滑,把经过预处理后的信号先进行谱平整,然后进行基音轨迹平滑;这样就可以把不同语音的基因频率分离出来,滤除所有非目标语音的基因频率;
S4对提取到的基音频率和语音基音频率库中已有的基音频率进行配比,然后将与基音频率库中不一致的基音频率滤除,使配比后的基音频率作为最终得到的用户语音发送到后续单元;
S5滤除了语音信号中的非目标语音就可以得到用户的语音,作为手机后续的通信信号发送出去,从而实现在不同语音环境下,用户都能进行通畅的通话,并只发送用户的语音,也可以在保护用户隐私方面有着重要应用。
2.实现权利要求1所述的一种移动手机特定连续语音过滤方法的过滤系统,其特征在于:其包括如下单元:
语音信号接受单元:用于检测到环境中语音信号,并作为移动手机设备的语音信号接收端,将信号接入到设备中将语音信号输入到语音信号预处理单元;
语音信号预处理单元:用于将已接收到的语音信号进行预处理包括预滤波、采样和量化、加窗和分帧、端点检测;
提取语音信号基音频率单元:将经过语音信号预处理单元预处理过后的语音信号进行基音频率提取,将语音中所有被接受到的声音基音频率都提取出来,以进行后续基音频率配比;
基音频率配比单元:将接收到语音信号提取到的基音频率与已经建立的语音基音频率库中的基音频率进行配比,并将不匹配的基音频率滤除,得到匹配的基音频率,已达到目标语音识别,非目标语音滤除的功能;
语音基音频率库:在用户开启语音识别功能时,进行特定用户的语音训练,从而生成的语音基音频率库,用于和通话接收到的语音进行配比,是实现语音识别的标杆;
语音信号输出单元:将识别后的语音基音频率,进行信号处理,并作为移动手机语音通信模块最终要处理的信号。
CN201410112404.XA 2014-03-25 2014-03-25 一种移动手机特定连续语音过滤方法及过滤装置 Pending CN103871417A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410112404.XA CN103871417A (zh) 2014-03-25 2014-03-25 一种移动手机特定连续语音过滤方法及过滤装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410112404.XA CN103871417A (zh) 2014-03-25 2014-03-25 一种移动手机特定连续语音过滤方法及过滤装置

Publications (1)

Publication Number Publication Date
CN103871417A true CN103871417A (zh) 2014-06-18

Family

ID=50909880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410112404.XA Pending CN103871417A (zh) 2014-03-25 2014-03-25 一种移动手机特定连续语音过滤方法及过滤装置

Country Status (1)

Country Link
CN (1) CN103871417A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104409080A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 语音端点检测方法和装置
CN105491582A (zh) * 2014-09-17 2016-04-13 联想(北京)有限公司 一种信息处理方法和装置
CN105632513A (zh) * 2015-12-18 2016-06-01 合肥寰景信息技术有限公司 一种网络社区的语音过滤方法
CN109688269A (zh) * 2019-01-03 2019-04-26 百度在线网络技术(北京)有限公司 语音指令的过滤方法和装置
CN110364178A (zh) * 2019-07-22 2019-10-22 出门问问(苏州)信息科技有限公司 一种语音处理方法、装置、存储介质和电子设备
CN110660032A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 一种对象屏蔽方法、对象屏蔽装置及电子设备
CN112562706A (zh) * 2020-11-30 2021-03-26 哈尔滨工程大学 一种基于时间潜在域特定说话人信息的目标语音提取方法
CN115086477A (zh) * 2022-06-02 2022-09-20 Oppo广东移动通信有限公司 控制方法和装置、电子设备、通话系统及可读存储介质
WO2022235748A1 (en) * 2021-05-04 2022-11-10 The Regents Of The University Of Michigan Activity recognition using inaudible frequencies for privacy
CN115086477B (zh) * 2022-06-02 2024-05-03 Oppo广东移动通信有限公司 控制方法和装置、电子设备、通话系统及可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1268732A (zh) * 2000-03-31 2000-10-04 清华大学 基于语音识别专用芯片的特定人语音识别、语音回放方法
CN1342968A (zh) * 2000-09-13 2002-04-03 中国科学院自动化研究所 用于语音识别的高精度高分辨率基频提取方法
CN1403953A (zh) * 2002-09-06 2003-03-19 浙江大学 掌上声纹验证系统
CN1746972A (zh) * 2004-09-09 2006-03-15 上海优浪信息科技有限公司 一种语音锁
CN101040324A (zh) * 2005-05-13 2007-09-19 松下电器产业株式会社 混合声音分离装置
CN102890936A (zh) * 2011-07-19 2013-01-23 联想(北京)有限公司 一种音频处理方法、终端设备及系统
CN103377651A (zh) * 2012-04-28 2013-10-30 北京三星通信技术研究有限公司 语音自动合成装置及方法
CN103514876A (zh) * 2012-06-28 2014-01-15 腾讯科技(深圳)有限公司 噪音消除方法和装置、以及移动终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1268732A (zh) * 2000-03-31 2000-10-04 清华大学 基于语音识别专用芯片的特定人语音识别、语音回放方法
CN1342968A (zh) * 2000-09-13 2002-04-03 中国科学院自动化研究所 用于语音识别的高精度高分辨率基频提取方法
CN1403953A (zh) * 2002-09-06 2003-03-19 浙江大学 掌上声纹验证系统
CN1746972A (zh) * 2004-09-09 2006-03-15 上海优浪信息科技有限公司 一种语音锁
CN101040324A (zh) * 2005-05-13 2007-09-19 松下电器产业株式会社 混合声音分离装置
CN102890936A (zh) * 2011-07-19 2013-01-23 联想(北京)有限公司 一种音频处理方法、终端设备及系统
CN103377651A (zh) * 2012-04-28 2013-10-30 北京三星通信技术研究有限公司 语音自动合成装置及方法
CN103514876A (zh) * 2012-06-28 2014-01-15 腾讯科技(深圳)有限公司 噪音消除方法和装置、以及移动终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵力: "《语音信号处理》", 30 May 2009, 机械工业出版社 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105491582A (zh) * 2014-09-17 2016-04-13 联想(北京)有限公司 一种信息处理方法和装置
CN104409080B (zh) * 2014-12-15 2018-09-18 北京国双科技有限公司 语音端点检测方法和装置
CN104409080A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 语音端点检测方法和装置
CN105632513A (zh) * 2015-12-18 2016-06-01 合肥寰景信息技术有限公司 一种网络社区的语音过滤方法
CN109688269A (zh) * 2019-01-03 2019-04-26 百度在线网络技术(北京)有限公司 语音指令的过滤方法和装置
CN110364178B (zh) * 2019-07-22 2021-09-10 出门问问(苏州)信息科技有限公司 一种语音处理方法、装置、存储介质和电子设备
CN110364178A (zh) * 2019-07-22 2019-10-22 出门问问(苏州)信息科技有限公司 一种语音处理方法、装置、存储介质和电子设备
CN110660032A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 一种对象屏蔽方法、对象屏蔽装置及电子设备
CN112562706A (zh) * 2020-11-30 2021-03-26 哈尔滨工程大学 一种基于时间潜在域特定说话人信息的目标语音提取方法
CN112562706B (zh) * 2020-11-30 2023-05-05 哈尔滨工程大学 一种基于时间潜在域特定说话人信息的目标语音提取方法
WO2022235748A1 (en) * 2021-05-04 2022-11-10 The Regents Of The University Of Michigan Activity recognition using inaudible frequencies for privacy
CN115086477A (zh) * 2022-06-02 2022-09-20 Oppo广东移动通信有限公司 控制方法和装置、电子设备、通话系统及可读存储介质
CN115086477B (zh) * 2022-06-02 2024-05-03 Oppo广东移动通信有限公司 控制方法和装置、电子设备、通话系统及可读存储介质

Similar Documents

Publication Publication Date Title
CN103871417A (zh) 一种移动手机特定连续语音过滤方法及过滤装置
US10476872B2 (en) Joint speaker authentication and key phrase identification
US8731936B2 (en) Energy-efficient unobtrusive identification of a speaker
CN102509547B (zh) 基于矢量量化的声纹识别方法及系统
WO2021139327A1 (zh) 一种音频信号处理方法、模型训练方法以及相关装置
WO2020181824A1 (zh) 声纹识别方法、装置、设备以及计算机可读存储介质
CN110299142B (zh) 一种基于网络融合的声纹识别方法及装置
KR20180034507A (ko) 사용자 성문 모델을 구축하기 위한 방법, 장치 및 시스템
CN110570873B (zh) 声纹唤醒方法、装置、计算机设备以及存储介质
CN107886957A (zh) 一种结合声纹识别的语音唤醒方法及装置
CN105006230A (zh) 一种面向非特定人的语音敏感信息检测和过滤方法
CN108364662B (zh) 基于成对鉴别任务的语音情感识别方法与系统
CN102324232A (zh) 基于高斯混合模型的声纹识别方法及系统
CN112562691A (zh) 一种声纹识别的方法、装置、计算机设备及存储介质
CN101540170B (zh) 一种基于仿生模式识别的声纹识别方法
CN108766441A (zh) 一种基于离线声纹识别和语音识别的语音控制方法及装置
CN102723078A (zh) 基于自然言语理解的语音情感识别方法
CN105845139A (zh) 一种离线语音控制方法和装置
CN109036467A (zh) 基于tf-lstm的cffd提取方法、语音情感识别方法及系统
Wang et al. Research on speech emotion recognition technology based on deep and shallow neural network
CN103366745A (zh) 基于语音识别保护终端设备的方法及其终端设备
CN113129867A (zh) 语音识别模型的训练方法、语音识别方法、装置和设备
Sinha et al. Acoustic-phonetic feature based dialect identification in Hindi Speech
CN115841821A (zh) 一种基于人类语音结构的语音干扰噪声设计方法
CN105845143A (zh) 基于支持向量机的说话人确认方法及其系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140618

RJ01 Rejection of invention patent application after publication