CN110120226A - 一种专网集群终端语音尾噪消除方法和设备 - Google Patents

一种专网集群终端语音尾噪消除方法和设备 Download PDF

Info

Publication number
CN110120226A
CN110120226A CN201810116797.XA CN201810116797A CN110120226A CN 110120226 A CN110120226 A CN 110120226A CN 201810116797 A CN201810116797 A CN 201810116797A CN 110120226 A CN110120226 A CN 110120226A
Authority
CN
China
Prior art keywords
xpeak
voice
time
last
uproar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810116797.XA
Other languages
English (en)
Other versions
CN110120226B (zh
Inventor
李琳
徐本凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TD Tech Ltd
TD Tech Chengdu Co Ltd
Original Assignee
TD Tech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TD Tech Ltd filed Critical TD Tech Ltd
Priority to CN201810116797.XA priority Critical patent/CN110120226B/zh
Publication of CN110120226A publication Critical patent/CN110120226A/zh
Application granted granted Critical
Publication of CN110120226B publication Critical patent/CN110120226B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/19Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Sub-Exchange Stations And Push- Button Telephones (AREA)
  • Telephone Function (AREA)

Abstract

本申请公开了一种专网集群终端语音尾噪消除方法,包括:根据输入语音信号的幅度判断语音的开始和结束;在语音结束时按照设置的启动时间启动尾音消除操作;在语音开始时按照设置的释放时间停止尾音消除操作。本申请还提供了一种专网集群终端语音尾噪消除设备。应用本申请公开的技术方案,能够对专网集群终端的语音尾噪进行平滑的消除。

Description

一种专网集群终端语音尾噪消除方法和设备
技术领域
本申请涉及通信技术领域,特别涉及一种专网集群终端语音尾噪消除方法和设备。
背景技术
在专网集群终端需要使用半双工业务,即:一方主讲一方监听(类似对讲机)。在终端处于监听状态时,由于喇叭功率大,在对方发起主讲时,本终端会听到“沙沙”响的尾噪,需要对尾噪进行消除。
通常对于喇叭功率较小的终端而言,听觉可以忽略这部分感受,而当使用大功率的终端时,沙沙的声响较为明显,导致用户感受较差。
产生尾噪的原因是:模块模拟器件在射频发射结束时,需要在最后一段很短暂的时间内判断声音是否结束,从而导致一部分尾噪泄露。由于尾噪和语音掺杂一起、且短暂,现有的降噪算法对尾噪的抑制效果有限,无法完全消除,对于用户而言,听觉上没有太大改善。
发明内容
本申请提供了一种专网集群终端语音尾噪消除方法和设备,以对专网集群终端的语音尾噪进行平滑的消除。
本申请公开了一种专网集群终端语音尾噪消除方法,包括:
根据输入语音信号的幅度判断语音的开始和结束;
在语音结束时按照设置的启动时间启动尾音消除操作;
在语音开始时按照设置的释放时间停止尾音消除操作。
较佳的,所述启动时间是指启动尾音消除操作的时间;
所述释放时间是指暂停或停止尾音消除操作的时间。
较佳的,按照以下流程执行:
A、比较输入语音信号x(n)与xPEAK(n-1)的大小,如果x(n)<xPEAK(n-1),采用式(1)更新xPEAK(n),否则,采用式(2)更新xPEAK(n):
xPEAK(n)=(1-A)·xPEAK(n-1)+A·|x(n)|(1)
xPEAK(n)=(1-R)·xPEAK(n-1)(2)
其中,xPEAK(n)为信号平稳的幅度;
A=1-exp(-2.2Ts/(Ta/1000)),R=1-exp(-2.2Ts/(Tr/1000));
Ta为启动时间,Tr为释放时间,Ts为采样时间;
B、将xPEAK(n)与Limit进行比较,得到增益更新系数f:
如果xPEAK(n)<Limit,则令f=0;
否则,令f=1;
其中,Limit为消除底噪的目标值,根据所需消除的噪声大小决定,为常数;
f为更新g(n)的系数值;
C、将g(n)与f进行比较,得出收敛速度更新系数coeff_g:
如果f<g(n-1),则令coeff_g=A;
否则,令coeff_g=R;
D、通过f和coeff_g,计算g(n):
g(n)=(1-coeff_g)*g(n-1)+(coeff_g)*f
E、通过g(n)计算输出值y(n)=x(n)*g(n);
F、保存每次计算得到的xPEAK(n)和g(n),用作下一次计算。
本申请还公开了一种专网集群终端语音尾噪消除设备,包括:
用于根据输入语音信号的幅度判断语音的开始和结束的模块;
用于在语音结束时按照设置的启动时间启动尾音消除操作的模块;
用于在语音开始时按照设置的释放时间停止尾音消除操作的模块。
较佳的,所述启动时间是指启动尾音消除操作的时间;
所述释放时间是指暂停或停止尾音消除操作的时间。
由上述技术方案可见,本申请提供的专网集群终端语音尾噪消除方法和设备通过语音语调特点检测语音,保证只消除尾部噪音,并防止由于消除中间语音而造成的语音不连续,并且,本申请对尾噪消除采用平滑处理,使得能够对语音尾噪进行平滑的消除。
附图说明
图1为本申请专网集群终端语音尾噪消除方法示意图;
图2为本申请专网集群终端语音尾噪消除方法的仿真效果示意图。
具体实施方式
为使本申请的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本申请作进一步详细说明。
为解决现有技术所述存在的问题,本申请提供了一种专网集群终端语音尾噪消除方法。
本申请的原理是:根据语音信号的幅度判断语音的开始和结束,在语音结束时按照本发明设置的启动时间及时启动尾音消除操作,在语音开始时按照本发明设置的释放时间及时停止尾音消除操作,从而避免对用户语音错误地进行消除尾音。其中:
启动时间(attack time)是指启动尾音消除操作的时间,其值影响语音结束时尾音消除算法生效的速度;
释放时间(release time)是指暂停或停止尾音消除操作的时间,其值影响语音出现时,尾音消除算法退出的速度。
如果尾音消除操作(即:尾音消除算法)的启动时间过短或释放时间过长,则可能会导致语音突变,这是因为:尾音消除算法本身是通过信号幅度来区分噪声和语音的,不能保证完全无失真。特别快的收敛,将误伤语音;启动时间参数过长会导致收敛慢,算法生效时间慢,消除底噪效果不理想。释放时间过短,也会导致算法过早退出影响噪声消除效果。
其中,启动时间和释放时间的取值需要结合所要消除的信号大小与语音信号大小的比例关系进行仿真得到。在进行仿真时,以保证正好可以消除底噪,且没有明显的语音断续和失真的情况下对应的值作为启动时间和释放时间的取值。例如:启动时间Ta可以取10ms,释放时间Tr可以取20ms。
本发明根据声音发生原理,通过启动时间和释放时间对信号运行幅度进行仿真,可以计算得到一段时间内信号平稳的幅度,防止信号区域消除所导致的断续,从而避免引起不必要的噪音。
具体而言,通过公式(1)和公式(2)计算幅度:
xPEAK(n)=(1-A)·xPEAK(n-1)+A·|x(n)| (1)
xPEAK(n)=(1-R)·xPEAK(n-1) (2)
根据实际输入信号(即:语音信号)与xPEAK的不同比值,分别采用两种不同的计算方法更新xPEAK,以得到平稳的幅度值。具体的,用实际信号输入的幅度x(n)与xPEAK(n-1)进行比较,如果x(n)小于xPEAK(n-1),则使用公式(1)更新xPEAK(n-1)得到当前的xPEAK(n),否则,使用公式(2)。其中,xPEAK(n-1)是时刻n-1的信号平稳的幅度,xPEAK(n)是当前时刻,即时刻n的信号平稳的幅度。
公式(1)和公式(2)中的两个系数A和R通过本发明采用传递函数H(Z),通过启动时间、释放时间和一系列的z变换、逆变换得到,其中:
A=1-exp(-2.2Ts/(Ta/1000));
R=1-exp(-2.2Ts/(Tr/1000));
其中:Ta为attack time,Tr为release time,Ts为采样时间。
下面结合图1,通过一个较佳实施例对本申请方法进行详细说明。
第1步:通过比较输入信号x(n)与xPEAK(n-1)的大小,判断是否执行消除噪声的操作:
如果x(n)<xPEAK(n-1),采用式(1)更新xPEAK(n)(消除尾音生效);
否则,采用式(2)更新xPEAK(n)(消除尾音不生效)。
实际上是通过输入信号x(n)与上一次xPEAK(n-1)值之间的比较,来判断是使用系数A还是R。
xPEAK(n)=(1-A)·xPEAK(n-1)+A·|x(n)| (1)
xPEAK(n)=(1-R)·xPEAK(n-1) (2)
本发明所述的启动时间和释放时间主要用于传递函数H(Z)中,通过一系列的z变换、逆变换,求得两个系数A=1-exp(-2.2Ts/(Ta/1000)),R=1-exp(-2.2Ts/(Tr/1000)),其中:Ta为attack time,Tr为release time,Ts为采样时间。
第2步:将xPEAK(n)与Limit进行比较,得到增益更新系数f。
如果xPEAK(n)<Limit,则令f=0;(消除噪声生效)
否则,令f=1;(消除噪声不生效)
其中,Limit为消除底噪的目标值,根据所需要消除的噪声大小决定,为常数。
f为更新g(n)的系数值。如果xPEAK(n)≥Limit,认为是正常语音,尽量不衰减;否则,进行大幅度衰减。
第3步:将g(n)与f进行比较,得出收敛速度更新系数coeff_g。
如果f<g(n-1),coeff_g=A,(消除噪声生效)
否则,coeff_g=R;(消除噪声不生效)
计算得到coeff_g后,为后续更新g(n)使用。
第4步:通过f和coeff_g,计算g(n)。
g(n)=(1-coeff_g)*g(n-1)+(coeff_g)*f
第5步:通过g(n)计算输出值y(n)=x(n)*g(n),消除无用的尾音,保留正常的语音信号。
第6步:将每次的xPEAK(n)和g(n)保留,用作下一次计算。
通过本发明提供的上述方法进行尾音检测和消除后,将以逼近0值且平滑的方法消除噪音。如图2所示,黑色为普通语音,灰色为消除掉的底噪,与语音掺杂一起,处理过后,不再听到沙沙的声响。根据图2的处理结果可以看到,本发明不是一次性斩断尾音,而是选择性的消除语音里面的杂音,不影响正常的语音信号。
对于专网终端,本发明提供的方法可以用于大功率的监听端,经过处理后,使用起来不再伴有杂音。当然小功率的终端在比较安静的场景下,也会有此类声音,也可以使用本发明提供的方法进行处理。
对应于上述方法,本申请还提供了一种专网集群终端语音尾噪消除设备,包括:
用于根据输入语音信号的幅度判断语音的开始和结束的模块;
用于在语音结束时按照设置的启动时间启动尾音消除操作的模块;
用于在语音开始时按照设置的释放时间停止尾音消除操作的模块。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (5)

1.一种专网集群终端语音尾噪消除方法,其特征在于,包括:
根据输入语音信号的幅度判断语音的开始和结束;
在语音结束时按照设置的启动时间启动尾音消除操作;
在语音开始时按照设置的释放时间停止尾音消除操作。
2.根据权利要求1所述的方法,其特征在于:
所述启动时间是指启动尾音消除操作的时间;
所述释放时间是指暂停或停止尾音消除操作的时间。
3.根据权利要求1或2所述的方法,其特征在于,按照以下流程执行:
A、比较输入语音信号x(n)与xPEAK(n-1)的大小,如果x(n)<xPEAK(n-1),采用式(1)更新xPEAK(n),否则,采用式(2)更新xPEAK(n):
xPEAK(n)=(1-A)·xPEAK(n-1)+A·|x(n)| (1)
xPEAK(n)=(1-R)·xPEAK(n-1) (2)
其中,xPEAK(n)为信号平稳的幅度;
A=1-exp(-2.2Ts/(Ta/1000)),R=1-exp(-2.2Ts/(Tr/1000));
Ta为启动时间,Tr为释放时间,Ts为采样时间;
B、将xPEAK(n)与Limit进行比较,得到增益更新系数f:
如果xPEAK(n)<Limit,则令f=0;
否则,令f=1;
其中,Limit为消除底噪的目标值,根据所需消除的噪声大小决定,为常数;
f为更新g(n)的系数值;
C、将g(n)与f进行比较,得出收敛速度更新系数coeff_g:如果f<g(n-1),则令coeff_g=A;
否则,令coeff_g=R;
D、通过f和coeff_g,计算g(n):
g(n)=(1-coeff_g)*g(n-1)+(coeff_g)*f
E、通过g(n)计算输出值y(n)=x(n)*g(n);
F、保存每次计算得到的xPEAK(n)和g(n),用作下一次计算。
4.一种专网集群终端语音尾噪消除设备,其特征在于,包括:用于根据输入语音信号的幅度判断语音的开始和结束的模块;
用于在语音结束时按照设置的启动时间启动尾音消除操作的模块;用于在语音开始时按照设置的释放时间停止尾音消除操作的模块。
5.根据权利要求4所述的设备,其特征在于:
所述启动时间是指启动尾音消除操作的时间;
所述释放时间是指暂停或停止尾音消除操作的时间。
CN201810116797.XA 2018-02-06 2018-02-06 一种专网集群终端语音尾噪消除方法和设备 Active CN110120226B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810116797.XA CN110120226B (zh) 2018-02-06 2018-02-06 一种专网集群终端语音尾噪消除方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810116797.XA CN110120226B (zh) 2018-02-06 2018-02-06 一种专网集群终端语音尾噪消除方法和设备

Publications (2)

Publication Number Publication Date
CN110120226A true CN110120226A (zh) 2019-08-13
CN110120226B CN110120226B (zh) 2021-09-03

Family

ID=67519937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810116797.XA Active CN110120226B (zh) 2018-02-06 2018-02-06 一种专网集群终端语音尾噪消除方法和设备

Country Status (1)

Country Link
CN (1) CN110120226B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040178852A1 (en) * 2003-03-12 2004-09-16 Brian Neunaber Apparatus and method of limiting power applied to a loudspeaker
CN1533134A (zh) * 1999-03-30 2004-09-29 �����ɷ� 通信设备话筒增益调节器及扬声器失真的控制装置
US7457757B1 (en) * 2002-05-30 2008-11-25 Plantronics, Inc. Intelligibility control for speech communications systems
US20090249943A1 (en) * 2008-04-07 2009-10-08 Roland Corporation Electronic musical instrument
CN101835071A (zh) * 2010-03-31 2010-09-15 惠州市德赛西威汽车电子有限公司 一种音响噪音控制电路
CN103187069A (zh) * 2011-12-29 2013-07-03 福建联拓科技有限公司 一种亚音频尾音检测的方法与装置
JP2013182169A (ja) * 2012-03-02 2013-09-12 Yamaha Corp 音響処理装置
CN106331380A (zh) * 2016-10-28 2017-01-11 大唐电信科技股份有限公司 Android平台宽窄带融合对讲语音网关控制方法及系统
US20170084289A1 (en) * 2015-09-23 2017-03-23 Marvell World Trade Ltd. Residual Noise Suppression
CN106612487A (zh) * 2015-10-27 2017-05-03 成都鼎桥通信技术有限公司 专网制式的终端音频指标的测试系统和测试方法
CN107040637A (zh) * 2017-06-06 2017-08-11 深圳天珑无线科技有限公司 消除电流音的方法、移动终端及计算机可读存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1533134A (zh) * 1999-03-30 2004-09-29 �����ɷ� 通信设备话筒增益调节器及扬声器失真的控制装置
US7457757B1 (en) * 2002-05-30 2008-11-25 Plantronics, Inc. Intelligibility control for speech communications systems
US20040178852A1 (en) * 2003-03-12 2004-09-16 Brian Neunaber Apparatus and method of limiting power applied to a loudspeaker
US20090249943A1 (en) * 2008-04-07 2009-10-08 Roland Corporation Electronic musical instrument
CN101835071A (zh) * 2010-03-31 2010-09-15 惠州市德赛西威汽车电子有限公司 一种音响噪音控制电路
CN103187069A (zh) * 2011-12-29 2013-07-03 福建联拓科技有限公司 一种亚音频尾音检测的方法与装置
JP2013182169A (ja) * 2012-03-02 2013-09-12 Yamaha Corp 音響処理装置
US20170084289A1 (en) * 2015-09-23 2017-03-23 Marvell World Trade Ltd. Residual Noise Suppression
CN106612487A (zh) * 2015-10-27 2017-05-03 成都鼎桥通信技术有限公司 专网制式的终端音频指标的测试系统和测试方法
CN106331380A (zh) * 2016-10-28 2017-01-11 大唐电信科技股份有限公司 Android平台宽窄带融合对讲语音网关控制方法及系统
CN107040637A (zh) * 2017-06-06 2017-08-11 深圳天珑无线科技有限公司 消除电流音的方法、移动终端及计算机可读存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DIMITRIOS GIANNOULIS、MICHAEL MASSBERG: "Digital Dynamic Range Compressor Design A Tutorial and Analysis", 《JOURNAL OF THE AUDIO ENGINEERING》 *
FELLOW_JING: "转载:DRC", 《博客园网页,网址:HTTPS://WWW.CNBLOGS.COM/FELLOW1988/P/7663774.HTML》 *
ZHANGLI CHEN ,ETAL.: "A revised method of calculating auditory exciation patterns and loudness for time-varying sounds", 《2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 *
于增辉等: "助听器多通道宽动态范围压缩的低功耗硬件实现", 《哈尔滨工程大学学报》 *
朱成亮等: "一种双频带压缩器的设计 ", 《广东通信技术》 *

Also Published As

Publication number Publication date
CN110120226B (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
US20210050030A1 (en) System and apparatus for real-time speech enhancement in noisy environments
CN109346096B (zh) 一种用于语音识别过程的回声消除方法及装置
CN108140395B (zh) 舒适噪声生成装置和方法
CN107134281A (zh) 一种自适应回声消除中自适应滤波器系数更新方法
US10115411B1 (en) Methods for suppressing residual echo
CN102881281A (zh) 具有低速率仿真的噪声消除系统
CN104717594B (zh) 助听系统、助听手机及其助听方法
CN104126297B (zh) 通信系统中的音频信号处理
EP4071757A1 (en) Echo cancellation method and device
KR101961998B1 (ko) 즉각적인 바람 잡음을 감소시키는 것
CN106448691A (zh) 一种用于扩音通信系统的语音增强方法
CN107071196B (zh) 一种自适应回声消除方法
US8600037B2 (en) Audio quality and double talk preservation in echo control for voice communications
CN103139688A (zh) 一种消除环境噪音的方法、装置和助听器
CN106161820A (zh) 一种用于立体声声学回声抵消的通道间去相关方法
US10277183B2 (en) Volume-dependent automatic gain control
JPH0968997A (ja) 音声処理方法及び装置
CN110120226A (zh) 一种专网集群终端语音尾噪消除方法和设备
JP4696776B2 (ja) 音声処理装置及びマイク装置
CN103096232A (zh) 一种用于助听器的频率自适应的方法和装置
CN110708651A (zh) 一种基于分段陷波的助听器啸叫检测与抑制方法及装置
CN102655558A (zh) 一种双端发音鲁棒结构及其消除声学回声的方法
JP2011045125A (ja) 音声処理装置
CN107393546B (zh) 一种用于语音识别过程的回声消除方法及语音识别设备
US20200053224A1 (en) Method for improving echo cancellation effect and system thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant