CN100548060C - Tetra集群手机语音处理方法 - Google Patents

Tetra集群手机语音处理方法 Download PDF

Info

Publication number
CN100548060C
CN100548060C CNB2006100423618A CN200610042361A CN100548060C CN 100548060 C CN100548060 C CN 100548060C CN B2006100423618 A CNB2006100423618 A CN B2006100423618A CN 200610042361 A CN200610042361 A CN 200610042361A CN 100548060 C CN100548060 C CN 100548060C
Authority
CN
China
Prior art keywords
speech
energy
voice
zero
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006100423618A
Other languages
English (en)
Other versions
CN1809197A (zh
Inventor
魏崇毓
宋道健
宋敬彬
张毅
孔志强
孙增国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Co Ltd
Qingdao Hisense Communication Co Ltd
Original Assignee
Hisense Group Co Ltd
Qingdao Hisense Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Co Ltd, Qingdao Hisense Communication Co Ltd filed Critical Hisense Group Co Ltd
Priority to CNB2006100423618A priority Critical patent/CN100548060C/zh
Publication of CN1809197A publication Critical patent/CN1809197A/zh
Application granted granted Critical
Publication of CN100548060C publication Critical patent/CN100548060C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种TETRA集群手机的语音处理方法,首先对采集到的语音数据进行活动语音判断,当为活动语音时,则对语音能量幅度进行修正,然后根据当前语音信号的能量大小调节采样麦克的增益,使采样得到的语音幅度稳定,当语音为非活动语音时,则用预先设定的背景音数据作为本次的语音采样数据,最终实现语音信号为活动语音时语音柔和,为非活动语音时听到舒适的背景音的效果。

Description

TETRA集群手机语音处理方法
技术领域
本发明属于集群通信终端技术领域,更具体地说涉及一种对TETRA集群手机的语音数据进行处理的技术领域。
背景技术
集群通信是实现移动中指挥调度通信最有效的手段之一,也是指挥调度最重要的通信方式之一。它是一种共享资源、分担费用、向用户提供优良服务的多用途、高效能的移动通信系统,集群通信系统随着技术的日趋成熟,应用越来越广泛,可以应用于智能交通、各种自然灾害的救险行动、机场民航、城市地铁等的指挥系统。
TETRA是一个强大的多功能数字集群移动通信系列标准,ETSI组织制定了TETRA标准的详细内容,其中的ETS 300 395-2规定了TETRA语音编解码的标准。上述标准并没有对语音信号的活动语音检测、能量调整等方面作出规定,
目前的TETRA集群手机存在的缺点,在于按照标准实现的系统对麦克采样获得的语音信号数据并不进行优化,直接对语音信号的原始数据进行处理,造成了语音能量起伏过大的情况:当外界语音能量高时,容易造成语音信号能量过高而尖锐刺耳,当外界的语音能量低时,则容易造成语音信号能量过低而听不清。
发明内容
本发明的目的就是为了解决目前TETRA集群手机的语音能量起伏过大的缺点,提供一种对TETRA集群手机的语音数据进行处理的方法,能够获得一种舒适的TETRA语音,本方法可以在TETRA语音编码的预处理阶段或者语音解码的后处理阶段或者预处理和后处理阶段都进行处理,对语音信号数据进行优化,使优化后的语音在TETRA手机用户通话时,听觉上达到舒适的效果。在不违背TETRA语音编解码标准的情况下很大程度上提高了语音感知上的舒适度。
为了实现上述目的,本发明包括以下步骤:
1、活动语音检测,对TETRA语音信号按帧进行阈值判断,按照语音帧的能量和语音帧的过零率进行双参数判断,采用对能量决策规则和过零率决策规则给予不同加权权重的非均匀加权决策规则;
2、若判断该语音帧为活动语音,对该语音帧的能量幅度进行调整;
3、若判断该语音帧为非活动语音,则用预存储的舒适背景音覆盖该语音帧。
其中能量决策规则包括以下步骤:
计算语音信号的能量,统计一个语音帧中全部240个数据的能量幅度值;
设置活动语音检测用的能量门限值,包括能量上限值和能量下限值,对计算出的语音信号的能量进行阈值判断;
当语音帧信号的能量大于能量上限值时,判定该语音帧为活动语音,当语音帧信号的能量小于能量下限值时,判定该语音帧为非活动语音,当语音帧信号的能量介于能量上限值和能量下限值二者之间时,状态未定。语音信号幅度值采用Q15量化。
其中过零率决策规则包括以下步骤:
计算语音信号的过零率ZCR值,统计一个语音帧中全部240个数据的ZCR值;
设置活动语音检测用的过零率门限值,包括过零率上限值和过零率下限值,对计算出的语音信号的过零率进行阈值判断;
当语音帧信号的过零率大于过零率上限值时,判定该语音帧为非活动语音,当语音帧信号的过零率小于过零率下限值时,判定该语音帧为活动语音,当语音帧的过零率介于过零率上限值和过零率下限值二者之间时,状态未定。
过零率上限制的范围是16-30,过零率下限值的范围是8-10。
非均匀加权决策规则中能量决策的权重大于过零率决策的权重。
步骤2中对活动语音信号数据的能量幅度进行调整包括如下步骤:
计算当前活动语音帧的能量幅度值;
设置能量门限值,包括门限值上限和门限值下限,对计算出的活动语音帧的能量幅度进行判断;
如果活动语音帧的能量幅度值大于门限值上限,则按照设定的语音能量减幅系数来降低此帧语音数据中各个采样值的能量幅度;
如果活动语音帧的能量幅度值小于门限值下限,则按照设定的语音能量增加系数来增加此帧语音数据中各个采样值的能量幅度;
如果活动语音帧的能量幅度值介于门限值上限和门限值下限之间,能量幅度值不变。
在TETRA语音编码的预处理阶段采用语音处理方法,在步骤2中,对语音信号数据能量幅度进行调整的同时,优选进行调整麦克的增益。
如果语音信号能量的幅度大于门限值上限,则对语音信号进行减幅处理的同时,减小麦克的增益;
如果能量的幅度小于门限值下限,则对语音信号进行增幅处理的同时,增大麦克的增益;其他情况麦克增益保持不变。
舒适背景音的构造,根据本方法所采用的硬件和一般通话环境通过试验获得一个舒适背景音样本,用此提前获得的背景音数据填充数据缓冲区。
在TETRA语音编解码处理中,在语音编码的预处理阶段或者语音解码的后处理阶段或者在语音编码的预处理阶段和语音解码的后处理阶段进行语音的能量调整和舒适背景音的产生。
采用本发明中的语音处理方法,能够实现语音信号为活动语音时语音柔和,为非活动语音时听到舒适的背景音的效果,提高了TETRA集群手机通话时用户听觉上的舒适度。
附图说明
下面结合附图和实施例对本发明作进一步的描述。
图1是本发明中的硬件连接方框图;
图2是本发明中语音数据处理的流程图;
图3是非均匀加权决策规则的语音活动检测图。
具体实施方式
如图1所示,在TETRA手机中,语音信息经麦克风或者带麦克的耳机传递给音频声码器CODEC,声码器把模拟的语音信号转换成数字信号经串行总线传输到微处理器CPU中,并在DSP芯片中进行语音数字信号的编码处理。播放声音时,数字语音信号经串行总线传递到微处理器CPU中,并在DSP芯片中进行数字解码及语音处理,然后把处理后的数字语音信号在音频声码器中转换成模拟信号,经功率放大器放大后,通过扬声器输出声音信息。其中微处理器CPU负责控制、调度系统运行。
由于TETRA语音编解码标准部分中没有对活动语音检测和能量幅度调整等处理作出规定,而目前TETRA手机没有进行语音优化的处理,按照标准实现的系统的语音效果比较差,所以本发明的技术方案是在TETRA语音编码的预处理或语音解码的后处理中对语音信号数据进行优化处理,使处理后的语音在TETRA手机用户通话时,听觉上达到舒适的效果。
如图2所示,首先对语音信号进行活动语音检测,按照检测的结果对不同的情况进行相关的处理,如果检测为活动语音,则调整语音能量的幅度;如果检测为非活动语音,则发送预构建的舒适语音信号,同时调整麦克的采样增益,使得语音的幅度始终处于一个稳定的范围,在原始语音数据的能量幅度高时语音不刺耳,语音能量幅度低时语音清晰,获得舒适的语音;舒适语音处理在DSP芯片上实现,系统负载低,计算时间短,实用性高。
对要处理的语音信号数据进行活动语音检测处理中,由于TETRA集群手机实时通信的特点,本方案中对于是否活动语音的判断是按帧进行的,即对TETRA语音信号按帧对全部240个数据进行阈值判断,按照情况将整个帧判定为活动语音或者非活动语音。
如图3所示是非均匀加权决策规则的语音活动检测,活动语音检测采用能量、过零率双参数方法进行判断,包括能量决策规则和过零率决策规则,其中能量决策规则的处理方法步骤描述如下:
1-1、计算语音信号的能量E:
计算能量E时,统计一个语音帧的全部240个能量信号的幅度值,令目前的信号为s[n],n=0,2,3.....,239,则以dB为单位,语音能量的计算方法按照理论应该如下计算:
E = 10 log 10 | Σ i = 0 239 ( s [ i ] ) 2 | ( dB )
为了便于在DSP上实现,在本方法中其能量的计算方法修正如下:
E = Σ i = 0 239 ( s [ i ] ) 2
1-2、活动语音的能量阈值判断:
选取出两个作为语音活动检测(VAD)判断用的能量门限值,第一个为能量上限值EU,第二个为能量下限值EL。当输入语音帧信号能量大于此上限值EU时,将此语音帧判定为活动语音,当输入语音帧信号的能量小于此下限值EL时,将此语音帧判定为非活动语音。令输出的结果为fE,fE值的计算方法总结成如下公式:
Figure C20061004236100073
能量门限值EU和EL的设置根据语音信号幅度值的量化方式不同而不同,当语音信号幅度值的量化采用Q15量化时,EU可在08000000h-10000000h范围内根据实际环境设置,EL则可在06000000h-04000000h范围内根据实际环境设置。
而过零率决策规则的处理方法步骤描述如下:
2-1、计算过零率ZCR:
计算过零率ZCR值时,取语音帧的全部240个数据进行计算,如下式所示:
ZCR = 1 239 Σ i = 1 239 | sign ( x [ i ] ) - sign ( x [ i - 1 ] ) |
其中函数sign(x[i])表示如下:
Figure C20061004236100082
2-2、活动语音的过零率阈值判断;
选取出两个活动语音判断用的过零率门限值,第一个为过零率下限值ZL,当输入语音帧信号的过零率小于此下限值时,将此语音帧判定为活动语音;第二个为过零率上限值ZU,当输入语音帧信号的过零率大于此上限值时,将此语音帧判定为非活动语音。令过零率决策规则输出之结果为fZCR,fZCR的计算方法总结成如下公式:
Figure C20061004236100083
由于过零率受硬件环境的影响,其门限值需要根据实际试验情况设置不同的数值,一般情况下,其参数可在如下范围内选取:过零率上限制ZU的范围在16-30之间,过零率下限值ZL的范围在8-10之间。
活动语音判断规则采用能量、过零率双参数方法,具体描述如下:
活动语音检测判断采用非均匀加权决策规则。非均匀加权决策规则的语音活动检测方法在找出上述两种决策规则的输出值后,给予其不同加权权重,得到活动语音检测参数F。上述情况可用如下的方程式表示:
F=y(fE,fZCR)
=αEfEZCRfZCR
其中αE、αZCR分别为能量决策规则和过零率决策规则输出值的加权权重。若最后计算所得的活动语音检测参数数值F大于或等于上门限值Fth时,则判断此帧语音数据为活动语音;若计算所得的数值F小于下门限值Ft1时,则判断此帧语音数据为非活动语音;位于二者之间时语音帧的状态未定。
活动语音检测的能量决策规则和过零率决策规则的加权权重值根据具体的手机硬件按照试验结果进行确定,来确定不同参数在活动语音检测中的作用,并且根据所取值来选定活动语音判定时的上下门限值。一般情况下αE、αZCR可采用非均匀权重进行计算,即αE大于αZCR;而Fth的选定范围则可以在0.5-1.0内,Ft1的选定范围则可以在0-0.5内,具体取值根据硬件情况试验确定。
活动语音检测判断后,按照活动语音检测的判定结果再分别进行不同的处理。其中语音能量信号幅度的调整步骤:
当判定此帧数据为活动语音时,对语音信号数据能量幅度进行调整。计算当前帧的能量幅度值E,与能量门限值EMU相比较,如果当前帧的能量幅度值E大于门限值上限,则按照设定的语音能量减幅系数fdec来降低此帧语音数据的各个采样值的能量幅度;如果当前帧的能量幅度值E小于下限门限值EML,则按照设定的语音能量增加系数finc来增加此帧语音数据的各个采样值的能量幅度;其他情况能量幅度值不变。
其计算公式如下:
Figure C20061004236100091
对麦克增益的调整步骤:
因为TETRA集群手机中每帧语音的时间长度为30ms,而语音信号具有短时间内的平稳性,可以认为在很短的时间间隔内,相邻两帧语音信号的能量幅度值是一致的,因此在调整语音数据信号能量的同时要调整麦克的增益。麦克的调整规则如下:增大语音信号能量幅度的同时增大麦克的增益,减小语音信号能量幅度的同时减小麦克的增益;能量幅度值不变时麦克的增益也不变。
当判定当前语音帧为静音时,从语音的连续性和通话方的感受考虑,需用预先构建的舒适背景音数据填写当前语音帧,使通话方不致感到语音间隙之间的突兀和对通话方活动通话进行提示。因为受使用的硬件环境和语音环境的影响比较大,舒适背景音的构建方式采用试验的方法获得,根据使用环境的不同语音数据的内容存在差异。
当判定当前语音帧的状态未定时,不对语音帧进行处理。
本发明中的语音处理方法使用的位置可以在语音编码的预处理阶段或者语音解码的后处理阶段,由于TETRA编解码阶段本身的运算量的不同,后处理阶段的计算量较小,所以放在语音处理的后处理阶段对系统的影响较小,是一个优选的方案。

Claims (9)

1.一种TETRA集群手机语音处理方法,其特征在于包括以下步骤:
1)活动语音检测,对TETRA语音信号按帧进行阈值判断,按照语音帧的能量和语音帧的过零率进行双参数判断,采用对能量决策规则和过零率决策规则给予不同加权权重的非均匀加权决策规则;
2)若判断该语音帧为活动语音,对该语音帧的能量幅度进行调整;
3)若判断该语音帧为非活动语音,则用预存储的舒适背景音覆盖该语音帧。
2.根据权利要求1所述的TETRA集群手机语音处理方法,其特征在于能量决策规则包括以下步骤:
计算语音信号的能量,统计一个语音帧中全部240个数据的能量幅度值;
设置活动语音检测用的能量门限值,包括能量上限值和能量下限值,对计算出的语音信号的能量进行阈值判断;
当语音帧信号的能量大于能量上限值时,判定该语音帧为活动语音,当语音帧信号的能量小于能量下限值时,判定该语音帧为非活动语音,当语音帧信号的能量介于能量上限值和能量下限值二者之间时,状态未定。
3.根据权利要求2所述的TETRA集群手机语音处理方法,其特征在于语音信号幅度值采用Q15量化。
4.根据权利要求1所述的TETRA集群手机语音处理方法,其特征在于过零率决策规则包括以下步骤:
计算语音信号的过零率ZCR值,统计一个语音帧中全部240个数据的ZCR值;
设置活动语音检测用的过零率门限值,包括过零率上限值和过零率下限值,对计算出的语音信号的过零率进行阈值判断;
当语音帧信号的过零率大于过零率上限值时,判定该语音帧为非活动语音,当语音帧信号的过零率小于过零率下限值时,判定该语音帧为活动语音,当语音帧的过零率介于过零率上限值和过零率下限值二者之间时,状态未定。
5.根据权利要求4所述的TETRA集群手机语音处理方法,其特征在于过零率上限值的范围是16-30,过零率下限值的范围是8-10。
6.根据权利要求1-5任一项权利要求所述的TETRA集群手机语音处理方法,其特征在于活动语音检测参数数值是语音帧的能量决策规则输出结果乘以能量决策的权重与过零率决策规则输出结果乘以过零率决策的权重之和,
若该语音帧的活动语音检测参数数值大于或等于上限值,则判断是活动语音,
若该语音帧的活动语音检测参数数值小于下限值,则判断是非活动语音。
7.根据权利要求1所述的TETRA集群手机语音处理方法,其特征在于非均匀加权决策规则中能量决策的权重大于过零率决策的权重。
8.根据权利要求1所述的TETRA集群手机语音处理方法,其特征在于对活动语音信号数据的能量幅度进行调整包括如下步骤:
计算当前活动语音帧的能量幅度值;
设置能量门限值,包括门限值上限和门限值下限,对计算出的活动语音帧的能量幅度进行判断;
如果活动语音帧的能量幅度值大于门限值上限,则按照设定的语音能量减幅系数来降低此帧语音数据中各个采样值的能量幅度;
如果活动语音帧的能量幅度值小于门限值下限,则按照设定的语音能量增加系数来增加此帧语音数据中各个采样值的能量幅度;
如果活动语音帧的能量幅度值介于门限值上限和门限值下限之间,能量幅度值不变。
9.根据权利要求8所述的TETRA集群手机语音处理方法,其特征在于语音处理方法的位置在语音编码预处理阶段,进行语音信号数据能量幅度调整的同时还要调整麦克的增益,
如果语音信号能量的幅度大于门限值上限,则对语音信号进行减幅处理的同时,减小麦克的增益;
如果能量的幅度小于门限值下限,则对语音信号进行增幅处理的同时,增大麦克的增益;其他情况麦克增益保持不变。
CNB2006100423618A 2006-02-06 2006-02-06 Tetra集群手机语音处理方法 Expired - Fee Related CN100548060C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100423618A CN100548060C (zh) 2006-02-06 2006-02-06 Tetra集群手机语音处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100423618A CN100548060C (zh) 2006-02-06 2006-02-06 Tetra集群手机语音处理方法

Publications (2)

Publication Number Publication Date
CN1809197A CN1809197A (zh) 2006-07-26
CN100548060C true CN100548060C (zh) 2009-10-07

Family

ID=36840839

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100423618A Expired - Fee Related CN100548060C (zh) 2006-02-06 2006-02-06 Tetra集群手机语音处理方法

Country Status (1)

Country Link
CN (1) CN100548060C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018119138A1 (en) * 2016-12-21 2018-06-28 Avnera Corporation Low-power, always-listening, voice-command detection and capture

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101998289B (zh) * 2009-08-19 2015-01-28 中兴通讯股份有限公司 一种集群终端呼叫过程中控制声音播放设备的方法及装置
CN105355197B (zh) * 2015-10-30 2020-01-07 百度在线网络技术(北京)有限公司 用于语音识别系统的增益处理方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
一种语音端点检测方法的探究. 刘庆升,徐宵鹏,黄文浩.计算机工程,第29卷第3期. 2003
一种语音端点检测方法的探究. 刘庆升,徐宵鹏,黄文浩.计算机工程,第29卷第3期. 2003 *
非连续传输模式在GSM系统中的应用. 许柄.电信快报,第2期. 2000
非连续传输模式在GSM系统中的应用. 许炳.电信快报,第2期. 2000
非连续传输模式在GSM系统中的应用. 许柄.电信快报,第2期. 2000 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018119138A1 (en) * 2016-12-21 2018-06-28 Avnera Corporation Low-power, always-listening, voice-command detection and capture
US10403279B2 (en) 2016-12-21 2019-09-03 Avnera Corporation Low-power, always-listening, voice command detection and capture
GB2573424A (en) * 2016-12-21 2019-11-06 Avnera Corp Low-power, always-listening, voice-command detection and capture
GB2573424B (en) * 2016-12-21 2022-06-29 Avnera Corp Low-power, always-listening, voice-command detection and capture

Also Published As

Publication number Publication date
CN1809197A (zh) 2006-07-26

Similar Documents

Publication Publication Date Title
TW586303B (en) Enhancing the intelligibility of received speech in a noisy environment
JP4307557B2 (ja) 音声活性度検出器
US6223154B1 (en) Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds
CN103247295B (zh) 用于频谱对比加强的系统、方法、设备
CN101213591B (zh) 用于非连续语音传输期间的舒适噪声参数自适应传输的系统和方法
CN102057427B (zh) 用于加强可懂度的方法和设备
CN101505448B (zh) 适应于声环境中的特定类型话音的助听器及相应方法
US6711258B1 (en) Apparatus and method for controlling a volume in a digital telephone
JP4649546B2 (ja) 補聴器
KR101068227B1 (ko) 명료도 향상장치와 이를 이용한 음성출력장치
US20150334215A1 (en) Far-end sound quality indication for telephone devices
CN103247294A (zh) 信号处理设备、方法、系统和通信终端
CN101669284A (zh) 移动音频装置的自动音量及动态范围调整
US6122531A (en) Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode
CN102781075A (zh) 一种降低移动终端通话功耗的方法及移动终端
CN103379231A (zh) 一种无线会议电话及其进行语音信号传递的方法
WO2013078677A1 (zh) 一种自适应调节音效的方法和设备
CN100548060C (zh) Tetra集群手机语音处理方法
CN112203188B (zh) 一种自动音量调节方法
CN102006349A (zh) 会议模式下增强手机通话质量的方法及其实现装置
CN103871416B (zh) 语音处理设备及语音处理方法
US7002069B2 (en) Balancing MIDI instrument volume levels
CN108133712A (zh) 一种处理音频数据的方法和装置
US20110071821A1 (en) Receiver intelligibility enhancement system
US20130030799A1 (en) Acoustic shock protection device and method thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091007

Termination date: 20190206

CF01 Termination of patent right due to non-payment of annual fee