CN109243498B - 一种基于fft语音信号的端点检测系统及检测方法 - Google Patents

一种基于fft语音信号的端点检测系统及检测方法 Download PDF

Info

Publication number
CN109243498B
CN109243498B CN201811383442.3A CN201811383442A CN109243498B CN 109243498 B CN109243498 B CN 109243498B CN 201811383442 A CN201811383442 A CN 201811383442A CN 109243498 B CN109243498 B CN 109243498B
Authority
CN
China
Prior art keywords
voice
integrated circuit
circuit module
signal processor
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811383442.3A
Other languages
English (en)
Other versions
CN109243498A (zh
Inventor
倪高红
姚力
许琴
钱垚
耿小磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing LES Information Technology Co. Ltd
Original Assignee
Nanjing LES Information Technology Co. Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing LES Information Technology Co. Ltd filed Critical Nanjing LES Information Technology Co. Ltd
Priority to CN201811383442.3A priority Critical patent/CN109243498B/zh
Publication of CN109243498A publication Critical patent/CN109243498A/zh
Application granted granted Critical
Publication of CN109243498B publication Critical patent/CN109243498B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种基于FFT语音信号的端点检测系统及检测方法,包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台;其中语音信号数据经AIC23采样转换为数字信号后,直接进入FPGA的FFT内核模块,由硬件电路实现FFT,速度快,系统延迟小,其中通过FPGA多了一次语音信号预处理程序,提高语音端点检测的准确率。

Description

一种基于FFT语音信号的端点检测系统及检测方法
技术领域
本专利属于语音信号数据处理技术领域,涉及到无线电台与有线电话转接技术。
背景技术
语音信号的端点检测,应用于电台与有限电话转接。无线电台与有线电话的语音转接器,广泛应用于海港码头语音调度、海岸电台SSB RT业务以及应急指挥通信的语音调度等。电话语音经转接器输入至电台,同时还需要送给电台一个同步的键控PTT信号,这就需要对语音信号的到来与结束的端点进行判断。
对于语音信号的端点检测,现有技术中一般采用短时能量检测法。对于没有噪声的语音信号而言,短时能量检测法检测语音的端点,检测的准确率较高;然而,对于含有大量噪声的语音,短时能量检测法检测语音的端点,就不合适了。调幅制式的短波电台输出的声音含有能量较大的白噪声,噪声的功率谱密度在整个频域内均匀分布,利用短时能量检测法,不可能准确检测出这样语音信号的端点。
故,需要一种新的技术方案以解决上述技术问题。
发明内容
发明目的:本发明的目的在于提供一种基于FFT语音信号的端点检测系统,以提高语音端点检测的准确率。
本发明还提供一种基于FFT语音信号的端点检测方法,同样以提高语音端点检测的准确率。
技术方案:为实现上述发明目的,本发明可采用以下技术方案:
一种基于FFT语音信号的端点检测系统,包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台;
所述输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束;
当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。
进一步的,还包括W5300网口集成电路模块,当语音结束端点到来时,触发W5300网口集成电路模块中断。
进一步的,W5300网口集成电路连接有一个IP化电台。
有益效果:本发明的检测系统硬件电路采用了FPGA,经AIC23采样转换为数字信号后,直接进入FPGA的FFT内核模块,由硬件电路实现FFT,速度快,系统延迟小,其中通过FPGA多了一次语音信号预处理程序,提高语音端点检测的准确率。
本发明提供的一种基于FFT语音信号的端点检测方法可采用以下技术方案,包括以下步骤:
(1)、通过一个输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
(2)、通过数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入一个FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;
(3)、数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束。
(4)、当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。
当语音结束端点到来时,触发W5300网口集成电路模块中断。
有益效果:本发明的检测方法硬件电路采用了FPGA,经AIC23采样转换为数字信号后,直接进入FPGA的FFT内核模块,由硬件电路实现FFT,速度快,系统延迟小,其中通过FPGA多了一次语音信号预处理程序,提高语音端点检测的准确率。在利用短时能量法判断语音端点时,采用滑动语音帧的算法,判断准确,算法优化。
附图说明
图1为本发明语音信号端点检测硬件原理图。
图2为语音信号端点检测方法的流程图。
具体实施方式
下面,结合附图对本发明做进一步详细说明。
请结合图1所示,本发明提供一种基于FFT语音信号的端点检测系统,包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台、W5300网口集成电路模块。其中数字信号处理器选择TI公司数字信号处理器TMS320F28335、FPGA选择Altera公司FPGA、专用语音集成电路选择TI公司AIC23专用语音集成电路。
请结合图2所示,所述输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器。数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束。
当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。当语音结束端点到来时,触发W5300网口集成电路模块中断。W5300网口集成电路连接有一个IP化电台。
请结合图1及图2所示,本发明提供的一种基于FFT语音信号的端点检测方法,包括以下步骤:
(1)、通过一个输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
(2)、通过数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入一个FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;
(3)、数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束。为了加快运算速度,减小延迟,在软件处理上,采用滑动窗的方式,窗口的宽度为1024个语音序列,每处理完这1024个数据,滑动到下一窗数据。1024点语音序列划分为32帧,每帧为32个语音数据。每帧的能量为:
Figure BDA0001872422640000041
根据每帧的能量判定语音端点。
(4)、当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。当语音结束端点到来时,触发W5300网口集成电路模块中断。

Claims (5)

1.一种基于FFT语音信号的端点检测系统,其特征在于,包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台;
所述输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束;
当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。
2.根据权利要求1所述的端点检测系统,其特征在于:还包括W5300网口集成电路模块,当语音结束端点到来时,触发W5300网口集成电路模块中断。
3.根据权利要求2所述的端点检测系统,其特征在于:W5300网口集成电路连接有一个IP化电台。
4.一种基于FFT语音信号的端点检测方法,其特征在于,包括以下步骤:
(1)、通过一个输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
(2)、通过数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入一个FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;
(3)、数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束;
(4)、当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。
5.根据权利要求4所述的基于FFT语音信号的端点检测方法,其特征在于:当语音结束端点到来时,触发W5300网口集成电路模块中断。
CN201811383442.3A 2018-11-20 2018-11-20 一种基于fft语音信号的端点检测系统及检测方法 Active CN109243498B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811383442.3A CN109243498B (zh) 2018-11-20 2018-11-20 一种基于fft语音信号的端点检测系统及检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811383442.3A CN109243498B (zh) 2018-11-20 2018-11-20 一种基于fft语音信号的端点检测系统及检测方法

Publications (2)

Publication Number Publication Date
CN109243498A CN109243498A (zh) 2019-01-18
CN109243498B true CN109243498B (zh) 2023-03-14

Family

ID=65075207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811383442.3A Active CN109243498B (zh) 2018-11-20 2018-11-20 一种基于fft语音信号的端点检测系统及检测方法

Country Status (1)

Country Link
CN (1) CN109243498B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112185426B (zh) * 2020-09-30 2022-12-27 青岛信芯微电子科技股份有限公司 一种语音端点检测设备及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101599269A (zh) * 2009-07-02 2009-12-09 中国农业大学 语音端点检测方法及装置
CN202563884U (zh) * 2011-11-18 2012-11-28 深圳市派高模业有限公司 语音识别处理器及智能设备
CN103886871A (zh) * 2014-01-28 2014-06-25 华为技术有限公司 语音端点的检测方法和装置
CN204305018U (zh) * 2014-12-10 2015-04-29 中国人民解放军63888部队 一种短波通信自适应频率自动获取和输入系统
CN105118502A (zh) * 2015-07-14 2015-12-02 百度在线网络技术(北京)有限公司 语音识别系统的端点检测方法及系统
KR20180021531A (ko) * 2016-08-22 2018-03-05 에스케이텔레콤 주식회사 심층 신경망을 이용한 음성 끝점 검출 방법 및 이를 위한 끝점 검출 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101599269A (zh) * 2009-07-02 2009-12-09 中国农业大学 语音端点检测方法及装置
CN202563884U (zh) * 2011-11-18 2012-11-28 深圳市派高模业有限公司 语音识别处理器及智能设备
CN103886871A (zh) * 2014-01-28 2014-06-25 华为技术有限公司 语音端点的检测方法和装置
CN204305018U (zh) * 2014-12-10 2015-04-29 中国人民解放军63888部队 一种短波通信自适应频率自动获取和输入系统
CN105118502A (zh) * 2015-07-14 2015-12-02 百度在线网络技术(北京)有限公司 语音识别系统的端点检测方法及系统
KR20180021531A (ko) * 2016-08-22 2018-03-05 에스케이텔레콤 주식회사 심층 신경망을 이용한 음성 끝점 검출 방법 및 이를 위한 끝점 검출 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于滑动窗口的语音端点检测算法;余洪涌 等;《微计算机应用》;20061130;第27卷(第6期);第641-645页 *

Also Published As

Publication number Publication date
CN109243498A (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
US9972343B1 (en) Multi-step validation of wakeup phrase processing
CN102160296B (zh) 双端通话检测方法及装置
CN103632676B (zh) 一种低信噪比语音降噪方法
CN104883437B (zh) 基于环境的语音分析调整提示音量的方法及系统
US8515748B2 (en) Mobile phone communication gap recovery
CN102543090B (zh) 一种应用于变速率语音和音频编码的码率自动控制系统
CN101641735B (zh) 估计通信系统中的噪声电平的方法
CN107154256B (zh) 基于声源定位的声掩蔽系统及自适应调整方法
CN110351766B (zh) 针对5g nr进行多小区盲检及测量处理的方法
CN202384000U (zh) 语音处理装置、车载终端设备
CN109243498B (zh) 一种基于fft语音信号的端点检测系统及检测方法
CN108231088B (zh) 一种应用于语音数字信号的快速自动增益控制方法和装置
CN102137194A (zh) 一种通话检测方法及装置
CN104269177A (zh) 一种语音处理方法及电子设备
CN102307271A (zh) 网络数字一体对讲系统及其传输方法
CN102608931B (zh) 一种电子设备的控制系统及控制方法
CN107958671B (zh) 一种执法记录仪的回声消除装置
CN101950564A (zh) 一种远程数字化语音采集分析识别系统
CN103581447A (zh) 一种信号处理的方法、装置和电子设备
CN201323602Y (zh) 一种处理语音的设备、数据卡和通信设备
CN107835067A (zh) 基于可编程器件的goose报文接收风暴抑制方法
CN101826328A (zh) 嵌入式无线可视门铃中的回音抵消方法
CN103236863B (zh) 采用了硬限幅器的fm数字调制解调电路的静噪处理方法
CN105915293A (zh) 一种基于无线声波信号的声音数字信息传输系统及方法
CN208445563U (zh) 一种高速水声语音通信系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant