CN109243498B - 一种基于fft语音信号的端点检测系统及检测方法 - Google Patents
一种基于fft语音信号的端点检测系统及检测方法 Download PDFInfo
- Publication number
- CN109243498B CN109243498B CN201811383442.3A CN201811383442A CN109243498B CN 109243498 B CN109243498 B CN 109243498B CN 201811383442 A CN201811383442 A CN 201811383442A CN 109243498 B CN109243498 B CN 109243498B
- Authority
- CN
- China
- Prior art keywords
- voice
- integrated circuit
- circuit module
- signal processor
- digital signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title description 5
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000001960 triggered effect Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供一种基于FFT语音信号的端点检测系统及检测方法,包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台;其中语音信号数据经AIC23采样转换为数字信号后,直接进入FPGA的FFT内核模块,由硬件电路实现FFT,速度快,系统延迟小,其中通过FPGA多了一次语音信号预处理程序,提高语音端点检测的准确率。
Description
技术领域
本专利属于语音信号数据处理技术领域,涉及到无线电台与有线电话转接技术。
背景技术
语音信号的端点检测,应用于电台与有限电话转接。无线电台与有线电话的语音转接器,广泛应用于海港码头语音调度、海岸电台SSB RT业务以及应急指挥通信的语音调度等。电话语音经转接器输入至电台,同时还需要送给电台一个同步的键控PTT信号,这就需要对语音信号的到来与结束的端点进行判断。
对于语音信号的端点检测,现有技术中一般采用短时能量检测法。对于没有噪声的语音信号而言,短时能量检测法检测语音的端点,检测的准确率较高;然而,对于含有大量噪声的语音,短时能量检测法检测语音的端点,就不合适了。调幅制式的短波电台输出的声音含有能量较大的白噪声,噪声的功率谱密度在整个频域内均匀分布,利用短时能量检测法,不可能准确检测出这样语音信号的端点。
故,需要一种新的技术方案以解决上述技术问题。
发明内容
发明目的:本发明的目的在于提供一种基于FFT语音信号的端点检测系统,以提高语音端点检测的准确率。
本发明还提供一种基于FFT语音信号的端点检测方法,同样以提高语音端点检测的准确率。
技术方案:为实现上述发明目的,本发明可采用以下技术方案:
一种基于FFT语音信号的端点检测系统,包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台;
所述输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束;
当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。
进一步的,还包括W5300网口集成电路模块,当语音结束端点到来时,触发W5300网口集成电路模块中断。
进一步的,W5300网口集成电路连接有一个IP化电台。
有益效果:本发明的检测系统硬件电路采用了FPGA,经AIC23采样转换为数字信号后,直接进入FPGA的FFT内核模块,由硬件电路实现FFT,速度快,系统延迟小,其中通过FPGA多了一次语音信号预处理程序,提高语音端点检测的准确率。
本发明提供的一种基于FFT语音信号的端点检测方法可采用以下技术方案,包括以下步骤:
(1)、通过一个输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
(2)、通过数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入一个FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;
(3)、数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束。
(4)、当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。
当语音结束端点到来时,触发W5300网口集成电路模块中断。
有益效果:本发明的检测方法硬件电路采用了FPGA,经AIC23采样转换为数字信号后,直接进入FPGA的FFT内核模块,由硬件电路实现FFT,速度快,系统延迟小,其中通过FPGA多了一次语音信号预处理程序,提高语音端点检测的准确率。在利用短时能量法判断语音端点时,采用滑动语音帧的算法,判断准确,算法优化。
附图说明
图1为本发明语音信号端点检测硬件原理图。
图2为语音信号端点检测方法的流程图。
具体实施方式
下面,结合附图对本发明做进一步详细说明。
请结合图1所示,本发明提供一种基于FFT语音信号的端点检测系统,包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台、W5300网口集成电路模块。其中数字信号处理器选择TI公司数字信号处理器TMS320F28335、FPGA选择Altera公司FPGA、专用语音集成电路选择TI公司AIC23专用语音集成电路。
请结合图2所示,所述输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器。数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束。
当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。当语音结束端点到来时,触发W5300网口集成电路模块中断。W5300网口集成电路连接有一个IP化电台。
请结合图1及图2所示,本发明提供的一种基于FFT语音信号的端点检测方法,包括以下步骤:
(1)、通过一个输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
(2)、通过数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入一个FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;
(3)、数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束。为了加快运算速度,减小延迟,在软件处理上,采用滑动窗的方式,窗口的宽度为1024个语音序列,每处理完这1024个数据,滑动到下一窗数据。1024点语音序列划分为32帧,每帧为32个语音数据。每帧的能量为:根据每帧的能量判定语音端点。
(4)、当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。当语音结束端点到来时,触发W5300网口集成电路模块中断。
Claims (5)
1.一种基于FFT语音信号的端点检测系统,其特征在于,包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台;
所述输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束;
当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。
2.根据权利要求1所述的端点检测系统,其特征在于:还包括W5300网口集成电路模块,当语音结束端点到来时,触发W5300网口集成电路模块中断。
3.根据权利要求2所述的端点检测系统,其特征在于:W5300网口集成电路连接有一个IP化电台。
4.一种基于FFT语音信号的端点检测方法,其特征在于,包括以下步骤:
(1)、通过一个输入语音集成电路模块将输入的语音A/D变换后输入给数字信号处理器;
(2)、通过数字信号处理器读取语音集成电路模块输入的语音数字序列1024个,然后写入一个FPGA的FFT内核,经FFT变换后进行数字语音预处理,抑制噪声;
(3)、数字信号处理器将1024序列划分32帧,每帧包含32个数据,运算出语音帧的能量,当超过设定的能量阈值,判定为语音的到来,当小于设定的能量阈值,判定为语音的结束;
(4)、当语音到来时,数字信号处理器将其中的一个GPIO设置为低电平,连接到无线电台的键控PPT,同时通过输出语音集成电路模块将语音输入至无线电台,启动无线电台发射;当语音结束端点到来时,数字信号处理器将该GPIO设置为高电平,无线电台关闭功率放大器。
5.根据权利要求4所述的基于FFT语音信号的端点检测方法,其特征在于:当语音结束端点到来时,触发W5300网口集成电路模块中断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811383442.3A CN109243498B (zh) | 2018-11-20 | 2018-11-20 | 一种基于fft语音信号的端点检测系统及检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811383442.3A CN109243498B (zh) | 2018-11-20 | 2018-11-20 | 一种基于fft语音信号的端点检测系统及检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109243498A CN109243498A (zh) | 2019-01-18 |
CN109243498B true CN109243498B (zh) | 2023-03-14 |
Family
ID=65075207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811383442.3A Active CN109243498B (zh) | 2018-11-20 | 2018-11-20 | 一种基于fft语音信号的端点检测系统及检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109243498B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112185426B (zh) * | 2020-09-30 | 2022-12-27 | 青岛信芯微电子科技股份有限公司 | 一种语音端点检测设备及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599269A (zh) * | 2009-07-02 | 2009-12-09 | 中国农业大学 | 语音端点检测方法及装置 |
CN202563884U (zh) * | 2011-11-18 | 2012-11-28 | 深圳市派高模业有限公司 | 语音识别处理器及智能设备 |
CN103886871A (zh) * | 2014-01-28 | 2014-06-25 | 华为技术有限公司 | 语音端点的检测方法和装置 |
CN204305018U (zh) * | 2014-12-10 | 2015-04-29 | 中国人民解放军63888部队 | 一种短波通信自适应频率自动获取和输入系统 |
CN105118502A (zh) * | 2015-07-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别系统的端点检测方法及系统 |
KR20180021531A (ko) * | 2016-08-22 | 2018-03-05 | 에스케이텔레콤 주식회사 | 심층 신경망을 이용한 음성 끝점 검출 방법 및 이를 위한 끝점 검출 장치 |
-
2018
- 2018-11-20 CN CN201811383442.3A patent/CN109243498B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599269A (zh) * | 2009-07-02 | 2009-12-09 | 中国农业大学 | 语音端点检测方法及装置 |
CN202563884U (zh) * | 2011-11-18 | 2012-11-28 | 深圳市派高模业有限公司 | 语音识别处理器及智能设备 |
CN103886871A (zh) * | 2014-01-28 | 2014-06-25 | 华为技术有限公司 | 语音端点的检测方法和装置 |
CN204305018U (zh) * | 2014-12-10 | 2015-04-29 | 中国人民解放军63888部队 | 一种短波通信自适应频率自动获取和输入系统 |
CN105118502A (zh) * | 2015-07-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别系统的端点检测方法及系统 |
KR20180021531A (ko) * | 2016-08-22 | 2018-03-05 | 에스케이텔레콤 주식회사 | 심층 신경망을 이용한 음성 끝점 검출 방법 및 이를 위한 끝점 검출 장치 |
Non-Patent Citations (1)
Title |
---|
一种基于滑动窗口的语音端点检测算法;余洪涌 等;《微计算机应用》;20061130;第27卷(第6期);第641-645页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109243498A (zh) | 2019-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9972343B1 (en) | Multi-step validation of wakeup phrase processing | |
CN102160296B (zh) | 双端通话检测方法及装置 | |
CN103632676B (zh) | 一种低信噪比语音降噪方法 | |
CN104883437B (zh) | 基于环境的语音分析调整提示音量的方法及系统 | |
US8515748B2 (en) | Mobile phone communication gap recovery | |
CN102543090B (zh) | 一种应用于变速率语音和音频编码的码率自动控制系统 | |
CN101641735B (zh) | 估计通信系统中的噪声电平的方法 | |
CN107154256B (zh) | 基于声源定位的声掩蔽系统及自适应调整方法 | |
CN110351766B (zh) | 针对5g nr进行多小区盲检及测量处理的方法 | |
CN202384000U (zh) | 语音处理装置、车载终端设备 | |
CN109243498B (zh) | 一种基于fft语音信号的端点检测系统及检测方法 | |
CN108231088B (zh) | 一种应用于语音数字信号的快速自动增益控制方法和装置 | |
CN102137194A (zh) | 一种通话检测方法及装置 | |
CN104269177A (zh) | 一种语音处理方法及电子设备 | |
CN102307271A (zh) | 网络数字一体对讲系统及其传输方法 | |
CN102608931B (zh) | 一种电子设备的控制系统及控制方法 | |
CN107958671B (zh) | 一种执法记录仪的回声消除装置 | |
CN101950564A (zh) | 一种远程数字化语音采集分析识别系统 | |
CN103581447A (zh) | 一种信号处理的方法、装置和电子设备 | |
CN201323602Y (zh) | 一种处理语音的设备、数据卡和通信设备 | |
CN107835067A (zh) | 基于可编程器件的goose报文接收风暴抑制方法 | |
CN101826328A (zh) | 嵌入式无线可视门铃中的回音抵消方法 | |
CN103236863B (zh) | 采用了硬限幅器的fm数字调制解调电路的静噪处理方法 | |
CN105915293A (zh) | 一种基于无线声波信号的声音数字信息传输系统及方法 | |
CN208445563U (zh) | 一种高速水声语音通信系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |