CN111063362B - 一种数字语音通信噪音消除和语音恢复方法及装置 - Google Patents

一种数字语音通信噪音消除和语音恢复方法及装置 Download PDF

Info

Publication number
CN111063362B
CN111063362B CN201911264004.XA CN201911264004A CN111063362B CN 111063362 B CN111063362 B CN 111063362B CN 201911264004 A CN201911264004 A CN 201911264004A CN 111063362 B CN111063362 B CN 111063362B
Authority
CN
China
Prior art keywords
voice
module
data
channel
synchronization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911264004.XA
Other languages
English (en)
Other versions
CN111063362A (zh
Inventor
许志强
廖蓉晖
吴东海
唐文
卿昱
李鉴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 30 Research Institute
Original Assignee
CETC 30 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 30 Research Institute filed Critical CETC 30 Research Institute
Priority to CN201911264004.XA priority Critical patent/CN111063362B/zh
Publication of CN111063362A publication Critical patent/CN111063362A/zh
Application granted granted Critical
Publication of CN111063362B publication Critical patent/CN111063362B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种数字语音通信噪音消除和语音恢复方法及装置,所述方法包括:正常数字语音通信过程中接收到的待播放的语音数据经过语音数据缓存模块缓存后进行播放;其中,语音数据缓存模块的语音数据缓存时间大于失步检测时间;当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道;当语音同步判决模块判决语音同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信。本发明在语音失步而产生噪音后,可以完全消除接收端听到的噪音;同时不会中断通信,极大的提升了用户体验。

Description

一种数字语音通信噪音消除和语音恢复方法及装置
技术领域
本发明属于通信技术领域,特别涉及一种数字语音通信噪音消除和语音恢复方法及装置。
背景技术
目前,数字语音通信已经广泛应用于通讯、多媒体网络以及各种消费类产品等诸多领域。与模拟语音通信相比,数字语音通信具有抗干扰能力强,且噪音不积累,便于处理、变换、存储,易于集成,使通信设备微型化、轻量化,易于加密处理且保密性好等优点。但数字语音通信对同步要求高,当数字语音传输过程中发生数据失步时,通信双方的语音数据会发生不规律的跳变,这将在语音通信中出现大量噪音,极大影响用户体验。针对数字语音通信中因失步而产生的噪音,如图1所示,目前大多数噪音消除方法是通过失步检测算法检测到失步后重新启动通信流程来消除噪音。
目前的噪音消除方法虽然能在产生噪音后通过重启通信流程的方式消除噪音,但由于在失步检测过程和重启通话流程中接收端将接收到的已失步的噪音数据进行解码播放,用户会听到刺耳的噪音,同时目前的噪音消除方法通过重启通信流程的方式来消除噪音,重启通信流程时间过长会导致通信中断,极大影响用户体验。
发明内容
本发明的目的在于:针对上述技术问题,本发明提供一种数字语音通信噪音消除和语音恢复方法及装置,通过设置语音数据缓存时间和控制语音通道切换,在语音失步而产生噪音后,可以完全消除接收端听到的噪音;同时不会中断通信。
本发明提供的一种数字语音通信噪音消除和语音恢复方法,包括:
正常数字语音通信过程中接收到的待播放的语音数据经过语音数据缓存模块缓存后进行播放;其中,语音数据缓存模块的语音数据缓存时间大于失步检测时间;
当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道;
当语音同步判决模块判决语音同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信。
本发明还提供一种数字语音通信噪音消除和语音恢复装置,包括:
语音数据缓存模块,用于缓存设定时间的正常数字语音通信过程中播放接收到的待播放的语音数据;其中,语音数据缓存模块的语音数据缓存时间大于失步检测时间;
语音通道切换模块,用于切换语音通道;
语音同步判决模块,用于在检测到失步时,控制语音通道切换模块将语音通道切换为舒适音通道;以及用于在判决语音同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、本发明提供一种数字语音通信噪音消除和语音恢复方法及装置,通过设置语音数据缓存时间和控制语音通道切换,在语音失步而产生噪音后,可以完全消除接收端听到的噪音;同时在失步后启动语音同步判决,判决语音同步后控制语音通道切换为语音数据通道,恢复正常通信,不会影响通话系统的正常使用,具有较好的实用性,极大的提升了用户体验。
2、本发明支持多种数据传输类型,也支持根据实际需求设置数据缓存时间,可直接嵌入到现有的数字语音通信系统中,方便用户使用。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是现有技术的数字语音通信的噪音消除方法示意图。
图2是本发明的原理图。
图3是本发明的语音数据缓存示意图。
图4是本发明的语音通道切换示意图。
图5是本发明的语音同步判决流程框图。
图6是应用本发明的示例应用场景图。
具体实施方式
如图2所示,本发明的一种数字语音通信噪音消除和语音恢复方法,包括:
正常数字语音通信过程中接收到的待播放的语音数据经过语音数据缓存模块缓存后进行播放;其中,语音数据缓存模块的语音数据缓存时间大于失步检测时间;
当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道;由于语音数据缓存时间大于失步检测时间,即使出现失步而引起噪音,语音接收端完全不会听到噪音;
当语音同步判决模块判决语音同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信。
通过上述可知,本发明的一种数字语音通信噪音消除和语音恢复方法,包括语音数据缓存、语音通道切换、语音同步判决3个部分:
(1)语音数据缓存
如图3所示,所述语音数据缓存模块需在语音通信前配置数据传输类型和语音数据缓存时间,根据配置参数在语音通信中实现语音数据输入和数据缓存功能。
所述数据传输类型支持目前数字语音通信中常用的数据传输类型,包括1位串行数据流、8位并行数据流和16位并行数据流。语音数据缓存模块为这三种数据类型均留有数据输入接口,只需配置适合当前数字语音通信的数据传输类型即可。
语音数据进入语音数据缓存模块后,根据数据缓存模块的缓存区内数据缓存时间将语音数据缓存,实现一段固定时间的语音数据缓存。
(2)语音通道切换
如图4所示,采用FLASH或文件存放舒适音音频数据;通信双方正常通话时,语音通道切换模块输出缓存后待解码的语音数据,接收端听到正常语音。当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道的方法为:当检测到失步时,语音同步判决模块控制语音通道切换模块读取FLASH或文件中存放的舒适音音频数据。其中,所述舒适音可以根据需求进行设置,可以是舒适音乐、舒适静音或提示音等。
(3)语音同步判决
如图5所示,所述语音同步判决模块判决语音同步的方法为:采用同步判决超时定时器进行判断,所述同步判决超时定时器预设有超时时间;当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道后,同时启动同步判决超时定时器,若所述同步判决超时定时器在预设的超时时间内没有再检测到失步,则判决为语音已同步;若所述同步判决超时定时器在预设的超时时间内再次检测到失步,则重启所述同步判决超时定时器,直至所述同步判决超时定时器在预设的超时时间内没有再检测到失步,则判决为语音已同步;在判决为语音已同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信。
根据上述的数字语音通信噪音消除和语音恢复方法,本发明还提供一种数字语音通信噪音消除和语音恢复装置,如图2所述,本发明的数字语音通信噪音消除和语音恢复装置,包括:语音数据缓存模块、语音通道切换模块、语音同步判决模块3个部分:
语音数据缓存模块,用于缓存设定时间的正常数字语音通信过程中播放接收到的待播放的语音数据;其中,语音数据缓存模块的语音数据缓存时间大于失步检测时间;
语音通道切换模块,用于切换语音通道;
语音同步判决模块,用于在检测到失步时,控制语音通道切换模块将语音通道切换为舒适音通道;以及用于在判决语音同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信。
如图3所示,所述语音数据缓存模块包括参数配置模块、数据类型选择模块和数据缓存模块;所述参数配置模块用于在语音通信前,控制数据类型选择模块配置数据传输类型,并控制数据缓存模块配置语音数据缓存时间。
进一步,所述数据类型选择模块配置的数据传输类型包括1位串行数据流、8位并行数据流和16位并行数据流。
如图4所示,所述数字语音通信噪音消除和语音恢复装置采用FLASH或文件存放舒适音音频数据;所述语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道的方法为:当检测到失步时,语音同步判决模块控制语音通道切换模块读取FLASH或文件中存放的舒适音音频数据。
为更好的阐述本发明的应用模式,以下将详细介绍一种应用场景。
如图6所示,数字语音通信设备1(以下简称“设备1”)和数字语音通信设备2(以下简称“设备2”)进行通话,设备1为语音发送端,设备2为语音接收端。设备1的语音数据经过编码发送,经通信传输线路发送至设备2,设备2中嵌入了本发明的数字语音通信噪音消除和语音恢复方法,设置接收端语音数据输入方式为1位串行数据流,语音数据缓存时间为40ms,同步判决超时定时器预设的的超时时间为1s。
若语音通话正常,设备2的接收端收到正常的通话语音;若通话中出现失步,失步检测模块可以在20ms内检测到失步,噪音消除和语音恢复装置将接收端语音通道切换为舒适音通道(舒适音乐、舒适静音或提示音等),同时启动语音同步判决模块判决是否同步,若1s内没有检测到失步,则判决为语音已同步,将接收端语音通道切换为语音数据通道,恢复语音通信,此时基本不会影响正常通话;若1s内再次检测到失步,则重启同步判决超时定时器,待判决为语音已同步后将接收端语音通道切换为语音数据通道,恢复语音通信。在整个失步过程中,由于数据缓存时间40ms大于失步检测时间20ms,接收方完全不会听到噪音,提升了通话中发生失步后的用户体验。

Claims (8)

1.一种数字语音通信噪音消除和语音恢复方法,其特征在于,包括:
正常数字语音通信过程中接收到的待播放的语音数据经过语音数据缓存模块缓存后进行播放;其中,语音数据缓存模块的语音数据缓存时间大于失步检测时间;
当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道;
当语音同步判决模块判决语音同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信,其中:
所述语音同步判决模块判决语音同步的方法为:采用同步判决超时定时器进行判断,所述同步判决超时定时器预设有超时时间;当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道后,同时启动同步判决超时定时器,若所述同步判决超时定时器在预设的超时时间内没有再检测到失步,则判决为语音已同步;若所述同步判决超时定时器在预设的超时时间内再次检测到失步,则重启所述同步判决超时定时器,直至所述同步判决超时定时器在预设的超时时间内没有再检测到失步,则判决为语音已同步;在判决为语音已同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信。
2.根据权利要求1所述的数字语音通信噪音消除和语音恢复方法,其特征在于,所述语音数据缓存模块需在语音通信前配置数据传输类型和语音数据缓存时间。
3.根据权利要求2所述的数字语音通信噪音消除和语音恢复方法,其特征在于,所述数据传输类型包括1位串行数据流、8位并行数据流和16位并行数据流。
4.根据权利要求1所述的数字语音通信噪音消除和语音恢复方法,其特征在于,采用FLASH或文件存放舒适音音频数据;当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道的方法为:当检测到失步时,语音同步判决模块控制语音通道切换模块读取FLASH或文件中存放的舒适音音频数据。
5.一种数字语音通信噪音消除和语音恢复装置,其特征在于,包括:
语音数据缓存模块,用于缓存设定时间的正常数字语音通信过程中播放接收到的待播放的语音数据;其中,语音数据缓存模块的语音数据缓存时间大于失步检测时间;
语音通道切换模块,用于切换语音通道;
语音同步判决模块,用于在检测到失步时,控制语音通道切换模块将语音通道切换为舒适音通道;以及用于在判决语音同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信,其中:
所述语音同步判决模块判决语音同步的方法为:采用同步判决超时定时器进行判断,所述同步判决超时定时器预设有超时时间;当检测到失步时,语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道,同时启动同步判决超时定时器,若所述同步判决超时定时器在预设的超时时间内没有再检测到失步,则判决为语音已同步;若所述同步判决超时定时器在预设的超时时间内再次检测到失步,则重启所述同步判决超时定时器,直至所述同步判决超时定时器在预设的超时时间内没有再检测到失步,则判决为语音已同步;在判决为语音已同步后,语音同步判决模块控制语音通道切换模块将语音通道切换为语音数据通道,恢复正常数字语音通信。
6.根据权利要求5所述的数字语音通信噪音消除和语音恢复装置,其特征在于,所述语音数据缓存模块包括参数配置模块、数据类型选择模块和数据缓存模块;所述参数配置模块用于在语音通信前,控制数据类型选择模块配置数据传输类型,并控制数据缓存模块配置语音数据缓存时间。
7.根据权利要求6所述的数字语音通信噪音消除和语音恢复装置,其特征在于,所述数据类型选择模块配置的数据传输类型包括1位串行数据流、8位并行数据流和16位并行数据流。
8.根据权利要求5所述的数字语音通信噪音消除和语音恢复装置,其特征在于,所述数字语音通信噪音消除和语音恢复装置采用FLASH或文件存放舒适音音频数据;所述语音同步判决模块控制语音通道切换模块将语音通道切换为舒适音通道的方法为:当检测到失步时,语音同步判决模块控制语音通道切换模块读取FLASH或文件中存放的舒适音音频数据。
CN201911264004.XA 2019-12-11 2019-12-11 一种数字语音通信噪音消除和语音恢复方法及装置 Active CN111063362B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911264004.XA CN111063362B (zh) 2019-12-11 2019-12-11 一种数字语音通信噪音消除和语音恢复方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911264004.XA CN111063362B (zh) 2019-12-11 2019-12-11 一种数字语音通信噪音消除和语音恢复方法及装置

Publications (2)

Publication Number Publication Date
CN111063362A CN111063362A (zh) 2020-04-24
CN111063362B true CN111063362B (zh) 2022-03-22

Family

ID=70300599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911264004.XA Active CN111063362B (zh) 2019-12-11 2019-12-11 一种数字语音通信噪音消除和语音恢复方法及装置

Country Status (1)

Country Link
CN (1) CN111063362B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1290389A (zh) * 1998-02-09 2001-04-04 诺基亚网络有限公司 一种解码方法、一种语音编码处理设备和一种网络单元
CN1659625A (zh) * 2002-05-31 2005-08-24 沃伊斯亚吉公司 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件
CN101268351A (zh) * 2005-05-31 2008-09-17 微软公司 健壮解码器
CN105741843A (zh) * 2014-12-10 2016-07-06 联芯科技有限公司 一种基于延时抖动的丢包补偿方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1290389A (zh) * 1998-02-09 2001-04-04 诺基亚网络有限公司 一种解码方法、一种语音编码处理设备和一种网络单元
CN1659625A (zh) * 2002-05-31 2005-08-24 沃伊斯亚吉公司 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件
CN101268351A (zh) * 2005-05-31 2008-09-17 微软公司 健壮解码器
CN105741843A (zh) * 2014-12-10 2016-07-06 联芯科技有限公司 一种基于延时抖动的丢包补偿方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Globally Synchronized Time via Datacenter Networks";Vishal Shrivastav等;《IEEE/ACM Transactions on Networking 》;20190611;第27卷(第4期);全文 *
王江艳." 自适应回波消除算法及ASIC实现".《中国优秀博硕士学位论文全文数据库(硕士)》.2002,(第02期), *

Also Published As

Publication number Publication date
CN111063362A (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
EP0861531B1 (en) Acoustic echo elimination in a digital mobile communications system
CN1909625A (zh) 一种自动调整音量的电视装置及控制方法
NO314528B1 (no) Demping av mikrofon i telekommunikasjonssystemer
NO316414B1 (no) Fremgangsmåte og maskin for taleomvandling, s¶rlig for å endre talehastighet
CN106170989A (zh) 耳机的识别方法和装置、耳机的控制方法和装置、耳机
EP1094446B1 (en) Voice recording with silence compression and comfort noise generation for digital communication apparatus
CN108133712B (zh) 一种处理音频数据的方法和装置
KR100848798B1 (ko) 배경 노이즈의 고속 동적 추정을 위한 방법
US20170345444A1 (en) Communication apparatus mounted with speech speed conversion device
EP2911152B1 (en) Gradual bandwidth adaptation for encoded audio signals
CN111063362B (zh) 一种数字语音通信噪音消除和语音恢复方法及装置
US20070133589A1 (en) Mute processing apparatus and method
CN107863981B (zh) 一种缩短呼叫建立时间的方法及对讲机
CN109360588A (zh) 一种基于移动设备的音频处理方法及装置
KR20020032894A (ko) 브이오아이피에서의 데이터 손실 방지 장치 및 방법
KR101377702B1 (ko) 가변 대역 코덱 및 그 제어 방법
JP5574346B2 (ja) 符号化装置、復号装置、およびこれらの方法
CN115038002A (zh) 一种蓝牙音频的播放方法、存储介质以及真无线耳机
JP2001045560A (ja) 携帯電話システム
CN113035226A (zh) 语音通话方法、通信终端和计算机可读介质
CN111386693A (zh) 一种通话中自动切换音频模式的调节系统及其方法
JP4510742B2 (ja) 音声パケット受信再生方法及びその装置、そのプログラム記録媒体
JP4918118B2 (ja) 通話区間検出装置、その方法、プログラム
CN114745464A (zh) 智能pstn话机声音通道切换消噪方法
JPH11205460A (ja) 音声信号検出処理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant