CN108055417A - 一种基于语音检测回音抑制切换音频处理系统及方法 - Google Patents

一种基于语音检测回音抑制切换音频处理系统及方法 Download PDF

Info

Publication number
CN108055417A
CN108055417A CN201711430359.2A CN201711430359A CN108055417A CN 108055417 A CN108055417 A CN 108055417A CN 201711430359 A CN201711430359 A CN 201711430359A CN 108055417 A CN108055417 A CN 108055417A
Authority
CN
China
Prior art keywords
audio stream
voice
speech detection
module
echo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711430359.2A
Other languages
English (en)
Other versions
CN108055417B (zh
Inventor
陈尚武
金国庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Polytron Technologies Inc
Original Assignee
Hangzhou Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Polytron Technologies Inc filed Critical Hangzhou Polytron Technologies Inc
Priority to CN201711430359.2A priority Critical patent/CN108055417B/zh
Publication of CN108055417A publication Critical patent/CN108055417A/zh
Application granted granted Critical
Publication of CN108055417B publication Critical patent/CN108055417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供一种基于语音检测回音抑制切换音频处理系统及方法,包括本地侧语音检测模块、网络侧语音检测模块、衰减器模块、切换器模块、回音抑制模块、扬声器和拾音器;当本地侧语音检测模块判断出本地正在语音,且网络侧语音检测模块通过语音检测方法判断出网络侧没有说活,则切换器模块把未经回音抑制模块的音频流C转发给音频流E,从而降低音频流E的失真,开启衰减器模块对音频流A进行衰减,避免音频流A该背景噪音影响网络发送音频流E,同时保留网络接收的音频流A的轻微背景音;采用本发明的技术方案,提供兼顾消除必要回音同时减少回音抑制的本地语音的处理,从而减少对声音破坏,最终提升本地发送的网络音频流E的音质。

Description

一种基于语音检测回音抑制切换音频处理系统及方法
技术领域
本发明涉及IP网络通信技术领域,具体为一种基于语音检测回音抑制切换音频处理系统及方法。
背景技术
IP网络通话因为IP网络时延,增加回音抑制模块清除模块成为必然选择。如图1所示,回音抑制基本原理是分析接收到网络音频流A特征,然后对拾音器的采集到音频流C,音频流C为混合本地声音B与回音(音频流A)的音频,回音抑制模块根据之前分析对音频流C去音频流A特性,最终得到要网络发送的音频流D。在去除音频流A特性同时,也必然对音频流C中本地音频A特性破坏,导致音频流D相比音频流C对本地声音B的声音还原要差。
发明内容
本发明的目的在于提供一种基于语音检测回音抑制切换音频处理系统及方法,能够消除必要回音同时减少回音抑制的本地语音的处理,从而减少回音抑制模块对本地声音破坏,最终提升本地发送的网络音频流E的音质。
本发明提供一种基于语音检测回音抑制切换音频处理系统,包括本地侧语音检测模块、网络侧语音检测模块、衰减器模块、切换器模块、回音抑制模块、扬声器和拾音器;
当本地侧语音检测模块判断出本地正在语音,且网络侧语音检测模块通过语音检测方法判断出网络侧没有说活,则切换器模块把未经回音抑制模块的音频流C转发给音频流E,从而降低音频流E的失真,开启衰减器模块对音频流A进行衰减,避免音频流A该背景噪音影响网络发送音频流E,同时保留网络接收的音频流A的轻微背景音;
当网络侧语音检测模块判断出网络侧开始语音,衰减器模块不对音频流A的数据包进行衰减,让网络侧音频流A无损到扬声器,同时切换器模块把经过回音抑制模块处理音频流D转发音频流E,避免音频流A的语音产生回音;切换器模块在切换转发音频流时选择在语音的字间切换,使声音切换更加平顺;一种基于语音检测回音抑制切换音频处理系统提供兼顾消除必要回音同时减少回音抑制的本地语音的处理,从而减少对声音破坏,最终提升本地发送的网络音频流E的音质。
其中:
音频流A为接收到的网络音频流;
音频流A2为音频流A经过衰减器模块处理后音频流;
音频流C为本地拾音器采集声音,包含本地声音B与回音的音频;
回音是音频流A2经过扬声器播放产生的;
音频流D为音频流C回音抑制模块处理后音频;
音频流E为音频流C与音频流D经过切换器模块处理,按时域混合后音频流。
本发明还提供一种基于语音检测回音抑制切换音频处理方法,包括如下步骤:
步骤(1):在初始状态为回音抑制状态,衰减器模块不对音频流A的数据包进行衰减,切换器模块转发音频流D的数据包,此时音频流A2等于音频流A,音频流E等于音频流D;
步骤(2):本地侧语音检测模块判断出本地是否有语音,如果有语音则继续判断是否本地语音的能量低谷;
步骤(3):网络侧语音检测模块判断出网络侧是否有语音,并保存最近一段时间的检测结果;
步骤(4):本地侧语音检测模块的检测本地的语音,查询网络侧语音检测模块的语音检测历史列表没有语音;判断当前系统状态是为回音抑制状态,则开启进入切换本地直通状态的流程;
步骤(5):进入切换到本地直通状态流程状态的流程;
步骤(6):网络侧语音检测模块的检测到网络侧的开始语音,判断当前工作模式为本地直通状态,则进入切换到回音抑制状态流程状态的流程;
步骤(7):进入切换到回音抑制状态流程状态的流程。
作为优选方案:步骤具体分为如下步骤:
步骤(2.1)、音频流D相比音频流C消除了音频流A2的回音干扰,本地侧语音检测选择音频流D做声音检测,对音频流D的数据采用分包处理方法,周期性处理采集的分包音频数据,对每个分包的音频数据的绝对值进行累加,累加值除于分包大小得到分包的平均值;
步骤(2.2)、当前音频流的分包的平均值跟声音阀值进行判断,大于声音阀值则认定检测到语音,小于声音阀值则认为静音;
步骤(2.3)、把过去时间t内所有检测有声音分包的平均值进行累加求平均值,得到时间t的所有语音的平均数AVG;
步骤(2.4)、当检测到语音时,继续把当前音频流分包的平均值判断是否小于平均数AVG的二分一,如小于则认为在本地语音处理于能量低谷。
作为优选方案:步骤(3)具体分为如下步骤:
步骤(3.1)、接收网络音频流原始分包大小不一致,导致是处理分包的时间精度不同,统一标准化时间精度,对从网络接收音频流A的数据采用重新分包处理方法,网络接收音频流A的先进入缓存队列,周期从缓存队列取固定大小音频数据;
步骤(3.2)、对每个重分包的音频数据的绝对值进行累加,累加值除于分包大小得到分包的平均值;
步骤(3.3)、分包的平均值跟声音阀值M进行判断,大于声音阀值则认定检测到语音,小于声音阀值则认为静音;
步骤(3.4)、网络侧语音检测模块检测结果放入语音检测历史列表,语音检测历史列表为固定大小,只保存最近检测结果,语音检测历史列表的时间累积大于回音的时延。
作为优选方案:步骤(5)具体分为如下步骤:
步骤(5.1)、衰减器模块对音频流A进行dn分贝衰减;对音频流A的每个采样数据进行除以衰竭系数得到音频流A2,对网络侧的音频流A的背景噪音进行压制,避免音频流A的背景噪音影响网络发送音频流E;
步骤(5.2)、人的语音中两字间是存在能量低谷,在能量低谷进行切换不会一个字发音的完成性,在音频流C的能量低谷时进行切换,实现字间切换,切换对听感破坏最小,从而提高语音质量;本地侧语音检测模块判断当前处于本地侧语音属于能量低谷或没有语音时,则判断出当前语音处于字间切换,切换器模块停止转发音频流D的数据包,开始转发音频流C的数据包;
步骤(5.3)、在切换过程中,网络侧语音检测模块检测有语音,则终止切换恢复到回音抑制状态。
作为优选方案:步骤(7)具体分为如下步骤:
步骤(7.1)、衰减器模块不对音频流A的数据包进行衰减,此时音频流A2等于音频流A,让网络侧音频流A的语音能够无损传到扬声器;
步骤(7.2)、本地侧语音检测模块对音频流C的进行分包判断是否为能量低谷时,同时开T1定时器,T1定时器目的防止网络侧的声音的产生回音传入音频流E。T1定时器取值决定音频流A2到音频流C的回来延时,时间扬声器到麦克风的声学延时小与1毫米,扬声器的放音延时与麦克风采集录音延时决定T1定时器取值。如果判断音频流C处于语音能量低谷或没有语音或T1定时器超时,则同时切换器模块开始经过回音抑制模块处理音频流D转发音频流E,音频流E等于音频流D。
与现有技术相比,本发明的有益效果如下:
采用本发明的技术方案,提供兼顾消除必要回音同时减少回音抑制的本地语音的处理,从而减少对声音破坏,最终提升本地发送的网络音频流E的音质。
附图说明
图1为背景技术中所述技术方案功能结构图;
图2为本发明的整体功能结构图。
本地侧语音检测模块1,网络侧语音检测模块2,衰减器模块3,切换器模块4,回音抑制模块5,扬声器6,拾音器7。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
如图2所示:本发明的第一个目的是提供一种基于语音检测回音抑制切换音频处理系统,减少回音抑制模块对本地声音破坏,提升发送的网络音频流的音质。
音频流A为接收到的网络音频流。
音频流A2为音频流A经过衰减器模块3处理后音频流。
音频流C为本地拾音器采集声音,包含本地声音B与回音的音频。
回音是音频流A2经过扬声器播放产生的。
音频流D为音频流C回音抑制模块5处理后音频。
音频流E为音频流C与音频流D经过切换器模块4处理,按时域混合后音频流。
实现本发明第一个目的的技术方案是:本地侧语音检测模块1,网络侧语音检测模块2,衰减器模块3,切换器模块4,回音抑制模块5,扬声器6,拾音器7。当本地侧语音检测模块1判断出本地正在语音,且网络侧语音检测模块2通过语音检测方法判断出网络侧没有说活,则切换器模块4把未经回音抑制模块5的音频流C转发给音频流E,从而降低音频流E的失真,开启衰减器模块对音频流A进行衰减,避免音频流A该背景噪音影响网络发送音频流E,同时保留网络接收的音频流A的轻微背景音。当网络侧语音检测模块2判断出网络侧开始语音,衰减器模块3不对音频流A的数据包进行衰减,让网络侧音频流A无损到扬声器6,同时切换器模块4把经过回音抑制模块处理音频流D转发音频流E,避免音频流A的语音产生回音。切换器模块4在切换转发音频流时选择在语音的字间切换,使声音切换更加平顺。一种基于语音检测回音抑制切换音频处理系统提供兼顾消除必要回音同时减少回音抑制的本地语音的处理,从而减少对声音破坏,最终提升本地发送的网络音频流E的音质。
本发明的第二个目的是提供一种基于语音检测回音抑制切换音频处理方法:
1.在初始状态为回音抑制状态,衰减器模块3不对音频流A的数据包进行衰减,切换器模块4转发音频流D的数据包,此时音频流A2等于音频流A,音频流E等于音频流D。
2.本地侧语音检测模块1判断出本地是否有语音,如果有语音则继续判断是否本地语音的能量低谷。
2.1音频流D相比音频流C消除了音频流A2的回音干扰,本地侧语音检测选择音频流D做声音检测,对音频流D的数据采用分包处理方法,周期性处理采集的分包音频数据,对每个分包的音频数据的绝对值进行累加,累加值除于分包大小得到分包的平均值。
举例:每秒8000次采样,每次采样16位数据(2字节),分包处理周期为20毫秒,则选160次采样做为分包处理周期。把160次采样数据取绝对值,并进行全部累加得累加值,累加值除于160得到平均值。
2.2当前音频流的分包的平均值跟声音阀值进行判断,大于声音阀值则认定检测到语音,小于声音阀值则认为静音。
2.3把过去时间t内(如:1分钟)内所有检测有声音分包的平均值进行累加求平均值,得到时间t的所有语音的平均数AVG。
2.4当检测到语音时,继续把当前音频流分包的平均值判断是否小于平均数AVG的二分一,如小于则认为在本地语音处理于能量低谷。
举例:声音阀值采用较灵敏的值,如取值500。
3.网络侧语音检测模块2判断出网络侧是否有语音,并保存最近一段时间的检测结果
3.1接收网络音频流原始分包大小不一致,导致是处理分包的时间精度不同,统一标准化时间精度,对从网络接收音频流A的数据采用重新分包处理方法,网络接收音频流A的先进入缓存队列,周期从缓存队列取固定大小音频数据。
举例:网络源音频流为每秒8000次采样,每次采样16位数据,网络源重新分包处理周期为20毫秒,则每个分包的音频数据单位为320字节。
3.2对每个重分包的音频数据的绝对值进行累加,累加值除于分包大小得到分包的平均值。
3.3分包的平均值跟声音阀值M进行判断,大于声音阀值则认定检测到语音,小于声音阀值则认为静音。
3.3网络侧语音检测模块2检测结果放入语音检测历史列表,语音检测历史列表为固定大小,只保存最近检测结果,语音检测历史列表的时间累积大于回音的时延。
举例:分包处理周期为20毫秒,回音小于100毫秒,则语音检测历史列表需要保存最新100毫秒内的语音检测结果,语音检测历史列表大小为5个。
4.本地侧语音检测模块1的检测本地的语音,查询网络侧语音检测模块2的语音检测历史列表没有语音。判断当前系统状态是为回音抑制状态,则开启进入切换本地直通状态的流程。
5.进入切换到本地直通状态流程状态的流程
5.1衰减器模块3对音频流A进行dn分贝衰减。对音频流A的每个采样数据进行除以衰竭系数得到音频流A2,对网络侧的音频流A的背景噪音进行压制,避免音频流A的背景噪音影响网络发送音频流E。
举例:衰减器模块3采音频流A进行9分贝衰减,根据分贝计算公式衰竭系数为8,音频流A2的数据为音频流A的每个采样数据进行除以8。
分贝定义:两个同类功率量或可与功率类比的量之比值的常用对数乘以10。
5.2人的语音中两字间是存在能量低谷,在能量低谷进行切换不会一个字发音的完成性,在音频流C的能量低谷时进行切换,实现字间切换,切换对听感破坏最小,从而提高语音质量。本地侧语音检测模块1判断当前处于本地侧语音属于能量低谷或没有语音时,则判断出当前语音处于字间切换,切换器模块4停止转发音频流D的数据包,开始转发音频流C的数据包。
5.3在切换过程中,网络侧语音检测模块2检测有语音,则终止切换恢复到回音抑制状态。
6.网络侧语音检测模块2的检测到网络侧的开始语音,判断当前工作模式为本地直通状态,则进入切换到回音抑制状态流程状态的流程。
7.进入切换到回音抑制状态流程状态的流程:
7.1衰减器模块3不对音频流A的数据包进行衰减,此时音频流A2等于音频流A,让网络侧音频流A的语音能够无损传到扬声器6;
7.2本地侧语音检测模块1对音频流C的进行分包判断是否为能量低谷时,同时开T1定时器,T1定时器目的防止网络侧的声音的产生回音传入音频流E。T1定时器取值决定音频流A2到音频流C的回来延时,时间扬声器到麦克风的声学延时小与1毫米,扬声器的放音延时与麦克风采集录音延时决定T1定时器取值。如果判断音频流C处于语音能量低谷或没有语音或T1定时器超时,则同时切换器模块4开始经过回音抑制模块处理音频流D转发音频流E,音频流E等于音频流D。
举例:T1定时包取值40毫秒,则判断判断音频流C的两个20毫秒分包,则强制进行切换。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于语音检测回音抑制切换音频处理系统,其特征在于,包括本地侧语音检测模块(1)、网络侧语音检测模块(2)、衰减器模块(3)、切换器模块(4)、回音抑制模块(5)、扬声器(6)和拾音器(7);
当本地侧语音检测模块(1)判断出本地正在语音,且网络侧语音检测模块(2)通过语音检测方法判断出网络侧没有说活,则切换器模块(4)把未经回音抑制模块(5)的音频流C转发给音频流E,从而降低音频流E的失真,开启衰减器模块对音频流A进行衰减,避免音频流A该背景噪音影响网络发送音频流E,同时保留网络接收的音频流A的轻微背景音;
当网络侧语音检测模块(2)判断出网络侧开始语音,衰减器模块(3)不对音频流A的数据包进行衰减,让网络侧音频流A无损到扬声器(6),同时切换器模块(4)把经过回音抑制模块处理音频流D转发音频流E,避免音频流A的语音产生回音;切换器模块(4)在切换转发音频流时选择在语音的字间切换,使声音切换更加平顺;
其中:
音频流A为接收到的网络音频流;
音频流A2为音频流A经过衰减器模块(3)处理后音频流;
音频流C为本地拾音器采集声音,包含本地声音B与回音的音频;
回音是音频流A2经过扬声器(6)播放产生的;
音频流D为音频流C回音抑制模块(5)处理后音频;
音频流E为音频流C与音频流D经过切换器模块(4)处理,按时域混合后音频流。
2.一种基于语音检测回音抑制切换音频处理方法,其特征在于,包括如下步骤:
步骤(1):在初始状态为回音抑制状态,衰减器模块(3)不对音频流A的数据包进行衰减,切换器模块(4)转发音频流D的数据包,此时音频流A2等于音频流A,音频流E等于音频流D;
步骤(2):本地侧语音检测模块(1)判断出本地是否有语音,如果有语音则继续判断是否本地语音的能量低谷;
步骤(3):网络侧语音检测模块(2)判断出网络侧是否有语音,并保存最近一段时间的检测结果;
步骤(4):本地侧语音检测模块(1)的检测本地的语音,查询网络侧语音检测模块(2)的语音检测历史列表没有语音;判断当前系统状态是为回音抑制状态,则开启进入切换本地直通状态的流程;
步骤(5):进入切换到本地直通状态流程状态的流程;
步骤(6):网络侧语音检测模块(2)的检测到网络侧的开始语音,判断当前工作模式为本地直通状态,则进入切换到回音抑制状态流程状态的流程;
步骤(7):进入切换到回音抑制状态流程状态的流程。
3.根据权利要求2中所述的一种基于语音检测回音抑制切换音频处理方法,其特征在于,步骤(2)具体分为如下步骤:
步骤(2.1)、音频流D相比音频流C消除了音频流A2的回音干扰,本地侧语音检测选择音频流D做声音检测,对音频流D的数据采用分包处理方法,周期性处理采集的分包音频数据,对每个分包的音频数据的绝对值进行累加,累加值除于分包大小得到分包的平均值;
步骤(2.2)、当前音频流的分包的平均值跟声音阀值进行判断,大于声音阀值则认定检测到语音,小于声音阀值则认为静音;
步骤(2.3)、把过去时间t内所有检测有声音分包的平均值进行累加求平均值,得到时间t的所有语音的平均数AVG;
步骤(2.4)、当检测到语音时,继续把当前音频流分包的平均值判断是否小于平均数AVG的二分一,如小于则认为在本地语音处理于能量低谷。
4.根据权利要求2中所述的一种基于语音检测回音抑制切换音频处理方法,其特征在于,步骤(3)具体分为如下步骤:
步骤(3.1)、接收网络音频流原始分包大小不一致,导致是处理分包的时间精度不同,统一标准化时间精度,对从网络接收音频流A的数据采用重新分包处理方法,网络接收音频流A的先进入缓存队列,周期从缓存队列取固定大小音频数据;
步骤(3.2)、对每个重分包的音频数据的绝对值进行累加,累加值除于分包大小得到分包的平均值;
步骤(3.3)、分包的平均值跟声音阀值M进行判断,大于声音阀值则认定检测到语音,小于声音阀值则认为静音;
步骤(3.4)、网络侧语音检测模块(2)检测结果放入语音检测历史列表,语音检测历史列表为固定大小,只保存最近检测结果,语音检测历史列表的时间累积大于回音的时延。
5.根据权利要求2中所述的一种基于语音检测回音抑制切换音频处理方法,其特征在于,步骤(5)具体分为如下步骤:
步骤(5.1)、衰减器模块(3)对音频流A进行dn分贝衰减;对音频流A的每个采样数据进行除以衰竭系数得到音频流A2,对网络侧的音频流A的背景噪音进行压制,避免音频流A的背景噪音影响网络发送音频流E;
步骤(5.2)、人的语音中两字间是存在能量低谷,在能量低谷进行切换不会一个字发音的完成性,在音频流C的能量低谷时进行切换,实现字间切换,切换对听感破坏最小,从而提高语音质量;本地侧语音检测模块(1)判断当前处于本地侧语音属于能量低谷或没有语音时,则判断出当前语音处于字间切换,切换器模块(4)停止转发音频流D的数据包,开始转发音频流C的数据包;
步骤(5.3)、在切换过程中,网络侧语音检测模块(2)检测有语音,则终止切换恢复到回音抑制状态。
6.根据权利要求2中所述的一种基于语音检测回音抑制切换音频处理方法,其特征在于,步骤(7)具体分为如下步骤:
步骤(7.1)、衰减器模块(3)不对音频流A的数据包进行衰减,此时音频流A2等于音频流A,让网络侧音频流A的语音能够无损传到扬声器(6);
步骤(7.2)、本地侧语音检测模块(1)对音频流C的进行分包判断是否为能量低谷时,同时开T1定时器,T1定时器目的防止网络侧的声音的产生回音传入音频流E。T1定时器取值决定音频流A2到音频流C的回来延时,时间扬声器到麦克风的声学延时小与1毫米,扬声器的放音延时与麦克风采集录音延时决定T1定时器取值。如果判断音频流C处于语音能量低谷或没有语音或T1定时器超时,则同时切换器模块(4)开始经过回音抑制模块处理音频流D转发音频流E,音频流E等于音频流D。
CN201711430359.2A 2017-12-26 2017-12-26 一种基于语音检测回音抑制切换音频处理系统及方法 Active CN108055417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711430359.2A CN108055417B (zh) 2017-12-26 2017-12-26 一种基于语音检测回音抑制切换音频处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711430359.2A CN108055417B (zh) 2017-12-26 2017-12-26 一种基于语音检测回音抑制切换音频处理系统及方法

Publications (2)

Publication Number Publication Date
CN108055417A true CN108055417A (zh) 2018-05-18
CN108055417B CN108055417B (zh) 2020-09-29

Family

ID=62131903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711430359.2A Active CN108055417B (zh) 2017-12-26 2017-12-26 一种基于语音检测回音抑制切换音频处理系统及方法

Country Status (1)

Country Link
CN (1) CN108055417B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965620A (zh) * 2018-08-24 2018-12-07 杭州数心网络科技有限公司 一种人工智能呼叫中心系统
CN109361827A (zh) * 2018-10-22 2019-02-19 杭州叙简科技股份有限公司 一种通信终端的回音二次抑制方法
CN110265055A (zh) * 2019-06-17 2019-09-20 杭州叙简科技股份有限公司 一种poc对讲的语音去噪增强系统及语音去噪增强方法
CN113038060A (zh) * 2019-12-25 2021-06-25 中国电信股份有限公司 多路音频处理方法和系统
CN113223546A (zh) * 2020-12-28 2021-08-06 南京愔宜智能科技有限公司 一种音视频会议系统及用于该音视频会议系统的回音抵消装置
CN114512139A (zh) * 2022-04-18 2022-05-17 杭州星犀科技有限公司 多路音频混音的处理方法、系统、混音处理器和存储介质

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1247663A (zh) * 1996-12-31 2000-03-15 艾利森公司 用于通信系统中噪音和回声抑制的交流中心削波器
CN1780166A (zh) * 2004-11-17 2006-05-31 北京三星通信技术研究有限公司 渐次衰减的非线性处理装置和方法
CN101136973A (zh) * 2006-08-31 2008-03-05 雅马哈株式会社 通话判定系统
CN101179635A (zh) * 2006-11-06 2008-05-14 爱普拉斯通信技术(北京)有限公司 对免提电话进行回声控制的装置、方法和系统
CN101217606A (zh) * 2008-01-02 2008-07-09 中兴通讯股份有限公司 前置回声抑制开关控制和双音多频信号检测的方法和装置
JP2008160457A (ja) * 2006-12-22 2008-07-10 Matsushita Electric Works Ltd 音声伝送システム
US7539300B1 (en) * 2005-06-11 2009-05-26 Mindspeed Technologies, Inc. Echo canceller with enhanced infinite and finite ERL detection
US7876718B1 (en) * 2001-12-06 2011-01-25 At&T Intellectual Property Ii, L.P. Echo reduction
CN102405634A (zh) * 2009-04-21 2012-04-04 松下电工株式会社 扬声电话装置
CN202197344U (zh) * 2011-07-08 2012-04-18 歌尔声学股份有限公司 送话器阵列回声消除系统
CN103391381A (zh) * 2012-05-10 2013-11-13 中兴通讯股份有限公司 回声消除方法及装置
CN103617797A (zh) * 2013-12-09 2014-03-05 腾讯科技(深圳)有限公司 一种语音处理方法,及装置
CN103888630A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 用于控制声学回声消除的方法和音频处理装置
CN104395957A (zh) * 2012-04-30 2015-03-04 创新科技有限公司 一种通用可重构回声消除系统
CN104980601A (zh) * 2014-04-02 2015-10-14 想象技术有限公司 用于动态调谐回音消除器的增益控制系统及方法
CN106448691A (zh) * 2015-08-10 2017-02-22 深圳市潮流网络技术有限公司 一种用于扩音通信系统的语音增强方法
CN106713570A (zh) * 2015-07-21 2017-05-24 炬芯(珠海)科技有限公司 一种回声消除方法和装置

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1247663A (zh) * 1996-12-31 2000-03-15 艾利森公司 用于通信系统中噪音和回声抑制的交流中心削波器
US7876718B1 (en) * 2001-12-06 2011-01-25 At&T Intellectual Property Ii, L.P. Echo reduction
CN1780166A (zh) * 2004-11-17 2006-05-31 北京三星通信技术研究有限公司 渐次衰减的非线性处理装置和方法
US7539300B1 (en) * 2005-06-11 2009-05-26 Mindspeed Technologies, Inc. Echo canceller with enhanced infinite and finite ERL detection
CN101136973A (zh) * 2006-08-31 2008-03-05 雅马哈株式会社 通话判定系统
CN101179635A (zh) * 2006-11-06 2008-05-14 爱普拉斯通信技术(北京)有限公司 对免提电话进行回声控制的装置、方法和系统
JP2008160457A (ja) * 2006-12-22 2008-07-10 Matsushita Electric Works Ltd 音声伝送システム
CN101217606A (zh) * 2008-01-02 2008-07-09 中兴通讯股份有限公司 前置回声抑制开关控制和双音多频信号检测的方法和装置
CN102405634A (zh) * 2009-04-21 2012-04-04 松下电工株式会社 扬声电话装置
CN202197344U (zh) * 2011-07-08 2012-04-18 歌尔声学股份有限公司 送话器阵列回声消除系统
CN104395957A (zh) * 2012-04-30 2015-03-04 创新科技有限公司 一种通用可重构回声消除系统
CN103391381A (zh) * 2012-05-10 2013-11-13 中兴通讯股份有限公司 回声消除方法及装置
CN103888630A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 用于控制声学回声消除的方法和音频处理装置
CN103617797A (zh) * 2013-12-09 2014-03-05 腾讯科技(深圳)有限公司 一种语音处理方法,及装置
CN104980601A (zh) * 2014-04-02 2015-10-14 想象技术有限公司 用于动态调谐回音消除器的增益控制系统及方法
CN106713570A (zh) * 2015-07-21 2017-05-24 炬芯(珠海)科技有限公司 一种回声消除方法和装置
CN106448691A (zh) * 2015-08-10 2017-02-22 深圳市潮流网络技术有限公司 一种用于扩音通信系统的语音增强方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘扬,付中华,唐玲: "《基于Windows平台的双通道回声抵消系统》", 《计算机与现代化》 *
王宏志,丁 宁: "《自适应声回声抵消器》", 《长春工业大学学报(自然科学版)》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965620A (zh) * 2018-08-24 2018-12-07 杭州数心网络科技有限公司 一种人工智能呼叫中心系统
CN109361827A (zh) * 2018-10-22 2019-02-19 杭州叙简科技股份有限公司 一种通信终端的回音二次抑制方法
CN109361827B (zh) * 2018-10-22 2021-02-09 杭州叙简科技股份有限公司 一种通信终端的回音二次抑制方法
CN110265055A (zh) * 2019-06-17 2019-09-20 杭州叙简科技股份有限公司 一种poc对讲的语音去噪增强系统及语音去噪增强方法
CN110265055B (zh) * 2019-06-17 2021-04-20 杭州叙简科技股份有限公司 一种poc对讲的语音去噪增强系统及语音去噪增强方法
CN113038060A (zh) * 2019-12-25 2021-06-25 中国电信股份有限公司 多路音频处理方法和系统
CN113038060B (zh) * 2019-12-25 2022-11-18 中国电信股份有限公司 多路音频处理方法和系统
CN113223546A (zh) * 2020-12-28 2021-08-06 南京愔宜智能科技有限公司 一种音视频会议系统及用于该音视频会议系统的回音抵消装置
CN114512139A (zh) * 2022-04-18 2022-05-17 杭州星犀科技有限公司 多路音频混音的处理方法、系统、混音处理器和存储介质
CN114512139B (zh) * 2022-04-18 2022-09-20 杭州星犀科技有限公司 多路音频混音的处理方法、系统、混音处理器和存储介质

Also Published As

Publication number Publication date
CN108055417B (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
CN108055417A (zh) 一种基于语音检测回音抑制切换音频处理系统及方法
US9443528B2 (en) Method and device for eliminating echoes
CA2527461C (en) Reverberation estimation and suppression system
EP2868073B1 (en) Echo control through hidden audio signals
James et al. Implementing voip: a voice transmission performance progress report
US8842851B2 (en) Audio source localization system and method
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
CN107360530A (zh) 一种回声消除的测试方法和装置
CN106571147B (zh) 用于网络话机声学回声抑制的方法
JP2004282700A (ja) エコー検出および監視
CN109040501A (zh) 一种改善voip通话质量的回声消除方法
CN101179635A (zh) 对免提电话进行回声控制的装置、方法和系统
US8600037B2 (en) Audio quality and double talk preservation in echo control for voice communications
US8588404B2 (en) Method and apparatus for acoustic echo cancellation in VoIP terminal
CN113823306B (zh) 语音的回声消除方法、装置、设备及存储介质
CN109643553A (zh) 使用稀疏预测滤波器集的调适的回波估计及管理
JP4105681B2 (ja) エコーサプレス方法、エコーサプレッサ、エコーサプレッサプログラム、通信路上の損失量制御方法、通信路上の損失量制御装置、通信路上の損失量制御プログラム、記録媒体
CN103312911B (zh) 数据处理方法和电子终端
US5502717A (en) Method and apparatus for estimating echo cancellation time
CN102117620B (zh) 一种双滤波器传递滤波器系数的方法及装置
CN206686330U (zh) 一种麦克风
CN109462789A (zh) 一种耳机播放音频的翻译方法
JP2002064617A (ja) 反響抑圧方法・反響抑圧装置
CN110933240B (zh) 一种VoIP终端的音频自动化测试装置以及方法
US8559466B2 (en) Selecting discard packets in receiver for voice over packet network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An audio processing system and method based on voice detection echo suppression switching

Effective date of registration: 20211202

Granted publication date: 20200929

Pledgee: Hangzhou High-tech Financing Guarantee Co.,Ltd.

Pledgor: HANGZHOU XUJIAN SCIENCE AND TECHNOLOGY Co.,Ltd.

Registration number: Y2021980013922

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20220322

Granted publication date: 20200929

Pledgee: Hangzhou High-tech Financing Guarantee Co.,Ltd.

Pledgor: HANGZHOU XUJIAN SCIENCE AND TECHNOLOGY Co.,Ltd.

Registration number: Y2021980013922

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An audio processing system and method based on voice detection echo suppression switching

Effective date of registration: 20220322

Granted publication date: 20200929

Pledgee: Shanghai Guotai Junan Securities Asset Management Co.,Ltd.

Pledgor: HANGZHOU XUJIAN SCIENCE AND TECHNOLOGY Co.,Ltd.

Registration number: Y2022990000162

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230131

Granted publication date: 20200929

Pledgee: Shanghai Guotai Junan Securities Asset Management Co.,Ltd.

Pledgor: HANGZHOU XUJIAN SCIENCE AND TECHNOLOGY Co.,Ltd.

Registration number: Y2022990000162

PC01 Cancellation of the registration of the contract for pledge of patent right