CN117544534A - 通信状态检测方法、装置、计算机设备以及存储介质 - Google Patents
通信状态检测方法、装置、计算机设备以及存储介质 Download PDFInfo
- Publication number
- CN117544534A CN117544534A CN202311278871.5A CN202311278871A CN117544534A CN 117544534 A CN117544534 A CN 117544534A CN 202311278871 A CN202311278871 A CN 202311278871A CN 117544534 A CN117544534 A CN 117544534A
- Authority
- CN
- China
- Prior art keywords
- energy
- far
- signal
- frequency point
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006854 communication Effects 0.000 title claims abstract description 182
- 238000004891 communication Methods 0.000 title claims abstract description 181
- 238000001514 detection method Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 31
- 230000008030 elimination Effects 0.000 claims abstract description 26
- 238000003379 elimination reaction Methods 0.000 claims abstract description 26
- 238000001228 spectrum Methods 0.000 claims description 40
- 230000005236 sound signal Effects 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Environmental & Geological Engineering (AREA)
- Telephone Function (AREA)
Abstract
本申请涉及一种通信状态检测方法、装置、计算机设备以及存储介质。所述方法包括:根据远端参考信号确定是否存在远端语音信号;若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率;确定所述远端消音频点的第一信号能量,以及所述邻近频点的第二信号能量;根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量;根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。上述方法提高了通信状态的检测精确度,从而实现了对回声的准确消除,提高了通信质量。
Description
技术领域
本申请涉及通信技术领域,特别是涉及一种通信状态检测方法、装置、计算机设备以及存储介质。
背景技术
在多人语音通信的通信场景中,通信信号中往往包含有回声信号,影响通信用户的通话体验,因此在多人语音通信时,需要通过回声消除系统来消除回声。回声消除系统在检测到通信状态为双讲状态时,会开启回声消除的工作模式以消除通信回声,因此,若要提高对回声的消除精确度,需要准确识别出通信状态是否为双讲状态。
现阶段,在对通信状态进行检测时,往往通过麦克风信号频点能量和扬声器信号频点能量的差异值确定通信状态是否为双讲状态,对通信状态的检测结果会受到噪声影响,导致确定的通信状态的准确率较低。因此,如何提高通信状态的检测精确度,从而提高回声的消除精度,提升用户的通信体验,是需要解决的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高通信状态的检测精确度的通信状态检测方法、装置、计算机设备以及存储介质。
第一方面,本申请提供了一种通信状态检测方法,所述方法包括:
根据远端参考信号确定是否存在远端语音信号;
若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率;
确定所述远端消音频点的第一信号能量,以及所述邻近频点的第二信号能量;
根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量;
根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
在其中一个实施例中,根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量,包括:
根据所述第一语音信号存在概率和所述第一信号能量的乘积确定第一频谱能量,并根据所述第二语音信号存在概率和所述第二信号能量的乘积确定第二频谱能量;
根据所述第一频谱能量确定远端消音频点的频点能量,并根据所述第二频谱能量确定邻近频点的频点能量。
在其中一个实施例中,根据所述第一频谱能量确定远端消音频点的频点能量,并根据所述第二频谱能量确定邻近频点的频点能量,包括:
根据连续帧的第一频谱能量的能量和确定远端消音频点的频点能量;
根据连续帧的第二频谱能量的能量和确定邻近频点的频点能量。
在其中一个实施例中,根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态,包括:
确定远端消音频点的频点能量和邻近频点的频点能量之间的频点能量比;
根据所述频点能量比确定通信状态。
在其中一个实施例中,根据所述频点能量比确定通信状态,包括:
确定所述频点能量比是否均小于或等于能量比阈值;
若是,则确定通信状态为远端单讲状态;
若否,则确定通信状态为双讲状态。
在其中一个实施例中,根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率,包括:
确定麦克风采集信号中是否存在远端消音频点的远端音频信号;
若是,则通过降噪算法,根据所述麦克风采集信号中的远端音频信号确定远端消音频点的语音先验信噪比,并根据所述远端消音频点的邻近频点的邻近音频信号确定邻近频点的语音先验信噪比;
根据远端消音频点的语音先验信噪比确定所述远端消音频点的第一语音信号存在概率,并根据邻近频点的语音先验信噪比确定所述邻近频点的第二语音信号存在概率。
在其中一个实施例中,根据远端参考信号确定是否存在远端语音信号,包括:
接收远端参考信号,并对所述远端参考信号进行语音识别,确定所述远端参考信号中的语音端点信息;
根据所述语音端点信息确定是否存在远端语音信号。
第二方面,本申请还提供了一种通信状态检测装置,所述装置包括:
远端语音信号确定模块,用于根据远端参考信号确定是否存在远端语音信号;
信号存在概率确定模块,用于若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率;
信号能量确定模块,用于确定所述远端消音频点的第一信号能量,以及所述邻近频点的第二信号能量;
频点能量确定模块,用于根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量;
通信状态确定模块,用于根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据远端参考信号确定是否存在远端语音信号;
若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率;
确定所述远端消音频点的第一信号能量,以及所述邻近频点的第二信号能量;
根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量;
根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
根据远端参考信号确定是否存在远端语音信号;
若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率;
确定所述远端消音频点的第一信号能量,以及所述邻近频点的第二信号能量;
根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量;
根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
上述通信状态检测方法、装置、计算机设备以及存储介质,在确定远端参考信号存在远端语音信号时,确定麦克风采集信号中的远端消音频点的第一语音信号存在概率,远端消音频点的第一信号能量,远端消音频点的邻近频点的第二语音信号存在概率,以及邻近频点的第二信号能量,根据第一语音存在概率、第一信号能量、第二语音存在概率和第二信号能量确定通信状态。解决了在进行通信状态检测时,直接通过麦克风信号频点能量和扬声器信号频点能量的差异值确定通信状态是否为双讲状态,导致的对通信状态的检测结果会受到噪声影响,所确定的通信状态的准确率较低的问题。上述方法,在进行通信状态检测时,通过对远端信号固定频点消音产生远端消音频点,可以扩大远端语音和近端语音的差异,在一定程度上提高通信状态检测精度,同时,根据远端消音频点的语音信号存在概率,远端消音频点的信号能量,远端消音频点的邻近频点的语音信号存在概率,以及邻近频点的信号能量确定通信状态是否为双讲状态,可在对通信状态进行检测时消除噪声干扰,进一步提高通信状态的检测精确度,从而提高回声消除精度,提升用户的通信体验。
附图说明
图1为一个实施例中通信状态检测方法的应用环境图;
图2为一个实施例中通信状态检测方法的流程示意图;
图3为另一个实施例中通信状态检测方法的流程示意图;
图4为另一个实施例中通信状态检测方法的流程示意图;
图5为另一个实施例中通信状态检测方法的流程示意图;
图6为另一个实施例中通信状态检测方法的流程示意图;
图7为一个实施例中通信状态检测装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的通信状态检测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器104根据远端参考信号确定是否存在远端语音信号;若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率;确定所述远端消音频点的第一信号能量,以及所述邻近频点的第二信号能量;根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量;根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态;根据通信状态处理通信过程中的语音信号,并通过通信网络将处理后的语音信号发送至终端102。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种通信状态检测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于回声消除系统,该方法包括以下步骤:
S210、根据远端参考信号确定是否存在远端语音信号。
需要说明的是,多人语音通信的通信场景中,需要进行语音信号的实时传输,此时本地的计算机设备可以通过麦克风采集近端信号并向外传输,同时还可以通过扬声器将接收到的音频信号进行播放,则麦克风在采集近端信号的同时,还可能实际采集到扬声器所播放的音频信号,从而产生回声。
其中,远端语音信号是指回声消除系统通过远端通信设备获取的远端通信用户所发出的语音信号。扬声器所播放的音频信号即为远端参考信号。
具体的,在获取到远端参考信号时,通过语音识别算法对远端参考信号进行语音识别,以根据语音识别结果确定远端参考信号中是否存在远端语音信号。
S220、若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及远端消音频点的邻近频点的第二语音信号存在概率。
需要说明的是,在进行通信状态检测时,需要对远端参考信号的固定频点的频点信号进行清零处理,确定需要清零处理的固定频点为远端消音频点,远端消音频点可以根据实际需要预先设置。对远端参考信号的固定频点的频点信号进行清零处理的方法可以是,通过滤波器对固定频点的频点信号进行抑制,使固定频点的能量降到接近为零。远端消音频点的邻近频点是指远端消音频点附近的频点,可以预先设置邻近频点和远端消音频点的位置关系,并根据远端消音频点,以及预先设置的邻近频点和远端消音频点的位置关系,确定远端消音频点的邻近频点。第一语音信号是指远端消音频点对应的语音信号,第二语音信号是指远端消音频点的邻近频点对应的语音信号。
其中,麦克风采集信号是通过近端通信设备的麦克风采集到的音频信号,当近端通信设备的麦克风开启时,近端通信设备可以采集到近端通信设备上的扬声器发出的远端音频信号,此时可能会出现回声现象。
第一语音存在概率可以表征麦克风采集信号中的远端消音频点存在语音信号的可能性,第二语音存在概率可以表征邻近频点存在语音信号的可能性。
具体的,若远端参考信号中存在远端语音信号,则存在正在通信的远端用户,因此若确定远端参考信号中存在远端语音信号,则获取麦克风采集信号,并确定麦克风采集信号中的远端消音频点的第一语音信号存在概率,以及远端消音频点的邻近频点的第二语音信号存在概率。
S230、确定远端消音频点的第一信号能量,以及邻近频点的第二信号能量。
其中,第一信号能量是指远端消音频点的每一帧的参考信号能量集合。第二信号能量是指邻近频点的每一帧的参考信号能量集合。
具体的,确定麦克风采集信号中的远端消音频点的第一信号能量,以及麦克风采集信号中的邻近频点的第二信号能量。
S240、根据第一语音信号存在概率和第一信号能量确定远端消音频点的频点能量,并根据第二语音信号存在概率和第二信号能量确定邻近频点的频点能量。
其中,远端消音频点的频点能量是指远端消音频点的总频谱能量。邻近频点的频点能量是指邻近频点的总频谱能量。
具体的,根据第一语音信号存在概率和第一信号能量,确定的远端消音频点的总频谱能量,将远端消音频点的总频谱能量作为远端消音频点的频点能量。根据第二语音信号存在概率和第二信号能量,确定邻近频点的总频谱能量,将邻近频点的总频谱能量作为邻近频点的频点能量。
S250、根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
其中,通信状态为双讲状态或远端单讲状态。
具体的,根据远端消音频点的频点能量和邻近频点的频点能量之间的差异确定通信状态。若通信状态为双讲状态,则开启回声消除的工作模式以消除通信回声。若通信状态为远端单讲状态,则无需进行回声消除。
上述通信状态检测方法中,在确定远端参考信号存在远端语音信号时,确定麦克风采集信号中的远端消音频点的第一语音信号存在概率,远端消音频点的第一信号能量,远端消音频点的邻近频点的第二语音信号存在概率,以及邻近频点的第二信号能量,根据第一语音存在概率、第一信号能量、第二语音存在概率和第二信号能量确定通信状态。解决了在进行通信状态检测时,直接通过麦克风信号频点能量和扬声器信号频点能量的差异值确定通信状态是否为双讲状态,导致的对通信状态的检测结果会受到噪声影响,所确定的通信状态的准确率较低的问题。上述方法,在进行通信状态检测时,通过对远端信号固定频点消音产生远端消音频点,可以扩大远端语音和近端语音的差异,在一定程度上提高通信状态检测精度,同时,根据远端消音频点的语音信号存在概率,远端消音频点的信号能量,远端消音频点的邻近频点的语音信号存在概率,以及邻近频点的信号能量确定通信状态是否为双讲状态,可在对通信状态进行检测时消除噪声干扰,进一步提高通信状态的检测精确度,从而提高回声消除精度,提升用户的通信体验。
在一个实施例中,如图3所示,根据第一语音信号存在概率和第一信号能量确定远端消音频点的频点能量,并根据第二语音信号存在概率和第二信号能量确定邻近频点的频点能量,包括:
S310、根据第一语音信号存在概率和第一信号能量的乘积确定第一频谱能量,并根据第二语音信号存在概率和第二信号能量的乘积确定第二频谱能量。
具体的,将各远端消音频点对应的第一语音信号存在概率和第一信号能量的乘积作为各远端消音频点的第一频谱能量。将各邻近频点的第二语音信号存在概率和第二信号能量的乘积作为各邻近频点的第二频谱能量。
S320、根据第一频谱能量确定远端消音频点的频点能量,并根据第二频谱能量确定邻近频点的频点能量。
具体的,根据各远端消音频点对应的第一频谱能量分别确定各远端消音频点的频点能量;根据各邻近频点对应的第二频谱能量分别确定各邻近频点的频点能量。
示例性的,远端消音频点的频点能量和邻近频点的频点能量的确定方式可以是:根据连续帧的第一频谱能量的能量和确定远端消音频点的频点能量;根据连续帧的第二频谱能量的能量和确定邻近频点的频点能量。
根据连续帧的第一频谱能量确定远端消音频点的频点能量,根据连续帧的第二频谱能量确定邻近频点的频点能量,可以提高频点能量的获取效率和精确度。
本实施例中,提供了一种确定远端消音频点的频点能量,以及邻近频点的频点能量的方式,可以提高远端消音频点的频点能量和邻近频点的频点能量的计算效率。
在一个实施例中,如图4所示,根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态,包括:
S410、确定远端消音频点的频点能量和邻近频点的频点能量之间的频点能量比。
具体的,将远端消音频点的频点能量和邻近频点的频点能量的比值作为频点能量比。
S420、根据频点能量比确定通信状态。
具体的,根据频点能量比确定远端消音频点的频点能量和邻近频点的频点能量之间的差异,以根据远端消音频点的频点能量和邻近频点的频点能量之间的差异确定通信状态。
示例性的,根据频点能量比确定通信状态的方法可以是:确定频点能量比是否均小于或等于能量比阈值;若是,则各远端消音频点的频点能量和其对应的邻近频点的频点能量之间的差异较小,此时可以确定麦克风采集信号中不存在远端语音信号,因此确定通信状态为远端单讲状态;若否,则存在至少一个远端消音频点的频点能量和其对应的邻近频点的频点能量的差异较大,此时可以确定麦克风采集信号中存在远端语音信号,因此通信状态为双讲状态。
其中,能量比阈值可以根据实际情况进行设置。
具体的,将各远端消音频点对应的频点能量比分别与能量比阈值进行比较,若各远端消音频点对应的频点能量比均小于或等于能量比阈值,则确定通信状态为远端单讲状态;若存在至少一个远端消音频点对应的频点能量比大于能量比阈值,则确定通信状态为双讲状态。
根据频点能量比和能量比阈值的比较结果确定通信状态是否为双讲状态,可以提高通信状态的确定效率。
上述方案,根据远端消音频点的频点能量和邻近频点的频点能量之间的频点能量比取得通信状态,可以在保证通信状态的精确度的同时,提高通信状态的确定效率。
在一个实施例中,如图5所示,根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及远端消音频点的邻近频点的第二语音信号存在概率,包括:
S510、确定麦克风采集信号中是否存在远端消音频点的远端音频信号。
其中,远端音频信号是指麦克风采集到的扬声器所发出的远端声音信号。
具体的,通过滤波器确定麦克风采集信号中是否存在远端消音频点的远端音频信号。
S520、若是,则通过降噪算法,根据麦克风采集信号中的远端音频信号确定远端消音频点的语音先验信噪比,并根据远端消音频点的邻近频点的邻近音频信号确定邻近频点的语音先验信噪比。
例如,降噪算法可以是音频压缩格式降噪算法,即SPEEX降噪算法。
其中,信噪比是指接收到的有效信号的强度与接收到的干扰信号的强度的比值,远端语音信号中包含有有效信号和干扰信号,远端参考信号中的语音信号为有效信号,远端消音频点的有效信号的信号强度和干扰信号的信号强度的比值越高,远端消音频点存在语音信号的概率越高。因此,可以通过语音先验信噪比确定远端消音频点的第一语音信号存在概率和邻近频点的第二语音信号存在概率。
具体的,若麦克风采集信号中存在远端消音频点的远端语音信号,则通过语音信号识别算法从麦克风采集信号中确定远端消音频点的远端音频信号,以及远端消音频点的邻近频点的邻近音频信号。通过降噪算法,根据麦克风采集信号中的远端音频信号中有效信号和无效信号的比值确定远端消音频点的语音先验信噪比,并根据远端语音信号的邻近音频信号中有效信号和无效信号的比值确定邻近频点的语音先验信噪比。
S530、根据远端消音频点的语音先验信噪比确定远端消音频点的第一语音信号存在概率,并根据邻近频点的语音先验信噪比确定邻近频点的第二语音信号存在概率。
具体的,将远端消音频点的语音先验信噪比的平均值作为远端消音频点的第一语音信号存在概率,将邻近频点的语音先验信噪比的均值作为邻近频点的第二语音信号存在概率。
上述方案,提供了一种确定远端消音频点的第一语音信号存在概率,以及邻近频点的第二语音信号存在概率的方法,可以提高第一语音信号存在概率和第二语音信号的精确度,根据第一语音信号存在概率和第二语音信号存在概率确定通信状态,可以避免噪声干扰,提高通信状态的可靠性。
在一个实施例中,如图6所示,根据远端参考信号确定是否存在远端语音信号,包括:
S610、接收远端参考信号,并对远端参考信号进行语音识别,确定远端参考信号中的语音端点信息。
其中,语音端点信息包括语音起始端点和语音结束端点。
具体的,接收远端参考信号,并通过语音信号端点检测方法对远端参考信号进行语音识别,确定远端参考信号中的语音端点信息。
其中,语音信号端点检测是语音信号分析、合成和识别中的一个重要环节,目的是从包含语音信号的一段信号中找出语音信号的起始端点和结束端点,从而只存储和处理有效语音信号。有效的端点检测不仅可以减少数据的存和处理时间,而且能排除无声段的噪声干扰。
S620、根据语音端点信息确定是否存在远端语音信号。
具体的,根据语音端点信息确定远端参考信号中是否存在有效语音信号,若是,则确定存在远端语音信号。
上述方案,根据语音端点信息确定是否存在远端语音信号,可以提高对远端语音信号是否存在的判断精确度,在确定存在远端语音信号之后再进一步的判断通信状态,可以避免资源浪费。
示例性的,在上述实施例的基础上,通信状态检测方法包括:
回声消除系统可以通过远端通信设备上的麦克风设备接收远端参考信号,并通过语音信号端点检测方法对远端参考信号进行语音识别,确定远端参考信号中的语音端点信息,根据语音端点信息确定是否存在远端语音信号,若是,则确定远端存在处于通话状态的通信用户,并确定远端参考信号的远端消音频点。在存在回声时,回声消除系统需要对远端消音频点的语音信号进行消除。
确定近端通信设备的麦克风采集信号是否存在远端消音频点的远端音频信号,若是,则从近端通信设备的麦克风采集信号中确定远端消音频点的远端音频信号,以及远端消音频点的邻近频点的邻近音频信号。通过降噪算法,根据远端音频信号确定远端消音频点的语音先验信噪比,并根据邻近音频信号确定邻近频点的语音先验信噪比。将远端消音频点的语音先验信噪比的平均值作为远端消音频点的第一语音信号存在概率,将邻近频点的语音先验信噪比的均值作为邻近频点的第二语音信号存在概率。
确定麦克风采集信号中的远端消音频点的第一信号能量,以及麦克风采集信号中的邻近频点的第二信号能量。将各远端消音频点对应的第一语音信号存在概率和第一信号能量的乘积作为各远端消音频点的第一频谱能量。将各邻近频点的第二语音信号存在概率和第二信号能量的乘积作为各邻近频点的第二频谱能量,根据连续帧的第一频谱能量的能量和确定远端消音频点的频点能量;根据连续帧的第二频谱能量的能量和确定邻近频点的频点能量。
确定远端消音频点的频点能量和邻近频点的频点能量之间的频点能量比,将各远端消音频点对应的频点能量比分别于能量比阈值进行比较,若各远端消音频点对应的频点能量比均小于或等于能量比阈值,则可以认为近端通信设备的麦克风处于关闭状态,此时近端通信设备的麦克风无法捕捉到近端通信设备的扬声器发出的远端语音信号,且回声消除系统只能获取到远端通信设备传输的远端参考信号,无法获取到近端音频信号,可以确定通信状态为远端单讲状态;若存在至少一个远端消音频点对应的频点能量比大于能量比阈值,则可以认为近端通信设备的麦克风处于开启状态,此时近端通信设备的麦克风可以捕捉到近端通信设备的扬声器发出的远端语音信号,即近端通信设备的麦克风既可以获取近端通信人员发出的语音信号,也可以获取到由近端通信设备上的扬声器发出的远端通信人员的语音信号,此时回声消除系统可以获取到远端通信设备传输的远端参考信号,以及近端通信设备的麦克风采集到的扬声器发出的远端音频信号,因此可以确定通信状态为双讲状态。
上述通信状态检测方法中,在确定远端参考信号存在远端语音信号时,确定麦克风采集信号中的远端消音频点的第一语音信号存在概率,远端消音频点的第一信号能量,远端消音频点的邻近频点的第二语音信号存在概率,以及邻近频点的第二信号能量,根据第一语音存在概率、第一信号能量、第二语音存在概率和第二信号能量确定通信状态。解决了在进行通信状态检测时,直接通过麦克风信号频点能量和扬声器信号频点能量的差异值确定通信状态是否为双讲状态,导致的对通信状态的检测结果会受到噪声影响,所确定的通信状态的准确率较低的问题。上述方法,在进行通信状态检测时,通过对远端信号固定频点消音产生远端消音频点,可以扩大远端语音和近端语音的差异,在一定程度上提高通信状态检测精度,同时,根据远端消音频点的语音信号存在概率,远端消音频点的信号能量,远端消音频点的邻近频点的语音信号存在概率,以及邻近频点的信号能量确定通信状态是否为双讲状态,可在对通信状态进行检测时消除噪声干扰,进一步提高通信状态的检测精确度,从而提高回声消除精度,提升用户的通信体验。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的通信状态检测方法的通信状态检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个通信状态检测装置实施例中的具体限定可以参见上文中对于通信状态检测方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种通信状态检测装置,包括:远端语音信号确定模块701、信号存在概率确定模块702、信号能量确定模块703、频点能量确定模块704和通信状态确定模块705,其中:
远端语音信号确定模块701,用于根据远端参考信号确定是否存在远端语音信号;
信号存在概率确定模块702,用于若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及远端消音频点的邻近频点的第二语音信号存在概率;
信号能量确定模块703,用于确定远端消音频点的第一信号能量,以及邻近频点的第二信号能量;
频点能量确定模块704,用于根据第一语音信号存在概率和第一信号能量确定远端消音频点的频点能量,并根据第二语音信号存在概率和第二信号能量确定邻近频点的频点能量;
通信状态确定模块705,用于根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
上述通信状态检测装置,在确定远端参考信号存在远端语音信号时,确定麦克风采集信号中的远端消音频点的第一语音信号存在概率,远端消音频点的第一信号能量,远端消音频点的邻近频点的第二语音信号存在概率,以及邻近频点的第二信号能量,根据第一语音存在概率、第一信号能量、第二语音存在概率和第二信号能量确定通信状态。解决了在进行通信状态检测时,直接通过麦克风信号频点能量和扬声器信号频点能量的差异值确定通信状态是否为双讲状态,导致的对通信状态的检测结果会受到噪声影响,所确定的通信状态的准确率较低的问题。上述方法,在进行通信状态检测时,通过对远端信号固定频点消音产生远端消音频点,可以扩大远端语音和近端语音的差异,在一定程度上提高通信状态检测精度,同时,根据远端消音频点的语音信号存在概率,远端消音频点的信号能量,远端消音频点的邻近频点的语音信号存在概率,以及邻近频点的信号能量确定通信状态是否为双讲状态,可在对通信状态进行检测时消除噪声干扰,进一步提高通信状态的检测精确度,从而提高回声消除精度,提升用户的通信体验。
示例性的,频点能量确定模块704具体用于:
根据第一语音信号存在概率和第一信号能量的乘积确定第一频谱能量,并根据第二语音信号存在概率和第二信号能量的乘积确定第二频谱能量;
根据第一频谱能量确定远端消音频点的频点能量,并根据第二频谱能量确定邻近频点的频点能量。
进一步的,频点能量确定模块704还具体用于:
根据连续帧的第一频谱能量的能量和确定远端消音频点的频点能量;
根据连续帧的第二频谱能量的能量和确定邻近频点的频点能量。
示例性的,通信状态确定模块705具体用于:
确定远端消音频点的频点能量和邻近频点的频点能量之间的频点能量比;
根据频点能量比确定通信状态。
进一步的,通信状态确定模块705还具体用于:
确定频点能量比是否均小于或等于能量比阈值;
若是,则确定通信状态为远端单讲状态;
若否,则确定通信状态为双讲状态。
进一步的,信号存在概率确定模块702具体用于:
确定麦克风采集信号中是否存在远端消音频点的远端音频信号;
若是,则通过降噪算法,根据麦克风采集信号中的远端音频信号确定远端消音频点的语音先验信噪比,并根据远端消音频点的邻近频点的邻近音频信号确定邻近频点的语音先验信噪比;
根据远端消音频点的语音先验信噪比确定远端消音频点的第一语音信号存在概率,并根据邻近频点的语音先验信噪比确定邻近频点的第二语音信号存在概率。
示例性的,远端语音信号确定模块701具体用于:
接收远端参考信号,并对远端参考信号进行语音识别,确定远端参考信号中的语音端点信息;
根据语音端点信息确定是否存在远端语音信号。
上述通信状态检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种通信状态检测方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
步骤一、根据远端参考信号确定是否存在远端语音信号;
步骤二、若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及远端消音频点的邻近频点的第二语音信号存在概率;
步骤三、确定远端消音频点的第一信号能量,以及邻近频点的第二信号能量;
步骤四、根据第一语音信号存在概率和第一信号能量确定远端消音频点的频点能量,并根据第二语音信号存在概率和第二信号能量确定邻近频点的频点能量;
步骤五、根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
步骤一、根据远端参考信号确定是否存在远端语音信号;
步骤二、若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及远端消音频点的邻近频点的第二语音信号存在概率;
步骤三、确定远端消音频点的第一信号能量,以及邻近频点的第二信号能量;
步骤四、根据第一语音信号存在概率和第一信号能量确定远端消音频点的频点能量,并根据第二语音信号存在概率和第二信号能量确定邻近频点的频点能量;
步骤五、根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
步骤一、根据远端参考信号确定是否存在远端语音信号;
步骤二、若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及远端消音频点的邻近频点的第二语音信号存在概率;
步骤三、确定远端消音频点的第一信号能量,以及邻近频点的第二信号能量;
步骤四、根据第一语音信号存在概率和第一信号能量确定远端消音频点的频点能量,并根据第二语音信号存在概率和第二信号能量确定邻近频点的频点能量;
步骤五、根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种通信状态检测方法,其特征在于,包括:
根据远端参考信号确定是否存在远端语音信号;
若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率;
确定所述远端消音频点的第一信号能量,以及所述邻近频点的第二信号能量;
根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量;
根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
2.根据权利要求1所述的方法,其特征在于,根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量,包括:
根据所述第一语音信号存在概率和所述第一信号能量的乘积确定第一频谱能量,并根据所述第二语音信号存在概率和所述第二信号能量的乘积确定第二频谱能量;
根据所述第一频谱能量确定远端消音频点的频点能量,并根据所述第二频谱能量确定邻近频点的频点能量。
3.根据权利要求2所述的方法,其特征在于,根据所述第一频谱能量确定远端消音频点的频点能量,并根据所述第二频谱能量确定邻近频点的频点能量,包括:
根据连续帧的第一频谱能量的能量和确定远端消音频点的频点能量;
根据连续帧的第二频谱能量的能量和确定邻近频点的频点能量。
4.根据权利要求1所述的方法,其特征在于,根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态,包括:
确定远端消音频点的频点能量和邻近频点的频点能量之间的频点能量比;
根据所述频点能量比确定通信状态。
5.根据权利要求4所述的方法,其特征在于,根据所述频点能量比确定通信状态,包括:
确定所述频点能量比是否均小于或等于能量比阈值;
若是,则确定通信状态为远端单讲状态;
若否,则确定通信状态为双讲状态。
6.根据权利要求1所述的方法,其特征在于,根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率,包括:
确定麦克风采集信号中是否存在远端消音频点的远端音频信号;
若是,则通过降噪算法,根据所述麦克风采集信号中的远端音频信号确定远端消音频点的语音先验信噪比,并根据所述远端消音频点的邻近频点的邻近音频信号确定邻近频点的语音先验信噪比;
根据远端消音频点的语音先验信噪比确定所述远端消音频点的第一语音信号存在概率,并根据邻近频点的语音先验信噪比确定所述邻近频点的第二语音信号存在概率。
7.根据权利要求1所述的方法,其特征在于,根据远端参考信号确定是否存在远端语音信号,包括:
接收远端参考信号,并对所述远端参考信号进行语音识别,确定所述远端参考信号中的语音端点信息;
根据所述语音端点信息确定是否存在远端语音信号。
8.一种通信状态检测装置,其特征在于,所述通信状态检测装置包括:
远端语音信号确定模块,用于根据远端参考信号确定是否存在远端语音信号;
信号存在概率确定模块,用于若是,则根据麦克风采集信号,确定远端消音频点的第一语音信号存在概率,以及所述远端消音频点的邻近频点的第二语音信号存在概率;
信号能量确定模块,用于确定所述远端消音频点的第一信号能量,以及所述邻近频点的第二信号能量;
频点能量确定模块,用于根据所述第一语音信号存在概率和所述第一信号能量确定远端消音频点的频点能量,并根据所述第二语音信号存在概率和所述第二信号能量确定邻近频点的频点能量;
通信状态确定模块,用于根据远端消音频点的频点能量和邻近频点的频点能量确定通信状态。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311278871.5A CN117544534A (zh) | 2023-09-28 | 2023-09-28 | 通信状态检测方法、装置、计算机设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311278871.5A CN117544534A (zh) | 2023-09-28 | 2023-09-28 | 通信状态检测方法、装置、计算机设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117544534A true CN117544534A (zh) | 2024-02-09 |
Family
ID=89786908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311278871.5A Pending CN117544534A (zh) | 2023-09-28 | 2023-09-28 | 通信状态检测方法、装置、计算机设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117544534A (zh) |
-
2023
- 2023-09-28 CN CN202311278871.5A patent/CN117544534A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10045140B2 (en) | Utilizing digital microphones for low power keyword detection and noise suppression | |
US9668048B2 (en) | Contextual switching of microphones | |
CN103190139B (zh) | 用于提供会议信息的系统和方法 | |
US20090323924A1 (en) | Acoustic echo suppression | |
CN104067341A (zh) | 在存在背景噪声的情况下的语音活动检测 | |
US11011182B2 (en) | Audio processing system for speech enhancement | |
WO2016180100A1 (zh) | 一种音频处理的性能提升方法及装置 | |
CN111883091A (zh) | 音频降噪方法和音频降噪模型的训练方法 | |
CN109616135B (zh) | 音频处理方法、装置及存储介质 | |
CN109756818B (zh) | 双麦克风降噪方法、装置、存储介质及电子设备 | |
CN106165015B (zh) | 用于促进基于加水印的回声管理的装置和方法 | |
CN111667843B (zh) | 终端设备的语音唤醒方法、系统、电子设备、存储介质 | |
JP2024507916A (ja) | オーディオ信号の処理方法、装置、電子機器、及びコンピュータプログラム | |
CN114333912B (zh) | 语音激活检测方法、装置、电子设备和存储介质 | |
WO2022143522A1 (zh) | 音频信号处理方法、装置和电子设备 | |
WO2023000444A1 (zh) | 扬声器的杂音检测方法、装置、电子设备和存储介质 | |
CN107910012B (zh) | 音频数据处理方法、装置及系统 | |
CN116705045B (zh) | 回声消除方法、装置、计算机设备和存储介质 | |
CN112863545B (zh) | 性能测试方法、装置、电子设备及计算机可读存储介质 | |
WO2024041512A1 (zh) | 音频降噪方法、装置、电子设备及可读存储介质 | |
CN110992975B (zh) | 一种语音信号处理方法、装置及终端 | |
CN110517708B (zh) | 一种音频处理方法、装置及计算机存储介质 | |
CN117457018A (zh) | 啸叫抑制方法和啸叫抑制装置 | |
CN117544534A (zh) | 通信状态检测方法、装置、计算机设备以及存储介质 | |
CN108962259B (zh) | 处理方法及第一电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |