CN111615035B - 一种波束形成方法、装置、设备和存储介质 - Google Patents

一种波束形成方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111615035B
CN111615035B CN202010443918.9A CN202010443918A CN111615035B CN 111615035 B CN111615035 B CN 111615035B CN 202010443918 A CN202010443918 A CN 202010443918A CN 111615035 B CN111615035 B CN 111615035B
Authority
CN
China
Prior art keywords
channel
sound
target
determining
detection signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010443918.9A
Other languages
English (en)
Other versions
CN111615035A (zh
Inventor
何俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rongcheng goer Technology Co.,Ltd.
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN202010443918.9A priority Critical patent/CN111615035B/zh
Publication of CN111615035A publication Critical patent/CN111615035A/zh
Application granted granted Critical
Publication of CN111615035B publication Critical patent/CN111615035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种波束形成方法、装置、设备和计算机可读存储介质,该方法包括:采集各个声道的声音信号;结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道;以所述目标声道为导向进行波束形成。由上可知,本申请在采集到各个声道的声音信号之后,可选择与AEC检测信号关联度高或/和能量分布接近的声音信号确定为目标声道,以便将目标声道作为导向进行波束形成,即本申请能够结合AEC检测信号动态调整目标方向,从而有效调节波束形成的指向性,使阵列接收信号达到更优的指向性效果。

Description

一种波束形成方法、装置、设备和存储介质
技术领域
本申请涉及智能音箱等产品波束形成技术领域,更具体地说,涉及一种波束形成方法、装置、设备和一种计算机可读存储介质。
背景技术
随着5G的问世,波束形成技术也成为了当下发展的热点之一。所谓的波束形成(beamforming),亦称空域滤波,是阵列信号处理的一个主要方面。技术理论框图如图1所示,其本质是通过对各阵元加权进行空域滤波,阵列的输出经过加权求和后,可以在一定时间内将阵列波束“导向”到一个方向,来达到增强期望信号、抑制干扰的目的,计算公式如下:
Figure BDA0002505067730000011
由此公式可知,针对固定阵列输入的固定信号,波束形成的输出结果完全由权重系数hi决定。而权重系数固定,只能将阵列波束导向到一个固定的方向。当信号源于这个固定方向以外的方向时,增强期望信号、抑制干扰的效果不理想。因此,如何动态地确定合适的目标方向是本领域技术人员亟待解决的问题。
发明内容
本申请的目的在于提供一种波束形成方法、装置、设备和一种计算机可读存储介质,能够有效调节波束形成的指向性。
为实现上述目的,本申请提供了一种波束形成方法,包括:
采集各个声道的声音信号;
结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道;
以所述目标声道为导向进行波束形成。
可选的,所述结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道,包括:
确定所述声音信号与所述AEC检测信号的相关系数,并基于所述相关系数在所述声音信号中确定候选声道;
利用所述AEC检测信号确定目标频域范围,根据所述目标频域范围从所述候选声道中选择所述目标声道。
可选的,所述结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道,包括:
利用所述AEC检测信号确定目标频域范围,根据所述目标频域范围在所述声音信号中确定候选声道;
确定所述声音信号与所述AEC检测信号的相关系数,并基于所述相关系数从所述候选声道中选择所述目标声道。
可选的,所述确定所述声音信号与所述AEC检测信号的相关系数,包括:
基于第一公式计算所述声音信号与所述AEC检测信号的相关系数,所述第一公式为:
Figure BDA0002505067730000021
其中,x和y分别为所述声音信号与所述AEC检测信号在当前时间节点的时域值,COV(x,y)为x和y的协方差,Var表示方差,ρxy为相关系数;
当确定所述候选声道时,将所述相关系数大于第一阈值的声道确定为所述候选声道;
当确定所述目标声道时,将所述相关系数最大的候选声道确定为所述目标声道。
可选的,在所述确定所述声音信号与所述AEC检测信号的相关系数之后,还包括:
判断各个所述声音信号对应的所述相关系数中是否存在大于第二阈值的系数;
如果是,则允许执行将所述相关系数最大的候选声道确定为所述目标声道的步骤;
如果否,则结束当前工作进程,禁止执行将所述相关系数最大的候选声道确定为所述目标声道的步骤。
可选的,所述利用所述AEC检测信号确定目标频域范围,包括:
对所述AEC检测信号进行频域划分,并计算各个频段的第一能量占比;
将所述第一能量占比大于第三阈值的频段确定为所述目标频域范围,并计算各个声道在所述目标频域范围的第二能量占比;
当确定所述候选声道时,将所述第二能量占比大于第四阈值的声道确定为所述候选声道;
当确定所述目标声道时,将所述第二能量占比中最大能量占比对应的候选声道作为所述目标声道。
可选的,在所述计算各个所述候选声道在所述目标频域范围的第二能量占比之后,还包括:
判断各个所述候选声道对应的第二能量占比中是否存在大于第五阈值的能量占比;
如果是,则允许执行将所述第二能量占比中最大能量占比对应的候选声道作为所述目标声道的步骤;
如果否,则结束当前工作进程,禁止执行将所述第二能量占比中最大能量占比对应的候选声道作为所述目标声道的步骤。
可选的,所述以所述目标声道为导向进行波束形成,包括:
根据各个声道与所述目标声道的声程差计算各个声道对应的补偿参数;
根据各声道对应的补偿参数通过反比例运算调整权重系数,以使波束形成指向目标声道,形成目标波束。
为实现上述目的,本申请提供了一种波束形成装置,包括:
信号采集模块,用于采集各个声道的声音信号;
声道确定模块,用于结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道;
波束形成模块,用于以所述目标声道为导向进行波束形成。
为实现上述目的,本申请提供了一种波束形成设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现前述公开的任一种波束形成方法的步骤。
为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述公开的任一种波束形成方法的步骤。
通过以上方案可知,本申请提供的一种波束形成方法,包括:采集各个声道的声音信号;结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道;以所述目标声道为导向进行波束形成。由上可知,本申请在采集到各个声道的声音信号之后,可以选择与AEC检测信号关联度高或/和能量分布接近的声音信号确定为目标声道,以便将目标声道作为导向进行波束形成,即本申请能够结合AEC检测信号动态调整目标方向,从而有效调节波束形成的指向性,使阵列接收信号达到更优的指向性效果。
本申请还公开了一种波束形成装置、设备和一种计算机可读存储介质,同样能实现上述技术效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为传统技术中波束形成的技术理论框图;
图2为本申请实施例公开的一种波束形成方法的流程图;
图3为一种具体的AEC回声消除技术的理论框图;
图4、图5为本申请实施例公开的另一种波束形成方法的流程图;
图6为本申请实施例公开的又一种波束形成方法的流程图;
图7为本申请实施例公开的一种波束形成装置的结构图;
图8为本申请实施例公开的一种波束形成设备的结构图;
图9为本申请实施例公开的另一种波束形成设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在相关技术中,波束形成的本质是通过对各阵元加权进行空域滤波,阵列的输出经过加权求和后,可以在一定时间内将阵列波束“导向”到一个方向,来达到增强期望信号、抑制干扰的目的,然而,针对固定阵列输入的固定信号,波束形成的输出结果完全由权重系数hi决定。在实际应用中,期望信号的方向通常是未知的,因此选择合适的权重系数是波束形成技术的关键所在。
因此,本申请实施例公开了一种波束形成方法,能够有效调节波束形成的指向性。
参见图2所示,本申请实施例公开的一种波束形成方法包括:
S101:采集各个声道的声音信号;
本申请实施例中,可以利用麦克风采集各个声道的声音信息。针对智能音箱等产品,通常存在多通道麦克风阵列,每个麦克风对应一个声道,由于各个麦克风声程差的不同,导致其接收信号相位差也存在不同。麦克风接收的信号中包括回声信号、噪声干扰信号和目标信号。
S102:结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道;
在本步骤中,可以结合AEC(Acoustic Echo Cancellation,回声消除)检测信号,即AEC中的扬声器输出信号,从声音信号中选择与AEC检测信号关联度较高或/和能量分布较接近的声音信号,以确定目标声道。图3为AEC回声消除技术的理论框图,参见图3所示,回声的主要来源是麦克风经过墙壁等大部件的反射传导,回声消除技术即为在接收信号中根据输出信号的成分进行检测和消除。
需要说明的是,本申请实施例可以通过关联度和能量分布中任一数据进行目标声道的选择。即可以选取声音信号中与AEC检测信号关联度最高的作为目标声道,或选取声音信号中与AEC检测信号能量分布最接近的作为目标声道。
作为一种优选的实施方式,为了提高准确度,可以结合关联度和能量分布两种数据进行目标声道的选择。在一种可行的实施方式中,可以先选取声音信号中与AEC检测信号关联度较高的若干声音信号作为候选声道,进而选取候选声道中与AEC检测信号能量分布最接近的作为目标声道;在另外一种可行的实施方式中,可以先选取声音信号中与AEC检测信号能量分布较接近的若干声音信号作为候选声道,进而选取候选声道中与AEC检测信号关联度较高的作为目标声道。
S103:以所述目标声道为导向进行波束形成。
可以理解的是,基于上述确定的目标声道,本步骤将以目标声道作为导向进行波束形成。具体地,可以先确定各个声道与目标声道之间的声程差,并进一步根据各个声道与目标声道的声程差,通过相位补偿或时间补偿的方式计算各个声道对应的补偿参数,由此可基于各声道对应的补偿参数调整权重系数,以使波束形成指向目标声道,形成目标波束。
在具体实施中,根据各声道对应的补偿参数调整权重系数时,可以通过反比例运算进行计算,即补偿参数越大,权重参数越小。这是由于补偿参数越大,表征该声道距离目标声道越远,因此对应的权重参数应当越小;反之,补偿参数越小,表征该声道距离目标声道越近,则对应的权重参数应当越大。本申请实施例并不对具体的计算公式进行限定,只需满足补偿参数和权重系数的反比例关系即可。
通过以上方案可知,本申请提供的一种波束形成方法,包括:采集各个声道的声音信号;结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道;以所述目标声道为导向进行波束形成。由上可知,本申请在采集到各个声道的声音信号之后,可以选择与AEC检测信号关联度高或/和能量分布接近的声音信号确定为目标声道,以便将目标声道作为导向进行波束形成,即本申请能够结合AEC检测信号动态调整目标方向,从而有效调节波束形成的指向性,使阵列接收信号达到更优的指向性效果。
本申请实施例公开了另一种波束形成方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。参见图4、图5所示,具体的:
S201:采集各个声道的声音信号;
S202:确定所述声音信号与所述AEC检测信号的相关系数,并基于所述相关系数在所述声音信号中确定候选声道;
在具体实施中,可基于第一公式计算声音信号与AEC检测信号的相关系数,相关系数用于表征声音信号和AEC检测信号的关联程度。第一公式可以具体为:
Figure BDA0002505067730000071
其中,x和y分别为声音信号与AEC检测信号在当前时间节点的时域值,COV(x,y)为x和y的协方差,Var表示方差,ρxy为相关系数。ρxy的计算结果在0到1之间,其大小与x和y的相关程度呈正相关。上述第一公式具体为计算声音信号和AEC检测信号相关系数的一种具体实施方式,并不能用于限定如何计算二者的相关系数。
进而可在各个声道中筛选出相关系数大于第一阈值的声道,将其确定为候选声道。优选的,由于接收信号中信号成分较多,上述第一阈值可以选择相对较小的阈值,以尽量保证不会有方向的泄露。当然,在具体实施过程中第一阈值可以根据需求进行设定,本实施例对此不进行具体限定。
S203:利用所述AEC检测信号确定目标频域范围,根据所述目标频域范围从所述候选声道中选择所述目标声道;
具体地,本申请实施例可针对步骤S102筛选得到的候选声道进行进一步的频率成分能力分析。首先,可对AEC检测信号进行频域划分,并计算各个频段的第一能量占比,进而可将第一能量占比大于第三阈值的频段确定为目标频域范围。例如,假设第三阈值为95%,若200~300Hz的能量占比大于95%,则选择200~300Hz作为目标频域范围;若100~200Hz的能量占比为10%,200~300Hz的能量占比为85%,则选择100~300Hz作为目标频域范围。
进一步地,可根据上述确定的目标频域范围从候选声道中选择得到目标声道。首先可以计算各个候选声道在目标频域范围的第二能量占比,并选择第二能量占比中最大能量占比对应的声道作为目标声道。
需要指出的是,在计算各个候选声道在目标频域范围的第二能量占比之后,还可判断各个候选声道对应的第二能量占比中是否存在大于第五阈值的能量占比。若存在,则可进入后续选择最大能量占比以确定目标声道的流程;若不存在,则判定为无有效信号,可直接结束当前工作进程,无需进入后续确定目标声道的工作流程。
S204:以所述目标声道为导向进行波束形成。
可以理解的是,在确定目标信道后,可以目标信道为基准,对其余声道的信号进行相应的相位延迟和提前即可。具体可通过如下公式计算补偿角:
Figure BDA0002505067730000081
其中,表示第i个麦克风距离基准点(目标)的相对距离,等于声程差,或是声程差乘一个系数,τ表示声波波长,确定补偿角后根据补偿角确定第i个的权重系数,补偿角越大,说明该麦克风距离目标声道越远,该麦克风的权重越小;反之,补偿角越小,权重越大。上述内容仅仅是相位补偿的一种具体实施方式,并不能用于限定波束形成参数的调整方法。
本申请实施例中,具体采用了应用于智能音箱等产品的基于回声检测的自适应波束形成技术,该技术可以有效的调节波束形成的指向性,使阵列接收信号方向指向使用者所需要的方向。在实际应用中,由于产品通常摆放在墙边,该方法的自适应波束形成效果更好。
本申请实施例公开了又一种波束形成方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。参见图6所示,具体的:
S301:采集各个声道的声音信号;
S302:利用所述AEC检测信号确定目标频域范围,根据所述目标频域范围在所述声音信号中确定候选声道;
本申请实施例中,可以对AEC检测信号进行频域划分,计算各个频段的第一能量占比,并将第一能量占比大于第三阈值的频段确定为目标频域范围。进而可计算各个声音信号在目标频域范围的第二能量占比,将第二能量占比大于第四阈值的声道确定为候选声道。上述第四阈值可以选择相对较小的阈值,以尽量保证不会有方向的泄露。在具体实施过程中,第四阈值可以根据需求进行设定,本实施例对此不进行具体限定。
S303:确定所述声音信号与所述AEC检测信号的相关系数,并基于所述相关系数从所述候选声道中选择所述目标声道;
在一种具体的实施方式中,本步骤可以基于上述第一公式计算声音信号与AEC检测信号的相关系数,将相关系数最大的候选声道确定为目标声道。
需要指出的是,在计算各个声音信号与AEC检测信号的相关系数之后,还可判断各个声音信号对应的相关系数中是否存在大于第二阈值的系数。若存在,则可进入后续将相关系数最大的候选声道确定为目标声道的流程;若不存在,则判定为无有效信号,可直接结束当前工作进程,无需进入后续确定目标声道的工作流程。
S304:以所述目标声道为导向进行波束形成。
下面对本申请实施例提供的一种波束形成装置进行介绍,下文描述的一种波束形成装置与上文描述的一种波束形成装置可以相互参照。
参见图7所示,本申请实施例提供的一种波束形成装置包括:
信号采集模块401,用于采集各个声道的声音信号;
声道确定模块402,用于结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道;
波束形成模块403,用于以所述目标声道为导向进行波束形成。
关于上述模块401至403的具体实施过程可参考前述实施例提供的相应内容,在此不再进行赘述。
本申请还提供了一种波束形成设备,参见图8所示,本申请实施例提供的一种波束形成设备包括:
存储器100,用于存储计算机程序;
处理器200,用于执行所述计算机程序时可以实现上述实施例所提供的步骤。
具体的,存储器100包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机可读指令,该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。处理器200在一些实施例中可以是一中央处理器(CentralProcessing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,为波束形成设备提供计算和控制能力,执行所述存储器100中保存的计算机程序时,可以实现前述任一实施例公开的波束形成方法的步骤。
在上述实施例的基础上,作为优选实施方式,参见图9所示,所述波束形成设备还包括:
输入接口300,与处理器200相连,用于获取外部导入的计算机程序、参数和指令,经处理器200控制保存至存储器100中。该输入接口300可以与输入装置相连,接收用户手动输入的参数或指令。该输入装置可以是显示屏上覆盖的触摸层,也可以是终端外壳上设置的按键、轨迹球或触控板,也可以是键盘、触控板或鼠标等。
显示单元400,与处理器200相连,用于显示处理器200处理的数据以及用于显示可视化的用户界面。该显示单元400可以为LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。
网络端口500,与处理器200相连,用于与外部各终端设备进行通信连接。该通信连接所采用的通信技术可以为有线通信技术或无线通信技术,如移动高清链接技术(MHL)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术等。
图9仅示出了具有组件100-500的波束形成设备,本领域技术人员可以理解的是,图9示出的结构并不构成对波束形成设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本申请还提供了一种计算机可读存储介质,该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述任一实施例公开的波束形成方法的步骤。
本申请在采集到各个声道的声音信号之后,可以选择与AEC检测信号关联度高或/和能量分布接近的声音信号确定为目标声道,以便将目标声道作为导向进行波束形成,即本申请能够结合AEC检测信号动态调整目标方向,从而有效调节波束形成的指向性,使阵列接收信号达到更优的指向性效果。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (11)

1.一种波束形成方法,其特征在于,包括:
采集各个声道的声音信号;
结合AEC检测信号,选择与所述AEC检测信号关联度高或/和能量分布接近的所述声音信号作为目标声道;所述AEC检测信号为AEC中的扬声器输出信号;
以所述目标声道为导向进行波束形成。
2.根据权利要求1所述的波束形成方法,其特征在于,所述结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道,包括:
确定所述声音信号与所述AEC检测信号的相关系数,并基于所述相关系数在所述声音信号中确定候选声道;
利用所述AEC检测信号确定目标频域范围,根据所述目标频域范围从所述候选声道中选择所述目标声道。
3.根据权利要求1所述的波束形成方法,其特征在于,所述结合AEC检测信号,通过关联度或/和能量分布在所述声音信号中确定目标声道,包括:
利用所述AEC检测信号确定目标频域范围,根据所述目标频域范围在所述声音信号中确定候选声道;
确定所述声音信号与所述AEC检测信号的相关系数,并基于所述相关系数从所述候选声道中选择所述目标声道。
4.根据权利要求2或3所述的波束形成方法,其特征在于,所述确定所述声音信号与所述AEC检测信号的相关系数,包括:
基于第一公式计算所述声音信号与所述AEC检测信号的相关系数,所述第一公式为:
Figure FDA0003001573790000011
其中,x和y分别为所述声音信号与所述AEC检测信号在当前时间节点的时域值,COV(x,y)为x和y的协方差,Var表示方差,ρxy为相关系数;
当确定所述候选声道时,将所述相关系数大于第一阈值的声道确定为所述候选声道;
当确定所述目标声道时,将所述相关系数最大的候选声道确定为所述目标声道。
5.根据权利要求4所述的波束形成方法,其特征在于,在所述确定所述声音信号与所述AEC检测信号的相关系数之后,还包括:
判断各个所述声音信号对应的所述相关系数中是否存在大于第二阈值的系数;
如果是,则允许执行将所述相关系数最大的候选声道确定为所述目标声道的步骤;
如果否,则结束当前工作进程,禁止执行将所述相关系数最大的候选声道确定为所述目标声道的步骤。
6.根据权利要求2或3所述的波束形成方法,其特征在于,所述利用所述AEC检测信号确定目标频域范围,包括:
对所述AEC检测信号进行频域划分,并计算各个频段的第一能量占比;
将所述第一能量占比大于第三阈值的频段确定为所述目标频域范围,并计算各个声道在所述目标频域范围的第二能量占比;
当确定所述候选声道时,将所述第二能量占比大于第四阈值的声道确定为所述候选声道;
当确定所述目标声道时,将所述第二能量占比中最大能量占比对应的候选声道作为所述目标声道。
7.根据权利要求6所述的波束形成方法,其特征在于,在所述计算各个所述候选声道在所述目标频域范围的第二能量占比之后,还包括:
判断各个所述候选声道对应的第二能量占比中是否存在大于第五阈值的能量占比;
如果是,则允许执行将所述第二能量占比中最大能量占比对应的候选声道作为所述目标声道的步骤;
如果否,则结束当前工作进程,禁止执行将所述第二能量占比中最大能量占比对应的候选声道作为所述目标声道的步骤。
8.根据权利要求1、2、3、5、7任一项所述的波束形成方法,其特征在于,所述以所述目标声道为导向进行波束形成,包括:
根据各个声道与所述目标声道的声程差计算各个声道对应的补偿参数;
根据各声道对应的补偿参数通过反比例运算调整权重系数,以使波束形成指向目标声道,形成目标波束。
9.一种波束形成装置,其特征在于,包括:
信号采集模块,用于采集各个声道的声音信号;
声道确定模块,用于结合AEC检测信号,选择与所述AEC检测信号关联度高或/和能量分布接近的所述声音信号作为目标声道;所述AEC检测信号为AEC中的扬声器输出信号;
波束形成模块,用于以所述目标声道为导向进行波束形成。
10.一种波束形成设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至8任一项所述波束形成方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述波束形成方法的步骤。
CN202010443918.9A 2020-05-22 2020-05-22 一种波束形成方法、装置、设备和存储介质 Active CN111615035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010443918.9A CN111615035B (zh) 2020-05-22 2020-05-22 一种波束形成方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010443918.9A CN111615035B (zh) 2020-05-22 2020-05-22 一种波束形成方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111615035A CN111615035A (zh) 2020-09-01
CN111615035B true CN111615035B (zh) 2021-05-14

Family

ID=72202258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010443918.9A Active CN111615035B (zh) 2020-05-22 2020-05-22 一种波束形成方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111615035B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109285556A (zh) * 2018-09-29 2019-01-29 百度在线网络技术(北京)有限公司 音频处理方法、装置、设备以及存储介质
CN109616134A (zh) * 2017-10-04 2019-04-12 国光电器股份有限公司 多通道子带处理
CN110875045A (zh) * 2018-09-03 2020-03-10 阿里巴巴集团控股有限公司 一种语音识别方法、智能设备和智能电视
CN110890104A (zh) * 2019-11-26 2020-03-17 苏州思必驰信息科技有限公司 语音端点检测方法及系统
EP3644588A1 (en) * 2018-10-24 2020-04-29 Yamaha Corporation Audio signal processing apparatus, mixer and audio signal processing method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10446169B1 (en) * 2018-03-26 2019-10-15 Motorola Mobility Llc Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo
CN110503970B (zh) * 2018-11-23 2021-11-23 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
CN110660404B (zh) * 2019-09-19 2021-12-07 北京声加科技有限公司 基于零陷滤波预处理的语音通信和交互应用系统、方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109616134A (zh) * 2017-10-04 2019-04-12 国光电器股份有限公司 多通道子带处理
CN110875045A (zh) * 2018-09-03 2020-03-10 阿里巴巴集团控股有限公司 一种语音识别方法、智能设备和智能电视
CN109285556A (zh) * 2018-09-29 2019-01-29 百度在线网络技术(北京)有限公司 音频处理方法、装置、设备以及存储介质
EP3644588A1 (en) * 2018-10-24 2020-04-29 Yamaha Corporation Audio signal processing apparatus, mixer and audio signal processing method
CN110890104A (zh) * 2019-11-26 2020-03-17 苏州思必驰信息科技有限公司 语音端点检测方法及系统

Also Published As

Publication number Publication date
CN111615035A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
US11967316B2 (en) Audio recognition method, method, apparatus for positioning target audio, and device
US9031257B2 (en) Processing signals
US8981994B2 (en) Processing signals
EP2748816B1 (en) Processing audio signals
US9042573B2 (en) Processing signals
CN102915753B (zh) 一种电子设备的智能控制音量的方法及实现装置
CN104781880A (zh) 用于提供通知的多信道语音存在概率估计的装置和方法
Salvati et al. Incoherent frequency fusion for broadband steered response power algorithms in noisy environments
CN110554357B (zh) 声源定位方法和装置
US20090279715A1 (en) Method, medium, and apparatus for extracting target sound from mixed sound
US8014230B2 (en) Adaptive array control device, method and program, and adaptive array processing device, method and program using the same
CN110261816B (zh) 语音波达方向估计方法及装置
KR20170053623A (ko) 사운드 소스들을 향상시키기 위한 방법 및 장치
CN109151671B (zh) 音频处理装置、音频处理方法和计算机程序产品
CN102855880A (zh) 用于多话筒音频设备的去噪方法
CN109616135B (zh) 音频处理方法、装置及存储介质
US20090121934A1 (en) Adaptive array control device, method and program, and adaptive array processing device, method and program
CN111615035B (zh) 一种波束形成方法、装置、设备和存储介质
CN113160846A (zh) 噪声抑制方法和电子设备
CN112735370B (zh) 一种语音信号处理方法、装置、电子设备和存储介质
JP4809395B2 (ja) 無線通信装置および干渉電力低減方法
CN111954225B (zh) 路由器位置的确定方法及电子设备
CN113223552B (zh) 语音增强方法、装置、设备、存储介质及程序
Yu et al. Performance for randomly described arrays
US11770647B2 (en) Task assigning method and task assigning device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210723

Address after: 264300 No. 699, Jiangjun South Road, Rongcheng City, Weihai City, Shandong Province

Patentee after: Rongcheng goer Technology Co.,Ltd.

Address before: 266100 Room 308, Beizhai Street Investment Service Center, Laoshan District, Qingdao City, Shandong Province

Patentee before: GOERTEK TECHNOLOGY Co.,Ltd.