CN113109763B - 声源位置确定方法和装置、可读存储介质、电子设备 - Google Patents

声源位置确定方法和装置、可读存储介质、电子设备 Download PDF

Info

Publication number
CN113109763B
CN113109763B CN202010032781.8A CN202010032781A CN113109763B CN 113109763 B CN113109763 B CN 113109763B CN 202010032781 A CN202010032781 A CN 202010032781A CN 113109763 B CN113109763 B CN 113109763B
Authority
CN
China
Prior art keywords
sound source
spherical harmonic
signal
harmonic domain
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010032781.8A
Other languages
English (en)
Other versions
CN113109763A (zh
Inventor
胡玉祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Horizon Robotics Technology Research and Development Co Ltd
Original Assignee
Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Horizon Robotics Technology Research and Development Co Ltd filed Critical Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority to CN202010032781.8A priority Critical patent/CN113109763B/zh
Publication of CN113109763A publication Critical patent/CN113109763A/zh
Application granted granted Critical
Publication of CN113109763B publication Critical patent/CN113109763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本公开实施例公开了一种声源位置确定方法和装置、可读存储介质、电子设备,其中,方法包括:在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号;对所述至少一帧原始声音信号进行处理,得到球谐域信号;基于所述球谐域信号,从所述至少一个位置中确定声源位置;本实施例通过处理球谐域信号,提高了声源定位的效率,降低了运算量,并且可对不同类型的球形传声器阵列进行处理,提高了本实施例方法的适用范围。

Description

声源位置确定方法和装置、可读存储介质、电子设备
技术领域
本公开涉及声源定位技术,尤其是一种声源位置确定方法和装置、可读存储介质、电子设备。
背景技术
球谐域传声器阵列可以进行三维空间的声源定位,常用的球阵列定位方法分为基于波束的、基于子空间的以及球谐域最大似然定位方法等。但是,基于波束的声源定位方法,空间分辨率较低;基于子空间的和球谐域最大似然定位方法,需要知道声源数目的先验信息。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种声源位置确定方法和装置、可读存储介质、电子设备。
根据本公开实施例的一个方面,提供了一种声源位置确定方法,包括:
在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号;
对所述至少一帧原始声音信号进行处理,得到球谐域信号;
基于所述球谐域信号,从所述至少一个位置中确定声源位置。
根据本公开实施例的另一方面,提供了一种声源位置确定装置,包括:
信号采集模块,用于在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号;
信号处理模块,用于对所述信号采集模块获得的至少一帧原始声音信号进行处理,得到球谐域信号;
声源定位模块,用于基于所述信号处理模块得到的球谐域信号,从所述至少一个位置中确定声源位置。
根据本公开实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述实施例所述的声源位置确定方法。
根据本公开实施例的还一方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述实施例所述的声源位置确定方法。
基于本公开上述实施例提供的一种声源位置确定方法和装置、可读存储介质、电子设备,在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号;对所述至少一帧原始声音信号进行处理,得到球谐域信号;基于所述球谐域信号,从所述至少一个位置中确定声源位置;本实施例通过处理球谐域信号,提高了声源定位的效率,降低了运算量,并且可对不同类型的球形传声器阵列进行处理,提高了本实施例方法的适用范围。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开一示例性实施例提供的声源位置确定系统的系统框图。
图2是本公开一示例性实施例提供的声源位置确定系统确定的声源位置的示意图。
图3是本公开一示例性实施例提供的声源位置确定方法的流程示意图。
图4是本公开图3所示的实施例中步骤303的一个流程示意图。
图5是本公开图4所示的实施例中步骤3032的一个流程示意图。
图6是本公开图3所示的实施例中步骤302的一个流程示意图。
图7是本公开一示例性实施例提供的声源位置确定装置的结构示意图。
图8是本公开另一示例性实施例提供的声源位置确定装置的结构示意图。
图9是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
申请概述
在实现本公开的过程中,发明人发现,现有技术中的球阵列定位方法主要包括基于波束的声源定位方法,但该技术方案至少存在以下问题:空间分辨率较低。
示例性系统
图1是本公开一示例性实施例提供的声源位置确定系统的系统框图。如图1所示,包括:
步骤a,将球形传声器阵列接收到的时域信号x(t)=[x1(t),x2(t),…,xQ(t)]变换到频域,获得频域信号p(k),可以表示为以下公式(1):
p(k)=[p(k,Ω1)p(k,Ω2)…p(k,ΩQ)]T 公式(1)
其中,Q为传声器数目,k为波数,Ωq为第q个传声器的位置,[]T表示转置。
步骤b,将频域信号p(k)通过球谐变换变换(SHT)到球谐域,获得球谐域信号pnm(k),可以表示为以下公式(2)和(3):
pnm(k)≈B(k)Y(Ψ)HS(k)+vnm(k) 公式(3)
其中,Ψ=[ψ1 ψ2 … ψL]为声源的位置,s(k)=[s1(k) s2(k)…sL(k)]T为声源强度,vnm(k)为球谐域噪声信号,N为球阵列阶数,满足(N+1)2<Q,()H表示共轭转置。Y(Ψ)如以下公式(4)所示:
Y(Ψ)=[y(ψ1) y(ψ2) … y(ψL)]T 公式(4)
其中,公式(4)中的每个元素通过以下公式(5)得到:
公式(3)中的B(k)通过以下公式(6)得到:
B(k)=diag{b0(k) b1(k) b1(k) b1(k) … bN(k)} 公式(6)其中,为n阶m次球谐函数;bn(k)是球形阵列的模式强度,与阵列类型相关。
步骤c,移除球谐域信号相关性,获得与频率相互独立的球谐域信号anm(k),该球谐域信号可表示为以下公式(7):
anm(k)=B(k)-1pnm(k)≈Y(Ψ)Hs(k) 公式(7)
步骤d,使用盲源分离算法处理anm(k),其中(k=kmin,…,kmax),获得分离滤波器W。
由上述公式(7)可知,不同频率的球谐域信号对应的混合矩阵是相同的,均为Y(Ψ)H。使用盲源分离方法处理anm(k)可以获得分离矩阵W,W是一个(N+1)2×(N+1)2的矩阵,可以表示为以下公式(8):
为提升声源定位的鲁棒性,可以使用盲源分离算法,同时处理多帧信号,即anm(k),其中(k=kmin,…,kmax,t=1,2,…,T)。
步骤e,获得每组分离滤波器的全空间响应,将(N+1)2组全空间响应相乘获得最终的空间响应。第l组滤波器的空间响应可以表示为以下公式(9)所示:
其中,Θ为空间内的所有定位方向,Y(Θ)的定义与公式(4)类似。
盲源分离的收敛结果是抑制声源方向的信号,因此(N+1)2组分离滤波器中,至少有一组分离滤波器在声源方向的响应趋近于0。将所有空间响应相乘,即可获得最终的空间响应,可通过以下公式(10)表达空间响应矩阵:
其中,最小的至少一个极小值点对应的位置即为声源的位置,例如,在一个可选示例中,确定的声源位置在空间响应矩阵表示如图2所示,其中,用黑色框标识出的两个白色极小值点201和202即为确定的声源位置。
示例性方法
图3是本公开一示例性实施例提供的声源位置确定方法的流程示意图。本实施例可应用在电子设备上,如图3所示,包括如下步骤:
步骤301,在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号。
本实施例中,通常需要进行识别的声音信号需要多帧进行识别,因此,在设定时间内采集至少一帧原始声音信号进行后续声源定位,例如,唤醒场景下的唤醒词需要在唤醒词所在时间段内进行声音采集;可选地,获得的原始声音信号可以为如图1所示的实施例中步骤a)得到的时域信号x(t)。
步骤302,对至少一帧原始声音信号进行处理,得到球谐域信号。
在一实施例中,对原始声音信号的处理可以如图1所示实施例中步骤a)、b)和c)提供的处理方式,例如,通过步骤a)将采集的时域信号处理与频域信号,通过步骤b)将频域信号处理为球谐域信号pnm(k),通过步骤c)获得与频率相互独立的球谐域信号anm(k)。
步骤303,基于球谐域信号,从至少一个位置中确定声源位置。
可选地,对球谐域信号的处理可参照图1所示实施例中的步骤d)和e),使用盲源分离算法处理球谐域信号anm(k),得到多组分离滤波器,基于每组分离滤波器的全空间响应,确定该设定空间内的至少一个位置为声源位置。
本公开上述实施例提供的一种声源位置确定方法,在设定时间内,在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号;对所述至少一帧原始声音信号进行处理,得到球谐域信号;基于所述球谐域信号,从所述至少一个位置中确定声源位置;由于球谐域信号处理的优势包括:可以获得与频率相互独立的球谐域信号,不同频率的信号,变换到球谐域并移除其频率相关性后,可以使用相同的球谐域传递函数进行处理;运算量降低,例如,传声器数目为Q时,进行频域声源定位,每个频点需要处理的信号数目为Q,而球谐域需要处理的信号数目为(N+1)2,而(N+1)2<Q;可以处理不同类型的传声器阵列,包括空心球阵列和刚性球阵列等,因此本实施例通过处理球谐域信号,提高了声源定位的效率,降低了运算量,并且可对不同类型的球形传声器阵列进行处理,提高了本实施例方法的适用范围。
如图4所示,在上述图3所示实施例的基础上,步骤303可包括如下步骤:
步骤3031,对球谐域信号进行盲源分离,得到至少一组分离滤波器。
可选地,本实施例中对球谐域信号的处理可参照图1提供的实施例中步骤d,利用盲源分离算法对球谐域信号anm(k)进行处理,得到分离滤波器W,同时处理多帧球谐域信号,得到多组分离滤波器。
步骤3032,基于至少一组分离滤波器中每组分离滤波器对应的全空间响应,从至少一个位置中确定声源位置。
本实施例中通过对每组分离滤波器确定全空间响应,通过至少一组分离滤波器对应的至少一个全空间响应确定一个整体的空间响应矩阵,以确定设定空间中的至少一个位置作为声源位置,可选地,该过程可参照图1提供的实施例中的步骤e,通过在空间响应矩阵中结果最小(由于盲源分离的收敛结果是抑制声源方向的信号,因此,空间响应越小,是声源位置的概率越大)的至少一个点确定至少一个声源位置;本实施例采用盲源分离方法可以较好的抑制声源方向的信号,进而获得较高的空间分辨率。
如图5所示,在上述图4所示实施例的基础上,步骤3032可包括如下步骤:
步骤501,分别确定每组分离滤波器的全空间响应,获得至少一个全空间响应。
可选地,每组分离滤波器的全空间响应可通过图1提供的实施例中步骤e中的公式(9)确定,利用公式(9)对每组分离滤波器确定一个对应的全空间响应,得到至少一个全空间响应。
可选地,针对每组分离滤波器,基于分离滤波器在分离矩阵中对应的行向量与球谐域传递函数,确定分离滤波器对应的全空间响应。
其中,行向量对应公式(9)中的球谐域传递函数对应公式(9)中的Y(Θ),Y(Θ)的确定与公式(4)类似,例如,Y(Θ)=[y(θ1) y(θ2) … y(θP)]T,其中,θ1、θ2…θP分别表示空间中的一个角度。
步骤502,基于至少一个全空间响应,确定原始声音信号的空间响应矩阵。
可选地,本实施例可通过图1提供的实施例中步骤e中的公式(10)确定空间响应矩阵,即,将步骤501得到的至少一个全空间响应相乘,以相乘得到的乘积作为空间响应矩阵。
步骤503,基于空间响应矩阵,从至少一个位置中确定声源位置。
可选地,步骤503包括:
基于空间响应矩阵中的元素值,确定至少一个声源;基于至少一个声源对应的方位角和仰角,确定至少一个声源对应的声源位置。
本实施例中,通过公式(10)得到一个体现了所有分离滤波器的全空间响应的空间响应矩阵,该空间响应矩阵DIR中包括多个元素值,每个元素值对应一个设定空间可能存在声源的位置,本实施例中,该位置通过声源位置与球形传声器阵列之间的角度确定(通常声源与球形传声器阵列之间的位置关系,用方位角和仰角表示),在已知球形传声器阵列和角度时,即可确定估计的声源位置,例如,如图2所示的实施例中的201和202标注的白色点即为确定的声源位置。
如图6所示,在上述图3所示实施例的基础上,步骤302可包括如下步骤:
步骤3021,针对每帧原始声音信号,对原始声音信号进行球谐域变换处理,得到球谐域向量。
本实施例中,获得的原始声音信号为时域信号,如图1提供的实施例步骤a中的时域信号x(t),经过频域变换,得到频域信号p(k);可选地,球谐域变换可参照图1提供的实施例中步骤b中的公式(2)和(3),通过公式(2)可实现从频域到球谐域的转换,通过公式(3)将公式(2)中的内容进行简化,其中,公式(3)中的各部分可基于公式(4)、(5)、(6)确定。
步骤3022,对至少一帧原始声音信号对应的至少一个球谐域向量进行处理,获得球谐域信号。
本实施例中,获得球谐域信号的过程可参照图1提供的实施例步骤c,具体地,可确定与频率相互独立的多帧原始声音信号对应的球谐域信号anm(k,t),其中(k=kmin,…,kmax,t=1,2,…,T);本实施例中使用盲源分离算法同时处理多帧信号,提升了声源定位的鲁棒性。
可选地,步骤3022包括:分别对至少一个球谐域向量中的每个球谐域向量进行处理,得到至少一个中间信号;
可选地,本实施例中,是对多帧原始声音信号同时处理,该中间信号为每帧原始声音信号对应的一个球谐域信号anm(k),例如,通过图1提供的实施例中步骤c中的公式(7)确定该中间信号。
将所有中间信号进行拼接,获得球谐域信号。
本实施例中,通过将所有中间信号在列的方向进行拼接,以多个单帧对应的球谐域信号anm(k)在列数上拼接,得到anm(k,t),其中(k=kmin,…,kmax,t=1,2,…,T)。
本公开实施例提供的任一种声源位置确定方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一种声源位置确定方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种声源位置确定方法。下文不再赘述。
示例性装置
图7是本公开一示例性实施例提供的声源位置确定装置的结构示意图。如图7所示,该实施例提供的装置包括:
信号采集模块71,用于在设定时间内,通过球谐传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号。
信号处理模块72,用于对信号采集模块71获得的至少一帧原始声音信号进行处理,得到球谐域信号。
声源定位模块73,用于利用盲源分离方法对信号处理模块72获得的球谐域信号进行处理,基于处理结果从至少一个位置中确定声源位置。
本公开上述实施例提供的一种声源位置确定装置,在设定时间内,在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号;对所述至少一帧原始声音信号进行处理,得到球谐域信号;基于所述球谐域信号,从所述至少一个位置中确定声源位置;由于球谐域信号处理的优势包括:可以获得与频率相互独立的球谐域信号,不同频率的信号,变换到球谐域并移除其频率相关性后,可以使用相同的球谐域传递函数进行处理;运算量降低;可以处理不同类型的传声器阵列,包括空心球阵列和刚性球阵列,因此本实施例通过处理球谐域信号,提高了声源定位的效率,降低了运算量,并且可对不同类型的传声器阵列进行处理,提高了本实施例方法的适用范围。
图8是本公开另一示例性实施例提供的声源位置确定装置的结构示意图。如图8所示,该实施例提供的装置中,信号处理模块72,包括:
向量处理单元721,用于针对每帧原始声音信号,对原始声音信号进行球谐域变换处理,得到球谐域向量。
球谐域处理单元722,用于对至少一帧原始声音信号对应的至少一个球谐域向量进行处理,获得球谐域信号。
可选地,球谐域处理单元722,具体用于分别对至少一个球谐域向量中的每个球谐域向量进行处理,得到至少一个中间信号;将所有中间信号进行拼接,获得球谐域信号。
声源定位模块73包括:
盲源分离单元731,用于对球谐域信号进行盲源分离,得到至少一组分离滤波器。
空间响应单元732,用于基于至少一组分离滤波器中每组分离滤波器对应的全空间响应,从至少一个位置中确定声源位置。
可选地,空间响应单元732具体用于分别确定每组分离滤波器的全空间响应,获得至少一个全空间响应;基于至少一个全空间响应,确定原始声音信号的空间响应矩阵;基于空间响应矩阵,从至少一个位置中确定声源位置。
可选地,空间响应单元732在分别确定每组分离滤波器的全空间响应,获得至少一个全空间响应时,用于针对每组分离滤波器,基于分离滤波器在分离矩阵中对应的行向量与球谐域传递函数,确定分离滤波器对应的全空间响应。
可选地,空间响应单元732在基于空间响应矩阵,从至少一个位置中确定声源位置时,用于基于空间响应矩阵中的元素值,确定至少一个声源;基于至少一个声源对应的方位角和仰角,确定至少一个声源对应的声源位置。
示例性电子设备
下面,参考图9来描述根据本公开实施例的电子设备。该电子设备可以是第一设备100和第二设备200中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
图9图示了根据本公开实施例的电子设备的框图。
如图9所示,电子设备90包括一个或多个处理器91和存储器92。
处理器91可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备90中的其他组件以执行期望的功能。
存储器92可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器91可以运行所述程序指令,以实现上文所述的本公开的各个实施例的声源位置确定方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备90还可以包括:输入装置93和输出装置94,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,在该电子设备是第一设备100或第二设备200时,该输入装置93可以是上述的麦克风或麦克风阵列,用于捕捉声源的输入信号。在该电子设备是单机设备时,该输入装置93可以是通信网络连接器,用于从第一设备100和第二设备200接收所采集的输入信号。
此外,该输入设备93还可以包括例如键盘、鼠标等等。
该输出装置94可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出设备94可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图9中仅示出了该电子设备90中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备90还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的声源位置确定方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的声源位置确定方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (8)

1.一种声源位置确定方法,包括:
在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号;
对所述至少一帧原始声音信号进行处理,得到球谐域信号;
利用盲源分离方法对所述球谐域信号进行处理,基于处理结果从所述至少一个位置中确定声源位置;包括:对所述球谐域信号进行盲源分离,得到至少一组分离滤波器;针对所述每组分离滤波器,基于所述分离滤波器在分离矩阵中对应的行向量与球谐域传递函数,确定所述分离滤波器对应的全空间响应;基于所述全空间响应,从所述至少一个位置中确定声源位置。
2.根据权利要求1所述的方法,其中,所述基于所述全空间响应,从所述至少一个位置中确定声源位置,包括:
基于所述至少一个全空间响应,确定所述原始声音信号的空间响应矩阵;
基于所述空间响应矩阵,从所述至少一个位置中确定所述声源位置。
3.根据权利要求2所述的方法,其中,所述基于所述空间响应矩阵,从所述至少一个位置中确定所述声源位置,包括:
基于所述空间响应矩阵中的元素值,确定至少一个声源;
基于所述至少一个声源对应的方位角和仰角,确定所述至少一个声源对应的声源位置。
4.根据权利要求1-3任一所述的方法,其中,所述对所述至少一帧原始声音信号进行处理,得到球谐域信号,包括:
针对每帧所述原始声音信号,对所述原始声音信号进行球谐域变换处理,得到球谐域向量;
对所述至少一帧原始声音信号对应的至少一个频点的球谐域向量进行处理,获得与频率相互独立的球谐域信号。
5.根据权利要求4所述的方法,其中,所述对所述至少一帧原始声音信号对应的至少一个频点的球谐域向量进行处理,获得与频率相互独立的球谐域信号,包括:
分别对所述至少一个球谐域向量中的每个频点的球谐域向量进行处理,移除其频率相关性,得到至少一个中间信号;
将所述所有中间信号进行拼接,获得与频率相互独立的球谐域信号。
6.一种声源位置确定装置,包括:
信号采集模块,用于在设定时间内,通过球形传声器阵列采集设定空间内至少一个位置发出的声音,获得至少一帧原始声音信号;
信号处理模块,用于对所述信号采集模块获得的至少一帧原始声音信号进行处理,得到球谐域信号;
声源定位模块,用于利用盲源分离方法对所述信号处理模块得到的球谐域信号进行处理,基于处理结果从所述至少一个位置中确定声源位置;所述声源定位模块,具体用于对所述球谐域信号进行盲源分离,得到至少一组分离滤波器;针对所述每组分离滤波器,基于所述分离滤波器在分离矩阵中对应的行向量与球谐域传递函数,确定所述分离滤波器对应的全空间响应;基于所述全空间响应,从所述至少一个位置中确定声源位置。
7.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-5任一所述的声源位置确定方法。
8.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-5任一所述的声源位置确定方法。
CN202010032781.8A 2020-01-13 2020-01-13 声源位置确定方法和装置、可读存储介质、电子设备 Active CN113109763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010032781.8A CN113109763B (zh) 2020-01-13 2020-01-13 声源位置确定方法和装置、可读存储介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010032781.8A CN113109763B (zh) 2020-01-13 2020-01-13 声源位置确定方法和装置、可读存储介质、电子设备

Publications (2)

Publication Number Publication Date
CN113109763A CN113109763A (zh) 2021-07-13
CN113109763B true CN113109763B (zh) 2023-08-25

Family

ID=76709976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010032781.8A Active CN113109763B (zh) 2020-01-13 2020-01-13 声源位置确定方法和装置、可读存储介质、电子设备

Country Status (1)

Country Link
CN (1) CN113109763B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866385A (zh) * 2012-09-10 2013-01-09 上海大学 一种基于球麦克风阵列的多声源定位方法
CN103592628A (zh) * 2013-11-12 2014-02-19 上海大学 一种基于球谐域实值权重波束形成的多声源定位方法
JP2014098568A (ja) * 2012-11-13 2014-05-29 Advanced Telecommunication Research Institute International 音源位置推定装置、音源位置推定方法および音源位置推定プログラム
CN106093866A (zh) * 2016-05-27 2016-11-09 南京大学 一种适用于空心球阵列的声源定位方法
WO2018066376A1 (ja) * 2016-10-05 2018-04-12 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN110675892A (zh) * 2019-09-24 2020-01-10 北京地平线机器人技术研发有限公司 多位置语音分离方法和装置、存储介质、电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3402223B1 (en) * 2016-01-08 2020-10-07 Sony Corporation Audio processing device and method, and program
JP6622159B2 (ja) * 2016-08-31 2019-12-18 株式会社東芝 信号処理システム、信号処理方法およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866385A (zh) * 2012-09-10 2013-01-09 上海大学 一种基于球麦克风阵列的多声源定位方法
JP2014098568A (ja) * 2012-11-13 2014-05-29 Advanced Telecommunication Research Institute International 音源位置推定装置、音源位置推定方法および音源位置推定プログラム
CN103592628A (zh) * 2013-11-12 2014-02-19 上海大学 一种基于球谐域实值权重波束形成的多声源定位方法
CN106093866A (zh) * 2016-05-27 2016-11-09 南京大学 一种适用于空心球阵列的声源定位方法
WO2018066376A1 (ja) * 2016-10-05 2018-04-12 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN110675892A (zh) * 2019-09-24 2020-01-10 北京地平线机器人技术研发有限公司 多位置语音分离方法和装置、存储介质、电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鲁棒性传声器阵列系统研究;胡玉祥;《中国博士学位论文全文数据库 信息科技辑》;20180915(第09期);I135-19页 *

Also Published As

Publication number Publication date
CN113109763A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
US8886526B2 (en) Source separation using independent component analysis with mixed multi-variate probability density function
US8880395B2 (en) Source separation by independent component analysis in conjunction with source direction information
US20130294611A1 (en) Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation
US20130294608A1 (en) Source separation by independent component analysis with moving constraint
WO2020147642A1 (zh) 语音信号处理方法、装置、计算机可读介质及电子设备
WO2016100460A1 (en) Systems and methods for source localization and separation
CN112652320B (zh) 声源定位方法和装置、计算机可读存储介质、电子设备
CN110673096B (zh) 语音定位方法和装置、计算机可读存储介质、电子设备
CN112489114B (zh) 图像转换方法、装置、计算机可读存储介质及电子设备
CN110675892B (zh) 多位置语音分离方法和装置、存储介质、电子设备
CN107240396B (zh) 说话人自适应方法、装置、设备及存储介质
CN112349292A (zh) 信号分离方法和装置、计算机可读存储介质、电子设备
WO2022005615A1 (en) Speech enhancement
CN110890098B (zh) 盲信号分离方法、装置和电子设备
CN113569860B (zh) 实例分割方法和实例分割网络的训练方法及其装置
CN116110422B (zh) 全向级联麦克风阵列降噪方法及系统
CN113109763B (zh) 声源位置确定方法和装置、可读存储介质、电子设备
CN111696573B (zh) 声源信号处理方法及装置、电子设备和存储介质
CN112346012A (zh) 声源位置确定方法和装置、可读存储介质、电子设备
CN110689900A (zh) 信号增强方法和装置、计算机可读存储介质、电子设备
CN114049502B (zh) 神经网络的训练、特征提取、数据处理方法和设备
CN111163401B (zh) 声音成分提取方法、降噪方法、装置及系统
CN115209030B (zh) 视频防抖处理方法、装置、电子设备和存储介质
CN110675331B (zh) 图像去噪方法、装置、计算机可读存储介质及电子设备
CN111695470B (zh) 一种基于深度特征正交分解的可见光-近红外行人再识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant