CN112637742B - 信号处理方法及信号处理装置、存储介质及耳机 - Google Patents

信号处理方法及信号处理装置、存储介质及耳机 Download PDF

Info

Publication number
CN112637742B
CN112637742B CN202011604295.5A CN202011604295A CN112637742B CN 112637742 B CN112637742 B CN 112637742B CN 202011604295 A CN202011604295 A CN 202011604295A CN 112637742 B CN112637742 B CN 112637742B
Authority
CN
China
Prior art keywords
sound source
current
identification information
determining
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011604295.5A
Other languages
English (en)
Other versions
CN112637742A (zh
Inventor
刘益帆
徐银海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ansheng Haolang Technology Co ltd
Original Assignee
Beijing Ansheng Haolang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ansheng Haolang Technology Co ltd filed Critical Beijing Ansheng Haolang Technology Co ltd
Priority to CN202011604295.5A priority Critical patent/CN112637742B/zh
Publication of CN112637742A publication Critical patent/CN112637742A/zh
Application granted granted Critical
Publication of CN112637742B publication Critical patent/CN112637742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1091Details not provided for in groups H04R1/1008 - H04R1/1083
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups

Abstract

本申请提供了一种信号处理方法及信号处理装置、存储介质及耳机,涉及信号处理技术领域,应用于包括第一数量个目标声源的空间声场。该信号处理方法包括:基于第二数量个传声器确定空间声场的声源采集信号;确定声源采集信号对应的辨识信息;基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号。本申请实现了从第一数量个目标声源对应的混合的声源采集信号中分辨识别出第一数量个目标声源各自对应的声源辨识信号的目的,进而为用户清晰便利地听取感兴趣的目标声源所发出的声源信号提供了前提条件,提升了用户体验好感度。

Description

信号处理方法及信号处理装置、存储介质及耳机
技术领域
本申请涉及信号处理技术领域,具体涉及信号处理方法及信号处理装置、存储介质及耳机。
背景技术
近年来,随着智能科技的迅速发展,耳机的应用日益广泛,尤其是能够在嘈杂环境中给予用户安静、舒适的听觉体验的主动降噪(Active Noise Cancellation,ANC)耳机。
然而,嘈杂环境中也可能存在多个用户感兴趣的声音(比如地铁车厢内的播报声音和面对面交流者的讲话声音等等)。由于嘈杂环境中的感兴趣的声音的信噪比较低,且多个感兴趣的声音之间也会相互影响,因此,无论是传统耳机还是ANC耳机,均极易使用户错过嘈杂环境中所包含的多个感兴趣的声音。
发明内容
为了解决上述技术问题,提出了本申请。本申请实施例提供了一种信号处理方法及信号处理装置、存储介质及耳机。
第一方面,本申请一实施例提供一种信号处理方法,应用于包括第一数量个目标声源的空间声场,第一数量为正整数。该信号处理方法包括:基于第二数量个传声器确定空间声场的声源采集信号,其中,第二数量为大于或等于第一数量的正整数;确定声源采集信号对应的辨识信息;基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号。
结合第一方面,在本申请一实施例中,确定声源采集信号对应的辨识信息,包括:步骤a):基于当前的声源采集信号和当前的辨识信息确定当前的目标函数;步骤b):基于当前的目标函数对当前的辨识信息进行更新;步骤c):重复步骤a)和步骤b),直至目标函数收敛到最小值,以确定声源采集信号对应的辨识信息。
结合第一方面,在本申请一实施例中,步骤a)包括:确定当前的声源采集信号对应的信息熵函数、当前的辨识信息对应的广义行列式函数以及当前的声源辨识信号对应的概率密度函数,其中,当前的声源辨识信号基于当前的声源采集信号和当前的辨识信息确定;基于信息熵函数、广义行列式函数和概率密度函数确定当前的目标函数。
结合第一方面,在本申请一实施例中,在步骤b)之前,该方法还包括:基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础目标函数。其中,步骤b)包括:分别基于当前的至少两个基础目标函数对当前的至少两个基础辨识信息进行更新,其中,当前的至少两个基础辨识信息各自对应的更新步长参数不同。
结合第一方面,在本申请一实施例中,在步骤c)之前,该方法还包括:基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础声源辨识信号;确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数。直至目标函数收敛到最小值,以确定声源采集信号对应的辨识信息,包括:直至当前的至少两个基础目标函数均收敛到最小值,基于最终的至少两个基础辨识信息和最终的至少两个基础声源辨识信号各自对应的最终的加权参数确定声源采集信号对应的辨识信息,其中,最终的至少两个基础声源辨识信号基于最终的声源采集信号和最终的至少两个基础辨识信息确定。
结合第一方面,在本申请一实施例中,确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数,包括:基于预设的更新次数阈值确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数。
结合第一方面,在本申请一实施例中,在基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号之后,该方法还包括:确定第一数量个目标声源各自对应的声源辨识信号的序列信息;基于序列信息播放第一数量个目标声源各自对应的声源辨识信号。
第二方面,本申请一实施例还提供一种信号处理装置,应用于包括第一数量个目标声源的空间声场,第一数量为正整数。该信号处理装置包括:第一确定模块,用于基于第二数量个传声器确定空间声场的声源采集信号,其中,第二数量为大于或等于第一数量的正整数;第二确定模块,用于确定声源采集信号对应的辨识信息;第三确定模块,用于基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号。
第三方面,本申请一实施例还提供一种计算机可读存储介质,存储介质存储有计算机程序,所述计算机程序用于执行上述任一实施例所提及的信号处理方法。
第四方面,本申请一实施例还提供一种耳机,该耳机包括:处理器和用于存储处理器可执行指令的存储器,其中,处理器用于执行上述任一实施例所提及的信号处理方法。
本申请实施例提供的信号处理方法,通过基于第二数量个传声器确定空间声场的声源采集信号,然后确定声源采集信号对应的辨识信息,并基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号的方式,实现了从第一数量个目标声源对应的混合的声源采集信号中分辨识别出第一数量个目标声源各自对应的声源辨识信号的目的,进而为用户清晰便利地听取感兴趣的目标声源所发出的声源信号提供了前提条件,提升了用户体验好感度。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1所示为本申请一实施例提供的信号处理方法的流程示意图。
图2所示为本申请一实施例提供的确定声源采集信号对应的辨识信息的流程示意图。
图3所示为本申请一实施例提供的基于当前的声源采集信号和当前的辨识信息确定当前的目标函数的流程示意图。
图4所示为本申请另一实施例提供的确定声源采集信号对应的辨识信息的流程示意图。
图5所示为本申请又一实施例提供的确定声源采集信号对应的辨识信息的流程示意图。
图6所示为本申请另一实施例提供的信号处理方法的流程示意图。
图7所示为本申请一实施例提供的信号处理装置的结构示意图。
图8所示为本申请一实施例提供的信号处理装置的第二确定模块的结构示意图。
图9所示为本申请一实施例提供的信号处理装置的目标函数确定单元的结构示意图。
图10所示为本申请另一实施例提供的信号处理装置的第二确定模块的结构示意图。
图11所示为本申请又一实施例提供的信号处理装置的第二确定模块的结构示意图。
图12所示为本申请另一实施例提供的信号处理装置的结构示意图。
图13所示为本申请一实施例提供的耳机的结构示意图。
图14所示为本申请另一实施例提供的耳机的结构示意图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
图1所示为本申请一实施例提供的信号处理方法的流程示意图。示例性地,本申请实施例提供的信号处理方法可以应用于包括第一数量个目标声源的空间声场,其中,第一数量为正整数。如图1所示,本申请实施例提供的信号处理方法包括如下步骤。
步骤110,基于第二数量个传声器确定空间声场的声源采集信号。
示例性地,第二数量为大于或等于第一数量的正整数。比如,第二数量为3,第一数量为2。又比如,第二数量为5,第一数量为3。
在本申请一实施例中,第一数量为大于1的正整数。换言之,空间声场中所包括的目标声源的数量为至少两个。
步骤120,确定声源采集信号对应的辨识信息。
示例性地,声源采集信号对应的辨识信息,指的是能够分辨识别第二数量个传声器采集的空间声场的声源采集信号的信息。换言之,声源采集信号为基于第一数量个目标声源各自发出的声源信号混合形成的混合信号,辨识信息为能够将第一数量个目标声源各自发出的声源信号从混合信号中辨识拆分出来的信息。比如,辨识信息为辨识系数矩阵。
步骤130,基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号。
示例性地,步骤130中提及的第一数量个目标声源各自对应的声源辨识信号,即为上述提及的第一数量个目标声源各自发出的声源信号。
本申请实施例提供的信号处理方法,通过基于第二数量个传声器确定空间声场的声源采集信号,然后确定声源采集信号对应的辨识信息,并基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号的方式,实现了从第一数量个目标声源对应的混合的声源采集信号中分辨识别出第一数量个目标声源各自对应的声源辨识信号的目的,进而为用户清晰便利地听取感兴趣的目标声源所发出的声源信号提供了前提条件,提升了用户体验好感度。
下面结合具体的数学表达式说明第一数量个目标声源各自发出的声源信号、第二数量个传声器采集的声源采集信号、声源采集信号对应的辨识信息和第一数量个目标声源对应的声源辨识信号之间的关系。
在本申请一实施例中,第一数量个(即n个)目标声源各自发出的声源信号表示为
Figure BDA0002870078050000061
对应地,第二数量个(即m个)传声器采集的声源采集信号表示为
Figure BDA0002870078050000062
并且,声源采集信号
Figure BDA0002870078050000063
对应的辨识信息表示为Wn×m,第一数量个目标声源对应的声源辨识信号为
Figure BDA0002870078050000064
其中,声源采集信号、辨识信息和声源辨识信号之间的关系可利用下述公式(1)表示。
Figure BDA0002870078050000065
由此可见,声源辨识信号
Figure BDA0002870078050000066
可以理解为是声源信号
Figure BDA0002870078050000067
的估计信号。
图2所示为本申请一实施例提供的确定声源采集信号对应的辨识信息的流程示意图。在图1所示实施例基础上延伸出图2所示实施例,下面着重叙述图2所示实施例与图1所示实施例的不同之处,相同之处不再赘述。
如图2所示,在本申请实施例提供的信号处理方法中,确定声源采集信号对应的辨识信息步骤,包括如下步骤。
步骤a),基于当前的声源采集信号和当前的辨识信息确定当前的目标函数。
需要说明的是,可根据当前的声源采集信号和当前的辨识信息的实际情况确定当前的目标函数,本申请实施例对目标函数的具体形式不进行限定。
步骤b),基于当前的目标函数对当前的辨识信息进行更新。
步骤c),重复步骤a)和步骤b),直至目标函数收敛到最小值,以确定声源采集信号对应的辨识信息。
本申请实施例提供的信号处理方法,通过基于当前的声源采集信号和当前的辨识信息确定当前的目标函数,然后基于目标函数进行迭代收敛计算的方式,实现了确定声源采集信号对应的辨识信息的目的。
图3所示为本申请一实施例提供的基于当前的声源采集信号和当前的辨识信息确定当前的目标函数的流程示意图。在图2所示实施例基础上延伸出图3所示实施例,下面着重叙述图3所示实施例与图2所示实施例的不同之处,相同之处不再赘述。
如图3所示,在本申请实施例提供的信号处理方法中,基于当前的声源采集信号和当前的辨识信息确定当前的目标函数步骤,包括如下步骤。
步骤310,确定当前的声源采集信号对应的信息熵函数、当前的辨识信息对应的广义行列式函数以及当前的声源辨识信号对应的概率密度函数。
步骤320,基于信息熵函数、广义行列式函数和概率密度函数确定当前的目标函数。
本申请实施例提供的信号处理方法,通过确定当前的声源采集信号对应的信息熵函数、当前的辨识信息对应的广义行列式函数以及当前的声源辨识信号对应的概率密度函数,然后基于信息熵函数、广义行列式函数和概率密度函数确定当前的目标函数的方式,实现了基于当前的声源采集信号和当前的辨识信息确定当前的目标函数。由于目标函数是基于当前的声源采集信号对应的信息熵函数、当前的辨识信息对应的广义行列式函数以及当前的声源辨识信号对应的概率密度函数确定的,因此,本申请实施例能够有效提高所确定的当前的目标函数的表征能力,进而能够提高基于目标函数确定的辨识信息的精准度。
在本申请一实施例中,当前的目标函数J(k)可利用下述公式(2)表示。
Figure BDA0002870078050000071
在公式(2)中,
Figure BDA0002870078050000072
为当前的声源采集信号
Figure BDA0002870078050000073
对应的信息熵函数,det[W(k)]为当前的辨识信息W(k)对应的广义行列式函数,
Figure BDA0002870078050000074
为当前的声源辨识信号
Figure BDA0002870078050000075
对应的概率密度函数。
计算最终的声源采集信号对应的辨识信息的过程,即为将上述公式(2)所示的目标函数迭代收敛到最小值的过程,可参见下述公式(3)。
Figure BDA0002870078050000081
在公式(3)中,I为单位矩阵,
Figure BDA0002870078050000082
为非线性函数向量,比如,可以为二次方函数向量或三次方函数向量,
Figure BDA0002870078050000083
μ为迭代步长,其取值显著影响迭代收敛的性能。若μ取值较大,则收敛速度快,但稳态误差较大,因此,对声源信号的还原精度相应较差;若μ取值较小,则稳态误差小,因此,对声源信号的还原精度相应较高,但收敛速度较慢。
图4所示为本申请另一实施例提供的确定声源采集信号对应的辨识信息的流程示意图。在图2所示实施例基础上延伸出图4所示实施例,下面着重叙述图4所示实施例与图2所示实施例的不同之处,相同之处不再赘述。
如图4所示,在本申请实施例提供的信号处理方法中,在基于当前的目标函数对当前的辨识信息进行更新步骤之前,还包括如下步骤。
步骤d),基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础目标函数。
举例说明,当前的基础目标函数包括两个,分别为J1(k)和J2(k)。当前的基础辨识信息包括两个,分别为W1(k)和W2(k)。那么,基于上述公式(2)和(3),可得到如下公式(4)和(5)。
Figure BDA0002870078050000084
Figure BDA0002870078050000085
其中,μ1>μ2。即,基础辨识信息W1(k)的迭代步长大于基础辨识信息W2(k)的迭代步长。
结合上述公式(2)至(5)能够得知,上述提及的当前的至少两个基础目标函数中的每个当前的基础目标函数,均为基于当前的声源采集信号和对应的当前的基础辨识信息确定的。
并且,基于当前的目标函数对当前的辨识信息进行更新步骤,包括如下步骤。
步骤b1),分别基于当前的至少两个基础目标函数对当前的至少两个基础辨识信息进行更新。
示例性地,当前的至少两个基础辨识信息各自对应的更新步长参数不同。其中,更新步长参数可以理解为迭代步长参数。
此外,在本申请实施例中,重复步骤a)和步骤b),直至目标函数收敛到最小值,以确定声源采集信号对应的辨识信息(即图3所示的步骤c)),包括:
步骤c1),重复步骤a)至步骤b1),直至至少两个基础目标函数均收敛到最小值,以确定声源采集信号对应的辨识信息。
在实际应用过程中,首先基于第二数量个传声器确定空间声场的声源采集信号,然后基于当前的声源采集信号和当前的辨识信息确定当前的目标函数,并基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础目标函数,继而分别基于当前的至少两个基础目标函数对当前的至少两个基础辨识信息进行迭代更新,直至上述提及的至少两个基础目标函数均收敛到最小值,以确定声源采集信号对应的辨识信息,最后,基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号。
本申请实施例提供的信号处理方法,通过利用至少两个基础目标函数对至少两个基础辨识信息进行迭代更新的方式,为根据实际需要提高确定声源采集信号对应的辨识信息步骤的适应能力提供了前提条件。比如,当至少两个基础辨识信息各自对应的迭代步长不相同时,本申请实施例能够充分利用不同迭代步长的优势,综合考虑收敛速度和稳态误差,以最终提高信号处理方法的适应能力和应用广泛性。
图5所示为本申请又一实施例提供的确定声源采集信号对应的辨识信息的流程示意图。在图4所示实施例基础上延伸出图5所示实施例,下面着重叙述图5所示实施例与图4所示实施例的不同之处,相同之处不再赘述。
如图5所示,在本申请实施例提供的信号处理方法中,在重复步骤a)至步骤b1),直至至少两个基础目标函数均收敛到最小值,以确定声源采集信号对应的辨识信息之前,还包括如下步骤。
步骤e),基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础声源辨识信号。
步骤f),确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数。
并且,在本申请实施例中,重复步骤a)至步骤b1),直至至少两个基础目标函数均收敛到最小值,以确定声源采集信号对应的辨识信息步骤,包括如下步骤。
步骤c2),重复步骤a)至步骤f),直至当前的至少两个基础目标函数均收敛到最小值,基于最终的至少两个基础辨识信息和最终的至少两个基础声源辨识信号各自对应的最终的加权参数确定所述声源采集信号对应的辨识信息。
举例说明,基础声源辨识信号的数量为两个,分别为
Figure BDA0002870078050000101
Figure BDA0002870078050000102
并且,
Figure BDA0002870078050000103
对应的加权参数为1-λ(k),
Figure BDA0002870078050000104
对应的加权参数为λ(k)。那么,基础声源辨识信号和声源辨识信号的关系可参见下述公式(6)。
Figure BDA0002870078050000105
应当理解,如果两个基础声源辨识信号分别为
Figure BDA0002870078050000106
Figure BDA0002870078050000107
且各自对应的基础辨识信息分别为W1(k)和W2(k),那么,基础辨识信息W1(k)和W2(k)满足下述公式(7)。
W(k)=[1-λ(k)]·W1(k)+λ(k)·W2(k) (7)
在公式(6)和(7)中,λ(k)的取值范围为[0,1]。
在实际应用过程中,首先基于第二数量个传声器确定空间声场的声源采集信号,然后基于当前的声源采集信号和当前的辨识信息确定当前的目标函数,基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础目标函数,继而分别基于当前的至少两个基础目标函数对当前的至少两个基础辨识信息进行更新,基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础声源辨识信号,并确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数,继而进行迭代收敛计算,直至当前的至少两个基础目标函数均收敛到最小值,基于最终的至少两个基础辨识信息和最终的至少两个基础声源辨识信号各自对应的最终的加权参数确定声源采集信号对应的辨识信息,最后,基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号。
本申请实施例提供的信号处理方法,通过为当前的至少两个基础声源辨识信号分别设置各自的加权参数的方式,实现了根据实际情况确保兼顾收敛速度和辨识信息的精准度的目的。
在图5所示实施例基础上延伸出本申请另一实施例。在本申请实施例中,确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数步骤,包括:基于预设的更新次数阈值确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数。
比如,预设的更新次数阈值为L,并将加权参数初始化为λ(0)=0。当k≤L时,λ(k)在[0,0.5)范围内更新,即权值系数矩阵W1(k)在初期发挥主要作用,大步长使算法具有较快的收敛速度;当k>L时,λ(k)在[0.5,1]范围内更新,即权值系数矩阵W2(k)在后期发挥主要作用,小步长使算法具有较小的稳定误差,最终得到能够对声源信号进行高精度还原的辨识信息。
需要说明的是,预设的更新次数阈值L可根据实际情况确定,本申请实施例对此不进行统一限定。
本申请实施例通过将加权参数与预设的更新次数阈值相关联,进而使加权参数根据实际的更新次数变换的方式,实现了基于实际的更新次数充分兼顾收敛速度和辨识信息精度的目的,进而为后续提高用户的体验好感度提供了前提条件。
图6所示为本申请另一实施例提供的信号处理方法的流程示意图。在图1所示实施例基础上延伸出图6所示实施例,下面着重叙述图6所示实施例与图1所示实施例的不同之处,相同之处不再赘述。
如图6所示,在本申请实施例提供的信号处理方法中,在基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号步骤之后,还包括如下步骤。
步骤610,确定第一数量个目标声源各自对应的声源辨识信号的序列信息。
在本申请一实施例中,步骤610中提及的序列信息,是预先获取或预先存储的。
步骤620,基于序列信息播放第一数量个目标声源各自对应的声源辨识信号。
比如,将本申请实施例提供的信号处理方法应用到耳机中,那么,耳机中的扬声器便可基于序列信息依次播放第一数量个目标声源各自对应的声源辨识信号。
在实际应用过程中,首先基于第二数量个传声器确定空间声场的声源采集信号,然后确定声源采集信号对应的辨识信息,并基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号,继而确定第一数量个目标声源各自对应的声源辨识信号的序列信息,并基于序列信息播放第一数量个目标声源各自对应的声源辨识信号。
本申请实施例提供的信号处理方法,能够使用户清晰、便利地听取空间声场中目标声源各自发出的声源信息,避免了用户错过空间声场中的重要声源信息或感兴趣声源信息的情况,进而提高了用户体验好感度。
图7所示为本申请一实施例提供的信号处理装置的结构示意图。如图7所示,本申请实施例提供的信号处理装置包括:
第一确定模块710,用于基于第二数量个传声器确定空间声场的声源采集信号;
第二确定模块720,用于确定声源采集信号对应的辨识信息;
第三确定模块730,用于基于声源采集信号和辨识信息确定第一数量个目标声源各自对应的声源辨识信号。
图8所示为本申请一实施例提供的信号处理装置的第二确定模块的结构示意图。在图7所示实施例基础上延伸出图8所示实施例,下面着重叙述图8所示实施例与图7所示实施例的不同之处,相同之处不再赘述。
如图8所示,在本申请实施例提供的信号处理装置中,第二确定模块720包括:
目标函数确定单元810,用于基于当前的声源采集信号和当前的辨识信息确定当前的目标函数(即执行步骤a));
更新单元820,用于基于当前的目标函数对当前的辨识信息进行更新(即执行步骤b));
辨识信息确定单元830,用于重复步骤a)和步骤b)(即重复迭代更新步骤),直至目标函数收敛到最小值,以确定声源采集信号对应的辨识信息。
图9所示为本申请一实施例提供的信号处理装置的目标函数确定单元的结构示意图。在图8所示实施例基础上延伸出图9所示实施例,下面着重叙述图9所示实施例与图8所示实施例的不同之处,相同之处不再赘述。
如图9所示,在本申请实施例提供的信号处理装置中,目标函数确定单元810包括:
概率密度函数确定子单元910,用于确定当前的声源采集信号对应的信息熵函数、当前的辨识信息对应的广义行列式函数以及当前的声源辨识信号对应的概率密度函数;
目标函数确定子单元920,用于基于信息熵函数、广义行列式函数和概率密度函数确定当前的目标函数。
图10所示为本申请另一实施例提供的信号处理装置的第二确定模块的结构示意图。在图8所示实施例基础上延伸出图10所示实施例,下面着重叙述图10所示实施例与图8所示实施例的不同之处,相同之处不再赘述。
如图10所示,在本申请实施例提供的信号处理装置中,第二确定模块720还包括:
基础目标函数确定单元815,用于基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础目标函数(即执行步骤d))。
并且,在本申请实施例中,更新单元820包括:
更新子单元821,用于分别基于当前的至少两个基础目标函数对当前的至少两个基础辨识信息进行更新(即执行步骤b1))。
并且,在本申请实施例中,辨识信息确定单元830包括:
第一辨识信息确定子单元831,用于重复步骤a)至步骤b1)(即重复迭代更新步骤),直至目标函数收敛到最小值,以确定声源采集信号对应的辨识信息。
图11所示为本申请又一实施例提供的信号处理装置的第二确定模块的结构示意图。在图10所示实施例基础上延伸出图11所示实施例,下面着重叙述图11所示实施例与图10所示实施例的不同之处,相同之处不再赘述。
如图11所示,在本申请实施例提供的信号处理装置中,第二确定模块720还包括:
基础声源辨识信号确定单元825,用于基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础声源辨识信号(即执行步骤e));
加权参数确定单元826,用于确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数(即执行步骤f))。
并且,在本申请实施例中,辨识信息确定单元830包括:
第二辨识信息确定子单元832,用于重复步骤a)至步骤f)(即重复迭代更新步骤),直至当前的至少两个基础目标函数均收敛到最小值,基于最终的至少两个基础辨识信息和最终的至少两个基础声源辨识信号各自对应的最终的加权参数确定所述声源采集信号对应的辨识信息。
图12所示为本申请另一实施例提供的信号处理装置的结构示意图。在图7所示实施例基础上延伸出图12所示实施例,下面着重叙述图12所示实施例与图7所示实施例的不同之处,相同之处不再赘述。
如图12所示,本申请实施例提供的信号处理装置还包括:
第四确定模块1210,用于确定第一数量个目标声源各自对应的声源辨识信号的序列信息;
播放模块1220,用于基于序列信息播放第一数量个目标声源各自对应的声源辨识信号。
应当理解,图7至图12提供的信号处理装置中包括的第一确定模块710、第二确定模块720、第三确定模块730、第四确定模块1210和播放模块1220,以及第二确定模块720中包括的目标函数确定单元810、基础目标函数确定单元815、更新单元820、基础声源辨识信号确定单元825、加权参数确定单元826和辨识信息确定单元830,以及目标函数确定单元810中包括的概率密度函数确定子单元910和目标函数确定子单元920,以及更新单元820中包括的更新子单元821,以及辨识信息确定单元830中包括的第一辨识信息确定子单元831和第二辨识信息确定子单元832的操作和功能可以参考上述图1至图6提供的信号处理方法,为了避免重复,在此不再赘述。
图13所示为本申请一实施例提供的耳机的结构示意图。如图13所示,耳机1300包括处理器1310以及与处理器1310通信连接的传声器1320和扬声器1330。具体地,处理器1310中存储的程序可用于执行上述任一实施例提及的信号处理方法。
可选地,处理器1310中包括辨识单元,该辨识单元用于计算上述实施例提及的辨识信息。
示例性地,耳机1300为ANC耳机。
需要说明的是,耳机1300中包括的传声器1320和扬声器1330的数量可根据实际情况确定,不局限于图13所示实施例的一个,亦可以为两个、三个或更多个。
图14所示为本申请另一实施例提供的耳机的结构示意图。如图14所示,本申请实施例提供的耳机1400包括一个或多个处理器1410和存储器1420。
处理器1410可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制耳机1400中的其他组件以执行期望的功能。
存储器1420可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器1410可以运行所述程序指令,以实现上文所述的本申请的各个实施例的信号处理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如声源采集信号等各种内容。
在一个示例中,耳机1400还可以包括:输入装置1430和输出装置1440,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置1430可以包括例如键盘、鼠标、麦克风等等。
该输出装置1440可以向外部输出各种信息,包括声源辨识信号等。该输出装置1440可以包括例如显示器、通信网络、扬声器及其所连接的远程输出设备等等。
当然,为了简化,图14中仅示出了该耳机1400中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,耳机1400还可以包括任何其他适当的组件。
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的信号处理方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的信号处理方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (8)

1.一种信号处理方法,其特征在于,应用于包括第一数量个目标声源的空间声场,所述第一数量为正整数,包括:
基于第二数量个传声器确定所述空间声场的声源采集信号,其中,所述第二数量为大于或等于所述第一数量的正整数;
确定所述声源采集信号对应的辨识信息;
基于所述声源采集信号和所述辨识信息确定所述第一数量个目标声源各自对应的声源辨识信号;
其中,所述确定所述声源采集信号对应的辨识信息,包括:
步骤a):基于当前的声源采集信号和当前的辨识信息确定当前的目标函数;
步骤b):基于当前的目标函数对当前的辨识信息进行更新;
步骤c):重复所述步骤a)和所述步骤b),直至目标函数收敛到最小值,以确定所述声源采集信号对应的辨识信息;
其中,在所述步骤b)之前,还包括:
基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础目标函数;
其中,所述步骤b)包括:分别基于当前的至少两个基础目标函数对当前的至少两个基础辨识信息进行更新,其中,当前的至少两个基础辨识信息各自对应的更新步长参数不同。
2.根据权利要求1所述的信号处理方法,其特征在于,所述步骤a)包括:
确定当前的声源采集信号对应的信息熵函数、当前的辨识信息对应的广义行列式函数以及当前的声源辨识信号对应的概率密度函数,其中,当前的声源辨识信号基于当前的声源采集信号和当前的辨识信息确定;
基于所述信息熵函数、所述广义行列式函数和所述概率密度函数确定当前的目标函数。
3.根据权利要求1所述的信号处理方法,其特征在于,在所述步骤c)之前,还包括:
基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础声源辨识信号;
确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数;
所述直至目标函数收敛到最小值,以确定所述声源采集信号对应的辨识信息,包括:
直至当前的至少两个基础目标函数均收敛到最小值,基于最终的至少两个基础辨识信息和最终的至少两个基础声源辨识信号各自对应的最终的加权参数确定所述声源采集信号对应的辨识信息,其中,最终的至少两个基础声源辨识信号基于最终的声源采集信号和最终的至少两个基础辨识信息确定。
4.根据权利要求3所述的信号处理方法,其特征在于,所述确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数,包括:
基于预设的更新次数阈值确定当前的至少两个基础声源辨识信号各自对应的当前的加权参数。
5.根据权利要求1或2所述的信号处理方法,其特征在于,在所述基于所述声源采集信号和所述辨识信息确定所述第一数量个目标声源各自对应的声源辨识信号之后,还包括:
确定所述第一数量个目标声源各自对应的声源辨识信号的序列信息;
基于所述序列信息播放所述第一数量个目标声源各自对应的声源辨识信号。
6.一种信号处理装置,其特征在于,应用于包括第一数量个目标声源的空间声场,所述第一数量为正整数,包括:
第一确定模块,用于基于第二数量个传声器确定所述空间声场的声源采集信号,其中,所述第二数量为大于或等于所述第一数量的正整数;
第二确定模块,用于确定所述声源采集信号对应的辨识信息;
第三确定模块,用于基于所述声源采集信号和所述辨识信息确定所述第一数量个目标声源各自对应的声源辨识信号;
其中,所述第二确定模块还用于
步骤a):基于当前的声源采集信号和当前的辨识信息确定当前的目标函数;
步骤b):基于当前的目标函数对当前的辨识信息进行更新;
步骤c):重复所述步骤a)和所述步骤b),直至目标函数收敛到最小值,以确定所述声源采集信号对应的辨识信息;
其中,在所述步骤b)之前,还包括:
基于当前的声源采集信号和当前的至少两个基础辨识信息分别确定当前的至少两个基础目标函数;
其中,所述步骤b)包括:分别基于当前的至少两个基础目标函数对当前的至少两个基础辨识信息进行更新,其中,当前的至少两个基础辨识信息各自对应的更新步长参数不同。
7.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1至5任一项所述的信号处理方法。
8.一种耳机,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于执行上述权利要求1至5任一项所述的信号处理方法。
CN202011604295.5A 2020-12-29 2020-12-29 信号处理方法及信号处理装置、存储介质及耳机 Active CN112637742B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011604295.5A CN112637742B (zh) 2020-12-29 2020-12-29 信号处理方法及信号处理装置、存储介质及耳机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011604295.5A CN112637742B (zh) 2020-12-29 2020-12-29 信号处理方法及信号处理装置、存储介质及耳机

Publications (2)

Publication Number Publication Date
CN112637742A CN112637742A (zh) 2021-04-09
CN112637742B true CN112637742B (zh) 2022-10-11

Family

ID=75287482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011604295.5A Active CN112637742B (zh) 2020-12-29 2020-12-29 信号处理方法及信号处理装置、存储介质及耳机

Country Status (1)

Country Link
CN (1) CN112637742B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108538320A (zh) * 2018-03-30 2018-09-14 广东欧珀移动通信有限公司 录音控制方法和装置、可读存储介质、终端

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763230B (zh) * 2014-01-17 2017-03-01 南京信息工程大学 一种改进的自适应盲源分离方法
KR102562287B1 (ko) * 2016-10-14 2023-08-02 삼성전자주식회사 전자 장치 및 전자 장치의 오디오 신호 처리 방법
CN110610718B (zh) * 2018-06-15 2021-10-08 炬芯科技股份有限公司 一种提取期望声源语音信号的方法及装置
CN111863020B (zh) * 2020-07-30 2022-09-20 腾讯科技(深圳)有限公司 语音信号处理方法、装置、设备及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108538320A (zh) * 2018-03-30 2018-09-14 广东欧珀移动通信有限公司 录音控制方法和装置、可读存储介质、终端

Also Published As

Publication number Publication date
CN112637742A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CN110503970B (zh) 一种音频数据处理方法、装置及存储介质
US10705789B2 (en) Dynamic volume adjustment for virtual assistants
WO2021093380A1 (zh) 一种噪声处理方法、装置、系统
CN112687286A (zh) 音频设备的降噪模型的调整方法和装置
CN112349292B (zh) 信号分离方法和装置、计算机可读存储介质、电子设备
WO2019233361A1 (zh) 对音乐进行音量调节的方法及设备
EP3320311B1 (en) Estimation of reverberant energy component from active audio source
KR102194194B1 (ko) 암묵 신호 분리를 위한 방법, 장치 및 전자 장치
WO2023287773A1 (en) Speech enhancement
JP5994639B2 (ja) 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム
CN112637742B (zh) 信号处理方法及信号处理装置、存储介质及耳机
US11676598B2 (en) System and method for data augmentation for multi-microphone signal processing
CN114420158A (zh) 模型训练方法及装置、目标频响信息确定方法及装置
US10825469B2 (en) System and method for voice activity detection and generation of characteristics respective thereof
CN111383629A (zh) 语音处理方法和装置、电子设备以及存储介质
CN113949983B (zh) 一种听音区域声效恢复方法及装置
KR102647545B1 (ko) 오픈형 스피커를 구비하는 전자 디바이스
US20230343312A1 (en) Music Enhancement Systems
Park et al. Integrated 3D Active Noise Cancellation Simulation and Synthesis Platform Using Tcl
Jankowski et al. Improved robust ASR for social robots in public spaces
Hussain et al. Speech Dereverberation Based on Self-supervised Residual Denoising Autoencoder with Linear Decoder
CN117953912A (zh) 一种语音信号处理方法及相关设备
CN117854525A (zh) 用于使用数据集进行音频信号增强的装置、方法和计算机程序
CN114257921A (zh) 拾音方法及装置、计算机可读存储介质及耳机
CN115798501A (zh) 一种语音降噪方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant