CN113938792B - 音频播放优化方法、设备和可读存储介质 - Google Patents

音频播放优化方法、设备和可读存储介质 Download PDF

Info

Publication number
CN113938792B
CN113938792B CN202111137389.0A CN202111137389A CN113938792B CN 113938792 B CN113938792 B CN 113938792B CN 202111137389 A CN202111137389 A CN 202111137389A CN 113938792 B CN113938792 B CN 113938792B
Authority
CN
China
Prior art keywords
microphone
audio
audio signal
sound source
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111137389.0A
Other languages
English (en)
Other versions
CN113938792A (zh
Inventor
杨华泽
赵江涛
张文松
苗成涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN202111137389.0A priority Critical patent/CN113938792B/zh
Priority to PCT/CN2021/132605 priority patent/WO2023045059A1/zh
Publication of CN113938792A publication Critical patent/CN113938792A/zh
Application granted granted Critical
Publication of CN113938792B publication Critical patent/CN113938792B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/22Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only 
    • H04R1/26Spatial arrangements of separate transducers responsive to two or more frequency ranges
    • H04R1/265Spatial arrangements of separate transducers responsive to two or more frequency ranges of microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种音频播放优化方法、电子设备及可读存储介质,所述音频播放优化方法包括:获取麦克风阵列的第一位置信息和通过所述麦克风阵列得到的音频信号,根据所述第一位置信息和所述音频信号确定音源位置;确定扬声器阵列针的声音叠加区;根据所述音源位置和所述声音叠加区之间的偏移角度,计算所述扬声器阵列的旋转角度;根据所述旋转角度,旋转所述扬声器阵列,并在旋转完毕后通过所述扬声器阵列向音源播放预设待播放音频。解决了采用扬声器阵列播放音频效果差的技术问题。

Description

音频播放优化方法、设备和可读存储介质
技术领域
本申请涉及音频播放技术领域,尤其涉及一种音频播放优化方法、设备和可读存储介质。
背景技术
随着科技的不断发展,人们对声音的要求越来越高,在很多音频播放产品中,会采用扬声器阵列来提高音量,然而在实际应用过程中,听音人在有的位置听到的声音的音量反而更不清楚了,使得成本加倍,但实际效果不增反降,且由于听音人的听音位置的不确定性,无法保证音量及听音效果的稳定提高,导致采用扬声器阵列播放音频的音量无法稳定提高,影响扬声器阵列的音频播放效果。
发明内容
本申请的主要目的在于提供一种音频播放优化方法、设备和可读存储介质,旨在解决现有技术中采用扬声器阵列播放音频效果差的技术问题。
为实现上述目的,本申请提供一种音频播放优化方法,所述音频播放优化方法包括:
获取麦克风阵列的第一位置信息和通过所述麦克风阵列得到的音频信号,根据所述第一位置信息和所述音频信号确定音源位置;
确定扬声器阵列的声音叠加区;
根据所述音源位置和所述声音叠加区之间的偏移角度,计算所述扬声器阵列的旋转角度;
根据所述旋转角度,旋转所述扬声器阵列,并在旋转完毕后通过所述扬声器阵列向音源播放预设待播放音频。
可选地,所述麦克风阵列包括第一麦克风和第二麦克风,所述获取麦克风阵列的第一位置信息以及所述麦克风阵列输出的音频信号,并根据所述第一位置信息和所述音频信号确定音源位置的步骤包括:
获取所述第一麦克风的第一麦克风位置和第一音频信号,以及所述第二麦克风的第二麦克风位置和第二音频信号;
根据所述第一音频信号和所述第二音频信号,计算得到所述第一音频信号的第一信号能量、所述第二音频信号的第二信号能量和所述第一音频信号与所述第二音频信号二者之间的时延信息;
根据所述第一信号能量、所述第二信号能量、所述时延信息、所述第一麦克风位置和所述第二麦克风位置,确定音源位置。
可选地,所述根据所述第一音频信号和所述第二音频信号,计算得到所述第一音频信号与所述第二音频信号二者之间的时延信息的步骤包括:
将所述第一音频信号由时域转换至频域,得到所述第一音频信号的第一频域数据,并将所述第二音频信号由时域转换至频域,得到所述第二音频信号的第二频域数据;
根据所述第一频域数据和所述第二频域数据之间的相位差,计算得到所述第一音频信号与所述第二音频信号二者之间的时延信息。
可选地,所述根据所述第一信号能量、所述第二信号能量、所述时延信息和所述麦克风位置,确定音源位置的步骤包括:
根据所述第一信号能量和所述第二信号能量,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第一位置关系;
根据所述时延信息,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第二位置关系;
根据所述第一位置关系和所述第二位置关系,确定所述音源位置。
可选地,所述根据所述第一信号能量和所述第二信号能量,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第一位置关系的步骤包括:
根据所述第一信号能量与所述第二信号能量的信号能量差,计算声音信号传播距离的距离比;
根据所述距离比,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第一位置关系。
可选地,所述根据所述时延信息,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第二位置关系的步骤包括:
根据所述时延信息,计算声音信号传播的距离差;
根据所述距离差,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第二位置关系。
可选地,所述扬声器阵列包括第一扬声器组和第二扬声器组,所述第一扬声器组与所述第二扬声器组呈平面对称,所述确定扬声器阵列的声音叠加区的步骤包括:
获取所述第一扬声器组和所述第二扬声器组的对称平面;
将所述对称平面作为所述扬声器阵列的声音叠加区。
可选地,所述的根据所述第一位置信息和所述音频信号确定音源位置的步骤之后,还包括:
当确定的音源位置超过一个时,将所述麦克风阵列旋转预设角度,并返回执行步骤:获取麦克风阵列的第一位置信息以及所述麦克风阵列输出的音频信号。
本申请还提供一种电子设备,所述电子设备为实体设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述投音频播放优化方法的程序,所述音频播放优化方法的程序被处理器执行时可实现如上述的音频播放优化方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有实现音频播放优化方法的程序,所述实现音频播放优化方法的程序被处理器执行以实现如上述音频播放优化方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的投影字体颜色选择方法的步骤。
本申请提供了一种音频播放优化方法、设备和可读存储介质,相比于现有技术中采用扬声器阵列来提高音量的技术手段,本申请通过获取麦克风阵列的第一位置信息和通过所述麦克风阵列得到的音频信号,根据所述第一位置信息和所述音频信号确定音源位置,实现了对音源的定位,通过确定扬声器阵列的声音叠加区,实现了接收扬声器播放的预设待播放音频的最佳目标方位的确定,通过根据所述音源位置和所述声音叠加区,确定所述扬声器阵列的旋转角度,并将所述扬声器阵列根据所述旋转角度进行旋转,实现了音源位置与所述声音叠加区的重合,其中,需要说明的是,采用扬声器阵列播放音频的音量根据听音人的位置不同可能不升反降的原因在于,两列或两列以上的声波之间可能会产生干涉现象,干涉后会在声场中会出现声音叠加区与声音抵消区,声音叠加区会使得声波叠加并提高音量,而声音抵消区会使得声波有所抵消从而降低音量及音质,在实际使用过程中,由于我们无法确定声音的接收方的具体位置,则无法保证声音的接收方在接收音频时处于声音叠加区,若声音的接收方在接收音频时处于抵消区,接收到的音频的音量不仅不会得到提高,反而会降低,因此通过麦克风确定听音人的位置,根据听音人的位置和声音叠加区可以确定播放音频的最佳目标方位,进而通过旋转扬声器阵列实现了向处于声音叠加区的听音人定向播放音频,使得采用扬声器阵列播放音频的音量稳定提高,克服了无法确定声音的接收方的具体位置可能出现的音频音量降低的缺陷,保证了声音的接收方在接收音频时处于声音叠加区,有效提高了扬声器阵列的音频播放效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请音频播放优化第一实施例的流程示意图;
图2为本申请实施例中音频播放优化的旋转角度俯视示意图;
图3为本申请音频播放优化第二实施例的流程示意图;
图4为本申请实施例中音频播放优化涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。
实施例一
本申请实施例提供一种音频播放优化方法,在本申请音频播放优化方法的第一实施例中,参照图1,所述音频播放优化方法包括:
步骤S10,获取麦克风阵列的第一位置信息和通过所述麦克风阵列得到的音频信号,根据所述第一位置信息和所述音频信号确定音源位置;
在本实施例中,需要说明的是,所述麦克风阵列是由一定数目的声传感器(一般是麦克风)组成,用来对声音信号进行采样并处理的系统,麦克风阵列中的每个麦克风,由于其空间上的位置距离音源和周边环境的距离均不同,接收到的音频信号也就会不同,例如,若麦克风阵列由N个麦克风组成,则可以获取到麦克风阵列输出的N个音频信号。
具体地,建立坐标系,获取麦克风阵列中每个麦克风在所述坐标系中的第一位置信息,并通过麦克风阵列中每个麦克风将接收同一音源发出的声音信号转换成音频信号,进而通过对所述音频信号进行处理(如:增益、去噪、通道合并、特征音频信号筛选等)和计算(如:傅里叶变换、函数运算、积分运算、四则运算等),得到所述音频信号的信号能量、频域数据和/或时域数据等,并通过计算得出不同麦克风接收到的音频信号的信号能量差、相位差、时延信息等,进而根据不同位置的麦克风接收同一个音源发出的声音信号在传播过程中能量的衰减的不同、在传播过程中传播时间的不同和/或在空间中不同媒质的分界面处发生反射后的路径不同等差异与不同麦克风的位置坐标之间的差异的关系,可以确定多个音源位置坐标与麦克风位置坐标的函数关系,进而通过对函数关系进行求解即可得到音源位置坐标,其中,所述第一位置信息包括每个麦克风的麦克风位置坐标和麦克风之间的距离等,所述时延信息是指阵列中不同麦克风接收到的同源信号之间由于信号传输距离不同而引起的时间差。
优选地,所述的根据所述第一位置信息和所述音频信号确定音源位置的步骤之后,还包括:
当确定的音源位置超过一个时,将所述麦克风阵列旋转预设角度,并返回执行步骤:获取麦克风阵列的第一位置信息以及所述麦克风阵列输出的音频信号。
在本实施例中,具体地,当根据所述第一位置信息和所述音频信号确定的音源位置坐标的数量为两个及两个以上或无数个(例如:求解后得到一个函数关系式等)时,将所述麦克风阵列旋转预设角度,并返回执行步骤:获取麦克风阵列的第一位置信息以及所述麦克风阵列输出的音频信号,其中,当声音信号受到噪声或环境的干扰、声音传播路径上的障碍物、音频信号处理过程发生错误和/或音源处于特殊位置导致计算过程得到特殊解等特殊情况,都有可能导致计算结果不唯一,出现多个解或解为函数关系式的计算结果,则无法准确确定哪个音源位置才是正确的音源位置,此时可以通过将麦克风阵列旋转一个预设角度,以通过改变接收声音的位置避开干扰,并返回执行步骤:获取麦克风阵列的第一位置信息以及所述麦克风阵列输出的音频信号,以重新确定音源位置。
在一种可实施的方式中,当确定的音源位置超过一个时,将所述音源位置作为第一参考音源位置,将所述麦克风阵列旋转预设角度,并返回执行步骤:获取麦克风阵列的第一位置信息以及所述麦克风阵列输出的音频信号,以重新确定新的音源位置;将新的音源位置作为第二参考音源位置;结合第一参考音源位置和第二参考音源位置,确定所述音源位置。
在本实施例中,提出了一种求解音源位置过程中出现特殊情况的解决办法,通过旋转麦克风阵列改变接收声音信号的位置,改变了声音的传播路径,进而改变了整个计算过程的全部参数,有效地避免了其中任一参数发生错误导致计算结果出现问题,且声音传播路径的改变也可以改变声音传播过程中外界障碍物或噪声等对声音传播的影响,且将两次计算得到的音源位置作为参考音源位置,结合两次计算得到的参考音源位置可以更准确地确认最终确定的音源位置,有效地提高了确定音源位置的准确率和成功率。
步骤S20,确定扬声器阵列的声音叠加区;
在本实施例中,需要说明的是,频率相同的两列声波叠加,使某些区域的振动加强,某些区域的振动减弱,振动加强的区域为声波的叠加区域,振动减弱的区域为声波的抵消区域,其中,任意两个音源的对称平面都是其叠加区域中音量叠加最大的区域,因此将该区域作为声音叠加区,可以保证声音叠加的效果和稳定性。
在本实施例中,具体地,获取扬声器阵列中每两个扬声器的对称平面,进而得到各对称平面的交集,将所述交集作为声音叠加区,其中,当所述交集不止一个时,获取所述交集的叠加次数,将所述交集中叠加次数最多的目标交集作为最终的声音叠加区,其中,当所述目标交集不止一个时,将所述交集中距离所述音源位置最近的目标交集作为声音叠加区。
优选地,所述扬声器阵列包括第一扬声器组和第二扬声器组,所述第一扬声器组与所述第二扬声器组呈平面对称,
在本实施例中,需要说明的是,所述第一扬声器组包括至少一个扬声器,所述第二扬声器组也包括至少一个扬声器,所述第一扬声器组中任一个扬声器都与所述第二扬声器组中的唯一一个扬声器呈平面对称。
所述获取扬声器阵列的声音叠加区的步骤包括:
步骤A10,获取所述第一扬声器组和所述第二扬声器组的对称平面;
步骤A20,将所述对称平面作为所述扬声器阵列的声音叠加区。
在本实施例中,具体地,获取使第一扬声器组中全部扬声器与第二扬声器组中全部扬声器一一对称的对称平面,将所述对称平面作为所述扬声器阵列的声音叠加区。
步骤S30,根据所述音源位置和所述声音叠加区之间的偏移角度,计算所述扬声器阵列的旋转角度;
在本实施例中,具体地,根据所述音源位置坐标、旋转基点的位置和所述声音叠加区的位置,结合三角函数,计算得到所述音源位置和所述声音叠加区之间的偏移角度,再根据所述偏移角度,结合三角函数,计算得到所述扬声器阵列基于旋转基点的旋转角度,其中,所述扬声器阵列绕旋转基点进行旋转,所述旋转基点可以是点或轴,若所述旋转基点是点,则所述扬声器阵列可以点在三维空间进行全角度旋转,或因实际需要或硬件上的限制不同 (如:扬声器阵列的固定位置、固定方式等的限制、计算求解需要等)全角度以内任意预设角度的旋转(如:水平方向180度以内和垂直方向180度以内旋转;水平方向360度旋转和垂直方向270度以内的旋转等),若所述旋转基点是轴,则所述扬声器阵列可以绕轴在垂直于轴的平面内进行360度旋转,或因实际需要或硬件上的限制不同(如:扬声器阵列的固定位置、固定方式等的限制、计算求解需要等)360度以内任意预设角度的旋转。
在一种可实施的方式中,旋转基点为旋转轴,扬声器阵列包括扬声器组1 和扬声器组2,所述扬声器组1包括至少一个扬声器,所述扬声器组2也包括至少一个扬声器,所述扬声器组1中任一个扬声器都与所述扬声器组2中的唯一一个扬声器延所述旋转轴对称,其中,所述扬声器阵列可以绕旋转轴在水平方向旋转任意角度,参照图2,图2是本实施例的旋转角度俯视示意图,通过计算可知,偏移角度等于旋转角度
Figure GDA0003390709530000081
其中,已知音源位置坐标,通过三角函数可以计算出α和β的角度。
步骤S40,根据所述旋转角度,旋转所述扬声器阵列,并在旋转完毕后通过所述扬声器阵列向音源播放预设待播放音频。
在本实施例中,具体地,将所述扬声器阵列按照所述旋转角度进行旋转,以使得所述音源位置处于所述声音叠加区,并在旋转完毕后,通过所述扬声器阵列向音源播放预设待播放音频。
在本实施例中,通过获取麦克风阵列的第一位置信息和通过所述麦克风阵列得到的音频信号,根据所述第一位置信息和所述音频信号确定音源位置,实现了对音源的定位,通过确定扬声器阵列的声音叠加区,实现了接收扬声器播放的预设待播放音频的最佳目标方位的确定,通过根据所述音源位置和所述声音叠加区,确定所述扬声器阵列的旋转角度,并将所述扬声器阵列根据所述旋转角度进行旋转,实现了音源位置与所述声音叠加区的重合,其中,需要说明的是,采用扬声器阵列播放音频的音量根据听音人的位置不同可能不升反降的原因在于,两列或两列以上的声波之间可能会产生干涉现象,干涉后会在声场中会出现声音叠加区与声音抵消区,声音叠加区会使得声波叠加并提高音量,而声音抵消区会使得声波有所抵消从而降低音量及音质,在实际使用过程中,由于我们无法确定声音的接收方的具体位置,则无法保证声音的接收方在接收音频时处于声音叠加区,若声音的接收方在接收音频时处于抵消区,接收到的音频的音量不仅不会得到提高,反而会降低,因此通过麦克风确定听音人的位置,根据听音人的位置和声音叠加区可以确定播放音频的最佳目标方位,进而通过旋转扬声器阵列实现了向处于声音叠加区的听音人定向播放音频,使得采用扬声器阵列播放音频的音量稳定提高,克服了无法确定声音的接收方的具体位置可能出现的音频音量降低的缺陷,保证了声音的接收方在接收音频时处于声音叠加区,有效提高了扬声器阵列的音频播放效果。
实施例二
进一步地,参照图3,基于本申请第一实施例,在本申请另一实施例中,与上述实施例一相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,所述麦克风阵列包括第一麦克风和第二麦克风,所述获取麦克风阵列的第一位置信息和通过所述麦克风阵列得到的音频信号,根据所述第一位置信息和所述音频信号确定音源位置的步骤包括:
步骤S11,获取所述第一麦克风的第一麦克风位置和第一音频信号,以及所述第二麦克风的第二麦克风位置和第二音频信号;
在本实施例中,具体地,建立二维坐标系,获取第一麦克风在所述二维坐标系中的第一麦克风位置信息和所述第一麦克风将接收到的声音信号转换成电信号后输出的第一音频信号,获取第二麦克风在所述坐标系中的第二麦克风位置信息和所述第二麦克风将接收到的声音信号转换成电信号后输出的第二音频信号。
步骤S12,根据所述第一音频信号和所述第二音频信号,计算得到所述第一音频信号的第一信号能量、所述第二音频信号的第二信号能量和所述第一音频信号与所述第二音频信号之间的时延信息;
在本实施例中,需要说明的是,每个麦克风在一段时间内接收到的信号能量是该麦克风在这段时间的信号采样的平方和。
具体地,通过对所述第一音频信号进行积分得到第一信号能量,对所述第二音频信号进行积分得到第二信号能量,根据第一音频信号和第二音频信号的时域数据和频域数据等,进而计算得到所述第一音频信号与所述第二音频信号之间的相位差,即可得到所述第一音频信号与所述第二音频信号之间的时延信息,其中,所述时延信息可以根据互相关函数、求取路径的脉冲响应(或传递函数)、结合语音特性的基音加权时延估计法、基于人耳感知特性的时延估计等方法进行计算得到。
优选地,所述根据所述第一音频信号和所述第二音频信号,计算得到所述第一音频信号与所述第二音频信号二者之间的时延信息的步骤包括:
步骤S121,将所述第一音频信号由时域转换至频域,得到所述第一音频信号的第一频域数据,并将所述第二音频信号由时域转换至频域,得到所述第二音频信号的第二频域数据;
在本实施例中,具体地,所述第一麦克风对声音信号进行采样得到的第一音频信号和所述第二麦克风对声音信号进行采样得到的音频信号均是随着时间的变化的时域信号,通过傅里叶变换工具将所述第一音频信号和所述第二音频信号从时域信号转换为频域信号,得到与所述第一音频信号对应的第一频域数据以及与所述第二音频信号对应的第二频域数据。
步骤S122,根据所述第一频域数据和所述第二频域数据计算得到所述第一音频信号与所述第二音频信号二者之间的时延信息。
在本实施例中,具体地,分别获取所述第一频域数据和所述第二频域数据与时域数据对应的a+bi形式的复数数据,通过采用imreal与imahinary 函数求解得到复数数据的实部与虚部,并根据实部与虚部计算得到对应的相位,进而计算得到所述第一音频信号与所述第二音频信号之间的相位差,即可得到所述第一音频信号与所述第二音频信号之间的时延信息。
在本实施例中,通过计算得到音频信号之间的相位差,来得到时延信息,不需要增加硬件设备或获取其他信息,可以低成本且快速的获取到时延信息,提高了音源定位的效率,进而提高了音频播放优化的效率。
步骤S13,根据所述第一信号能量、所述第二信号能量、所述时延信息、所述第一麦克风位置和所述第二麦克风位置,确定音源位置。
在本实施例中,具体地,根据不同位置的麦克风接收同一个音源发出的声音信号在传播过程中能量的衰减的不同,可以确定所述第一麦克风位置、所述第二麦克风位置、所述第一信号能量、所述第二信号能量与所述音源位置之间的函数关系,根据不同位置的麦克风接收同一个音源发出的声音信号因传播距离不同导致的接收时间的差异,可以确定所述第一麦克风位置、所述第二麦克风位置、所述时延信息与所述音源位置之间的函数关系,在根据能量确定的函数关系和根据时延信息确定的函数关系中,仅音源位置为未知数,因此可以确定音源的位置坐标。
优选地,所述根据所述第一信号能量、所述第二信号能量、所述时延信息和所述麦克风位置,确定音源位置的步骤包括:
步骤S131,根据所述第一信号能量和所述第二信号能量,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第一位置关系;
在本实施例中,具体地,根据声音在传播过程中,信号能量的衰减服从逆平方定律,通过确定信号采样、源信号和音源的声音信号传播距离之间的关系,同时已知每个麦克风在一段时间内接收到的信号能量是该麦克风在这段时间的信号采样的平方和,进而可以得到两个麦克风的信号能量、源信号和声音信号传播距离之间的两个关系式,其中,所述声音信号传播距离是声音信号从音源发出到被麦克风接收之间的传播距离,即可表示为音源到所述扬声器阵列中每个麦克风之间的距离,即可将声音信号传播距离用第一麦克风位置、第二麦克风位置和音源位置表示,由于同源信号的源信号相同,通过计算抵消掉源信号后,可以得到第一信号能量、第二信号能量、第一麦克风位置、第二麦克风位置与所述音源位置之间的关系,由于第一信号能力和第二信号能量可以通过对信号采样进行积分得到,因此可以得到所述第一麦克风位置、所述第二麦克风位置与所述音源位置之间的第一位置关系。
优选地,所述根据所述第一信号能量和所述第二信号能量,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第一位置关系的步骤包括:
步骤S1311,根据所述第一信号能量与所述第二信号能量的信号能量差,计算声音信号传播距离的距离比;
在本实施例中,具体地,通过计算所述第一信号能量与所述第二信号能量的信号能量差,可以将源信号从公式中抵消,由于信号能量等于信号采样的平方和,信号采样与声音信号传播距离成反比,由此可知,信号能量与声音信号传播距离的平方成反比,进而得到所述第一信号能量与所述第二信号能量的比值等于声音信号从音源到第二麦克风的声音信号传播距离与声音信号从音源到第一麦克风的声音信号传播距离的比值。
步骤S1312,根据所述距离比,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第一位置关系。
在本实施例中,具体地,将声音信号传播距离用第一麦克风位置、第二麦克风位置和音源位置表示,且第一信号能力和第二信号能量可以通过对信号采样进行积分得到,因此可以得到所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第一位置关系。
步骤S132,根据所述时延信息,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第二位置关系;
在本实施例中,具体地,根据所述时延信息确定声音信号传播的距离差,将声音信号传播距离用第一麦克风位置、第二麦克风位置和音源位置表示,即可得到所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第二位置关系,其中所述时延信息可以根据互相关函数、求取路径的脉冲响应(或传递函数)、结合语音特性的基音加权时延估计法、基于人耳感知特性的时延估计等进行计算得到。
优选地,所述根据所述时延信息,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第二位置关系的步骤包括:
步骤S1321,根据所述时延信息,计算声音信号传播的距离差;
在本实施例中,具体地,根据音频信号到达两个麦克风之间的到达时间差,得到时延信息,根据所述时延信息和声音在介质中的传播速度,计算得到音频信号从所述音源位置传播到所述第一麦克风位置的距离和从所述音源位置传播到所述第二麦克风位置的距离之间的距离差。
步骤S1322,根据所述距离差,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第二位置关系。
在本实施例中,具体地,用所述第一麦克风位置与所述音源位置表示声音信号从音源到第一麦克风之间的第一传播距离,用所述第二麦克风位置与所述音源位置表示声音信号从音源到第二麦克风之间的第二传播距离,根据第一传播距离与第二传播距离之间的距离差,即可得到所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第二位置关系。
步骤S133,根据所述第一位置关系和所述第二位置关系,确定所述音源位置。
在本实施例中,具体地,在所述第一位置关系和所述第二位置关系中,未知数仅有音源位置的横坐标和纵坐标,对由所述第一位置关系和所述第二位置关系组成的方程组求解,即可得到所述音源位置的横坐标和纵坐标,即可确定所述音源位置。
在本实施例中,通过两个麦克风实现了对音源的准确定位,减少了音源定位所需的麦克风的数量,有效降低了音源定位的成本,还可以减小设备的硬件体积。
实施例三
本发明实施例提供一种电子设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例一中的音频播放优化方法。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机、智能安防类产品等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下系统可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的方法中限定的上述功能。
本发明提供的电子设备,采用上述实施例一或实施例二中的音频播放优化方法,解决了采用扬声器阵列播放音频效果差技术问题。与现有技术相比,本发明实施例提供的电子设备的有益效果与上述实施例一提供的音频播放优化方法的有益效果相同,且该电子设备中的其他技术特征与上一实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
实施例四
本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例一中的音频播放优化的方法。
本发明实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如 Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本发明提供的计算机可读存储介质,存储有用于执行上述音频播放优化方法的计算机可读程序指令,解决了采用扬声器阵列播放音频效果差的技术问题。与现有技术相比,本发明实施例提供的计算机可读存储介质的有益效果与上述实施例一或实施例二提供的音频播放优化方法的有益效果相同,在此不做赘述。
实施例五
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的音频播放优化方法的步骤。
本申请提供的计算机程序产品解决了采用扬声器阵列播放音频效果差的技术问题。与现有技术相比,本发明实施例提供的计算机程序产品的有益效果与上述实施例一或实施例二提供的音频播放优化方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (9)

1.一种音频播放优化方法,其特征在于,所述音频播放优化方法包括:
获取麦克风阵列的第一位置信息和通过所述麦克风阵列得到的音频信号,根据所述第一位置信息和所述音频信号确定音源位置;
确定扬声器阵列的声音叠加区;
根据所述音源位置和所述声音叠加区之间的偏移角度,计算所述扬声器阵列的旋转角度;
根据所述旋转角度,旋转所述扬声器阵列,并在旋转完毕后通过所述扬声器阵列向音源播放预设待播放音频;
其中,所述扬声器阵列包括第一扬声器组和第二扬声器组,所述第一扬声器组与所述第二扬声器组呈平面对称,所述确定扬声器阵列的声音叠加区的步骤包括:
获取所述第一扬声器组和所述第二扬声器组的对称平面;
将所述对称平面作为所述扬声器阵列的声音叠加区。
2.如权利要求1所述的音频播放优化方法,其特征在于,所述麦克风阵列包括第一麦克风和第二麦克风,所述获取麦克风阵列的第一位置信息和通过所述麦克风阵列得到的音频信号,根据所述第一位置信息和所述音频信号确定音源位置的步骤包括:
获取所述第一麦克风的第一麦克风位置和第一音频信号,以及所述第二麦克风的第二麦克风位置和第二音频信号;
根据所述第一音频信号和所述第二音频信号,计算得到所述第一音频信号的第一信号能量、所述第二音频信号的第二信号能量和所述第一音频信号与所述第二音频信号二者之间的时延信息;
根据所述第一信号能量、所述第二信号能量、所述时延信息、所述第一麦克风位置和所述第二麦克风位置,确定音源位置。
3.如权利要求2所述的音频播放优化方法,其特征在于,所述根据所述第一音频信号和所述第二音频信号,计算得到所述第一音频信号与所述第二音频信号二者之间的时延信息的步骤包括:
将所述第一音频信号由时域转换至频域,得到所述第一音频信号的第一频域数据,并将所述第二音频信号由时域转换至频域,得到所述第二音频信号的第二频域数据;
根据所述第一频域数据和所述第二频域数据之间的相位差,计算得到所述第一音频信号与所述第二音频信号二者之间的时延信息。
4.如权利要求2所述的音频播放优化方法,其特征在于,所述根据所述第一信号能量、所述第二信号能量、所述时延信息和所述麦克风位置,确定音源位置的步骤包括:
根据所述第一信号能量和所述第二信号能量,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第一位置关系;
根据所述时延信息,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第二位置关系;
根据所述第一位置关系和所述第二位置关系,确定所述音源位置。
5.如权利要求4所述的音频播放优化方法,其特征在于,所述根据所述第一信号能量和所述第二信号能量,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第一位置关系的步骤包括:
根据所述第一信号能量与所述第二信号能量的信号能量差,计算声音信号传播距离的距离比;
根据所述距离比,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第一位置关系。
6.如权利要求4所述的音频播放优化方法,其特征在于,所述根据所述时延信息,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置三者之间的第二位置关系的步骤包括:
根据所述时延信息,计算声音信号传播的距离差;
根据所述距离差,确定所述第一麦克风位置、所述第二麦克风位置与所述音源位置的第二位置关系。
7.如权利要求1所述的音频播放优化方法,其特征在于,所述的根据所述第一位置信息和所述音频信号确定音源位置的步骤之后,还包括:
当确定的音源位置超过一个时,将所述麦克风阵列旋转预设角度,并返回执行步骤:获取麦克风阵列的第一位置信息以及所述麦克风阵列输出的音频信号。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的音频播放优化方法的步骤。
9.一种可读存储介质,其特征在于,所述可读存储介质上存储有实现音频播放优化方法的程序,所述实现音频播放优化方法的程序被处理器执行以实现如权利要求1至7中任一项所述音频播放优化方法的步骤。
CN202111137389.0A 2021-09-27 2021-09-27 音频播放优化方法、设备和可读存储介质 Active CN113938792B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111137389.0A CN113938792B (zh) 2021-09-27 2021-09-27 音频播放优化方法、设备和可读存储介质
PCT/CN2021/132605 WO2023045059A1 (zh) 2021-09-27 2021-11-24 音频播放优化方法、设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111137389.0A CN113938792B (zh) 2021-09-27 2021-09-27 音频播放优化方法、设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN113938792A CN113938792A (zh) 2022-01-14
CN113938792B true CN113938792B (zh) 2022-08-19

Family

ID=79277086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111137389.0A Active CN113938792B (zh) 2021-09-27 2021-09-27 音频播放优化方法、设备和可读存储介质

Country Status (2)

Country Link
CN (1) CN113938792B (zh)
WO (1) WO2023045059A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116156368B (zh) * 2023-04-03 2023-08-15 江西斐耳科技有限公司 一种音箱、音响系统及音箱校准方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007078545A (ja) * 2005-09-15 2007-03-29 Yamaha Corp 対象物検出装置及び音声会議装置
CN101656908A (zh) * 2008-08-19 2010-02-24 深圳华为通信技术有限公司 控制声音聚焦的方法、通讯设备及通讯系统
CN109698984A (zh) * 2018-06-13 2019-04-30 北京小鸟听听科技有限公司 一种音频交互设备和数据处理方法、计算机存储介质
CN110992972A (zh) * 2019-11-20 2020-04-10 佳禾智能科技股份有限公司 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质
CN112188368A (zh) * 2020-09-29 2021-01-05 深圳创维-Rgb电子有限公司 定向增强声音的方法及系统
CN214014501U (zh) * 2020-12-31 2021-08-20 广州艾美网络科技有限公司 声场调节装置、音箱及音响设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4127248B2 (ja) * 2004-06-23 2008-07-30 ヤマハ株式会社 スピーカアレイ装置及びスピーカアレイ装置の音声ビーム設定方法
KR101990370B1 (ko) * 2014-11-26 2019-06-18 한화테크윈 주식회사 카메라 시스템 및 카메라 시스템 동작 방법
CN107925813B (zh) * 2015-08-14 2020-01-14 杜比实验室特许公司 具有不对称扩散以用于经反射声音再现的向上激发扩音器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007078545A (ja) * 2005-09-15 2007-03-29 Yamaha Corp 対象物検出装置及び音声会議装置
CN101656908A (zh) * 2008-08-19 2010-02-24 深圳华为通信技术有限公司 控制声音聚焦的方法、通讯设备及通讯系统
CN109698984A (zh) * 2018-06-13 2019-04-30 北京小鸟听听科技有限公司 一种音频交互设备和数据处理方法、计算机存储介质
CN110992972A (zh) * 2019-11-20 2020-04-10 佳禾智能科技股份有限公司 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质
CN112188368A (zh) * 2020-09-29 2021-01-05 深圳创维-Rgb电子有限公司 定向增强声音的方法及系统
CN214014501U (zh) * 2020-12-31 2021-08-20 广州艾美网络科技有限公司 声场调节装置、音箱及音响设备

Also Published As

Publication number Publication date
WO2023045059A1 (zh) 2023-03-30
CN113938792A (zh) 2022-01-14

Similar Documents

Publication Publication Date Title
US10932075B2 (en) Spatial audio processing apparatus
US20230213349A1 (en) Audio Processing Apparatus
US9936292B2 (en) Spatial audio apparatus
CN102630385B (zh) 音频场景内的音频缩放处理的方法、装置及系统
CN109804559B (zh) 空间音频系统中的增益控制
US9924291B2 (en) Distributed wireless speaker system
US9196238B2 (en) Audio processing based on changed position or orientation of a portable mobile electronic apparatus
CN109155884B (zh) 用于立体声分离和定向抑制的系统和方法
CN109565629B (zh) 用于控制音频信号的处理的方法和装置
JP7082126B2 (ja) デバイス内の非対称配列の複数のマイクからの空間メタデータの分析
JP2020500480A5 (zh)
US11284211B2 (en) Determination of targeted spatial audio parameters and associated spatial audio playback
US9826332B2 (en) Centralized wireless speaker system
US20200217919A1 (en) Sound source distance estimation
CN113938792B (zh) 音频播放优化方法、设备和可读存储介质
CN113889140A (zh) 音频信号播放方法、装置和电子设备
CN115495038A (zh) 音频调整方法、装置、电子设备及可读存储介质
JP2020522189A (ja) インコヒーレント冪等アンビソニックスレンダリング
US11217220B1 (en) Controlling devices to mask sound in areas proximate to the devices
Nakamura et al. Indoor localization using multiple stereo speakers for smartphones.
US11277706B2 (en) Angular sensing for optimizing speaker listening experience
JP2020148763A (ja) 無指向性の可聴雑音源の位置特定機器
Iida et al. Acoustic VR System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant