CN110377265A

CN110377265A - 声音播放方法及装置

Info

Publication number: CN110377265A
Application number: CN201910557857.6A
Authority: CN
Inventors: 何至军; 赵闯
Original assignee: New New Special Electric Automobile Industry Co Ltd
Current assignee: New New Special Electric Automobile Industry Co Ltd
Priority date: 2019-06-24
Filing date: 2019-06-24
Publication date: 2019-10-25

Abstract

本发明提供一种声音播放方法及装置，涉及音频播放技术领域。该声音播放方法包括：获取原始音频以及原始音频的录制特征信息。根据播放场景内的N个声音播放设备的位置信息、原始音频的特征信息，以及录制场景的位置与播放场景的位置之间的映射关系，获取每个音源的音源距离以及每个声音播放设备的听音距离。根据音源距离以及听音距离，获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，得到调整后的音频。通过N个声音播放设备播放调整后的音频。根据调整后的音频播放，可以在播放场景中还原原始音频中音源的录制特征，使用户的听音感受接近录制场景中的听音感受，声音层次感强，细节饱满，听音效果好。

Description

声音播放方法及装置

技术领域

本发明涉及音频播放技术领域，具体而言，涉及一种声音播放方法及装置。

背景技术

随着车载电子设备、通信技术以及人工智能的发展，车载娱乐变得越来越丰富，对于车载娱乐来说，听觉体验是十分重要的组成部分。

现有的车载音响系统中，可以通过调整多个声音播放装置的参数，实现调整车内音场的中心点，以提高用户的听音体验。

但现有技术中，无法还原音频的层次感，导致听到的声音扁平，听音效果差。

发明内容

本发明的目的在于，针对上述现有技术中的不足，提供一种声音播放方法及装置，以解决无法还原音频的层次感，导致听到的声音扁平，听音效果差的问题。

为实现上述目的，本发明实施例采用的技术方案如下：

第一方面，本发明实施例提供了一种声音播放方法，包括：获取原始音频以及原始音频的录制特征信息，录制特征信息包括多个音源的类型、以及录制场景中每个音源的位置信息、听音位置信息。根据播放场景内的N个声音播放设备的位置信息、原始音频的特征信息，以及录制场景的位置与播放场景的位置之间的映射关系，获取每个音源的音源距离以及每个声音播放设备的听音距离，其中，N为大于1的整数，音源距离为播放场景内音源的映射位置，与声音播放设备之间距离，听音距离为播放场景内听音位置的映射位置与声音播放设备之间的距离。根据音源距离以及听音距离，获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，得到调整后的音频。通过N个声音播放设备播放调整后的音频。

可选地，根据播放场景内的N个声音播放设备的位置信息、原始音频的特征信息，以及录制场景的位置与播放场景的位置之间的映射关系，获取每个音源的音源距离信息以及每个声音播放设备的听音距离信息，包括：根据每个音源的位置信息和听音位置信息，以及预设的录制场景的坐标系与播放场景的坐标系之间的映射关系，分别确定每个音源在播放场景的坐标系中的音源映射坐标以及听音位置在播放场景的坐标系中的听音映射坐标。获取N个声音播放设备在播放场景的坐标系中的播放坐标。根据N个播放坐标、每个音源的音源映射坐标，确定每个音源的音源距离信息。根据N个播放坐标、听音映射坐标，确定每个声音播放设备的听音距离信息。

可选地，听音位置在播放场景的坐标系中的听音映射坐标为原点坐标。

可选地，根据音源距离信息以及听音距离信息，获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，得到调整后的音频，包括：根据声音延迟算法、音源距离信息以及听音距离信息，获取延迟调整参数。根据声音强度算法、音源距离信息以及听音距离信息，获取强度调整参数。根据延迟调整参数和强度调整参数调整原始音频，得到调整后的音频。

可选地，根据延迟调整参数和强度调整参数调整原始音频，得到调整后的音频，包括：根据强度调整参数，调整每个音源对应声道的声音强度。将调整后的多个音源对应的声道合成，获取N个输出的声道。根据延迟调整参数，调整N个输出的声道的声音延迟信息，得到调整后的N个声道。

相应的，通过N个声音播放设备播放调整后的音频，包括：根据N个调整后的声道以及声音延迟信息，在对应的声音播放设备进行播放。

第二方面，本发明实施例还提供了一种声音播放装置，包括：

获取模块，用于获取原始音频以及原始音频的录制特征信息，录制特征信息包括多个音源的类型、以及录制场景中每个音源的位置信息、听音位置信息。获取模块，还用于根据播放场景内的N个声音播放设备的位置信息、原始音频的特征信息，以及录制场景的位置与播放场景的位置之间的映射关系，获取每个音源的音源距离以及每个声音播放设备的听音距离，其中，N为大于1的整数，音源距离为播放场景内音源的映射位置，与声音播放设备之间距离，听音距离为播放场景内听音位置的映射位置与声音播放设备之间的距离。调整模块，用于根据音源距离以及听音距离，获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，得到调整后的音频。播放模块，用于通过N个声音播放设备播放调整后的音频。

可选地，获取模块，具体用于根据每个音源的位置信息和听音位置信息，以及预设的录制场景的坐标系与播放场景的坐标系之间的映射关系，分别确定每个音源在播放场景的坐标系中的音源映射坐标以及听音位置在播放场景的坐标系中的听音映射坐标。获取N个声音播放设备在播放场景的坐标系中的播放坐标。根据N个播放坐标、每个音源的音源映射坐标，确定每个音源的音源距离信息。根据N个播放坐标、听音映射坐标，确定每个声音播放设备的听音距离信息。

可选地，调整模块，具体用于根据声音延迟算法、音源距离信息以及听音距离信息，获取延迟调整参数。根据声音强度算法、音源距离信息以及听音距离信息，获取强度调整参数。根据延迟调整参数和强度调整参数调整原始音频，得到调整后的音频。

可选地，调整模块，具体用于根据强度调整参数，调整每个音源对应声道的声音强度。将调整后的多个音源对应的声道合成，获取N个输出的声道。根据延迟调整参数，调整N个输出的声道的声音延迟信息，得到调整后的N个声道。

相应的，播放模块，具体用于根据N个调整后的声道以及声音延迟信息，在对应的声音播放设备进行播放。

第三方面，本发明实施例提供一种电子设备，包括：处理器、计算机可读存储介质和总线，计算机可读存储介质存储有处理器可执行的机器可读指令，当电子设备运行时，处理器与计算机可读存储介质之间通过总线通信，处理器执行机器可读指令，以执行上述第一方面任一方法的步骤。

第四方面，本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器运行时执行如上述第一方面任一方法的步骤。

本发明的有益效果是：通过获取原始音频以及原始音频的录制特征信息，并根据原始音频的录制特征信息，在播放场景中获取每个音源的音源距离以及每个声音播放设备的听音距离，使用音源距离和听音距离获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，最后，通过N个声音播放设备播放调整后的音频。根据调整后的音频播放，可以在播放场景中还原原始音频中音源的录制特征，使用户的听音感受接近录制场景中的听音感受，声音层次感强，细节饱满，听音效果好。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请提供的声音播放方法的播放场景示意图；

图2为本申请提供的声音播放方法的录制场景示意图；

图3为本申请提供的声音播放方法的应用场景示意图；

图4为本申请一实施例提供的声音播放方法的流程示意图；

图5为本申请另一实施例提供的声音播放方法的流程示意图；

图6为本申请一实施例提供的声音播放方法中播放场景的坐标系示意图；

图7为本申请另一实施例提供的声音播放方法的流程示意图；

图8为本申请一实施例提供的声音播放方法调整原始音频场景示意图；

图9为本申请一实施例提供的声音播放方法调整原始音频的波形示意图；

图10为本申请另一实施例提供的声音播放方法调整原始音频场景示意图；

图11为本申请另一实施例提供的声音播放方法调整原始音频的波形示意图；

图12为本申请另一实施例提供的声音播放方法的流程示意图；

图13为本申请一实施例提供的声音播放装置的结构示意图；

图14为本申请一实施例提供的电子设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。

图1为本申请提供的声音播放方法的播放场景示意图，图2为本申请提供的声音播放方法的录制场景示意图，图3为本申请提供的声音播放方法的应用场景示意图。

播放场景即为播放音频的场景，如图1所示，以交通工具的播放场景为例，交通工具内可设有4个声音播放设备101，用户即为乘客102，乘客102的位置可以在主驾驶座位、副驾驶座位或后排座位等交通工具的任一位置，可以通过位置传感器如设置在座椅处或其它位置的传感器获取乘客102的具体位置，在此不做限制。当然，本申请提供的声音播放方法还可以应用于其他播放场景，例如室内、电影院、KTV等，当用于其他播放场景时，只需要进行适应性的调整，即可实现本申请中的方案，在此不多赘述。

录制场景即音频的录制场景，如图2所示，录制场景中包括听音位置104，多个音源103，以两个音源为例，其中，一个音源103距离听音位置104的距离为l₁、另一个音源103距离听音位置104的距离为l₂，该两个音源103与听音位置104的连线之间存在夹角θ。其中，录制场景可以是音乐厅，此时音源103可以是小号、长笛、圆号、小提琴等任一可发声器件，或者，录制场景还可以是录音棚，此时音源103可以是单人、多人或者其它发声主体，在此不做限制。

如图3所示，通过执行本申请所提供的声音播放方法调整原始音频并通过声音播放设备101播出后，可使得乘客102听到的声音在空间感受上与录制场景尽可能一致，实现了听音场景中录制场景的重现，即听音位置104与乘客102的位置重叠，并且听到的音源103的声音与录制场景中听音位置104听到的音源103的感受相同。

需要指出的是，本申请所涉及的交通工具可以为燃油汽车、电动汽车、柴油汽车、混合动力汽车或其它任一类型的交通工具。

图4为本申请一实施例提供的声音播放方法的流程示意图。其中，该方法的执行主体可以是具有计算处理能力的终端，该终端可以为车载终端，如车机、车辆中控设备或智能后视镜等，该终端还可以为位于交通工具内，可与交通工具的中控设备连接的用户终端，如电脑、平板电脑或移动终端等，在此不做限制。

如图4所示，该方法包括：

S210、获取原始音频以及原始音频的录制特征信息，录制特征信息包括多个音源的类型、以及录制场景中每个音源的位置信息、听音位置信息。

一些实施方式中，原始音频的格式可以包括动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III，MP3)、无损音频压缩编码(FreeLossless Audio Codec，FLAC)、窗波(Windows Wave，WAV)、窗媒体音频(Windows MediaAudio，WMA)、高级音频编码(Advanced Audio Coding、AAC)等。其中，原始音频的录制特征信息可以单独存放，也可以集成在原始音频中，在此不做限制。也就是说，获取原始音频之后，对该原始音频进行处理，以获取该原始音频的录制特征信息；或者，获取该原始音频的同时，从该原始音频所在的位置获取该原始音频的录制特征信息。

其中，获取该原始音频可包括：从预设的存储器如内置的存储器或者外接的存储器中，获取该原始音频；或者，从云端服务器获取该原始音频；或者，从与执行该声音播放方法的设备连接的终端设备如用户终端获取该原始音频。当然，上述仅为获取原始音频的一些示例，本申请还可通过其他的方式实现，在此不再赘述。

需要说明的是，对于确定的录制场景，如录音室、演播厅、音乐厅等，其音源个数、音源位置、听音位置等信息均为已知信息，可直接获取。

S220、根据播放场景内的N个声音播放设备的位置信息、原始音频的特征信息，以及录制场景的位置与播放场景的位置之间的映射关系，获取每个音源的音源距离以及每个声音播放设备的听音距离。

其中，N为大于1的整数，音源距离为播放场景内音源的映射位置，与声音播放设备之间距离，听音距离为播放场景内听音位置的映射位置与声音播放设备之间的距离。

需要说明的是，录制场景的位置与播放场景的位置之间的映射关系用于将录制场景中的音源的位置信息、听音位置信息映射到播放场景中，以便于计算每个音源的音源距离以及每个声音播放设备的听音距离。该映射关系可以是录制场景与播放场景之间坐标系的映射关系，也可以是录制场景中的点与播放场景中的点的映射关系，还可以为该录制场景与播放场景的其它映射关系。

S230、根据音源距离以及听音距离，获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，得到调整后的音频。

一些实施方式中，每个音源类型都有对应的调整参数，根据每个音源类型的调整参数对应调整原始音频，使得调整后的音频在播放场景中播出后，能够还原录制场景中每个音源的听感。

S240、通过N个声音播放设备播放调整后的音频。

一些实施方式中，每个声音播放设备都可以播放一个声道，该声道中的音频信息是根据该声音播放设备调整过延迟和强度的，通过N个声音播放设备同时播放调整后的音频，即可在播放场景中还原录制场景的听感。

本实施例中，通过获取原始音频以及原始音频的录制特征信息，并根据原始音频的录制特征信息，在播放场景中获取每个音源的音源距离以及每个声音播放设备的听音距离，使用音源距离和听音距离获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，最后，通过N个声音播放设备播放调整后的音频。由于根据调整后的音频播放，可以在播放场景中还原原始音频中音源的录制特征，使用户的听音感受接近录制场景中的听音感受，声音层次感强，细节饱满，听音效果好。

图5为本申请另一实施例提供的声音播放方法的流程示意图。

可选地，如图5所示，根据播放场景内的N个声音播放设备的位置信息、原始音频的特征信息，以及录制场景的位置与播放场景的位置之间的映射关系，获取每个音源的音源距离信息以及每个声音播放设备的听音距离信息，可包括：

S221、根据每个音源的位置信息和听音位置信息，以及预设的录制场景的坐标系与播放场景的坐标系之间的映射关系，分别确定每个音源在播放场景的坐标系中的音源映射坐标以及听音位置在播放场景的坐标系中的听音映射坐标。

一些实施方式中，录制场景和播放场景中分别具有各自的坐标系，这样，在录制场景中，每个音源的位置信息和听音位置信息都可以在录制场景的坐标系中，通过坐标点进行表示。

一种可能的实现方式中，录制场景的位置与播放场景的位置之间的映射关系可以为预设的录制场景的坐标系与播放场景的坐标系之间的映射关系，即录制场景与播放场景的坐标系之间的映射关系。不同的坐标系可具有各自的坐标尺，又称坐标尺度，例如，预设的录制场景的坐标系的横轴、纵轴的尺度与播放场景不同，可以将不同尺度的映射关系作为坐标系的映射关系，从而可将录制场景的坐标可以转换为与播放场景的尺度相同的坐标，然后标记在播放场景中，转换后的录制场景的坐标即为录制场景的坐标在播放场景中的映射坐标。如此，便可得到每个音源在播放场景的坐标系中的音源映射坐标以及听音位置在播放场景的坐标系中的听音映射坐标，用以计算每个音源的音源距离信息和每个声音播放设备的听音距离信息。

或者，预设的录制场景的坐标系与播放场景的坐标系之间的映射关系可以是坐标系中点的映射关系。例如，预设的录制场景的坐标系的横轴、纵轴的尺度可以与播放场景相同，此时，只需要将预设的录制场景中的坐标直接映射到播放场景中即可，但预设的录制场景的坐标系与播放场景的坐标系之间的映射关系不以此为限。

其中，听音位置在播放场景的坐标系中的听音映射坐标可以为原点坐标。这样，可以减少映射的复杂度，在原点相同且坐标系尺度相同的情况下，只需要将录制场景的坐标系中的坐标直接作为播放场景的坐标系中的坐标即可。

S222、获取N个声音播放设备在播放场景的坐标系中的播放坐标。

如下结合示例进行说明。图6为本申请一实施例提供的声音播放方法中播放场景的坐标系示意图。如图6所示，声音播放设备101可以为4个，每个声音播放设备在播放坐标系中都有各自的坐标，该坐标通常是固定的，即，在确定播放场景时，即可确定该场景中声音播放设备101的数量，以及每个声音播放设备101的坐标。

S223、根据N个播放坐标、每个音源的音源映射坐标，确定每个音源的音源距离信息。

继续结合图6进行说明，以其中一个声音播放设备101和一个音源103为例，进行解释。

一些实施方式中，可以根据该声音播放设备101的坐标、播放场景的坐标系中的音源103的映射坐标，计算获取该声音播放设备101和该音源103之间的距离D，D即为该音源的音源距离信息。

S224、根据N个播放坐标、听音映射坐标，确定每个声音播放设备的听音距离信息。

同样的，如图6所示，将听音位置104在播放场景的坐标系中的听音映射坐标与乘客102的位置坐标应设在同一点(坐标系原点)，则坐标系原点与声音播放设备101之间的距离L即为L即为听音距离信息。

通过每个音源的位置信息和听音位置信息，以及预设的录制场景的坐标系与播放场景的坐标系之间的映射关系，获取播放场景中的音源距离信息、听音距离信息，使得还原的录制场景中的听感更加接近真实的录制场景中的听感。

图7为本申请另一实施例提供的声音播放方法的流程示意图。

可选地，如图7所示，根据音源距离信息以及听音距离信息，获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，得到调整后的音频，可包括：

S231、根据声音延迟算法、音源距离信息以及听音距离信息，获取延迟调整参数。

一种可能的实现方式中，参考图6，调整声音延迟的目的在于使不同声音播放设备播放的声音同时到达用户位置，设声音的传播速度为v0，声音，听音距离信息为L_n(n为N个声音播放设备中，第n个声音播放设备)，则每个声音播放设备播放的声音到达用户的时间t_n为:

由于每个声音播放设备与用户之间的距离L_n均不相同，所以t_n的值也不相同，取其中最大的值t_max作为基准，t_max＝max(t_n)，则每个声音播放设备对应的延迟时间t_delay_n＝t_max-t_n。

S232、根据声音强度算法、音源距离信息以及听音距离信息，获取强度调整参数。

一种可能的实施方式中，调整声音强度的目的在于在播放场景里，还原录制场景中，到达听音位置时的声音强度。

声音强度的衰减原理为：

其中，B为听音位置的声音强度，K表示比例系数，B₀为声源处的声音强度，R为听音位置与声源的距离。

参考图6，乘客102实际听到的声音强度B_n为：

其中，n与S231中的n表示的意义相同。

但是，还原录制场景时，声音到达听音位置时的目标声音强度B_e为：

其中，B_e为本实施例中的最佳强度，即声音到达听音位置时的目标声音强度为B_e时，能够获得最佳听感。D_n为该声音播放设备的音源距离信息。

则声音强度的调整方式为：

B_x＝H_nB₀

其中，B_x为调整后的声音强度，B_x的理论值等于B_e，但实际应用中，B_x是趋近于B_e的，只要B_x和B_e的误差在预设范围之内，则认为调整后的声音强度可以获得最佳听感。

若H_n>1,则表示声音强度要增强，若H_n<1,则表示声音强度需要减弱。

S233、根据延迟调整参数和强度调整参数调整原始音频，得到调整后的音频。

一些实施方式中，需要先对原始音频中，不同音源的声道进行对应调整，然后再按照预设规则将所有声道进行调整，得到调整后的音频。

通过获取的延迟调整参数以及获取的强度调整参数对原始音频进行调整，可以实现在播放场景中，更加准确的还原录制场景中的听感。

图8为本申请一实施例提供的声音播放方法调整原始音频场景示意图，图9为本申请一实施例提供的声音播放方法调整原始音频的波形示意图，图10为本申请另一实施例提供的声音播放方法调整原始音频场景示意图，图11为本申请另一实施例提供的声音播放方法调整原始音频的波形示意图，图12为本申请另一实施例提供的声音播放方法的流程示意图。

可选地，如图12所示，根据延迟调整参数和强度调整参数调整原始音频，得到调整后的音频，包括：

S2331、根据强度调整参数，调整每个音源对应声道的声音强度。

一些实施方式中，参考图8和图9，其中，ABCD各对应一个声音播放设备，对于只有一个需要还原的声点α，可以认为录制场景中只有一个声源，其中，声点指的是在播放场景中，用户感受到的声源的位置。

对于原始音频中，声音强度和延迟都是相同的，根据强度调整参数H_n调整每个声音播放设备对应声道的强度，得到声音强度调整后的音频。

还有一些实施方式中，参考图10和图11，其中，包括多个声点，在此以两个声点(α、β)为例，进行解释，每个声点对应的音源在原始音频中具有不同的声音强度和声音延迟，对于每个声道，需要对每个声点单独调整其声音强度。

需要说明的是，虽然在本申请，先通过S2331调整了声音强度，然后通过S2333调整了声音延迟，但是这两个步骤的顺序不做限制。

S2332、将调整后的多个音源对应的声道合成，获取N个输出的声道。

一些实施方式中，合成声道的数量与声音播放设备的数量相同，每个声音播放设备对应一个合成的声道。

S2333、根据延迟调整参数，调整N个输出的声道的声音延迟信息，得到调整后的N个声道。

与S2331中的对应单个声点和多个声点的方法相同，根据t_delay_n对应调整原始音频中，每个声道的延时，使得每个声道的声音都能同时到达用户。

一些实施方式中，对于每个声音播放设备播放自己对应的声道，例如，在图11中，声音播放设备A可以播放声道A，声音播放设备B可以播放声道B。

通过强度调整参数、延迟调整参数调整N个输出声道的声音强度和声音延迟，并将每个声道在对应的声音播放设备中进行播放，使得播放出来的声音能够最大程度的还原录制场景中的听感，提高听音感受。

图13为本申请一实施例提供的声音播放装置的结构示意图。如图13所示，本发明实施例还提供了一种声音播放装置，包括：

获取模块310，用于获取原始音频以及原始音频的录制特征信息，录制特征信息包括多个音源的类型、以及录制场景中每个音源的位置信息、听音位置信息。获取模块310，还用于根据播放场景内的N个声音播放设备的位置信息、原始音频的特征信息，以及录制场景的位置与播放场景的位置之间的映射关系，获取每个音源的音源距离以及每个声音播放设备的听音距离，其中，N为大于1的整数，音源距离为播放场景内音源的映射位置，与声音播放设备之间距离，听音距离为播放场景内听音位置的映射位置与声音播放设备之间的距离。调整模块320，用于根据音源距离以及听音距离，获取每个音源的类型对应的调整参数，并根据调整参数调整原始音频，得到调整后的音频。播放模块330，用于通过N个声音播放设备播放调整后的音频。

可选地，获取模块310，具体用于根据每个音源的位置信息和听音位置信息，以及预设的录制场景的坐标系与播放场景的坐标系之间的映射关系，分别确定每个音源在播放场景的坐标系中的音源映射坐标以及听音位置在播放场景的坐标系中的听音映射坐标。获取N个声音播放设备在播放场景的坐标系中的播放坐标。根据N个播放坐标、每个音源的音源映射坐标，确定每个音源的音源距离信息。根据N个播放坐标、听音映射坐标，确定每个声音播放设备的听音距离信息。

可选地，预设的录制场景的坐标系与播放场景的坐标系之间的映射关系，包括：将录制场景的坐标系中听音位置对应的坐标，映射在播放场景的坐标系的原点上。

可选地，调整模块320，具体用于根据声音延迟算法、音源距离信息以及听音距离信息，获取延迟调整参数。根据声音强度算法、音源距离信息以及听音距离信息，获取强度调整参数。根据延迟调整参数和强度调整参数调整原始音频，得到调整后的音频。

可选地，调整模块320，具体用于根据强度调整参数，调整每个音源对应声道的声音强度。将调整后的多个音源对应的声道合成，获取N个输出的声道。根据延迟调整参数，调整N个输出的声道的声音延迟信息，得到调整后的N个声道。

相应的，播放模块330，具体用于根据N个调整后的声道以及声音延迟信息，在对应的声音播放设备进行播放。

上述装置用于执行前述实施例提供的方法，其实现原理和技术效果类似，在此不再赘述。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，简称ASIC)，或，一个或多个微处理器(digital singnal processor，简称DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，简称FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(CentralProcessing Unit，简称CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，简称SOC)的形式实现。

图14为本申请一实施例提供的电子设备结构示意图。

如图14所示，该电子设备包括：处理器401、计算机可读存储介质402和总线403，其中：

电子设备可以包括一个或多个处理器401、总线403和计算机可读存储介质402，其中，计算机可读存储介质402用于存储程序，处理器401通过总线403与计算机可读存储介质402通信连接，处理器401调用计算机可读存储介质402存储的程序，以执行上述方法实施例。

电子设备可以是通用计算机、服务器或移动终端等，在此不做限制。电子设备用于实现本申请的上述方法实施例。

需要说明的是，处理器401可以包括一个或多个处理核(例如，单核处理器或多核处理器)。仅作为举例，处理器可以包括中央处理单元(Central Processing Unit，CPU)、专用集成电路(Application Specific Integrated Circuit，ASIC)、专用指令集处理器(Application Specific Instruction-set Processor，ASIP)、图形处理单元(GraphicsProcessing Unit，GPU)、物理处理单元(Physics Processing Unit，PPU)、数字信号处理器(Digital Signal Processor，DSP)、现场可编程门阵列(Field Programmable GateArray，FPGA)、可编程逻辑器件(Programmable Logic Device，PLD)、控制器、微控制器单元、简化指令集计算机(Reduced Instruction Set Computing，RISC)、或微处理器等，或其任意组合。

计算机可读存储介质402可以包括：包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(Read-Only Memory，ROM)等，或其任意组合。作为举例，大容量存储器可以包括磁盘、光盘、固态驱动器等；可移动存储器可包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等；易失性读写存储器可以包括随机存取存储器(Random AccessMemory，RAM)；RAM可以包括动态RAM(Dynamic Random Access Memory，DRAM)，双倍数据速率同步动态RAM(Double Date-Rate Synchronous RAM，DDR SDRAM)；静态RAM(StaticRandom-Access Memory，SRAM)，晶闸管RAM(Thyristor-Based Random Access Memory，T-RAM)和零电容器RAM(Zero-RAM)等。作为举例，ROM可以包括掩模ROM(Mask Read-OnlyMemory，MROM)、可编程ROM(Programmable Read-Only Memory，PROM)、可擦除可编程ROM(Programmable Erasable Read-only Memory，PEROM)、电可擦除可编程ROM(ElectricallyErasable Programmable read only memory，EEPROM)、光盘ROM(CD-ROM)、以及数字通用磁盘ROM等。

为了便于说明，在电子设备中仅描述了一个处理器401。然而，应当注意，本申请中的电子设备还可以包括多个处理器401，因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如，若电子设备的处理器401执行步骤A和步骤B，则应该理解，步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如，第一处理器执行步骤A，第二处理器执行步骤B，或者第一处理器和第二处理器共同执行步骤A和B。

可选地，本发明还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器运行时执行如上述方法的步骤。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(英文：processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取存储器(英文：Random Access Memory，简称：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种声音播放方法，其特征在于，包括：

获取原始音频以及所述原始音频的录制特征信息，所述录制特征信息包括多个音源的类型、以及录制场景中每个所述音源的位置信息、听音位置信息；

根据播放场景内的N个声音播放设备的位置信息、所述原始音频的特征信息，以及所述录制场景的位置与所述播放场景的位置之间的映射关系，获取每个所述音源的音源距离以及每个所述声音播放设备的听音距离，其中，N为大于1的整数，所述音源距离为所述播放场景内所述音源的映射位置，与所述声音播放设备之间距离，所述听音距离为所述播放场景内所述听音位置的映射位置与所述声音播放设备之间的距离；

根据所述音源距离以及所述听音距离，获取每个所述音源的类型对应的调整参数，并根据所述调整参数调整所述原始音频，得到调整后的音频；

通过N个所述声音播放设备播放所述调整后的音频。

2.根据权利要求1所述的方法，其特征在于，所述根据播放场景内的N个声音播放设备的位置信息、所述原始音频的特征信息，以及所述录制场景的位置与所述播放场景的位置之间的映射关系，获取每个所述音源的音源距离信息以及每个所述声音播放设备的听音距离信息，包括：

根据每个所述音源的位置信息和所述听音位置信息，以及预设的所述录制场景的坐标系与所述播放场景的坐标系之间的映射关系，分别确定每个所述音源在所述播放场景的坐标系中的音源映射坐标以及所述听音位置在所述播放场景的坐标系中的听音映射坐标；

获取N个所述声音播放设备在所述播放场景的坐标系中的播放坐标；

根据N个所述播放坐标、每个所述音源的音源映射坐标，确定每个所述音源的音源距离信息；

根据N个所述播放坐标、所述听音映射坐标，确定每个所述声音播放设备的听音距离信息。

3.根据权利要求2所述的方法，其特征在于，所述听音位置在所述播放场景的坐标系的中的听音映射坐标为原点坐标。

4.根据权利要求2所述的方法，其特征在于，所述根据所述音源距离以及所述听音距离，获取每个所述音源的类型对应的调整参数，并根据所述调整参数调整所述原始音频，得到调整后的音频，包括：

根据声音延迟算法、所述音源距离信息以及所述听音距离信息，获取延迟调整参数；

根据声音强度算法、所述音源距离信息以及所述听音距离信息，获取强度调整参数；

根据所述延迟调整参数和所述强度调整参数调整所述原始音频，得到调整后的音频。

5.根据权利要求4所述的方法，其特征在于，根据所述延迟调整参数和所述强度调整参数调整所述原始音频，得到调整后的音频，包括：

根据所述强度调整参数，调整每个所述音源对应声道的声音强度；

将调整后的多个音源对应的声道合成，获取N个输出的声道；

根据所述延迟调整参数，调整N个所述输出的声道的声音延迟信息，得到调整后的N个声道；

相应的，所述通过N个所述声音播放设备播放所述调整后的音频，包括：

根据N个所述调整后的声道以及所述声音延迟信息，在对应的所述声音播放设备进行播放。

6.一种声音播放装置，其特征在于，包括：

获取模块，用于获取原始音频以及所述原始音频的录制特征信息，所述录制特征信息包括多个音源的类型、以及录制场景中每个所述音源的位置信息、听音位置信息；

所述获取模块，还用于根据播放场景内的N个声音播放设备的位置信息、所述原始音频的特征信息，以及所述录制场景的位置与所述播放场景的位置之间的映射关系，获取每个所述音源的音源距离以及每个所述声音播放设备的听音距离，其中，N为大于1的整数，所述音源距离为所述播放场景内所述音源的映射位置，与所述声音播放设备之间距离，所述听音距离为所述播放场景内所述听音位置的映射位置与所述声音播放设备之间的距离；

调整模块，用于根据所述音源距离以及所述听音距离，获取每个所述音源的类型对应的调整参数，并根据所述调整参数调整所述原始音频，得到调整后的音频；

播放模块，用于通过N个所述声音播放设备播放所述调整后的音频。

7.根据权利要求6所述的装置，其特征在于，所述获取模块，具体用于根据每个所述音源的位置信息和所述听音位置信息，以及预设的所述录制场景的坐标系与所述播放场景的坐标系之间的映射关系，分别确定每个所述音源在所述播放场景的坐标系中的音源映射坐标以及所述听音位置在所述播放场景的坐标系中的听音映射坐标；

8.根据权利要求7所述的装置，其特征在于，所述听音位置在所述播放场景的坐标系中的听音映射坐标为原点坐标。

9.根据权利要求7所述的装置，其特征在于，所述调整模块，具体用于根据声音延迟算法、所述音源距离信息以及所述听音距离信息，获取延迟调整参数；

10.根据权利要求9所述的装置，其特征在于，所述调整模块，具体用于根据所述强度调整参数，调整每个所述音源对应声道的声音强度；

将调整后的多个音源对应的声道合成，获取N个输出的声道；

相应的，所述播放模块，具体用于根据N个所述调整后的声道以及所述声音延迟信息，在对应的所述声音播放设备进行播放。