CN114338622A

CN114338622A - 一种音频传输方法、音频播放方法、存储介质及相关设备

Info

Publication number: CN114338622A
Application number: CN202111632207.7A
Authority: CN
Inventors: 尚家乐
Original assignee: Goertek Optical Technology Co Ltd
Current assignee: Goertek Techology Co Ltd
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2022-04-12

Abstract

本申请公开了一种音频传输方法，应用于音频传输设备，包括：确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；显示所述视觉数据，以便音频播放设备利用摄像头采集所述视觉数据并播放所述视觉数据对应的音频。本申请能够避免音频传输对通道资源的占用，提高音频传输效率。本申请还公开了一种音频传输设备、一种音频播放方法、一种音频播放设备、一种存储介质及一种电子设备，具有以上有益效果。

Description

一种音频传输方法、音频播放方法、存储介质及相关设备

技术领域

本申请涉及音频传输技术领域，特别涉及一种音频传输方法、音频播放方法、存储介质及相关设备。

背景技术

VR(Virtual Reality)设备、AR设备等电子设备可以接受其他设备传输的音频并进行播放，目前音频数据通常利用通道直接传输。但是随着音频的品质提高，需要传输的音频数据量较大，且传输过程需要占用较多的通道资源。

因此，如何避免音频传输对通道资源的占用，提高音频传输效率是本领域技术人员目前需要解决的技术问题。

发明内容

本申请的目的是提供一种音频传输方法、音频传输设备、音频播放方法、音频播放设备、存储介质及电子设备，能够避免音频传输对通道资源的占用，提高音频传输效率。

为解决上述技术问题，本申请提供一种音频传输方法，应用于音频传输设备，包括：

确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；

将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；

根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；

显示所述视觉数据，以便音频播放设备利用摄像头采集所述视觉数据并播放所述视觉数据对应的音频。

可选的，所述确定目标音频PCM数据，包括：

确定多个所述音频播放设备对应的多个目标音频PCM数据；

相应的，根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据，包括：

根据所述描述符图像和所述采样点灰度图像生成每一所述目标音频PCM数据对应的视觉子数据；

拼接所有所述视觉子数据得到所述视觉数据。

可选的，在显示所述视觉数据之前，还包括：

在所述视觉数据中添加灰度对比区，以便所述音频播放设备根据所述灰度对比区对测量的灰度值进行偏差纠正；其中，所述灰度对比区的灰度值为预设值。

可选的，将所述音频头部信息转换为描述符图像，包括：

查询所述目标音频PCM数据对应的用户密钥，并利用所述用户密钥加密所述音频头部信息得到描述符向量；

生成所述描述符向量对应的所述描述符图像。

可选的，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像，包括：

按照所述目标音频PCM数据的采样深度将所述采样点数据转化为对应的字节流；

为所述字节流中每一字节创建对应的灰度窗口，并将字节的值设置为所述灰度窗口的灰度值得到所述采样点灰度图像。

本申请还提供了一种音频播放方法，应用于音频播放设备，包括：

利用摄像头采集音频传输设备显示的视觉数据；其中，所述音频传输设备显示所述视觉数据的过程包括：确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；显示所述视觉数据；

将所述视觉数据中的所述描述符图像转换为所述音频头部信息；

根据所述音频头部信息将所述采样点灰度图像转化为所述采样点数据；

根据所述采样点数据播放所述目标音频PCM数据对应的音频。

可选的，将所述视觉数据中的所述描述符图像转换为所述音频头部信息，包括：

生成所述描述符图像对应的描述符向量；其中，所述描述符图像的生成过程为：查询所述目标音频PCM数据对应的用户密钥，并利用所述用户密钥加密所述音频头部信息得到所述描述符向量，生成所述描述符向量对应的所述描述符图像；

利用所述音频播放设备对应的目标用户密钥解密所述描述符向量，并判断所述描述符向量是否解密成功；

若是，则根据解密结果确定所述音频头部信息。

可选的，根据所述音频头部信息将所述采样点灰度图像转化为所述采样点数据，包括：

根据所述音频头部信息确定头部索引、采样率和采样深度；

对所述采样点灰度图像进行灰度分割得到多个所述灰度窗口，并计算每一所述灰度窗口对应的灰度值；

利用所述头部索引、所述采样率和所述采样深度将所有灰度窗口对应的灰度值转化为所述采样点数据。

可选的，计算每一所述灰度窗口对应的灰度值，包括：

确定所述视觉数据中灰度对比区的测量灰度值和实际灰度值，根据所述灰度对比区的测量灰度值和实际灰度值确定灰度测量偏差；

利用所述灰度测量偏差对所述灰度窗口的测量灰度值进行偏差纠正，得到每一所述灰度窗口对应的灰度值。

本申请还提供了一种音频传输设备，包括：

数据确定模块，用于确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；

音频转换模块，用于将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；

视觉数据生成模块，用于根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；

显示模块，用于显示所述视觉数据，以便音频播放设备利用摄像头采集所述视觉数据并播放所述视觉数据对应的音频。

本申请还提供了一种音频播放设备，包括：

视觉数据采集模块，用于利用摄像头采集音频传输设备显示的视觉数据；其中，所述音频传输设备显示所述视觉数据的过程包括：确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；显示所述视觉数据；

头部信息转换模块，用于将所述视觉数据中的所述描述符图像转换为所述音频头部信息；

采样点数据转换模块，用于根据所述音频头部信息将所述采样点灰度图像转化为所述采样点数据；

音频播放模块，用于根据所述采样点数据播放所述目标音频PCM数据对应的音频。

本申请还提供了一种存储介质，其上存储有计算机程序，所述计算机程序执行时实现上述音频传输方法和/或上述音频播放方法执行的步骤。

本申请还提供了一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器调用所述存储器中的计算机程序时实现上述音频传输方法和/或上述音频播放方法执行的步骤。

本申请提供了一种音频传输方法，应用于音频传输设备，包括：确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；显示所述视觉数据，以便音频播放设备利用摄像头采集所述视觉数据并播放所述视觉数据对应的音频。

本申请将目标音频PCM数据的音频头部信息转换为描述符图像，将目标音频PCM数据的采样点数据转换为采样点灰度图像，进而根据描述符图像和采样点灰度图像生成对应的视觉数据，通过上述方式可以将目标音频PCM数据转换为视觉数据。显示视觉数据后，音频播放设备可以利用摄像头采集的视觉数据播放对应的音频。本实施例将音频数据的传输过程转化为视觉数据的传输过程，无需占用通道资源，能够避免音频传输对通道资源的占用，提高了音频传输效率。本申请同时还提供了一种音频传输设备、音频播放方法、音频播放设备、存储介质及电子设备，具有上述有益效果，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例，下面将对实施例中所需要使用的附图做简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种音频传输方法的流程图；

图2为本申请实施例所提供的一种视频数据示意图；

图3为本申请实施例所提供的一种三音频同时传输场景下的视觉数据结构示意图；

图4为本申请实施例所提供的一种包含灰度对比区的视觉数据结构示意图；

图5为本申请实施例所提供的一种音频传输方法的流程图；

图6为本申请实施例所提供的一种利用视觉信息进行音频定向一对多传输的方法的流程图；

图7为本申请实施例所提供的一种灰度视频流的结构示意图；

图8为本申请实施例所提供的一种音频传输设备的结构示意图；

图9为本申请实施例所提供的一种音频播放设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

下面请参见图1，图1为本申请实施例所提供的一种音频传输方法的流程图。

具体步骤可以包括：

S101：确定目标音频PCM数据；

其中，本实施例可以应用于音频传输设备，该音频传输设备可以将音频播放设备进行播放。目标音频PCM(Pulse Code Modulation，脉冲编码调制)数据为音频播放设备需要播放的音频，目标音频PCM数据包括音频头部信息和采样点数据。音频头部信息中可以包括头部索引、采样率和采样深度，音频播放设备可以根据音频头部信息对采样点数据进行采样，进而根据采样结果播放相应的音频。上述头部索引用于指示采样的起始位置。

S102：将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；

其中，本实施例可以将音频头部信息映射为对应的向量，进而基于向量生成对应的描述符图像。本实施例可以预先设置音频头部信息与描述符图像的转换关系，基于该转换关系生成对应的描述符图像。为了提高描述符图像的识别效率，描述符图像可以为灰度图像。不同音频头部信息对应的描述符图像不相同，根据描述符图像可以逆向推导出音频头部信息。音频采样点数据中可以包括多个采样点，本实施例可以将根据采样深度将N个采样点合成一个字节，得到采样点数据对应的字节流。字节流中每一字节对应一个灰度窗口，每一灰度窗口的灰度值为对应的字节的值。具体的，本实施例可以按照所述目标音频PCM数据的采样深度将所述采样点数据转化为对应的字节流；为所述字节流中每一字节创建对应的灰度窗口，并将字节的值设置为所述灰度窗口的灰度值得到所述采样点灰度图像。灰度图像中灰度窗口的排列顺序与字节流中各字节的排列顺序相同。以采样深度为16Bit，可以将2个采样点合成一个字节，该字节对应一个灰度窗口，字节的取值范围为0～255，字节的值为灰度窗口的灰度值，上述灰度窗口所有像素点的灰度值相同。

S103：根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；

其中，本实施例可以将描述符图像与灰度图像进行拼接得到目标音频PCM数据对应的视觉数据。视觉数据可以为一张图像数据，也可以为包括多帧图像的视频数据。请参见图2，图2为本申请实施例所提供的一种视频数据示意图。

S104：显示所述视觉数据，以便音频播放设备利用摄像头采集所述视觉数据并播放所述视觉数据对应的音频。

其中，在得到视觉数据之后，可以利用音频传输设备的显示屏显示视觉数据。具体的，若视觉数据为一张图像数据，可以显示该图像；若是视觉数据为视频数据，可以依次显示该视频数据中的每一帧图像。音频播放设备可以利用摄像头进行拍摄，以便采集视觉数据。在音频播放设备得到视觉数据后，可以从视觉数据中解析得到音频头部信息，根据所述音频头部信息将所述采样点灰度图像转化为所述采样点数据，以便播放对应的音频。

本实施例将目标音频PCM数据的音频头部信息转换为描述符图像，将目标音频PCM数据的采样点数据转换为采样点灰度图像，进而根据描述符图像和采样点灰度图像生成对应的视觉数据，通过上述方式可以将目标音频PCM数据转换为视觉数据。显示视觉数据后，音频播放设备可以利用摄像头采集的视觉数据播放对应的音频。本实施例将音频数据的传输过程转化为视觉数据的传输过程，无需占用通道资源，能够避免音频传输对通道资源的占用，提高了音频传输效率。

作为一种可行的实施方式，图1对应的实施例可以将多个目标音频PCM数据转换至同一视觉数据内，以便为多个音频播放设备同时传输音频。具体的，上述实施例可以确定多个所述音频播放设备对应的多个目标音频PCM数据，然后生成每一目标音频PCM数据的描述符图像和所述采样点灰度图像。根据所述描述符图像和所述采样点灰度图像生成每一所述目标音频PCM数据对应的视觉子数据；拼接所有所述视觉子数据得到所述视觉数据。请参见图3，图3为本申请实施例所提供的一种三音频同时传输场景下的视觉数据结构示意图。此时音频播放设备1可以根据描述符图像1同一行的视觉子数据播放相应的音频1，音频播放设备2可以根据描述符图像2同一行的视觉子数据播放相应的音频2，音频播放设备3可以根据描述符图像3同一行的视觉子数据播放相应的音频3。

作为一种可行的实施方式，在显示所述视觉数据之前，还可以在所述视觉数据中添加灰度对比区，以便所述音频播放设备根据所述灰度对比区对测量的灰度值进行偏差纠正；其中，所述灰度对比区的灰度值为预设值(如灰度值为0)。具体的，灰度对比区设置于描述符图像与采样点灰度图像之间，由于摄像头采集的灰度值会受到环境光强的影响，本实施例提供灰度值为预设值的灰度对比区，以便纠正检测的灰度偏差。请参见图4，图4为本申请实施例所提供的一种包含灰度对比区的视觉数据结构示意图。

作为一种可行的实施方式，本实施例可以通过以下方式将音频头部信息转换为描述符图像：查询所述目标音频PCM数据对应的用户密钥，并利用所述用户密钥加密所述音频头部信息得到描述符向量；生成所述描述符向量对应的所述描述符图像。在上述实施例中音频播放设备、目标音频PCM数据和用户密钥三者具有预设的对应关系，通过使用用户密钥加密音频头部信息可以使特定的音频播放设备才能够正确解密描述符向量，提高了音频传输的私密性。

下面请参见图5，图5为本申请实施例所提供的一种音频传输方法的流程图。

具体步骤可以包括：

S501：利用摄像头采集音频传输设备显示的视觉数据；

其中，本实施例可以应用于音频播放设备，上述音频播放设备可以为图1对应实施例中的音频播放设备，视觉数据为图1对应实施例中音频传输设备现实的视觉数据。

其中，所述音频传输设备显示所述视觉数据的过程包括：确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据，显示所述视觉数据。

S502：将所述视觉数据中的所述描述符图像转换为所述音频头部信息；

其中，本步骤中可以按照音频传输设备生成描述符图像的逆过程将所述视觉数据中的所述描述符图像转换为所述音频头部信息。

具体的，上述描述符图像的生成过程为：查询所述目标音频PCM数据对应的用户密钥，并利用所述用户密钥加密所述音频头部信息得到所述描述符向量，生成所述描述符向量对应的所述描述符图像。在描述符图像被加密的基础上，可以通过以下方式将所述视觉数据中的所述描述符图像转换为所述音频头部信息：生成所述描述符图像对应的描述符向量；利用所述音频播放设备对应的目标用户密钥解密所述描述符向量，并判断所述描述符向量是否解密成功；若是，则根据解密结果确定所述音频头部信息。

S503：根据所述音频头部信息将所述采样点灰度图像转化为所述采样点数据；

在得到音频头部信息的基础上，本步骤可以根据所述音频头部信息确定头部索引、采样率和采样深度；对所述采样点灰度图像进行灰度分割得到多个所述灰度窗口，并计算每一所述灰度窗口对应的灰度值；利用所述头部索引、所述采样率和所述采样深度将所有灰度窗口对应的灰度值转化为所述采样点数据。

作为一种可行的实施方式，音频传输设备可以在采样点灰度图像的头部添加M个(如3个)基准灰度窗口，基准灰度窗口之间灰度值差为固定值，本实施例可以判断前M个灰度窗口之间灰度值差是否为固定值；若是，则判定灰度分割成功，进入利用头部索引、采样率和采样深度将所有灰度窗口对应的灰度值转化为所述采样点数据的操作；若否，则判定灰度分割失败，此时可以向音频传输设备发送灰度分割失败的提示信息，以便音频传输设备增加视觉数据种灰度窗口的尺寸。

具体的，若视觉数据种存在灰度对比区，本实施例可以通过以下方式计算每一所述灰度窗口对应的灰度值：确定所述视觉数据中灰度对比区的测量灰度值和实际灰度值，根据所述灰度对比区的测量灰度值和实际灰度值确定灰度测量偏差；利用所述灰度测量偏差对所述灰度窗口的测量灰度值进行偏差纠正，得到每一所述灰度窗口对应的灰度值。

S504：根据所述采样点数据播放所述目标音频PCM数据对应的音频。

本实施例利用摄像头采集的视觉数据，并利用视觉数据播放对应的音频。音频传输设备将目标音频PCM数据的音频头部信息转换为描述符图像，将目标音频PCM数据的采样点数据转换为采样点灰度图像，进而根据描述符图像和采样点灰度图像生成对应的视觉数据，通过上述方式可以将目标音频PCM数据转换为视觉数据。本实施例将音频数据传输过程转化为视觉数据的传输过程，无需占用通道资源，能够避免音频传输对通道资源的占用，提高了音频传输效率。

下面通过在实际应用中的实施例说明上述实施例描述的流程。

相关技术中，音频传输有着传输数据量大、隐私性差、传输过程占用通道资源较大的缺点，且当前的外放式的音箱类产品在播放音源时存在仅能固化播放单一频道，隐私性和针对性较差，无法动态灵活的选择音频接收对象。

为了解决上述相关技术中存在的缺陷，本申请通过灰度视觉信息，以一种视觉方法来传输音频数据，可以做到音频传输的针对性和低资源耗费。请参见图6，图6为本申请实施例所提供的一种利用视觉信息进行音频定向一对多传输的方法的流程图，本实施例通过视觉信息来传递音频信息，减少了传输成本且传输方式更为灵活，可以一对多针对性传输音频数据，具体包括以下步骤：

S601：从服务器获取对应的用户密钥key值。

S602：音频PCM数据进行数字化灰度处理，得到承载音频数据的灰度视频流(即视觉数据)。

S603：显示设备依据设定的灰度窗口尺寸播放形成承载音频数据的灰度视频流。

S604：VR/AR头显或其他音频播放设备通过视觉摄像头捕获灰度视频流。

S605：音频播放设备判断是否完成灰度分割操作；若是，则进入S606；若否，则进入S611。

S606：音频播放设备分析捕获的灰度视频流，提取预存的key值与ID识别区的特征描述向量进行校验解密操作。

S607：判断ID校验是否成功；若是，则进入S608；若否，则继续遍历其他频道，在ID识别区进行校验。

S608：解密出音频PCM数据的头部索引。

S609：根据头部索引、采样率和采样深度将灰度窗口的灰度值转化为音频PCM采样点。

S610：将采样点存入fifo区域以便取出采样点进行播放。

S611：音频播放设备通过无线通道(spp/ble)向显示设备返回灰度分割失败信息。

S612：根据反馈结果即音频数据大小重新调整二维灰度窗口设定尺寸。

请参见图7，图7为本申请实施例所提供的一种灰度视频流的结构示意图，灰度视频流包括多个频道，每一频道具有对应的音频PCM数据和音频播放设备，ID识别区设置描述符图像，描述符图像包括圆形特征点和环形描述符，用来标识音频所属用户，并绑定音频头部信息(频道、采样率、采样深度)。灰度对比区为灰度值为0的色块，一块灰度窗口对应的灰度值代表音频采样点中的1个字节，Index表示灰度窗口的索引值，一块灰度窗口对应的灰度值代表音频采样点中的1个字节。图7中灰度窗口中的数字表示灰度值。

本实施例提供了通过灰度对比区进行不同场景下灰度窗口值精确提取的方案，在对图7中的灰度窗口进行灰度提取时，可以按照如下公式利用灰度对比区中的灰度信息来计算出因为光照等因素而产生的灰度值偏移的问题，从而确保在不同的光照场景下能提取出准确的灰度值进行音频数据的转换，计算灰度值的公式如下：

G＝g+g_offset；

上式中G为图7中每一个灰度窗口的最终灰度值，g为直接从灰度窗口中提取的直观灰度值，g_offset为该频道灰度对比区的灰度值减去0(纯黑)得出的偏移校准值，因为灰度对比区的预设的值为纯黑，如果因光照等因素产生了一定的灰度上升(黑色变浅)，那么这个上升的灰度值即为偏移值，因为局部光照变化的有限性，此偏移值可以如上式所述用来校准频道下直观灰度值。

图6中的用户密钥key值为存在于服务器中与用户协商一致的密钥，此密钥用来基于一定的加密算法产生ID区的描述子，用户也可以用此key值解密ID区的描述子，解密结果为2维的向量，表明解密成功与否及起始灰度窗口的序列号，具体如下式所示：

上式中为

加解密算法，此算法根据密级要求进行预设选择，(r,i)为二维解密结果，r表示解密成功标志，i标志起始灰度窗口的序列号，因为以常规16k采样率16bit采样深度的音频数据为例，每个采样点由两个字节构成(本实施例中对应两个灰度窗口)，这两个字节有高低位之分，如果一个连续的音频数据流的起始字节错误，则后续采样点将会因为高低位连续取反而得不到正确的音频流，因而起到了一定的安全加密作用。p_d即为ID识别区的描述符向量，k_d为用户密钥向量，下标d表明这些向量的维度，维度越高则安全等级越高，通过上述方式提高了音频传输的私密性。

请参见图8，图8为本申请实施例所提供的一种音频传输设备的结构示意图；

该设备可以包括：

数据确定模块801，用于确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；

音频转换模块802，用于将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；

视觉数据生成模块803，用于根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；

显示模块804，用于显示所述视觉数据，以便音频播放设备利用摄像头采集所述视觉数据并播放所述视觉数据对应的音频。

进一步的，数据确定模块801用于确定多个所述音频播放设备对应的多个目标音频PCM数据；

相应的，视觉数据生成模块803用于根据所述描述符图像和所述采样点灰度图像生成每一所述目标音频PCM数据对应的视觉子数据；拼接所有所述视觉子数据得到所述视觉数据。

进一步的，还包括：

灰度对比区设置模块，用于在显示所述视觉数据之前，在所述视觉数据中添加灰度对比区，以便所述音频播放设备根据所述灰度对比区对测量的灰度值进行偏差纠正；其中，所述灰度对比区的灰度值为预设值。

进一步的，音频转换模块802包括：

描述符图像生成单元，用于查询所述目标音频PCM数据对应的用户密钥，并利用所述用户密钥加密所述音频头部信息得到描述符向量；还用于生成所述描述符向量对应的所述描述符图像。

和/或，采样点灰度图像生成单元，用于按照所述目标音频PCM数据的采样深度将所述采样点数据转化为对应的字节流；还用于为所述字节流中每一字节创建对应的灰度窗口，并将字节的值设置为所述灰度窗口的灰度值得到所述采样点灰度图像。

请参见图9，图9为本申请实施例所提供的一种音频播放设备的结构示意图；

该设备可以包括：

视觉数据采集模块901，用于利用摄像头采集音频传输设备显示的视觉数据；其中，所述音频传输设备显示所述视觉数据的过程包括：确定目标音频PCM数据；其中，所述目标音频PCM数据包括音频头部信息和采样点数据；将所述音频头部信息转换为描述符图像，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像；根据所述描述符图像和所述采样点灰度图像生成所述目标音频PCM数据对应的视觉数据；显示所述视觉数据；

头部信息转换模块902，用于将所述视觉数据中的所述描述符图像转换为所述音频头部信息；

采样点数据转换模块903，用于根据所述音频头部信息将所述采样点灰度图像转化为所述采样点数据；

音频播放模块904，用于根据所述采样点数据播放所述目标音频PCM数据对应的音频。

进一步的，头部信息转换模块902，用于生成所述描述符图像对应的描述符向量；其中，所述描述符图像的生成过程为：查询所述目标音频PCM数据对应的用户密钥，并利用所述用户密钥加密所述音频头部信息得到所述描述符向量，生成所述描述符向量对应的所述描述符图像；还用于利用所述音频播放设备对应的目标用户密钥解密所述描述符向量，并判断所述描述符向量是否解密成功；若是，则根据解密结果确定所述音频头部信息。

进一步的，采样点数据转换模块903，用于根据所述音频头部信息确定头部索引、采样率和采样深度；还用于对所述采样点灰度图像进行灰度分割得到多个所述灰度窗口，并计算每一所述灰度窗口对应的灰度值；还用于利用所述头部索引、所述采样率和所述采样深度将所有灰度窗口对应的灰度值转化为所述采样点数据。

进一步的，采样点数据转换模块903计算每一所述灰度窗口对应的灰度值的过程包括：确定所述视觉数据中灰度对比区的测量灰度值和实际灰度值，根据所述灰度对比区的测量灰度值和实际灰度值确定灰度测量偏差；利用所述灰度测量偏差对所述灰度窗口的测量灰度值进行偏差纠正，得到每一所述灰度窗口对应的灰度值。

本申请还提供了一种存储介质，其上存有计算机程序，该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请还提供了一种电子设备，可以包括存储器和处理器，所述存储器中存有计算机程序，所述处理器调用所述存储器中的计算机程序时，可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口，电源等组件。

由于设备部分的实施例与方法部分的实施例相互对应，因此设备部分的实施例请参见方法部分的实施例的描述，这里暂不赘述。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的设备而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种音频传输方法，其特征在于，应用于音频传输设备，包括：

2.根据权利要求1所述音频传输方法，其特征在于，所述确定目标音频PCM数据，包括：

确定多个所述音频播放设备对应的多个目标音频PCM数据；

拼接所有所述视觉子数据得到所述视觉数据。

3.根据权利要求1所述音频传输方法，其特征在于，在显示所述视觉数据之前，还包括：

4.根据权利要求1所述音频传输方法，其特征在于，将所述音频头部信息转换为描述符图像，包括：

生成所述描述符向量对应的所述描述符图像。

5.根据权利要求1所述音频传输方法，其特征在于，将所述采样点数据转换为包含多个灰度窗口的采样点灰度图像，包括：

6.一种音频播放方法，其特征在于，应用于音频播放设备，包括：

根据所述采样点数据播放所述目标音频PCM数据对应的音频。

7.根据权利要求6所述音频播放方法，其特征在于，将所述视觉数据中的所述描述符图像转换为所述音频头部信息，包括：

若是，则根据解密结果确定所述音频头部信息。

8.根据权利要求6所述音频播放方法，其特征在于，根据所述音频头部信息将所述采样点灰度图像转化为所述采样点数据，包括：

根据所述音频头部信息确定头部索引、采样率和采样深度；

9.根据权利要求8所述音频播放方法，其特征在于，计算每一所述灰度窗口对应的灰度值，包括：

10.一种音频传输设备，其特征在于，包括：

11.一种音频播放设备，其特征在于，包括：

12.一种电子设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器调用所述存储器中的计算机程序时实现如权利要求1至5任一项所述音频传输方法和/或如权利要求6至9任一项所述音频播放方法的步骤。

13.一种存储介质，其特征在于，所述存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器加载并执行时，实现如权利要求1至5任一项所述音频传输方法和/或如权利要求6至9任一项所述音频播放方法的步骤。