CN110010151A

CN110010151A - 一种音频信号处理方法及设备、存储介质

Info

Publication number: CN110010151A
Application number: CN201811651551.9A
Authority: CN
Inventors: 郑亚军; 邓瀚林; 路翔; 张玉蕾
Original assignee: AAC Technologies Pte Ltd
Current assignee: AAC Technologies Pte Ltd
Priority date: 2018-12-31
Filing date: 2018-12-31
Publication date: 2019-07-12
Also published as: US11289110B2; US20200211577A1; WO2020140590A1

Abstract

本发明实施例涉及音频信号处理领域，公开了一种音频信号处理方法。本发明中，该音频信号处理方法包括：获取输入的音频信号；解析获得音频信号的音频特征；确定音频特征对应的振动特征；根据振动特征，生成音频信号对应的振动信号。根据输入的音频信号的音频特征对应的振动特征，将输入的音频信号自动地转换为振动信号，可避免人工操作造成的错误，使振动信号具有较高的通用性。

Description

一种音频信号处理方法及设备、存储介质

技术领域

本发明实施例涉及信号处理领域，特别涉及一种音频信号处理方法及设备、存储介质。

背景技术

目前，随着智能电子设备的快速发展，用户对于智能电子设备所带来的感官体验，要求也越来越高，除了传统的视觉与听觉体验，对于触觉体验中的震感体验也逐渐被用户所接受。在一些智能触控电子设备中，如手机、游戏设备、平板电脑等，已经有部分产品增加了震感体验的功能，并且将该震感体验作为用户体验中的一个重要评测指标，常用的震感体验多应用在信息提醒中，例如：信息接收、来电通知、闹钟、日历中的行程提醒等，以及应用于游戏和电影情节的互动体验中。

发明人发现现有技术中至少存在如下问题：上述震感体验给用户带来的感官体验还十分有限，例如：应用于通知和计时提醒的震感旋律单一，用户在长时间接触后，容易产生麻木感，导致用户对该设备的震感反应迟钝，降低了该设备送达信息的效率；而应用于游戏和电影情节的互动体验中，其中的振感主要是采用人工根据听感来手动匹配振动信号，该方法效率很低，并且受人的主观因素影响明显，对配置振动的人员要求较高，不能够得到普遍应用。

发明内容

本发明实施方式的目的在于提供一种音频信号处理方法及设备、存储介质，根据输入的音频信号的音频特征对应的振动特征，将输入的音频信号自动地转换为振动信号，可避免人工操作造成的错误，使振动信号具有较高的通用性。

为解决上述技术问题，本发明的实施方式提供了一种音频信号处理方法，包括以下步骤：获取输入的音频信号；解析获得音频信号的音频特征；确定音频特征对应的振动特征；根据振动特征，生成音频信号对应的振动信号。

为解决上述技术问题，本发明的实施方式提供了一种音频信号处理装置，该装置包括：获取模块，用于获取输入的音频信号；解析模块，用于解析获得音频信号的音频特征；配置模块，用于确定音频特征对应的振动特征；生成模块，用于根据振动特征，生成音频信号对应的振动信号。

本发明的实施方式还提供了一种电子设备，包括：至少一个处理器；以及，与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述音频信号处理方法。

本发明的实施方式还提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述音频信号处理方法。

本发明实施方式相对于现有技术而言，根据输入的音频信号的音频特征对应的振动特征，将输入的音频信号自动地转换为振动信号，可避免人工操作造成的错误，使振动信号具有较高的通用性。

另外，音频特征包括：音频信号的节拍时长、音符占比率、音频强度、音频粗糙度和强度峰值中的至少一种。

另外，振动特征包括：振动强度、振动频率和振动波形中的至少一种。

该方式中，可将多个维度的振动特征，应用于不同的场景，扩展振动信号的应用维度。

另外，节拍时长与振动频率呈反比，和/或，与振动强度呈反比，和/或，与振动波长呈正比；音符占比率与振动频率呈正比，和/或，与振动强度呈正比，和/或，与振动波长呈反比；音频强度与振动频率呈正比，和/或，与振动强度呈正比，和/或，与振动波长呈反比；音频粗糙度与振动频率呈正比，和/或，与振动强度呈正比，和/或，与振动波长呈反比；强度峰值与振动频率呈反比，和/或，与振动强度呈正比，和/或，与振动波长呈正比。

该方式中，通过音频特征与振动特征之间的对应关系，根据不同的应用场景，使振动信号具有较高的通用性。

另外，根据预先设置的音频特征与振动特征之间的对应关系，确定音频信号的音频特征对应的振动特征。

另外，将音频信号分段后，分别计算每段音频信号的速度、音符数和频谱关系；分别根据每段音频信号的速度，确定每段音频信号各自的节拍时长；和/或，分别根据每段音频信号的音符数以及每段音频信号的时长，确定每段音频信号各自的音符占比率；和/或，分别根据每段音频信号的频谱关系，确定每段音频信号各自的音频强度；和/或，分别根据每段音频信号的频谱关系，确定每段音频信号各自的音频粗糙度；和/或，分别根据每段音频信号的总帧数和强度峰值占比率，确定每段音频信号各自的强度峰值。

该方式中，通过解析音频信号，获得多个维度的音频特征，根据不同维度的音频特征，可增加对于音频信号的利用率，进而对应的振动信号也会有多种应用场景，扩展了振动信号的应用维度。

另外，根据振动特征，生成音频信号对应的振动信号之后，获得输入的马达参数；根据马达参数和振动信号，获得并输出振动波形信号。

该方式中，通过输入的马达参数和振动信号，进而获得对应马达的振动波形信号，提高振动波形信号与马达的适配性。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。

图1是根据本发明第一实施方式中的音频信号处理方法流程方框图；

图2是根据本发明第二实施方式中的音频信号处理方法流程方框图；

图3是根据本发明第二实施方式中的音频信号和振动信号的波形图；

图4是根据本发明第三实施方式中的音频信号处理装置方框图；

图5是根据本发明第四实施方式中的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本申请所要求保护的技术方案。

本发明的第一实施方式涉及一种音频信号处理方法。用于根据输入的音频信号的音频特征对应的振动特征，将输入的音频信号自动地转换为振动信号，可避免人工操作造成的错误，使振动信号具有较高的通用性。

下面对本实施方式中的音频信号处理方法的实现细节进行具体的说明，以下内容仅为方便理解本方案的实现细节，并非实施本方案的必须。

图1所示为本实施方式中的音频信号处理方法的流程图，该方法可包括如下步骤。

在步骤101中，获取输入的音频信号。

需要说明的是，输入的音频信号可以保存在多种格式的音频文件中，例如，获取后缀名为wav、ogg、mp3、flac、aiff、aifc、au的音频文件中所包含的音频信号。因为多轨音频在多轨道上的单信号特征基本一致，所以在分析中，提取音频文件其中一个音轨上的信号作为输入的音频信号即可。

在步骤102中，解析获得音频信号的音频特征。

其中，音频特征包括：音频信号的节拍时长、音符占比率、音频强度、音频粗糙度(roughness)和强度峰值中的至少一种。当然，音频特征还可能是其他参数，此处仅为举例说明，本发明的保护范围并不以此为限制。

在一个具体实现中，根据客户的需要，解析输入的音频信号，可获得音频信号的节拍时长、音符占比率、音频强度、音频粗糙度和强度峰值中的至少一种，例如，对于音乐，可以通过乐理的相关知识获取该音频信号的节拍长度和音符占比率即可满足客户需求。

其中，解析音频信号获得音频特征的一个具体实现过程为：将音频信号分段后，分别计算每段音频信号的速度、音符数和频谱关系；分别根据每段音频信号的速度，确定每段音频信号各自的节拍时长；和/或，分别根据每段音频信号的音符数以及每段音频信号的时长，确定每段音频信号各自的音符占比率；和/或，分别根据每段音频信号的频谱关系，确定每段音频信号各自的音频强度；和/或，分别根据每段音频信号的频谱关系，确定每段音频信号各自的音频粗糙度；和/或，分别根据每段音频信号的总帧数和强度峰值占比率，确定每段音频信号各自的强度峰值。

在一个具体实现中，结合乐理上的相关知识，分别计算每段音频信号的速度、音符数和频谱关系，例如，根据能量特征及频谱特征可分析获得该音频信号的速度，以及音符数；对该音频信号做傅里叶变换即可得到该音频信号的频谱关系；用单位时间除以音乐速度即可得到节拍时长；音符数除以音频总时长可获得音符占比率。

在一个具体实现中，对整段音频信号进行分帧，再对每一帧进行频谱分析，可获得相关系数，比如音频信号的振幅，音频信号的频率等，将这些系数带入到对应的计算公式中，可计算获得每一帧的音频强度和音频粗糙度。

其中，音频强度可根据以下公式计算获得：其中，x_f是音频信号的振幅；F为最高频率，其中系数C与最高频率F相对应，其对应关系可参考标准ISO266:2003,例如，当F＝6400Hz时，查找标准ISO-266:2003,可获得系数C＝0.065；α_f是在关于频率f等响曲线的声压级；c是度量常数，根据音频采样类型来设定，例如，对于典型的16位整数采样，取c值为1.37。

在对每段音频信号进行混合频率处理后，基于人耳对于混频后的音频信号的感受进行量化计算，得到该音频信号的音频粗糙度，具体可根据以下公式计算获得：其中，f₁和f₂为指定的一系列音阶频率中的任意两个频率值；在对每一帧进行频谱分析时，x₁和x₂是频率值f₁和f₂对应的幅度值；x_M为x₁和x₂两者中的较大值，即x_M＝max(x₁,x₂)；x_m为x₁和x₂两者之中的较小值，即x_m＝min(x₁,x₂)；f_d为f₁与f₂差的绝对值，即f_d＝|f₂-f₁|；s为系数，即s＝0.24/(0.0.207min(f₁,f₂)+18.96)。

通过解析音频信号，获得多个维度的音频特征，根据不同维度的音频特征，可增加对于音频信号的利用率，对应的振动信号也会被应用于多种应用场景，扩展了振动信号的应用维度。

在步骤103中，确定音频特征对应的振动特征。

其中，振动特征包括：振动强度、振动频率和振动波形中的至少一种。需要说明的是，振动特征还可能是其他参数，此处仅为举例说明，本发明的保护范围并不以此为限制。

在一个具体实现中，根据音频信号的多维度的音频特征，以及预先设置的音频特征与振动特征之间的对应关系，在不同节拍内，确定振动特征中的至少一种，例如，可对应确定振动强度，和/或，振动频率，和/或，振动波形。

在一个具体实现中，根据预先设置的音频特征与振动特征之间的对应关系，确定音频信号的音频特征对应的振动特征。

例如，节拍时长与振动频率呈反比，和/或，与振动强度呈反比，和/或，与振动波长呈正比；音符占比率与振动频率呈正比，和/或，与振动强度呈正比，和/或，与振动波长呈反比；音频强度与振动频率呈正比，和/或，与振动强度呈正比，和/或，与振动波长呈反比；音频粗糙度与振动频率呈正比，和/或，与振动强度呈正比，和/或，与振动波长呈反比；强度峰值与振动频率呈反比，和/或，与振动强度呈正比，和/或，与振动波长呈正比。

需要说明的是，可应用音频特征与振动特征的对应关系中的至少一种，来具体确定不同场景下所需要的振动特征，扩展了振动特征的应用维度。例如，在手机上设定闹钟提醒，只需要确定节拍时长和音符占比率与各个振动特征之间的对应关系，或者只使用节拍长度与各个振动特征之间的对应关系，或者只使用音符占比率与各个振动特征之间的对应关系，即可简单确定该闹钟所需要的振动特征；例如，在游戏中，若想获得更好的振动体验，就需要确定节拍时长，音符占比率，音频强度以及音频粗糙度这些音频特征所对应的振动特征，进而使客户获得的游戏振动体验更精细，为客户带来更好的游戏体验。

在步骤104中，根据振动特征，生成音频信号对应的振动信号。

在一个具体实现中，根据音频信号的音频特征与振动信号的振动特征的对应关系，为每段音频信号配置好对应的振动特征，进而生成该音频信号对应的振动信号，并输出该振动信号。

需要说明的是，根据多次将音频信号转换为振动信号的测试经验，可获得经验值强度峰值占比率，使用音频信号中包含的总帧数乘以该强度峰值占比率，约等于数量n，其中的数量n表示在该音频信号中具有n个强度峰值，在总帧数固定的情况下，若确定获得的音频信号的强度峰值占比率越大，则该音频信号所包含的强度峰值越多；若确定对应的音频粗糙度越大，并且该音频信号所包含的强度峰值越多，则可确定该音频信号对应的振动强度越强；若确定该音频信号所包含的强度峰值越多，则可确定该音频信号对应的振动频率越小，该音频信号对应的振动波长越长。

在本实施方式中，通过输入的音频信号的音频特征对应的振动特征，将输入的音频信号自动地转换为振动信号，可避免人工操作造成的错误，使振动信号具有较高的通用性。

本发明的第二实施方式涉及一种音频信号处理方法。第二实施方式与第一实施方式大致相同，主要区别之处在于：还需要根据获得的马达参数和振动信号，获得并输出振动波形信号。

具体处理流程如图2所示，在本实施方式中，该音频信号处理方法包括步骤201～206，因该实施方式中步骤201～204，与第一实施方式中的步骤101～104相同，在此不再赘述，下面具体介绍本实施方式中的步骤205～206。

在步骤205中，获得输入的马达参数。

需要说明的是，其中的马达参数主要包括：马达型号、马达形式、谐振频率、轴的直径、空转电流、转速、电压等参数。该马达参数是为了更好的匹配振动信号，根据马达参数的不同，所产生的振动效果也不同。若该马达参数与振动信号相匹配，则获得的振动效果就好；反之，若该马达参数与振动信号不匹配，则获得的振动效果就比较差，例如，谐振频率为110Hz的马达，用170Hz的正弦波驱动，震感可能会很弱，用户体验的效果就会较差。

在步骤206中，根据马达参数和振动信号，获得并输出振动波形信号。

在一个具体实现中，以马达参数为索引，将振动信号保存到数据库中；若需要获得振动波形信号，则根据马达参数从数据库中调取到对应的振动信号，以及上述马达参数确定对应的马达性能，计算获得对应的振动波形信号，并将该振动波形信号输出。

在一个具体实现中，将该方法应用于服务器上，终端设备将音频信号和相关的马达参数上传给该服务器，该服务器根据该音频信号的处理方法，解析该音频信号获得对应的音频特征，并根据该音频特征获得对应的振动特征，进而获得对应的振动波形信号，该服务器再将该振动波形信号下载到终端设备上，根据该振动波形信号，驱动终端设备上的马达，进而使该终端设备的使用者获得振动触感。

在一个具体实现中，选用音频信号A作为实验对象验证该音频信号处理方法的效果，该音频信号的波形图，如图3中的I所示，其中，音频信号A的采样率为44.1KHz，文件格式为ogg，经过该音频信号的音频特征与振动信号的振动特征的对应关系，获取到该音频信号的音频特征参数为：节拍步长为488ms，音符占比率为0.4643，强度峰值占比率为0.2644，根据上述振动信号的振动特征，获得振动信号的波形图，如图3中的II所示，对比图3中的I和II，可确定该振动信号的波形图能够很好的反应音频信号的音频特征。

在该实施方式中，通过不同的终端上所使用的马达参数的不同，结合振动信号，获得对应的振动波形信号，该振动波形信号可以适配于不同马达，进而提高该振动信号的通用性。

上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包括相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

本发明的第三实施方式涉及一种音频信号处理装置，该装置的具体实施可参见第一实施方式的相关描述，重复之处不再赘述。值得说明的是，本实施方式中的装置的具体实施也可参见第二实施方式的相关描述，但不局限于以上两个实施例，其他未说明的实施例也在本装置的保护范围之内。

如图4所示，该装置主要包括：获取模块401用于获取输入的音频信号；解析模块402用于解析获得音频信号的音频特征；配置模块403用于确定音频特征对应的振动特征；生成模块404用于根据振动特征，生成音频信号对应的振动信号。

不难发现，本实施方式为与第一或第二实施方式相对应的系统实施例，本实施方式可与第一或第二实施方式互相配合实施。第一或第二实施方式中提到的相关技术细节在本实施方式中依然有效，为了减少重复，这里不再赘述。相应地，本实施方式中提到的相关技术细节也可应用在第一或第二实施方式中。

值得一提的是，本实施方式中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施方式中不存在其它的单元。

本申请第四实施方式提供了一种电子设备，该设备具体结构如图5所示。包括至少一个处理器501；以及，与至少一个处理器501通信连接的存储器502。其中，存储器502存储有可被至少一个处理器501执行的指令，指令被至少一个处理器501执行，以使至少一个处理器501能够执行第一或第二实施方式所描述的音频信号处理方法。

本实施方式中，处理器501以中央处理器(Central Processing Unit，CPU)为例，存储器502以可读写存储器(Random Access Memory，RAM)为例。处理器501、存储器502可以通过总线或者其他方式连接，图5中以通过总线连接为例。存储器502作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中实现音频信号处理方法的程序就存储于存储器502中。处理器501通过运行存储在存储器502中的非易失性软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述音频信号处理方法。

存储器502可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储选项列表等。此外，存储器502可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器502可选包括相对于处理器501远程设置的存储器，这些远程存储器可以通过网络连接至外接设备。

一个或者多个程序模块存储在存储器502中，当被一个或者多个处理器501执行时，执行上述任意方法实施例中的音频信号处理方法。

上述产品可执行本申请实施例所提供的方法，具备执行方法相应的功能模块和有益效果，未在本实施例中详尽描述的技术细节，可参见本申请实施例所提供的方法。

本申请的第五实施方式涉及一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，该计算机程序被处理器执行时能够实现本申请任意方法实施例中涉及的音频信号处理方法。

本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

Claims

1.一种音频信号处理方法，其特征在于，所述方法包括：

获取输入的音频信号；

解析获得所述音频信号的音频特征；

确定所述音频特征对应的振动特征；

根据所述振动特征，生成所述音频信号对应的振动信号。

2.根据权利要求1所述的音频信号处理方法，其特征在于，所述音频特征包括：所述音频信号的节拍时长、音符占比率、音频强度、音频粗糙度和强度峰值中的至少一种。

3.根据权利要求2所述的音频信号处理方法，其特征在于，所述振动特征包括：振动强度、振动频率和振动波形中的至少一种。

4.根据权利要求3所述的音频信号处理方法，其特征在于，所述节拍时长与所述振动频率呈反比，和/或，与所述振动强度呈反比，和/或，与所述振动波长呈正比；

所述音符占比率与所述振动频率呈正比，和/或，与所述振动强度呈正比，和/或，与所述振动波长呈反比；

所述音频强度与所述振动频率呈正比，和/或，与所述振动强度呈正比，和/或，与所述振动波长呈反比；

所述音频粗糙度与所述振动频率呈正比，和/或，与所述振动强度呈正比，和/或，与所述振动波长呈反比；

所述强度峰值与所述振动频率呈反比，和/或，与所述振动强度呈正比，和/或，与所述振动波长呈正比。

5.根据权利要求4所述的音频信号处理方法，其特征在于，确定所述音频特征对应的振动特征，包括：

根据预先设置的音频特征与振动特征之间的对应关系，确定所述音频信号的音频特征对应的振动特征。

6.根据权利要求4所述的音频信号处理方法，其特征在于，解析获得所述音频信号的音频特征，包括：

将所述音频信号分段后，分别计算每段音频信号的速度、音符数和频谱关系；

分别根据每段音频信号的速度，确定每段音频信号各自的节拍时长；和/或，

分别根据每段音频信号的音符数以及每段音频信号的时长，确定每段音频信号各自的音符占比率；和/或，

分别根据每段音频信号的频谱关系，确定每段音频信号各自的音频强度；和/或，

分别根据每段音频信号的频谱关系，确定每段音频信号各自的音频粗糙度；和/或，

分别根据每段音频信号的总帧数和强度峰值占比率，确定每段音频信号各自的强度峰值。

7.根据权利要求1至6中任一项所述的音频信号处理方法，其特征在于，根据所述振动特征，生成所述音频信号对应的振动信号之后，还包括：

获得输入的马达参数；

根据所述马达参数和所述振动信号，获得并输出振动波形信号。

8.一种音频信号处理装置，其特征在于，包括：

获取模块，用于获取输入的音频信号；

解析模块，用于解析获得所述音频信号的音频特征；

配置模块，用于确定所述音频特征对应的振动特征；

生成模块，用于根据所述振动特征，生成所述音频信号对应的振动信号。

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至7中任一所述的音频信号处理方法。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一所述的音频信号处理方法。