CN117998250A - 音频处理设备和方法 - Google Patents
音频处理设备和方法 Download PDFInfo
- Publication number
- CN117998250A CN117998250A CN202211353277.3A CN202211353277A CN117998250A CN 117998250 A CN117998250 A CN 117998250A CN 202211353277 A CN202211353277 A CN 202211353277A CN 117998250 A CN117998250 A CN 117998250A
- Authority
- CN
- China
- Prior art keywords
- audio data
- audio
- sound
- target
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 198
- 238000000034 method Methods 0.000 title description 21
- 230000000694 effects Effects 0.000 claims abstract description 52
- 238000001228 spectrum Methods 0.000 claims description 57
- 238000003672 processing method Methods 0.000 claims description 28
- 230000003595 spectral effect Effects 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 230000002708 enhancing effect Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000003190 augmentative effect Effects 0.000 description 6
- 230000001755 vocal effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 239000011521 glass Substances 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 229920005994 diacetyl cellulose Polymers 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
本说明书提供的音频处理设备和方法,音频处理设备包括发声模组和音频处理电路,其中,发声模组包括K个发声单元,每个发声单元的音频特性均不同,K为大于1的整数;音频处理电路在获取初始音频数据后,将初始音频数据转换成K路声道的目标音频数据,每路声道的目标音频数据适配对应的发声单元的音频特性,以及将K路声道的目标音频数据分别输入至对应的K个发声单元,使每个发声单元将对应的目标音频数据转换为目标音频,形成混响声音;该方案可以提升音频处理的音质效果。
Description
技术领域
本说明书涉及音频处理领域,尤其涉及一种音频处理设备和方法。
背景技术
随着音频播放的智能化,用户的音频的音质效果提出了更高的要求。在音频播放中,使用低音、中音和高音等多个发声单元是一种满足高音质需求的解决方案。在采用多个发声单元播放音频时,现有的音频处理方法是将一声道的音频数据直接发送至多个发声单元进行播放。
在对现有技术的研究和实践过程中,本申请的发明人发现由于不同发声单元具有不同的音频特性,对于低音、中音和高音等不同发声单元直接播放相同的音频数据,在播放过程中并不能发挥每个发声单元的最佳播放效果,从而影响了播放时的音质效果,因此,导致音频处理的音质效果较差。
因此,需要提供一种音质效果更好的音频处理设备和方法。
发明内容
本说明书提供一种音质效果更好的音频处理设备和方法。
第一方面,本说明书提供一种音频处理设备,包括:发声模组,包括K个发声单元,每个所述发声单元的音频特性均不同,其中K为大于1的整数;以及音频处理电路,被配置为:获取初始音频数据,将所述初始音频数据转换成K路声道的目标音频数据,每路声道的目标音频数据适配对应的所述发声单元的音频特性,以及将所述K路声道的目标音频数据分别输入至对应的所述K个发声单元,使每个发声单元将对应的目标音频数据转换为目标音频,形成混响声音。
在一些实施例中,为了将所述初始音频数据转换成K路声道的目标音频数据,且每路声道的目标音频数据适配对应的所述发声单元的音频特性,所述音频处理电路:将所述初始音频数据复制成K路声道的所述初始音频数据;以及对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述对应的发声单元的音频特性。
在一些实施例中,所述初始音频数据的频谱包括K个频段;以及所述K个发声单元中的第i个发声单元在第i个频段具有期望的音响效果,所述i为[1,K]中的任意整数,其中,为了对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述对应的发声单元的音频特性,所述音频处理电路:对第i路声道的所述初始音频数据,保留或增强第i个频段上的幅值,衰减其他频段下的幅值,得到第i路声道的目标音频数据,所述第i路声道的目标音频数据适配所述第i路声道对应的发声单元的音频特性。
在一些实施例中,所述期望的音响效果包括还原度超过预设值、预设音响效果或目标音响效果中的至少一种。
在一些实施例中,为了对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述对应的发声单元的音频特性,音频处理电路:对第i声道的所述初始音频数据,保留第i个频段的音频数据,过滤掉其他频段的音频数据,得到第i路声道的目标音频数据,所述第i路声道的目标音频数据适配所述第i路声道对应的发声单元的音频特性。
在一些实施例中,所述音频处理电路还包括K个频谱调节电路,其中,第i个频谱调节电路工作时对所述第i路声道的所述初始音频数据进行所述频谱调节。
在一些实施例中,所述发声单元至少包括高频、中频和低频的扬声器,以及所述K个频段覆盖所述高频、所述中频和所述低频。
在一些实施例中,所述音频处理电路还包括DAC模组,所述DAC模组工作时:接收所述K路声道的目标音频数据;将所述K路声道的目标音频数据转换为K路模拟电信号;以及将所述K路模拟电信号分别输入对应的发声单元。
在一些实施例中,为了将所述K路声道的目标音频数据分别输入至对应的所述K个发声单元,所述音频处理电路:将每路声道的目标音频进行组合,得到整合音频数据;以及将所述整合音频数据分别输入至对应的所述K个发声单元。
在一些实施例中,所述整合音频数据包括K段子数据,其中,第i段子数据包括第i路声道的目标音频数据和对应的第i个标识,所述i为[1,K]中的任意整数。
在一些实施例中,所述音频处理电路还包括数字音频接口,工作时通过所述数字音频接口将所述整合音频数据分别输入至对应的所述K个发声单元,其中,所述K个发声单元中的每个所述发声单元包括识别电路和至少一个扬声器,当第i个识别电路工作时:接收到所述整合音频数据,在所述整合音频数据中识别出对应的第i个标识,并过滤掉其他标识对应的子数据,以及将所述第i个标识对应的目标音频数据转换为覆盖第i个频段的目标音频,并将所述目标音频发送至所述至少一个扬声器。
在一些实施例中,所述音频处理电路还包括数字音频接口,所述音频数字接口在工作时:接收所述整合音频数据;在所述整合音频数据中识别出每个发声单元对应的标识和所述标识对应的目标音频数据;以及将所述目标音频数据发送至对应的发声单元。
在一些实施例中,所述K个发声单元工作时以相同的相位同时播放对应的所述目标音频。
在一些实施例中,所述音频处理设备为耳机。
在一些实施例中,所述声道与所述发声单元之间对应关系包括一一对应的关系、多对一的关系或一对多的关系中的一种。
在一些实施例中,在所述K个发声单元中至少一个发声单元发生变化或者接收到音效调整请求时,所述音频处理电路调整所述声道与所述发声单元之间的对应关系。
第二方面,本说明书还提供一种用于耳机的音频处理方法,包括,通过所述耳机的音频处理电路:获取初始音频数据;将所述初始音频数据转换为K路声道的目标音频数据,每路声道的目标音频数据适配所述耳机内对应的K发声单元中的一个发声单元的音频特性,其中K为大于1的整数,且每个发声单元的音频特性均不同;以及将所述K路声道的目标音频数据分别输入对应的所述K个发声单元,使得所述K个发声单元输出混响声音。
在一些实施例中,所述将所述初始音频数据转换为K路声道的目标音频数据,每路声道的目标音频数据适配对应的发声单元的音频特性,包括:将所述初始音频数据复制成K路声道的所述初始音频数据;以及对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述耳机内对应的K个发声单元中的一个发声单元的音频特性。
在一些实施例中,所述初始音频数据包括K个频段;以及所述K个发生单元中的第i个发声单元在第i个频段具有期望的音响效果,所述i为[1,K]中的任意整数,其中,所述对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述耳机内对应的K个发声单元中的一个发声单元的音频特性,包括:对第i路声道的所述初始音频数据,保留或增强第i个频段上的幅值,衰减其他频段下的幅值,得到第i路声道的目标音频数据,所述第i路声道的目标音频数据适配所述耳机内所述第i路声道对应的发声单元的音频特性。
在一些实施例中,所述对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述耳机内对应的K发声单元中的一个发声单元的音频特性,包括:对第i路声道的所述初始音频数据,保留第i个频段的音频数据,滤掉其他频段的音频数据,得到第i路声道的目标音频数据,所述第i路声道的目标音频数据适配所述耳机内所述第i路声道对应的发声单元的音频特性。
在一些实施例中,所述将所述K路声道的目标音频数据分别输入对应的所述K个发声单元,使得所述K个发声单元输出混响声音,包括:将每路声道的目标音频数据转换为模拟电信号;以及将所述模拟电信号分别输入所述对应的发声单元,使每个发声单元将对应的模拟电信号转换为目标音频,形成混响。
在一些实施例中,所述将所述K路声道的目标音频数据分别输入对应的所述K个发声单元,使得所述K个发声单元输出混响声音,包括:将每路声道的目标音频数据进行组合,得到整合音频数据;以及将所述整合音频数据分别输入至对应的发声单元,使得所述K个发声单元输出混响声音。
在一些实施例中,所述将所述整合音频数据分别输入至对应的发声单元,使得所述K个发声单元输出混响声音,包括:通过数字音频接口将所述整合音频数据分别输入至所述K个发声单元,使得所述K个发声单元输出混响声音。
第三方面,本说明书还提供一种音频处理系统,包括:至少一个存储介质,存储有至少一个指令集,用于进行音频处理;以及至少一个处理器,同所述至少一个存储介质通信连接,其中,当所述音频处理系统运行时,所述至少一个处理器读取所述至少一个指令集,并且根据所述至少一个指令集的指示执行上述的音频处理方法。
由以上技术方案可知,本说明书提供的音频处理设备,包括发声模组和音频处理电路,其中,发声模组包括K个发声单元,每个发声单元的音频特性均不同,K为大于1的整数;音频处理电路在获取初始音频数据后,将初始音频数据转换成K路声道的目标音频数据,每路声道的目标音频数据适配对应的发声单元的音频特性,以及将K路声道的目标音频数据分别输入至对应的K个发声单元,使每个发声单元将对应的目标音频数据转换为目标音频,形成混响声音;由于该方案可以通过音频处理电路将初始音频数据转换为K路声道的目标音频数据并分别输入至对应的K个发声单元,而且,每路声道的目标音频数据适配对应的发声单元的音频特性,从而保证发声模组中每个发声单元发出的声音具有最佳的发声效果,因此,可以提升音频处理的音质效果。
本说明书提供的音频处理方法和系统,在获取初始音频数据后,将初始音频数据转换为K路声道的目标音频数据,每路声道的目标音频数据适配对应的发声单元的音频特性,其中K为大于1的整数;以及将K路声道的目标音频数据分别输入对应的K个发声单元,使得K个发声单元输出混响声音,其中,每个发声单元的音频特性均不同;由于该方案可以将初始音频数据转换为K路声道的目标音频数据,然后,分别将K路声道的目标音频数据输入至对应的K个发声单元,而且,每路声道的目标音频数据适配对应的发声单元的音频特性,从而保证发声模组中每个发声单元发出的声音具有最佳的发声效果,因此,可以提升音频处理的音质效果。
本说明书提供的音频处理设备和方法的其他功能将在以下说明中部分列出。根据描述,以下数字和示例介绍的内容将对那些本领域的普通技术人员显而易见。本说明书提供的音频处理设备和方法的创造性方面可以通过实践或使用下面详细示例中所述的方法、装置和组合得到充分解释。
附图说明
为了更清楚地说明本说明书实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本说明书的实施例提供的一种音频处理设备的应用场景示意图;
图2示出了根据本说明书的实施例提供的一种音频处理设备的硬件结构图;
图3示出了根据本说明书的实施例提供的一种音频处理电路的结构示意图;
图4示出了根据本说明书的实施例提供的一种音频处理电路的另一个结构示意图;
图5示出了根据本说明书的实施例提供的一种音频处理电路的另一结构示意图;
图6示出了根据本说明书的实施例提供的一种发声单元的结构示意图;
图7示出了根据本说明书的实施例提供的一种音频处理系统的设备示意图;
图8示出了根据本说明书的实施例提供的一种音频处理方法的流程示意图;
图9示出了根据本说明书的实施例提供的一种采用DAC模组的音频处理方法的流程示意图;
图10出了根据本说明书的实施例提供的另一种采用DAC模组的音频处理方法的流程示意图;以及
图11示出了根据本说明书的实施例提供的一种采用数字音频接口的音频处理方法的流程示意图。
具体实施方式
以下描述提供了本说明书的特定应用场景和要求,目的是使本领域技术人员能够制造和使用本说明书中的内容。对于本领域技术人员来说,对所公开的实施例的各种局部修改是显而易见的,并且在不脱离本说明书的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用。因此,本说明书不限于所示的实施例,而是与权利要求一致的最宽范围。
这里使用的术语仅用于描述特定示例实施例的目的,而不是限制性的。比如,除非上下文另有明确说明,这里所使用的,单数形式“一”,“一个”和“该”也可以包括复数形式。当在本说明书中使用时,术语“包括”、“包含”和/或“含有”意思是指所关联的整数,步骤、操作、元素和/或组件存在,但不排除一个或多个其他特征、整数、步骤、操作、元素、组件和/或组的存在或在该系统/方法中可以添加其他特征、整数、步骤、操作、元素、组件和/或组。
考虑到以下描述,本说明书的这些特征和其他特征、以及结构的相关元件的操作和功能、以及部件的组合和制造的经济性可以得到明显提高。参考附图,所有这些形成本说明书的一部分。然而,应该清楚地理解,附图仅用于说明和描述的目的,并不旨在限制本说明书的范围。还应理解,附图未按比例绘制。
本说明书中使用的流程图示出了根据本说明书中的一些实施例的系统实现的操作。应该清楚地理解,流程图的操作可以不按顺序实现。相反,操作可以以反转顺序或同时实现。此外,可以向流程图添加一个或多个其他操作。可以从流程图中移除一个或多个操作。
在对本说明书具体实施例说明之前,先对本说明书的应用场景进行如下介绍。
本说明书涉及音频处理设备的使用场景。一个示例性的使用场景如下:音频处理设备获取到目标设备输出的初始音频数据之后,对初始音频数据进行处理,并通过发声模组播放处理后的音频数据对应的目标音频,从而形成混响声音。
图1示出了根据本说明书的实施例提供的一种音频处理设备的应用场景示意图。如图1所示,应用场景001可以包括音频处理设备10、目标设备20以及网络30。
所述音频处理设备10可以包括发声模组100和音频处理电路200。在一些实施例中,音频处理电路200可以从目标设备20获取初始音频数据,并对初始音频数据进行处理,并将处理好的目标音频数据发送至发声模组100进行发声,从而形成混响声音。在一些实施例中,音频处理设备10可以存储有执行本说明书描述的音频处理方法的数据或指令,并可以执行或用于执行所述数据或指令。在一些实施例中,音频处理设备10可以包括具有数据信息处理功能的硬件设备和驱动该硬件设备工作所需必要的程序。比如,音频处理设备10可以为耳机、大型家用或商用的音响系统等。上述音频处理方法将在本文后续内容中进行介绍。
目标设备20可以为具有音频数据输出功能的电子设备。在一些实施例中,目标设备20可以包括移动设备、平板电脑、笔记本电脑、机动车辆的内置设备或类似内容,或其任意组合。在一些实施例中,所述移动设备可包括智能家居设备、智能移动设备、虚拟现实设备、增强现实设备或类似设备,或其任意组合。在一些实施例中,所述智能家居装置可包括智能电视、台式电脑、智能音箱等,或任意组合。在一些实施例中,所述智能移动设备可包括智能手机、个人数字辅助、游戏设备、导航设备等,或其任意组合。在一些实施例中,所述虚拟现实设备或增强现实设备可能包括虚拟现实头盔、虚拟现实眼镜、虚拟现实手柄、增强现实头盔、增强现实眼镜、增强现实手柄或类似内容,或其中的任何组合。例如,所述虚拟现实设备或所述增强现实设备可能包括谷歌眼镜、头戴式显示器、VR等。在一些实施例中,所述机动车中的内置装置可包括车载计算机、车载电视等。在一些实施例中,目标设备20可以包括音频采集设备,用于采集目标空间内的音频数据,从而获取初始音频数据。在一些实施例中,目标设备20还可以从其他设备接收初始音频数据。
在一些实施例中,目标设备20可以安装有一个或多个应用程序(APP)。所述APP能够为用户提供通过同外界交互的能力以及界面。所述APP包括但不限于:网页浏览器类APP程序、搜索类APP程序、聊天类APP程序、购物类APP程序、视频类APP程序、理财类APP程序、即时通信工具、邮箱客户端、社交平台软件等等。在一些实施例中,目标设备20上可以安装有目标APP。所述目标APP能够生成或获取初始音频数据,或者所述目标APP能够从其他设备接收初始音频数据。
网络30用以在音频处理设备10和目标设备20之间提供通信连接的介质。网络30可以促进信息或数据的交换。如图1所示,音频处理设备10和目标设备20可以同网络30连接,并且通过网络30互相传输信息或数据。在一些实施例中,网络30可以是任何类型的无线网络。比如,网络30可以包括电信通信网络、内联网、互联网、局域网(LAN)、广域网(WAN)、无线局域网(WLAN)、大都市市区网(MAN)、公用电话交换网(PSTN)、蓝牙TM网络、ZigBeeTM网络、近场通信(NFC)网络或类似网络。比如,上述网络30可以为蓝牙TM网络,则该情况下,音频处理设备10可以为支持蓝牙TM(bluetoothTM)协议的音频处理设备;目标设备20可以为支持蓝牙TM协议的音频数据输出设备。音频处理设备10可以与目标设备20之间基于蓝牙TM协议进行通信。在一些实施例中,音频处理设备10还可以与目标设备20之间通过有线网络或者局域网络进行数据传输。
应该理解,图1中的音频处理设备10、目标设备20和网络30的数目仅仅是示意性的。根据实现需要,可以具有任意数目的音频处理设备10、目标设备20和网络30。
图2示出了根据本说明书的一些实施例提供的一种音频处理设备10的硬件结构图。如图2所示,音频处理设备10可以包括:发声模组100和音频处理电路200。
在一些实施例中,发声模组100可以包括K个发声单元110,K为大于1的整数,另外,每个发声单元110的音频特性均不同。所述发声单元110可以包括一个或多个可以发出声音的设备,比如,所述发声单元110可以包括一个或多个各种类型的扬声器。不同扬声器可以有不同的音频特性。所述音频特性可以理解为针对相同的音频信号而产生不同的音响效果,也就是说,不同的发声单元110对相同频段的音频信号输入其频响函数不同的,因此在音质上具有不同的音响效果。比如,有些发生单元110的音频特性为对中频音频数据具有更好的还原度和/或发出更浑厚和/或更丝滑的音响效果(thick and/or butter-like soundquality);有些发生单元的音频特性对在高频的音频数据有更好的还原度和/或能产生纯净清澈的音响效果(pure and clear sound quality)。再比如,以发声单元110包括骨传导发声单元和气传导发声单元为例,骨传导发声单元针对中、高频具有更好的音响效果,而气传导发声单元针对低频的音频具有更好的发声效果。其中,对人耳来说,低频可以指的是大体上20Hz至150Hz的频段,中频可以指的是大体上150Hz至5KHz的频段,高频段可以指的是大体上5KHz至20KHz的频段,中低频可以指的是大体上150Hz至500Hz的频段,中高频指的是500Hz至5KHz的频段。本领域普通技术人员将会理解,上述频段的区分只是作为一个例子大概给出区间。上述频段的定义可以随着不同行业、不同的应用场景和不同分类标准而改变。比如在另外一些应用场景下,低频指的是大体上20Hz至80Hz的频段,中低频可以指大体上80Hz-160Hz之间的频段,中频可以指大体上160Hz至1280Hz的频段,中高频可以指大体上1280Hz-2560Hz的频段,高频段可以指大体上2560Hz至20KHz的频段。
音频处理电路200被配置为可以获取初始音频数据,将初始音频数据转换成K路声道的目标音频数据,每路声道的目标音频数据适配对应的发声单元110的音频特性,比如,如果发声单元110的音频特性是在高频区可以发出清澈的音质,但是在中频和低频区的音响表现力普通,则该发声单元110对应的那路声道的目标音频数据便具有更多的高频音频数据,而在中频和低频部分的音频数据量较少甚至没有。将初始音频数据转换之后,音频处理电路200可以将K路声道的目标音频数据分别输入至对应的K个发声单元,使每个发声单元将对应的目标音频数据转换为目标音频,形成混响声音。
其中,初始音频数据可以为一个或多个声道的数字化音频数据。该初始音频数据可以包括脉冲编码调制的音频数据(PCM音频数据)或者其他类型的数字化音频数据。以初始音频数据为PCM音频数据为例,该初始音频数据就可以为将一种模拟信号经数模转换直接形成的二进制序列。音频处理电路200获取初始音频数据的方式可以有多种,比如,音频处理电路200可以直接接收目标设备20发送的初始音频数据,或者,可以接收音频采集设备发送的初始音频数据,或者,可以在预设音频数据集合中获取至少一个音频数据作为初始音频数据,或者,还可以获取原始音频数据。然后,音频处理电路200可以在原始音频数据中选取出一个声道的音频数据作为初始音频数据,或者,音频处理电路200上还可以包括音频采集电路。所述音频处理电路200可以通过音频采集电路采集音频数据,并对采集到的原始音频数据进行数模转换,从而得到初始音频数据。
音频处理电路200在获取初始音频之后,便可以将初始音频数据转换成K路声道的目标音频数据,每路声道的目标音频数据适配对应的发声单元110的音频特性。声道可以理解为音频数据的通道,一个声道可以对应一个发声单元110。音频处理电路200将初始音频数据转换成K路声道的目标音频数据的方式可以有多种,比如,音频处理电路200可以将初始音频数据复制成K路声道的初始音频数据,以及对每路声道的初始音频数据进行频谱调节,使得调节后的目标音频数据适配对应的发声单元110的音频特性。
其中,音频处理电路200可以包括复制电路,通过复制电路将初始音频数据复制成K路声道的初始音频数据。在一些实施例中,还可以通过集成在音频处理电路200上的处理器或者独立处理器将初始音频数据复制成K路声道的初始音频数据。
其中,初始音频数据的频谱可以包括K个频段,K个发声单元110中的第i个发声单元110在第i个频段具有期望的音响效果,i为[1,K]中的任意整数。以初始音频数据的频谱分布在[20Hz,20KHz]为例,则K个频段可以为该频谱中的任意一个频段,K个频段可以完整覆盖整个频谱,也可以覆盖预先设定的高频、中频和低频等频谱范围,K个频段之间可以存在重合的频段,也可以是完全独立的频段,等等。
在一些实施例中,期望的音响效果可以为预设的音响效果。所述音响效果可以包括对音质所期望的浑厚度、丝滑度、纯净度等音乐领域的概念,也可以包括还原度超过预设值等科学概念中一个、多个或者任意组合的。比如,所述还原度可以理解为在播放的目标音频与该目标音频对应的原始音频的还原程度,也可以理解为目标音频与原始音频之间的相似程度。所述预设音响效果可以理解为预先设定的针对发声单元发出的混响声音的音效参数符合预设音响参数时的音响效果。所述目标音响效果可以理解为期望达到的一个特定音响效果。在这里需要说明的是,第i个发声单元110在第i个频段具有期望的音响效果,不同发声单元110在不同频段上的期望的音响效果可以相同,也可以不相同。另外,不同发声单元110根据自身的音频特性,可以对应不同的频段。不同发声单元110对应不同的频段中可以存在重合的频段,也可以不存在重合的频段。
其中,频谱调节可以理解为针对初始音频数据的不同频段的音频数据进行调节。音频处理电路200对每路声道的初始音频数据进行频谱调节的方式可以有多种。比如,对任意在[1,K]之间的整数i,音频处理电路200可以采用频谱调节算法对第i路声道的初始音频数据,保留或增强第i个频段上的幅值,衰减其他频段下的幅值,得到第i路声道的目标音频,该第i路声道的目标音频数据适配第i路声道对应的发声单元110的音频特性;或者,音频处理电路200还可以采用频谱调节算法对第i路声道的初始音频数据,保留第i个频段的音频数据,过滤掉其他频段的音频数据,得到第i路声道的目标音频,该第i路声道的目标音频数据适配第i路声道对应的发声单元110的音频特性。
其中,频谱调节算法可以理解为一种对初始音频数据进行频谱调节的软件算法。频谱调节算法的类型可以有多种,比如,可以包括效果均衡算法(EQ)、分频算法和滤波器算法中的至少一种。另外,频谱调节算法的算法参数可以根据需求动态调节,从而实现更加丰富的听感。
在一些实施例中,还可以通过硬件方式进行频谱调节,因此,音频处理电路200还可以包括K个频谱调节电路210,如图3所示,其中,第i个频谱调节电路工作时对第i路声道的初始音频数据进行频谱调节。频谱调节的方式与频谱调节算法的调节方式类似,详见上文所述,在此就不再一一赘述。
其中,频谱调节电路210的类型可以有多种,比如,可以包括分频电路和DSP处理电路等的至少一种。
音频处理电路200在将初始音频数据转换为K路声道的目标音频数据之后,便可以将K路声道的目标音频数据分别输入至对应的K个发声单元110,每个发声单元110将对应的目标音频数据转换为目标音频,形成混响声音。音频处理电路200将K路声道的目标音频数据分别输入至对应的K个发声单元110的方式可以有多种,比如,音频处理设备200可以直接将K路声道的目标音频数据分别输入至对应的K个发声单元110;或者,音频处理电路200还可以将每路声道的目标音频进行组合,得到整合音频数据,将整合音频数据分别输入至对应的K个发声单元110。
其中,如图4所示,音频处理电路200还可以包括DAC(数模转换器)模组220,DAC模组220可以包括至少一个DAC221。音频处理电路200就可以通过DAC模组中的DAC221将将K路声道的目标音频数据分别输入至对应的K个发声单元110。DAC模组220在工作时,接收K路声道的目标音频数据,将K路声道的目标音频数据转换为K路模拟电信号,以及将K路模拟电信号分别输入对应的发声单元110。DAC模组220中的DAC221与K个发声单元之间的对应关系可以有多种,比如,可以包括一对一,一对多,或者多对多,等等。
其中,音频处理电路200将每路声道的目标音频数据进行组合的方式可以有多种,比如,音频处理电路200可以通过组合操作将每路声道的目标音频数据组成一帧音频数据,从而得到整合音频数据。
其中,整合音频数据包括K段子数据,其中,第i段子数据包括第i路声道的目标音频数据和对应的第i个标识,所述i为[1,K]中的任意整数。通过第i个标识,就可以在整合音频数据中识别出第i路声道对应的目标音频数据。因此,数字音频接口230或者第i个发声单元110就可以基于第i个标识,识别出第i路声道的目标音频数据。
音频处理电路200在将每路声道的目标音频数据进行组合之后,便可以将组合后形成的整合音频数据分别输入至对应的K个发声单元110。由于整合音频数据此时依然是数字化的音频数据,因此,音频处理电路200还可以包括数字音频接口230,如图5所示。音频处理电路200工作时就可以通过数字音频接口230将整合音频数据分别输入至对应的K个发声单元。
其中,音频处理电路200就可以通过数字音频接口230将整合音频数据分别输入至对应的K个发声单元的方式可以有多种,比如,数字音频接口230在接收到整合音频数据之后,直接将整合音频数据分别发送至对应的K个发声单元110,K个发声单元110在整合音频数据中识别出对应的目标音频数据,或者,数字音频接口230在整合音频数据中识别出每个发声单元110对应的目标音频数据,将目标音频数据发送至对应的发声单元110。
其中,数字音频接口(Digital Audio Interfaces,DAI)230可以理解为板级或板间传输数字音频信号的接口,相比于模拟接口,数字音频接口230抗干扰能力更强,硬件设计简单。数字音频接口230的类型可以有多种,比如,可以包括I2S(一种数字音频接口)、TDM(一种数字音频接口)、PCM(一种数字音频接口)和PDM(一种数字音频接口)中的至少一种。在数字音频接口230直接将整合音频数据发送至K个发声单元110时,K个发声单元110中的每个发声单元110需要在整合音频数据中识别出对应的目标音频数据,因此,发声单元110还可以包括识别电路111和至少一个扬声器112,如图6所示。当第i个识别电路111工作时:接收整合音频数据,在整合音频数据中识别出对应的第i个标识,并滤掉其他标识对应的子数据,以及将第i个标识对应的目标音频数据转换为覆盖第i个频段的目标音频,并将目标音频发送至至一个扬声器112。
其中,在数字音频接口230在整合音频数据中识别出每个发声单元110对应的目标音频数据,并将目标音频数据发送至对应的发声单元110时,数字音频接口230就需要具有识别每个发声单元110对应的目标音频数据的能力,因此,数字音频接口230此时就是一个具备识别和分发功能的数字音频接口230。数字音频接口230在工作时:接收整合音频数据,在整合音频数据中识别出每个发声单元110对应的标识和该标识对应的目标音频数据,以及将目标音频数据发送至对应的发声单元110。
K个发声单元在接收到对应的目标音频数据之后,便可以将目标音频数据转换为目标音频,从而形成混响声音。所述目标音频就可以理解为人耳可以听见的声音,而音频数据声音对应的电信号,或者说载有声音信息的电信号,这里的电信号可以为数字信号或模拟电信号,等等。发声单元110将目标音频数据转换为目标音频之后,便可以将目标音频发送至至少一个扬声器112,通过至少一个扬声器112播放目标音频。通过K个发声单元110中的至少一个扬声器112播放对应的目标音频,从而就可以形成混响声音。
其中,K个发声单元110工作时可以采用相同的相位同时播放对应的目标音频,就可以避免混响声音中不同的目标音频之间互相影响,从而影响了混响声音的音质。
其中,K个发声单元中至少包括高频、中频和低频的扬声器112,高频、中频和低频可以根据初始音频数据的实际频谱进行设定。初始音频数据的频谱包括K个频段,K个频段可以覆盖高频、中频和低频。如前所述,在一些应用场景中,低频可以指的是大体上20Hz至150Hz的频段,中频可以指的是大体上150Hz至5KHz的频段,高频段可以指的是大体上5KHz至20KHz的频段,中低频可以指的是大体上150Hz至500Hz的频段,中高频指的是500Hz至5KHz的频段。本领域普通技术人员将会理解,上述频段的区分只是作为一个例子大概给出区间。上述频段的定义可以随着不同行业、不同的应用场景和不同分类标准而改变。比如在另外一些应用场景下,低频指的是大体上20Hz至80Hz的频段,中低频可以指大体上80Hz-160Hz之间的频段,中频可以指大体上160Hz至1280Hz的频段,中高频可以指大体上1280Hz-2560Hz的频段,高频段可以指大体上2560Hz至20KHz的频段。
其中,扬声器112的类型可以有多种,比如,可以包括空气扬声器和振动传导扬声器,等等。所述空气扬声器可以理解为输出空气传导声波的扬声器,而振动扬声器可以理解为输出固体媒介传导的声波(如骨传导声波)的扬声器。振动扬声器和空气传导扬声器可以是两个独立的功能器件,也可以是实现多个功能的单个器件的一部分。K个发声单元110中每个发声单元110中可以包括空气扬声器和振动扬声器中的至少一种。
在一些实施例中,音频处理设备10可以为耳机。耳机的类型可以有多种,比如,可以包括有线耳机、无线耳机或蓝牙耳机,等等。
在一些实施例中,音频处理设备10还可以包括进行音频处理的音频播放设备,比如,可以包括助听器、音箱或者其他音频播放设备,等等。
在一些实施例中,声道与发声单元110之间的对应关系可以包括一一对应的关系、多对一的关系或一对多的关系中的一种。所述一一对应的关系就可以为每一路声道元对应一个发声单元110,比如,以发声单元110为K个,声道为K路为例,则第i路声道就可以对应第i个发声单元110,从而使得音频处理电路200或处理器400将每路声道的目标音频数据发送至发声单元110其中,i的取值范围为[1,K]。所述多对一的关系就可以为多路声道对应同一个发声单元110,比如,以声道为M路,发声单元的数量为N个,M大于N为例,为了将每路声道的目标音频数据输入至发声单元110,就可以将多路声道对应同一发声单元,从而使得音频处理电路200或处理器400将M路声道的目标音频数据发送至N个发声单元110。所述一对多的关系就可以为将一路声道可以对应多个发声单元110,比如,以声道为M路,发声单元的数量为N个,M小于N为例,为了将每路声道的目标音频数据输入至发声单元,就可以将一路声道对应多个发声单元,从而使得音频处理电路200或处理器400将M路声道的目标音频数据发送至N个发声单元110。
在一些实施例中,在K个发声单元110中至少一个发声单元110发生变化或者接收到音效调整请求时,所述音频处理电路200调整声道与发声单元之间的对应关系。发声单元110发生变化的情况可以有多种,比如,可以包括发声单元发声失败、发声单元出现异常或者发声单元的发声性能发生变化(譬如,发声单元从骨导发声变为气导发声单元,等等)或者其他变化的情况,等等。所述音效调整请求可以为对当前播放的音频的音效进行调整的请求。所述音效可以为当前播放的音频的播放效果,音效的类型可以有多种,比如,可以包括重金属、轻音乐、电音、古典、流行音乐或爵士,等等。在K个发声单元110中至少一个发声单元110发声变化或者接收到音效调整请求时,音频处理电路200或者处理器400均可以调整声道与发声单元之间的对应关系。调整声道与发声单元之间的对应关系的方式可以有多种,比如,可以在同一种对应关系中进行调整,也可以调整为不同的对应关系。所谓在同一种对应关系中调整是指在不改变对应关系的类型的情况下调整一路或多路声道对应的发声单元,比如,以对应关系为一一对应的关系为例,就可以将第i路声道对应第i个发声单元调整为第i路声道对应第n个发声单元。所谓调整为不同的对应关系是指将当前的对应关系调整为另一种对应关系,比如,一当前的声道与发声单元110的对应关系为一一对应的关系为例,音频处理电路200或者处理器400可以将一一对应的关系调整为多对一的关系,或者,还可以将一一对应的关系调整为一对多的关系。在调整后的对应关系中,每路声道所对应的发声单元110与调整之前可以相同,也可以不同。比如,以当前对应的关系为为一一对应的关系,调整后的关系为多对一的关系为例,调整前的第i路声道对应第i个发声单元110,第i+1路声道对应第i+1个发声单元110,调整后的第i路声道可以对应第i个发声单元110,第i+1路声道也可以对应第i个发声单元110,等等。
在上述描述中,所述音频处理设备10中的音频处理电路200以及与其配合的其他电子器件,比如DAC、频谱调节设备等,都可以是集成在一块或者多块电路板上相互电连接的电路或者电子器件。上述音频处理设备10还可以包括处理器和存储介质,然后通过处理器来完成上述音频处理电路200和一些电子器件的全部或者部分功能。
图7示出了根据本申请一些实施例中的音频处理系统001(以下简称系统001)的设备示意图。除了前面描述的硬件之外,音频处理设备10还可以包括至少一个存储介质300和至少一个处理器400。为了满足内部和外部通信需求,音频处理设备10还可以包括通信端口500和内部通信总线600。
内部通信总线600可以连接不同的系统组件,包括存储介质300、处理器400和通信端口500。
音频处理设备10同外界的数据通信可以通过通信端口500来完成。比如,音频处理设备10可以通过通信端口500从目标设备20中获取初始音频数据。
至少一个存储介质300可以包括数据存储装置。所述数据存储装置可以是非暂时性存储介质,也可以是暂时性存储介质。比如,所述数据存储装置可以包括磁盘、只读存储介质(ROM)或随机存取存储介质(RAM)中的一种或多种。当音频处理设备10运行时,存储介质300还可以包括存储在所述数据存储装置中的至少一个指令集,用于获取初始音频数据,并对初始音频数据进行处理。所述指令是计算机程序代码,所述计算机程序代码可以包括执行本说明书提供的音频处理方法的程序、例程、对象、组件、数据结构、过程、模块等等。
至少一个处理器400可以同至少一个存储介质300通过内部通信总线600通信连接。所述通信连接是指能够直接地或者间接地接收信息的任何形式的连接。至少一个处理器400用以执行上述至少一个指令集。当音频处理设备10运行时,至少一个处理器400读取所述至少一个指令集,并且根据所述至少一个指令集的指示执行本说明书提供的音频处理方法。处理器400可以执行音频处理方法包含的所有步骤。处理器242可以是一个或多个处理器的形式,在一些实施例中,处理器242可以包括一个或多个硬件处理器,例如微控制器,微处理器,精简指令集计算机(RISC),专用集成电路(ASIC),特定于应用的指令集处理器(ASIP),中央处理单元(CPU),图形处理单元(GPU),物理处理单元(PPU),微控制器单元,数字信号处理器(DSP),现场可编程门阵列(FPGA),高级RISC机器(ARM),可编程逻辑器件(PLD),能够执行一个或多个功能的任何电路或处理器等,或其任何组合。仅仅为了说明问题,在本说明书中音频处理设备10中仅描述了一个处理器400。然而,应当注意,本说明书中音频处理设备10还可以包括多个处理器400,因此,本说明书中披露的操作和/或方法步骤可以如本说明书所述的由一个处理器执行,也可以由多个处理器联合执行。例如,如果在本说明书中音频处理设备10的处理器400执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同处理器400联合或分开执行(例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一和第二处理器共同执行步骤A和B)。
在一些实施例中,音频处理设备10对初始音频数据进行处理时,可以由音频处理电路200执行全部的音频处理步骤,或者,还可以由音频处理电路200、存储介质300和处理器400共同完成。
其中,音频处理电路200执行全部的音频处理步骤的方式可以有多种,比如,音频处理电路200获取音频数据,将初始音频数据转换成K路声道的目标音频数据,每路声道的目标音频数据适配对应的发声单元的音频特性,以及将K路声道的目标音频数据分别输入至对应的K个发声单元110,每个发声单元将对应的目标音频数据转换为目标音频,形成混响声音。
其中,音频处理电路200、存储介质300和处理器400共同完成音频处理的步骤可以有多种,比如,音频处理电路200或处理器400获取初始音频处理,处理器400在存储介质300中获取控制指令,基于该控制指令执行复制操作,复制出K路声道的初始音频数据,并采用频谱调节算法对K路声道的初始音频数据进行频谱调节,得到每路声道的目标音频数据,处理器400将目标音频数据发送至音频处理电路200中的DAC模组200,DAC模组220在接收到每路声道的目标音频数据之后,便可以将目标音频数据转换为模拟电信号,并将模拟电信号发送至对应的发声单元100,每个发声单元将对应的目标音频数据转换为目标音频,形成混响声音;或者,音频处理电路200或处理器400获取初始音频处理,处理器400在存储介质300中获取控制指令,基于该控制指令执行复制操作,复制出K路声道的初始音频数据,并采用频谱调节算法对K路声道的初始音频数据进行频谱调节,得到每路声道的目标音频数据,处理器400对每路声道的目标音频数据进行组合操作,得到整合音频数据,并将整合音频数据发送至音频处理电路200中的数字音频接口230,数字音频接口230将整合音频数据直接发送至每路发声单元110,每路发声单元110在整合音频数据中识别出对应的目标音频数据,并将目标音频数据转换为目标音频,形成混响声音;或者,音频处理电路200或处理器400获取初始音频处理,处理器400在存储介质300中获取控制指令,基于该控制指令执行复制操作,复制出K路声道的初始音频数据,并采用频谱调节算法对K路声道的初始音频数据进行频谱调节,得到每路声道的目标音频数据,处理器400对每路声道的目标音频数据进行组合操作,得到整合音频数据,并将整合音频数据发送至音频处理电路200中的数字音频接口230,数字音频接口230在整合音频数据中识别出每路发声单元110对应的目标音频数据,并将目标音频数据发送至对应的发声单元110,每个发声单元110将对应的目标音频数据转换为目标音频,形成混响声音,等等。
下面对用于耳机的音频处理方法进行介绍。
图8示出了根据本说明书实施例提供的用于耳机的音频处理方法的流程示意图。音频处理设备10可以执行本说明书的音频处理方法P700。具体的,音频处理设备10中的音频处理电路200和/或处理器400可以读取存储在本地存储介质中的指令集,然后,根据指令集的指示,执行本说明书描述的音频处理方法P700。如图8所示,方法P700可以包括:
S710:获取初始音频数据。
例如,音频处理电路200或处理器400可以获取初始音频数据,获取初始音频数据的方式可以参见上文所述,在此就不再一一赘述。
S720:将初始音频数据转换为K路声道的目标音频数据,每路声道的目标音频数据适配耳机内对应的K发声单元中一个发声单元的音频特性。
例如,音频处理电路200或处理器400可以将初始音频数据复制成K路声道的初始音频数据,以及对每路声道的初始进行频谱调节,使得调节后的目标音频数据适配耳机内对应的K发声单元110中的一个发声单元的音频特性。
其中。初始音频数据包括K个频段,具体可以详见上文所述。K个发声单元110中第i个发声单元在第i个频段具有期望的音响效果,所述期望的音响效果可以参见上文所述,在此就不再一一赘述。
其中,对每路声道的初始音频数据进行频谱调节,使得调节后的目标音频数据适配耳机内对应的K个发声单元110中的一个发声单元的音频特性的方式可以有多种,比如,音频处理电路200或者处理器400可以采用频谱调节算法对每路声道的初始音频数据进行频谱调节,具体的调节方式可以有多种,譬如,音频处理电路200或者处理器400可以对第i路的初始音频数据,保留或增强第i个频段上的幅值,衰减其他频段下的幅值,得到第i路声道的目标音频数据,该第i路声道的目标音频数据适配耳机内第i路声道对应的发声单元110的音频特性,或者,对第i路声道的初始音频数据,保留第i个频段的音频数据,滤掉其他频段的音频数据,得到第i路声道的目标音频数据,该第i路声道的目标音频数据适配耳机内第i路声道对应的发声单元110的音频特性;或者,音频处理电路200还可以采用频谱调节电路210对每路声道的初始音频数据进行频谱调节,具体的调节方式与采用频谱调节算法的调节方式类似,详见上文所述,在此就不再一一赘述。
其中,频谱调节算法的类型可以有多种,具体可以参见上文所述,在此就不再一一赘述。
S730:将K路声道的目标音频数据分别输入对应的K个发声单元,使得K个发声单元输出混响声音。
其中,每个发声单元110的音频特性均不同。
其中,将K路声道的目标音频数据分别输入对应的K个发声单元110,使得K个发声单元110输出混响声音的方式可以有多种,具体可以如下:
例如,音频处理电路200或处理器400可以采用DAC模组220将每路声道的目标音频数据转换为模拟电信号,以及将模拟电信号分别输入对应的发声单元110,使每个发声单元将对应的模拟电信号转换为目标音频,形成混响声音,或者,将每路声道的目标音频数据,得到整合音频数据,以及通过数字音频接口230将整合音频数据分别输入至对应的发声单元110,使得K个发声单元110输出混响声音,具体可以参见上文所述,在此就不再一一赘述。
其中,以音频处理设备10为耳机为例,耳机中可以包括气导发声单元、骨导发声单元和其他类型的发声单元中的至少一种。以其他类型的发声单元可以针对全频谱的音频数据均有期望的音响效果为例,则针对其他类型的发声单元,就无需对初始音频数据进行频谱调节。因此,以初始音频数据为一声道的初始音频数据,K个发声单元110中C个发声单元110对应的初始音频数据需要进行频谱调节,(K-C)个发声单元110无需进行频谱调节为例,音频处理方法的流程可以如图9、10和11所示,具体可以如下:
图9示出了采用DAC模组220进行音频处理的流程示意图。在图9中,音频处理电路200或处理器400对一声道的初始音频数据进行复制操作,得到K路声道对应的初始音频数据,对其中的C个声道对应的初始音频数据采用频谱调节算法进行频谱调节。以声道和发声单元110之间的对应关系为一一对应为例,每一路声道对应一个DAC221,每一个DAC221对应一个发声单元110,就可以采用DAC模组220中对应的DAC221将其中的C路声道对应的目标音频数据输入至发声单元110(1~C),然后,将其他未进行频谱调节的(K-C)路声道对应的初始音频数据作为目标音频数据输入至发声单元110(C+1~K),然后,K个发声单元110就可以将接收到的目标音频数据转换为目标音频,并通过发声单元110中的至少一个扬声器发声,从而形成混响声音,具体过程可以参见上文所述,在此就不再一一赘述。
其中,需要说明的是,声道与发声单元之间的对应关系还可以包括多对一和一对多的关系,因此,DAC模组220中的DAC221与发声单元110的之间的关系也可以不为一一对应的关系,此时就可以将DAC模组220中的DAC221看作一个整体,如图10所示,此时,音频处理电路200或处理器400就可以通过DAC模组220统筹将目标音频数据发送至发声单元110。因此,DAC模组220中的DAC221就可以根据发声单元110的性能,自适应的将对应的目标音频数据发送至发声单元。比如,发声单元m对进行频谱处理过的第n路声道的目标音频数据具有更好的发声性能,此时,音频处理电路200或处理器400就可以将第n路声道对应的目标音频数据发送至发声单元,m为[1,K]中的任意整数,n为[1,C]中的任意整数。另外,DAC模组220中的DAC221还可以对一路或多路声道对应的目标音频数据切换输入不同的发声单元。比如,第i路声道的目标音频数据当前对应的发声单元为发声单元i,但是此时随着发声单元i性能发生变化、发声失败或者接收到音效调整请求时,就可以将第i路声道的目标音频数据发送至符合预设发声性能的其他发声单元,从而使得其他发声单元可以继续基于该目标音频数据进行发声,i为[1,K]中的任意整数。如果其他发声单元当前也有对应的目标音频数据时,就可以将当前的目标音频数据进行丢弃,或者,还可以将两个目标音频数据进行融合,并基于融合后的音频数据进行发声,等等。DAC模组220中的DAC221还可以将多路声道对应的目标音频数据切换输入同一发声单元。比如,音频处理电路200或处理器400可以通过DAC模组220中的一个或多个DAC221,将第i路声道的目标音频数据和第(i+1)路声道的目标音频数据输入至同一发声单元i,i为[1,K]中的任意整数,等等。DAC模组220中的DAC221还可以将单一声道的目标音频数据切换输入至多个发声单元,比如,音频处理电路200或处理器400可以通过DAC模组220中的一个或多个DAC221将第i路声道的目标音频数据发送至多个发声单元,i为[1,K]中的任意整数。
图11示出了采用数字音频接口230进行音频处理的流程示意图。在图11中,音频处理电路200或处理器200对一声道的初始音频数据进行复制操作,得到K个声道对应的初始音频数据,对其中的C个声道对应的初始音频数据采用频谱调节算法进行频谱调节,然后,将频谱处理后的C个声道对应的目标音频数据和未处理的(K-C)个声道对应的初始音频数据作为目标音频数据进行组合操作,得到一帧的整合音频数据。通过数字音频接口230将整合音频数据分别输入至K个发声单元110,使得K个发声单元可以获取对应的目标音频数据,然后,将目标音频数据转换为目标音频,并通过发声单元110中的至少一个扬声器发声,从而形成混响声音,具体过程可以参见上文所述,在此就不再一一赘述。
其中,在音频处理方法的流程中,实现了将一个声道的音频数据发送至多个声道,而且,每个声道对应的初始音频数据还可以单独进行调整,以适应不同发声单元110的音频特性,另外,在采用频谱调节算法对初始音频数据进行频谱调节时,频谱调节算法的算法参数可以进行动态调节,从而实现更加丰富的听感。
综上所述,本说明书提供的音频处理设备和音频处理方法,音频处理设备包括发声模组和音频处理电路,其中,发声模组包括K个发声单元,每个发声单元的音频特性均不同,K为大于1的整数;音频处理电路在获取初始音频数据后,将初始音频数据转换成K路声道的目标音频数据,每路声道的目标音频数据适配对应的发声单元的音频特性,以及将K路声道的目标音频数据分别输入至对应的K个发声单元,使每个发声单元将对应的目标音频数据转换为目标音频,形成混响声音;由于该方案可以通过音频处理电路将初始音频数据转换为K路声道的目标音频数据并分别输入至对应的K个发声单元,而且,每路声道的目标音频数据适配对应的发声单元的音频特性,从而保证发声模组中每个发声单元发出的声音具有最佳的发声效果,因此,可以提升音频处理的音质效果。
本说明书另一方面提供一种非暂时性存储介质,存储有至少一组用来进行音频处理的可执行指令。当所述可执行指令被处理器执行时,所述可执行指令指导所述处理器实施本说明书所述音频处理方法P700的步骤。在一些可能的实施方式中,本说明书的各个方面还可以实现为一种程序产品的形式,其包括程序代码。当所述程序产品在音频处理设备10上运行时,所述程序代码用于使音频处理设备10执行本说明书描述的音频处理方法P700的步骤。用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)包括程序代码,并可以在音频处理设备10上运行。然而,本说明书的程序产品不限于此,在本说明书中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统使用或者与其结合使用。所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本说明书操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在音频处理设备10上执行、部分地在音频处理设备10上执行、作为一个独立的软件包执行、部分在音频处理设备10上部分在远程计算设备上执行、或者完全在远程计算设备上执行。
上述对本说明书中的一些实施例进行了描述。其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者是可能有利的。
综上所述,在阅读本详细公开内容之后,本领域技术人员可以明白,前述详细公开内容可以仅以示例的方式呈现,并且可以不是限制性的。尽管这里没有明确说明,本领域技术人员可以理解本说明书需求囊括对实施例的各种合理改变,改进和修改。这些改变,改进和修改旨在由本说明书提出,并且在本说明书的示例性实施例的精神和范围内。
此外,本说明书中的某些术语已被用于描述本说明书的实施例。例如,“一个实施例”,“实施例”和/或“一些实施例”意味着结合该实施例描述的特定特征,结构或特性可以包括在本说明书的至少一个实施例中。因此,可以强调并且应当理解,在本说明书的各个部分中对“实施例”或“一个实施例”或“替代实施例”的两个或更多个引用不一定都指代相同的实施例。此外,特定特征,结构或特性可以在本说明书的一个或多个实施例中适当地组合。
应当理解,在本说明书的实施例的前述描述中,为了帮助理解一个特征,出于简化本说明书的目的,本说明书将各种特征组合在单个实施例、附图或其描述中。然而,这并不是说这些特征的组合是必须的,本领域技术人员在阅读本说明书的时候完全有可能将其中一部分设备标注出来作为单独的实施例来理解。也就是说,本说明书中的实施例也可以理解为多个次级实施例的整合。而每个次级实施例的内容在于少于单个前述公开实施例的所有特征的时候也是成立的。
本文引用的每个专利,专利申请,专利申请的出版物和其他材料,例如文章,书籍,说明书,出版物,文件,物品等,可以通过引用结合于此。用于所有目的全部内容,除了与其相关的任何起诉文件历史,可能与本文件不一致或相冲突的任何相同的,或者任何可能对权利要求的最宽范围具有限制性影响的任何相同的起诉文件历史。现在或以后与本文件相关联。举例来说,如果在与任何所包含的材料相关联的术语的描述、定义和/或使用与本文档相关的术语、描述、定义和/或之间存在任何不一致或冲突时,使用本文件中的术语为准。
最后,应理解,本文公开的申请的实施方案是对本说明书的实施方案的原理的说明。其他修改后的实施例也在本说明书的范围内。因此,本说明书披露的实施例仅仅作为示例而非限制。本领域技术人员可以根据本说明书中的实施例采取替代配置来实现本说明书中的申请。因此,本说明书的实施例不限于申请中被精确地描述过的实施例。
Claims (23)
1.一种音频处理设备,其特征在于,包括:
发声模组,包括K个发声单元,每个所述发声单元的音频特性均不同,其中K为大于1的整数;以及
音频处理电路,被配置为:
获取初始音频数据,
将所述初始音频数据转换成K路声道的目标音频数据,每路声道的目标音频数据适配对应的所述发声单元的音频特性,以及
将所述K路声道的目标音频数据分别输入至对应的所述K个发声单元,使每个发声单元将对应的目标音频数据转换为目标音频,形成混响声音。
2.根据权利要求1所述的音频处理设备,其特征在于,为了将所述初始音频数据转换成K路声道的目标音频数据,且每路声道的目标音频数据适配对应的所述发声单元的音频特性,所述音频处理电路:
将所述初始音频数据复制成K路声道的所述初始音频数据;以及
对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述对应的发声单元的音频特性。
3.根据权利要求1所述的音频处理设备,其特征在于,
所述初始音频数据的频谱包括K个频段;以及
所述K个发声单元中的第i个发声单元在第i个频段具有期望的音响效果,所述i为[1,K]中的任意整数,
其中,为了对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述对应的发声单元的音频特性,所述音频处理电路:
对第i路声道的所述初始音频数据,保留或增强第i个频段上的幅值,衰减其他频段下的幅值,得到第i路声道的目标音频数据,所述第i路声道的目标音频数据适配所述第i路声道对应的发声单元的音频特性。
4.根据权利要求3所述的音频处理设备,其特征在于,所述期望的音响效果包括还原度超过预设值、预设音响效果或目标音响效果中的至少一种。
5.根据权利要求3所述的音频处理设备,其特征在于,为了对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述对应的发声单元的音频特性,所述音频处理电路:
对第i声道的所述初始音频数据,保留第i个频段的音频数据,过滤掉其他频段的音频数据,得到第i路声道的目标音频数据,所述第i路声道的目标音频数据适配所述第i路声道对应的发声单元的音频特性。
6.根据权利要求3所述的音频处理设备,其特征在于,所述音频处理电路还包括K个频谱调节电路,其中,第i个频谱调节电路工作时对所述第i路声道的所述初始音频数据进行所述频谱调节。
7.根据权利3所述的音频处理设备,其特征在于,所述发声单元至少包括高频、中频和低频的扬声器,以及
所述K个频段覆盖所述高频、所述中频和所述低频。
8.根据权利要求1所述的音频处理设备,其特征在于,所述音频处理电路还包括DAC模组,所述DAC模组工作时:
接收所述K路声道的目标音频数据;
将所述K路声道的目标音频数据转换为K路模拟电信号;以及
将所述K路模拟电信号分别输入对应的发声单元。
9.根据权利要求1所述的音频处理设备,其特征在于,为了将所述K路声道的目标音频数据分别输入至对应的所述K个发声单元,所述音频处理电路:
将每路声道的目标音频进行组合,得到整合音频数据;以及
将所述整合音频数据分别输入至对应的所述K个发声单元。
10.根据权利要求9所述的音频处理设备,其特征在于,所述整合音频数据包括K段子数据,其中,第i段子数据包括第i路声道的目标音频数据和对应的第i个标识,所述i为[1,K]中的任意整数。
11.根据权利要求9所述的音频处理设备,其特征在于,所述音频处理电路还包括数字音频接口,工作时通过所述数字音频接口将所述整合音频数据分别输入至对应的所述K个发声单元,
其中,所述K个发声单元中的每个所述发声单元包括识别电路和至少一个扬声器,当第i个识别电路工作时:
接收到所述整合音频数据,
在所述整合音频数据中识别出对应的第i个标识,并过滤掉其他标识对应的子数据,以及
将所述第i个标识对应的目标音频数据转换为覆盖第i个频段的目标音频,并将所述目标音频发送至所述至少一个扬声器。
12.根据权利要求9所述的音频处理设备,其特征在于,所述音频处理电路还包括数字音频接口,所述音频数字接口在工作时:
接收所述整合音频数据;
在所述整合音频数据中识别出每个发声单元对应的标识和所述标识对应的目标音频数据;以及
将所述目标音频数据发送至对应的发声单元。
13.根据权利要求1所述的音频处理设备,其特征在于,所述K个发声单元工作时以相同的相位同时播放对应的所述目标音频。
14.根据权利要求1所述的音频处理设备,其特征在于,所述音频处理设备为耳机。
15.根据权利要求1所述的音频处理设备,其特征在于,所述声道与所述发声单元之间对应关系包括一一对应的关系、多对一的关系或一对多的关系中的一种。
16.根据权利要求1所述的音频处理设备,其特征在于,在所述K个发声单元中至少一个发声单元发生变化或者接收到音效调整请求时,所述音频处理电路调整所述声道与所述发声单元之间的对应关系。
17.一种用于耳机的音频处理方法,其特征在于,包括,通过所述耳机的音频处理电路:
获取初始音频数据;
将所述初始音频数据转换为K路声道的目标音频数据,每路声道的目标音频数据适配所述耳机内对应的K个发声单元中一个发声单元的音频特性,其中K为大于1的整数,且每个所述发声单元的音频特性均不同;以及
将所述K路声道的目标音频数据分别输入对应的所述K个发声单元,使得所述K个发声单元输出混响声音。
18.根据权利要求17所述的音频处理方法,其特征在于,所述将所述初始音频数据转换为K路声道的目标音频数据,每路声道的目标音频数据适配所述耳机内对应的K个发声单元中的一个发声单元的音频特性,包括:
将所述初始音频数据复制成K路声道的所述初始音频数据;以及
对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述耳机内对应的K发声单元中的一个发声单元的音频特性。
19.根据权利要求18所述的音频处理方法,其特征在于,
所述初始音频数据包括K个频段;以及
所述K个发生单元中的第i个发声单元在第i个频段具有期望的音响效果,所述i为[1,K]中的任意整数,
其中,所述对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述耳机内对应的K个发声单元中的一个发声单元的音频特性,包括:
对第i路声道的所述初始音频数据,保留或增强第i个频段上的幅值,衰减其他频段下的幅值,得到第i路声道的目标音频数据,所述第i路声道的目标音频数据适配所述耳机内所述第i路声道对应的发声单元的音频特性。
20.根据权利要求19所述的音频处理方法,其特征在于,所述对每路声道的所述初始音频数据进行频谱调节,使得调节后的目标音频数据适配所述耳机内对应的K发声单元中的一个发声单元的音频特性,包括:
对第i路声道的所述初始音频数据,保留第i个频段的音频数据,滤掉其他频段的音频数据,得到第i路声道的目标音频数据,所述第i路声道的目标音频数据适配所述耳机内所述第i路声道对应的发声单元的音频特性。
21.根据权利要求17所述的音频处理方法,其特征在于,所述将所述K路声道的目标音频数据分别输入对应的所述K个发声单元,使得所述K个发声单元输出混响声音,包括:
将每路声道的目标音频数据转换为模拟电信号;以及
将所述模拟电信号分别输入所述对应的发声单元,使每个发声单元将对应的模拟电信号转换为目标音频,形成混响声音。
22.根据权利要求17所述的音频处理方法,其特征在于,所述将所述K路声道的目标音频数据分别输入对应的所述K个发声单元,使得所述K个发声单元输出混响声音,包括:
将每路声道的目标音频数据进行组合,得到整合音频数据;以及
将所述整合音频数据分别输入至对应的发声单元,使得所述K个发声单元输出混响声音。
23.根据权利要求22所述的音频处理方法,其中,所述将所述整合音频数据分别输入至对应的发声单元,使得所述K个发声单元输出混响声音,包括:
通过数字音频接口将所述整合音频数据分别输入至所述K个发声单元,使得所述K个发声单元输出混响声音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211353277.3A CN117998250A (zh) | 2022-11-01 | 2022-11-01 | 音频处理设备和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211353277.3A CN117998250A (zh) | 2022-11-01 | 2022-11-01 | 音频处理设备和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117998250A true CN117998250A (zh) | 2024-05-07 |
Family
ID=90889427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211353277.3A Pending CN117998250A (zh) | 2022-11-01 | 2022-11-01 | 音频处理设备和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117998250A (zh) |
-
2022
- 2022-11-01 CN CN202211353277.3A patent/CN117998250A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2017272228B2 (en) | Signal Enhancement Using Wireless Streaming | |
KR100684054B1 (ko) | 오디오 시스템의 베이스 강화 수단 | |
EP3061268B1 (en) | Method and mobile device for processing an audio signal | |
US9398381B2 (en) | Hearing instrument | |
CN115442709B (zh) | 音频处理方法、虚拟低音增强系统、设备和存储介质 | |
US20190222699A1 (en) | Adaptive filter unit for being used as an echo canceller | |
CN1658709A (zh) | 声音再现设备和声音再现方法 | |
CN111654806B (zh) | 音频播放方法、装置、存储介质及电子设备 | |
US10547927B1 (en) | Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices | |
CN112399301A (zh) | 耳机及降噪方法 | |
KR101377135B1 (ko) | 오디오 신호의 저주파 및 중주파 성분 보강 방법 및 그장치 | |
US20240298122A1 (en) | Low latency hearing aid | |
EP3824464A1 (en) | Controlling audio focus for spatial audio processing | |
US11205440B2 (en) | Sound playback system and output sound adjusting method thereof | |
WO2020017518A1 (ja) | 音声信号処理装置 | |
CN117882394A (zh) | 通过使用线性化和/或带宽扩展产生第一控制信号和第二控制信号的装置和方法 | |
EP3599775B1 (en) | Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices | |
US20060052129A1 (en) | Method and device for playing MPEG Layer-3 files stored in a mobile phone | |
CN117998250A (zh) | 音频处理设备和方法 | |
CN118679757A (zh) | 音频处理设备和方法 | |
CN113689890B (zh) | 多声道信号的转换方法、装置及存储介质 | |
EP3821616A1 (en) | Acoustic radiation reproduction | |
US11974087B2 (en) | Headphone system | |
CN115804106A (zh) | 声学输出装置和声学输出装置的控制方法 | |
US10887721B2 (en) | Communication device with spatial source separation, communication system, and related method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |