CN113923584A - 基于矩阵音频通道元数据和生成方法、设备及存储介质 - Google Patents
基于矩阵音频通道元数据和生成方法、设备及存储介质 Download PDFInfo
- Publication number
- CN113923584A CN113923584A CN202111021067.XA CN202111021067A CN113923584A CN 113923584 A CN113923584 A CN 113923584A CN 202111021067 A CN202111021067 A CN 202111021067A CN 113923584 A CN113923584 A CN 113923584A
- Authority
- CN
- China
- Prior art keywords
- audio
- channel
- matrix
- audio channel
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000015654 memory Effects 0.000 claims description 18
- 238000009877 rendering Methods 0.000 abstract description 3
- 230000005236 sound signal Effects 0.000 description 13
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
本公开涉及一种基于矩阵音频通道元数据和生成方法、电子设备及存储介质。基于矩阵音频通道元数据,包括:属性区,包括音频通道名称、音频通道标识和音频通道类型描述信息;子元素区,包括至少一个用于指示音频通道时域划分的音频块格式和音频截止频率信息,其中,所述音频块格式包括音频块标识和矩阵子元素,所述矩阵子元素包括用于组合其他通道的系数。音频数据在渲染时在空间中能够实现三维声的复现,从而提高了声音场景的质量。
Description
技术领域
本公开涉及音频处理的技术领域,尤其涉及一种基于矩阵音频通道元数据和生成方法、设备及存储介质。
背景技术
随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。
本公开提供了一种音频通道元数据和生成方法,以便提供一种能够解决上述技术问题的元数据。
发明内容
本公开的目的在于提出一种基于矩阵音频通道元数据和生成方法、设备及存储介质,以解决上述技术问题之一。
为实现上述目的,本公开第一方面提供了一种基于矩阵音频通道元数据,包括:
属性区,包括音频通道名称、音频通道标识和音频通道类型描述信息;
子元素区,包括至少一个用于指示音频通道时域划分的音频块格式和音频截止频率信息,其中,所述音频块格式包括音频块标识和矩阵子元素,所述矩阵子元素包括用于组合其他通道的系数。
为实现上述目的,本公开第二方面提供了一种音频通道元数据的生成方法,包括:
生成包括如第一方面所述基于矩阵音频通道元数据。
为实现上述目的,本公开第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器生成包括如第一方面所述基于矩阵音频通道元数据。
为实现上述目的,本公开第四方面提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器生成包括如第一方面所述基于矩阵音频通道元数据。
由上可见,本公开基于矩阵音频通道元数据,包括:属性区,包括音频通道名称、音频通道标识和音频通道类型描述信息;子元素区,包括至少一个用于指示音频通道时域划分的音频块格式和音频截止频率信息,其中,所述音频块格式包括音频块标识和矩阵子元素,所述矩阵子元素包括用于组合其他通道的系数。所述基于矩阵音频通道元数据描述了音频通道引用其他音频通道和对应的系数,指示矩阵化音频信号的转换输出,在以在空间中能够实现三维声的复现,从而提高了声音场景的质量。
附图说明
图1为本公开实施例1中提供了一种三维声音频制作模型的示意图;
图2为本公开实施例2中提供的一种音频通道元数据的生成方法的流程图;
图3为本公开实施例3提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
如图1所示,三维声音频制作模型由一组制作元素组成,每个制作元素用于描述音频制作的一个阶段,三维声音频制作模型包括内容制作部分和格式制作部分。
内容制作部分包括:音频节目、音频内容、音频对象和音轨唯一标识。
所述音频节目包括叙述、声音效果和背景音乐,音频节目引用一个或多个音频内容,音频内容组合在一起以构建为完整的音频节目。
所述音频内容描述音频节目的一个组成部分(例如背景音乐)的内容,并引用一个或多个音频对象将内容与其格式联系起来。
所述音频对象用于建立内容、格式和使用音轨唯一标识元素的资源之间的关系,并确定实际音轨的音轨唯一标识。
格式制作部分包括:音频包格式、音频通道格式、音频流格式、音频轨道格式。
所述音频包格式将是音频对象和原始音频数据依据通道分组打包时所采用的格式。
所述音频通道格式表示单个音频采样序列,可以对其执行某种操作,例如,在场景中渲染对象的移动。
流,是渲染通道、对象、高阶环境音组件或包所需的音轨的组合。所述音频流格式建立音频轨道格式集和音频通道格式集或音频包格式之间的关系。
所述音频轨道格式对应于存储介质中单个音轨中的一组样本或数据,用于描述原始音频数据的格式,及渲染器的解码信号。音频轨道格式来自音频流格式,用于识别成功解码音轨数据所需的音轨组合。
通过三维声音频制作模型对原始音频数据进行制作后生成包含元数据的合成音频数据。
所述元数据(Metadata)是描述数据特性的信息,元数据支持的功能包括指示存储位置、历史数据、资源查找或文件记录。
合成音频数据以通信方式传输到远端后,由远端基于元数据对合成音频数据进行渲染,还原原始声音场景。
实施例1
本公开提供了三维声音频模型中的一种音频通道元数据,并进行详细说明。
现有技术中所使用的基于通道的音频类型,是一种无需任何信号改动,而直接将每个通道音频信号传送到对应的每个扬声器的方式。例如,单声道、立体声、环绕5.1、环绕7.1和环绕22.2都是基于通道的音频格式,每个通道都输送到一个扬声器。虽然基于通道的音频类型在现有技术中有所应用,但为基于通道的音频类型增加对应的音频通道元数据,可以使音频处理变得容易,通过用合适的标识符标记每个通道,可以确保音频指向正确的扬声器。
音频通道格式表示单个音频采样序列,可以对其执行某些操作,例如在场景中渲染对象的移动。本公开实施例采用音频通道元数据描述音频通道格式。对矩阵类型的音频通道格式进行说明。
该音频通道元数据包括属性区和子元素区。
属性区,包括音频通道名称、音频通道标识和音频通道类型描述信息;
子元素区,包括至少一个用于指示音频通道时域划分的音频块格式和音频截止频率信息,其中,所述音频块格式包括音频块标识和矩阵子元素,所述矩阵子元素包括用于组合其他通道的系数。
其中,音频通道格式包含一个或多个音频块格式集,这些音频块格式在时域中将音频通道格式细分。
属性区包括对音频通道元数据的通用定义。音频通道名称可以是为音频通道设置的名称,用户可以通过音频通道名称确定音频通道。音频通道标识为音频通道标识符号。音频通道类型描述信息可以是音频通道类型的描述符和/或音频通道类型的说明信息,可以采用类型定义和/或类型标签定义通道的类型。音频通道格式的类型定义指定它所描述的音频类型,并确定在音频块格式子级中使用哪些参数。在本公开实施例中,音频类型,可以包括:通道类型、矩阵类型、对象类型、场景类型和双耳声道类型。类型标签可以是数字代码,每种通道类型可以有对应的数字代码表示。例如,矩阵类型的通道以0002表示。
所述音频通道标识可以包括:用于指示所述音频通道中包含的音频类型的音频类型标识和用于指示所述音频通道中包含的音频流格式的音频流标识。可选的,音频通道标识可以包含8位十六进制数字,在前的四位数字表示通道中包含的音频类型,在后的四位数字表示相匹配的音频流格式。例如,音频通道标识为AC_yyyyxxxx,yyyy表示通道中包含的音频类型,xxxx与音频流格式数字匹配。如表1所示,
表1
表1中,需求一项是指在生成音频通道元数据时,是否需要设置该项属性,“是”表示该项属性为必须项,“可选”表示该项属性为可选项,而类型定义和类型标签至少需要设置其中之一。
子元素区中包括至少一个音频块格式,音频块包含动态元数据的通道时域划分。子元素区中还可以包括音频截止频率信息,音频截止频率信息可以设置为指示高频截止和/或低频截止的音频频率。如表2所示,
表2
表2中数量一项表明子元素可以设置的数量,音频通道可以包括至少一个音频块,所以音频通道格式的子元素音频块的数量可以是大于0的整数,而音频截止频率信息为可选项,不设置该项时,该项的数量为0,设置低频截止和高频截止的音频频率之一时,该项的数量为1,设置低频截止和高频截止的音频频率两个属性时,该项的数量为2。
每个音频块格式中设置有音频块标识,其中,音频块标识可以包括用于指示音频通道内音频块的索引。音频块标识中可以包括8位十六进制数字作为通道内音频块的索引,例如,音频块标识为AB_00010001_00000001,最后8位十六进制数字作为通道内音频块的索引,音频通道中第一个音频块的索引可以从00000001开始。音频块格式还可以包括块的启动时间和块的持续时间,如果未设置块的启动时间,则可以认为音频块从00:00:00.0000开始,对于时间格式,可以采用“hh:mm:ss.ZZZZ”格式,其中,“hh”表示时,“mm”表示分,“ss”表示秒的整数部分,“ZZZZ”表示更小级数的秒,如:毫秒;如果未设置块的持续时间,则该音频块将持续整个音频通道的持续时间。如果音频通道格式中只有一个音频块格式,则假定它是一个“静态”对象,块持续时间等于该音频通道的持续时间,因此应忽略块的启动时间和块的持续时间。如果音频通道格式中包含多个音频块格式,则假定它们是“动态”对象,因此应同时使用块的启动时间和块的持续时间。音频块格式属性设置如表3,
表3
音频通道格式的类型可以包括:音床、矩阵、对象、场景和双耳声道,本公开实施例对矩阵的音频通道格式元数据进行说明。针对“矩阵”类型的音频通道格式元数据,需要设置相应的子元素用于定义编码矩阵(例如,从左/右到中/侧)、解码矩阵(例如,从中/侧到左/右)和直接矩阵(例如,Lo/Ro)。矩阵子元素包含系数子元素,系数子元素可以采用列表的形式记录,每个系数子元素引用其他通道和乘法因子。系数子元素列表中的所有系数应相加以生成矩阵方程。可定义三种类型的矩阵:编码矩阵、解码矩阵和直接矩阵。其中,编码矩阵通常用于描述如何对音频信号进行编码以生成矩阵化音频信号。解码矩阵通常用于描述如何将音频信号从矩阵化音频信号转换为另一类型的输出(对于另一类型的输出,通常,但不限于音床)。这是编码矩阵的相反过程,编码矩阵可以引用解码矩阵来连接相关矩阵。直接矩阵可以直接从基于通道的矩阵转换为基于通道的矩阵,例如降混频。音频包格式包含对矩阵通道进行分组的子元素,并允许在编码矩阵和解码矩阵之间进行交叉引用。例如,“侧”通道的编码矩阵元素将包含两个系数子元素,一个值为0.5表示“左”,另一个值为-0.5表示“右”,给出:Side=0.5·Left-0.5·Right。相应的,解码矩阵的一个例子是:Left=0.5·Mid+0.5·Side,其中“Left”成为基于通道的输出。一个直接矩阵的例子为5.1——LoRo向降混合,其中
Lout=Left+0.7071·Centre+0.7071·LeftSurround
Rout=Right+0.7071·Centre+0.7071·RightSurround
增益系数和相位的值可以是常量(使用gain和phase表示),也可以是变量(使用gainVar和phaseVar表示),使渲染器可以通过另一元数据源来确定数值。
属性区中音频通道类型描述信息设置为矩阵,可以是类型定义为“矩阵”。子元素区中的信息也设置为用于类型定义“矩阵”。音频块格式除了上述音频块格式所包含的信息外,还为类型定义为“矩阵”的音频块格式定义了矩阵子元素,所述矩阵子元素包括用于组合其他通道的系数,作为音频块格式的子元素。矩阵子元素包括用于组合其他通道的系数。音频块格式还可以包括与所述矩阵子元素对应的输出通道标识符号编号,用于定义解码矩阵或直接矩阵输出音频数据的音频通道。如表4,
表4
表4中,数量为“0或1”的元素为可选项,数量为“1”的元素为必选项。矩阵子元素下还设置有若干系数(coefficient)子元素,矩阵子元素可以包括:其他通道增益系数常量、其他通道增益系数变量、其他通道相位常量、其他通道相位变量、其他通道延时常量、其他通道延时变量和其他通道预设参考系数。如表5所示。
表5
表5中,数量为“0…*”的子元素可以设置的数量为大于等于0的整数,数量为“1…*”的子元素可以设置的数量为大于0的整数。表5中为“空”的项表示该项不存在,设置子元素时不需要设置这一项。表5中的子元素,其属性只能指定一个用途,如表5中所示的增益系数常量(gain)、增益系数变量(gainVar)、相位常量(phase)、相位变量(phaseVar)、延时常量(delay)和延时变量(delayVar)。其他通道预设参考系数可以是根据引用的其他通道中的属性进行设置,例如其他通道的音频通道标识符号。表5中增益系数常量的示例为负增益值,而负增益值表示信号反转。
本公开实施例通过音频通道元数据描述了矩阵化音频信号引用音频通道的关系,在空间中能够实现三维声的复现,从而提高了声音场景的质量。
实施例2
本公开还提供了与上述实施例承接的方法实施例,用于音频通道元数据的产生方法,基于相同的名称含义的解释与如上实施例相同,具有与如上实施例相同的技术效果,此处不再赘述。
一种音频通道元数据的生成方法,如图2所示,包括以下步骤:
步骤S110,响应于用户针对音频通道元数据的设置操作,产生音频通道元数据,所述音频通道元数据包括:
属性区,包括音频通道名称、音频通道标识和音频通道类型描述信息;
子元素区,包括至少一个用于指示音频通道时域划分的音频块格式和音频截止频率信息,其中,所述音频块格式包括音频块标识和矩阵子元素,所述矩阵子元素包括用于组合其他通道的系数。
用户针对音频通道元数据的设置操作,可以是用户针对音频通道元数据的相关属性进行设置的操作,例如,接收用户逐项输入的音频通道元数据的相关属性;或者,根据用户对预设元数据生成程序的操作自动生成音频通道元数据,该预设元数据生成程序可以设置为根据系统默认属性设置音频通道元数据的全部属性;或者,根据用户对预设元数据生成程序的操作自动生成音频通道元数据,该预设元数据生成程序可以设置为根据系统默认属性设置音频通道元数据的部分属性,然后接收用户输入的剩余属性。
可选的,所述音频通道标识包括:用于指示所述音频通道中包含的音频类型的音频类型标识和用于指示所述音频通道中包含的音频流格式的音频流标识。
可选的,所述音频通道类型描述信息,包括类型标签和/或类型定义。
可选的,所述音频块标识包括用于指示音频通道内音频块的索引。
可选的,所述音频截止频率信息包括用于指示高频截止和/或低频截止的音频频率。
可选的,所述音频块格式还包括:与所述矩阵子元素对应的输出通道标识符号编号,用于定义解码矩阵或直接矩阵输出音频数据的音频通道。
可选的,所述矩阵子元素,包括:
其他通道增益系数常量、其他通道增益系数变量、其他通道相位常量、其他通道相位变量、其他通道延时常量、其他通道延时变量和其他通道预设参考系数。
本公开实施例音频通道元数据的生成方法生成的音频通道元数据,描述了矩阵化音频信号引用音频通道的关系,在空间中能够实现三维声的复现,从而提高了声音场景的质量。
实施例3
图3为本公开实施例3提供的一种电子设备的结构示意图。如图3所示,该电子设备包括:处理器30、存储器31、输入装置32以及输出装置33。该电子设备中处理器30的数量可以是一个或者多个,图3中以一个处理器30为例。该电子设备中存储器31的数量可以是一个或者多个,图3中以一个存储器31为例。该电子设备的处理器30、存储器31、输入装置32以及输出装置33可以通过总线或者其他方式连接,图3中以通过总线连接为例。该电子设备可以是电脑和服务器等。本公开实施例以电子设备为服务器进行详细说明,该服务器可以是独立服务器或集群服务器。
存储器31作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本公开任意实施例所述产生音频通道元数据的程序指令/模块。存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器31可进一步包括相对于处理器30远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置32可用于接收输入的数字或者字符信息,以及产生与电子设备的观众用户设置以及功能控制有关的键信号输入,还可以是用于获取图像的摄像头以及获取音频数据的拾音设备。输出装置33可以包括扬声器等音频设备。需要说明的是,输入装置32和输出装置33的具体组成可以根据实际情况设定。
处理器30通过运行存储在存储器31中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即生成音频通道元数据。
实施例4
本公开实施例4还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器生成包括如实施例1所述音频通道元数据。
当然,本公开实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的电子方法操作,还可以执行本公开任意实施例所提供的电子方法中的相关操作,且具备相应的功能和有益效果。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本公开可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是机器人,个人计算机,服务器,或者网络设备等)执行本公开任意实施例所述的电子方法。
值得注意的是,上述电子装置中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开的保护范围。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“在一实施例中”、“在又一实施例中”、“示例性的”或“在具体的实施例中”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
虽然,上文中已经用一般性说明、具体实施方式及试验,对本公开作了详尽的描述,但在本公开基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本公开精神的基础上所做的这些修改或改进,均属于本公开要求保护的范围。
Claims (10)
1.一种基于矩阵音频通道元数据,其特征在于,包括:
属性区,包括音频通道名称、音频通道标识和音频通道类型描述信息;
子元素区,包括至少一个用于指示音频通道时域划分的音频块格式和音频截止频率信息,其中,所述音频块格式包括音频块标识和矩阵子元素,所述矩阵子元素包括用于组合其他通道的系数。
2.根据权利要求1所述的基于矩阵音频通道元数据,其特征在于,所述音频通道标识包括:用于指示所述音频通道中包含的音频类型的音频类型标识和用于指示所述音频通道中包含的音频流格式的音频流标识。
3.根据权利要求1所述的基于矩阵音频通道元数据,其特征在于,所述音频通道类型描述信息,包括类型标签和/或类型定义。
4.根据权利要求1所述的基于矩阵音频通道元数据,其特征在于,所述音频块标识包括用于指示音频通道内音频块的索引。
5.根据权利要求1所述的基于矩阵音频通道元数据,其特征在于,所述音频截止频率信息包括用于指示高频截止和/或低频截止的音频频率。
6.根据权利要求1所述的基于矩阵音频通道元数据,其特征在于,所述音频块格式还包括:与所述矩阵子元素对应的输出通道标识符号编号,用于定义解码矩阵或直接矩阵输出音频数据的音频通道。
7.根据权利要求6所述的基于矩阵音频通道元数据,其特征在于,所述矩阵子元素,包括:
其他通道增益系数常量、其他通道增益系数变量、其他通道相位常量、其他通道相位变量、其他通道延时常量、其他通道延时变量和其他通道预设参考系数。
8.一种音频通道元数据的生成方法,其特征在于,设置为生成包括如权利要求1-7任一项所述基于矩阵音频通道元数据。
9.一种电子设备,其特征在于,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器生成包括如权利要求1-7任一项所述基于矩阵音频通道元数据。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器生成包括如权利要求1-7任一项所述基于矩阵音频通道元数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111021067.XA CN113923584A (zh) | 2021-09-01 | 2021-09-01 | 基于矩阵音频通道元数据和生成方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111021067.XA CN113923584A (zh) | 2021-09-01 | 2021-09-01 | 基于矩阵音频通道元数据和生成方法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113923584A true CN113923584A (zh) | 2022-01-11 |
Family
ID=79233667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111021067.XA Pending CN113923584A (zh) | 2021-09-01 | 2021-09-01 | 基于矩阵音频通道元数据和生成方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113923584A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101379464A (zh) * | 2005-12-21 | 2009-03-04 | 数字标记公司 | 规则驱动型个域网id元数据路由系统和网络 |
CN103650539A (zh) * | 2011-07-01 | 2014-03-19 | 杜比实验室特许公司 | 用于自适应音频信号产生、编码和呈现的系统和方法 |
CN105431900A (zh) * | 2013-07-31 | 2016-03-23 | 杜比实验室特许公司 | 空间上的弥漫性或大音频对象的处理 |
US9774976B1 (en) * | 2014-05-16 | 2017-09-26 | Apple Inc. | Encoding and rendering a piece of sound program content with beamforming data |
CN107925391A (zh) * | 2015-09-30 | 2018-04-17 | 苹果公司 | 基于编码音频元数据的响度均衡和drc期间的动态均衡 |
JP2019003185A (ja) * | 2017-06-09 | 2019-01-10 | 日本放送協会 | 音響信号補助情報変換伝送装置及びプログラム |
US20210005211A1 (en) * | 2019-07-02 | 2021-01-07 | Dolby International Ab | Using metadata to aggregate signal processing operations |
US20210050028A1 (en) * | 2018-01-26 | 2021-02-18 | Lg Electronics Inc. | Method for transmitting and receiving audio data and apparatus therefor |
-
2021
- 2021-09-01 CN CN202111021067.XA patent/CN113923584A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101379464A (zh) * | 2005-12-21 | 2009-03-04 | 数字标记公司 | 规则驱动型个域网id元数据路由系统和网络 |
CN103650539A (zh) * | 2011-07-01 | 2014-03-19 | 杜比实验室特许公司 | 用于自适应音频信号产生、编码和呈现的系统和方法 |
CN105431900A (zh) * | 2013-07-31 | 2016-03-23 | 杜比实验室特许公司 | 空间上的弥漫性或大音频对象的处理 |
US9774976B1 (en) * | 2014-05-16 | 2017-09-26 | Apple Inc. | Encoding and rendering a piece of sound program content with beamforming data |
CN107925391A (zh) * | 2015-09-30 | 2018-04-17 | 苹果公司 | 基于编码音频元数据的响度均衡和drc期间的动态均衡 |
JP2019003185A (ja) * | 2017-06-09 | 2019-01-10 | 日本放送協会 | 音響信号補助情報変換伝送装置及びプログラム |
US20210050028A1 (en) * | 2018-01-26 | 2021-02-18 | Lg Electronics Inc. | Method for transmitting and receiving audio data and apparatus therefor |
US20210005211A1 (en) * | 2019-07-02 | 2021-01-07 | Dolby International Ab | Using metadata to aggregate signal processing operations |
Non-Patent Citations (2)
Title |
---|
国际电信联盟: "音频定义模型", 《ITU-R BS.2076-1 建议书》 * |
张静琦: "音频定义模型简介", 《电声技术》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107277691B (zh) | 基于云的多声道音频播放方法、系统及音频网关装置 | |
CN113905321A (zh) | 基于对象音频通道元数据和生成方法、设备及存储介质 | |
CN114023339A (zh) | 基于音床音频包格式元数据和产生方法、设备及介质 | |
GB2578715A (en) | Controlling audio focus for spatial audio processing | |
CN113923584A (zh) | 基于矩阵音频通道元数据和生成方法、设备及存储介质 | |
CN114203189A (zh) | 基于双耳音频包格式元数据和产生方法、设备及介质 | |
CN114203190A (zh) | 基于矩阵音频包格式元数据和产生方法、设备及存储介质 | |
US20090088879A1 (en) | Audio reproduction device and method for audio reproduction | |
CN114023340A (zh) | 基于对象音频包格式元数据和产生方法、设备及介质 | |
CN114979935A (zh) | 一种对象输出渲染项确定方法、装置、设备及存储介质 | |
CN114512152A (zh) | 一种广播音频格式文件生成方法、装置、设备及存储介质 | |
CN113905322A (zh) | 基于双耳音频通道元数据和生成方法、设备及存储介质 | |
CN113923264A (zh) | 基于场景音频通道元数据和生成方法、设备及存储介质 | |
CN114051194A (zh) | 一种音频轨道元数据和生成方法、电子设备及存储介质 | |
CN114143695A (zh) | 一种音频流元数据和生成方法、电子设备及存储介质 | |
CN113889128A (zh) | 一种音频制作模型和生成方法、电子设备及存储介质 | |
CN114121036A (zh) | 音轨唯一标识元数据和生成方法、电子设备及存储介质 | |
CN113938811A (zh) | 基于音床音频通道元数据和生成方法、设备及存储介质 | |
CN114360556A (zh) | 串行音频元数据帧生成方法、装置、设备及存储介质 | |
CN115190412A (zh) | 生成渲染器内部数据结构的方法、装置、设备及存储介质 | |
CN114530157A (zh) | 音频元数据通道分配区块生成方法、装置、设备及介质 | |
CN108206983B (zh) | 兼容现有音视频系统的三维声信号的编码器及其方法 | |
CN114363790A (zh) | 串行音频块格式元数据生成方法、装置、设备及介质 | |
CN114203188A (zh) | 基于场景音频包格式元数据和产生方法、设备及存储介质 | |
CN114363791A (zh) | 串行音频元数据生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220111 |