CN104240712B - 一种三维音频多声道分组聚类编码方法及系统 - Google Patents
一种三维音频多声道分组聚类编码方法及系统 Download PDFInfo
- Publication number
- CN104240712B CN104240712B CN201410524784.8A CN201410524784A CN104240712B CN 104240712 B CN104240712 B CN 104240712B CN 201410524784 A CN201410524784 A CN 201410524784A CN 104240712 B CN104240712 B CN 104240712B
- Authority
- CN
- China
- Prior art keywords
- sound channel
- module
- signal
- sound
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及一种三维音频多声道分组聚类编码方法及系统,利用同一声源同组扬声器信号子带包络结构相似性的特点,提出一种基于子带频点极值包络相似性计算方法进行动态的三维音频分组下混,分组计算复杂度远低于传统的声道间相关性计算方法,但准确率相当。相比现有多声道下混编码方法,本方法能有效地将形成主要声像的多个扬声器进行分组,保证分组扬声器提取的空间参数信息更好地描述实际声像的空间位置信息,解决固定分组参数提取方法中带来的信息混叠问题。
Description
技术领域
本发明涉及音频编码技术领域,尤其涉及一种三维音频多声道分组聚类编码方法及系统。
背景技术
在传统的立体声和环绕声编码方法中,参与下混的声道对信号相关性强,参数编码能提供较高的压缩比的同时提高较好的音质。三维音频环境下声道数目多,声道内容复杂,声道间关联复杂。形成同一声像的扬声器分组具有信号相关性最强,扬声器分组不固定、且扬声器分组不固定依赖于物理最近邻原则等特点。现有的三维多声道参数编码主要基于固定的扬声器分组或基于能量高低对扬声器进行分组聚类,提取声像的空间参数信息,以最简单的方式考虑三维音频的声道间相关性,分组方法缺乏理论指导,无法完整揭示三维音频信号的空间聚类性,在三维音频下信号去冗余的效果降低,同时不相关声道下混还会导致信息混叠。因此,从现有的简单分析声道间的空间位置关联性到分析更本质的声道间的音源对象关联性,研究面向声源的声道间空间关联特性,找到形成同一声像的相关性最强的最优扬声器分组,将是三维多声道音频参数编码中,准确进行声源空间参数提取的关键之一。
发明内容
本发明的目的是提供一种三维音频多声道分组聚类编码系统及方法,使得在多声道下混编码中,找到形成同一声像的相关性最强的最优扬声器分组,从而使得虚拟声源空间参数提取更准确,有效去除声道间信号冗余。
为达到上述目的,本发明提供一种三维音频多声道分组聚类编码方法,包括以下步骤:
S1,对N个声道输入信号进行预处理,得到N个声道的当前帧的音频信号S1,...,SN;
S2,由步骤S1所得音频信号S1,...,SN,进行时频变换得到频谱系数X1,...,XN;
S3,对步骤S2所得频谱系数X1,...,XN进行子带划分,得到N个声道的子带频谱系数X1(k),...,XN(k),k∈{1,...,K},K为每个声道每帧信号时频变换后的频点总数;
S4,根据步骤S3得到的N个声道的子带频谱系数X1(k),...,XN(k),计算得到两两声道间的相关性系数Rij;
S5,根据步骤S4得到的两两声道间的相关性系数Rij,对N个声道信号进行聚类分组,得到M个分组G1,...,GM;
S6,根据步骤S5得到M个分组信息,进行熵编码,将编码结果作为码流的一部分输出给解码端;
S7,根据步骤S5得到M个分组信息,对步骤S3得到的每个声道的子带频谱系数X1(k),...,XN(k)进行下混,得到M组下混声道信号;
S8,根据步骤S7得到的M组下混声道信号,利用现有的通用音频编码方法进行量化编码,将编码结果作为码流的一部分输出给解码端;
S9,根据步骤S5得到M个分组信息,对每个分组内的声道进行空间参数提取,得到M组空间参数;
S10,根据步骤S9得到的M组空间参数,利用现有的通用音频编码方法对空间参数进行编码,将编码结果作为码流的一部分输出给解码端。
所述步骤S4进一步包括以下子步骤,
S4.1,根据步骤S3得到的N个声道的子带频谱系数X1(k),...,XN(k),k∈{1,...,K},K为每个声道每帧信号时频变换后的频点总数,计算每个声道的L个频谱极大值点n∈{1,...,N},l∈{1,...,L};
S4.2,根据步骤S4.1得到的每个声道的L个频谱极大值点{Xn(L1),…,Xn(Ll),…,Xn(LL)},得到每个声道的对应频点编号的集合n∈{1,...,N},N为声道个数,K为每个声道每帧信号时频变换后的频点总数;
S4.3,根据步骤S4.2得到的所有声道的对应频点编号的集合,对第i和j个声道的频点编号的集合Di和Dj,求取得到两个集合元素的交集Di∩Dj,i≠j,i,j∈{1,...,N},统计得到交集元素的个数Cij;
S4.4,根据步骤S4.3得到的两两声道频谱极大值点对应频点交集个数Cij,计算得到两两声道间的相关性系数Rij=Cij/K。
步骤S5包括以下子步骤,
S5.1,根据步骤S4得到的两两声道间的相关性系数Rij∈U,U={R12,R13,...,R1N,R23,...R2N,...,R(N-1)N},i,j∈{1,...,N},i≠j,求取U的最大值Max(U)为Rab,放入相关性系数最大值集合SU,同时从U中删除掉下标中含有a或b的所有元素,得到剩下的元素组成新的集合U;
S5.2,根据新的集合U,重复步骤S5.1,直到得到N/2个按从大到小顺序排列的两两声道相关性系数的排序结果SU={R1,R2,...,RN/2};
S5.3,按步骤S5.2得到的两两声道间的相关性排序结果SU={R1,R2,...,RN/2},对N个扬声器信号进行聚类分组,逐一将相关性最强的两个声道分为一组,依次得到M-1个分组,然后将剩下的声道分为第M组,最终得到M个分组信息G1,...,GM
一种三维音频多声道分组聚类编码系统,包括以下模块:
预处理模块,用于对N个声道输入信号进行预处理,得到N个声道的当前帧的音频信号S1,...,SN输出给时频变换模块;
时频变换模块,用于对从预处理模块输入的音频信号S1,...,SN进行时频变换,得到频谱系数X1,...,XN,输出给子带划分模块;
子带划分模块,用于对时频变换模块输入的频谱系数X1,...,XN进行子带划分,得到N个声道的子带频谱系数X1(k),...,XN(k),分三路输出,一路输出给声道相关性分析模块,一路输出给空间参数提取模块,一路输出给分组下混模块;
声道相关性分析模块,用于对N个声道的频谱系数X1,...,XN进行分析,得到声道间的相关性系数,输出给聚类分组模块;
聚类分组模块,根据声道间的相关性,对N个声道信号进行聚类分组,将得到的分组信息分三路输出,一路输出给分组信息量化编码模块,一路输出给分组下混模块,一路输出给空间参数提取模块;
分组信息量化编码模块,用于对N个声道的分组信息进行量化编码,将编码结果作为码流的一部分输出给解码端;
分组下混模块,根据N个声道的分组信息,对N个声道进行下混,得到下混声道信号,输出给下混信号量化编码模块;
下混信号量化编码模块,对下混声道信号进行编码,将编码结果作为码流的一部分输出给解码端;
空间参数提取模块,根据N个声道的分组信息,对每个分组中的声道信号提取空间参数,输出给空间参数量化编码模块;
空间参数量化编码模块,对提取出的空间参数进行量化编码,将编码结果作为码流的一部分输出给解码端。
本发明针对现有多声道下混编码方法中使用简单的固定分组下混不能有效地利用三维音频信号的空间聚类特性,会导致三维音频信号去冗余效果降低,不相关的声道分组进行空间参数提取会造成重建空间音质受损的问题,利用同一声源同组扬声器信号子带包络结构相似性的特点,提出一种基于子带频点极值包络相似性计算方法进行动态的三维音频分组下混,分组计算复杂度远低于相关性计算方法,但准确率相当,该方法能有效地将形成主要声像的多个扬声器进行分组,保证分组扬声器提取的空间参数信息更好地描述实际声像的空间位置信息,解决固定分组参数提取方法中带来的信息混叠问题。
附图说明
图1是本发明实施例提供的三维音频多声道分组聚类编码方法的原理框图。
具体实施方式
下面结合附图和实施例详细对本发明提供的三维音频多声道分组聚类编码方法及系统进行详细描述。
具体实施时,本发明所提供系统可采用计算机软件模块化技术实现。参见图1,本发明提供了一种三维音频多声道分组聚类编码方法,具体步骤包括:
在步骤S1中,对N个声道输入信号进行预处理,具体包括高通滤波、分帧处理,将输入信号101送入高通滤波器,滤除50Hz以下的低频信号;以20ms为一帧读取采样数据作为当前帧数据;得到N个声道的当前帧的音频信号S1,...,SN,即音频信号102下标1表示第1个声道,下标N表示第N个声道;
在步骤S2中,由步骤S1所得音频信号S1,...,SN,进行256点的FFT时频变换,得到每一帧各自256个频谱系数X1,...,XN,即频谱系数103;
在步骤S3,对步骤S2所得频谱系数X1,...,XN进行子带划分,将整个频谱均匀划分为16个子带,每个子带16个频谱系数,得到N个声道的子带频谱系数X1(k),...,XN(k),即信号104,k∈{1,...,K},K=256,为每个声道每帧信号时频变换后的频点总数;
在步骤S4中,根据步骤S3得到的N个声道的子带频谱系数X1(k),...,XN(k),计算得到两两声道间的相关性系数Rij,i和j对应声道编号,i≠j,i,j∈{1,...,N},即信号105;
在步骤S5中,根据步骤S4得到的两两声道间的相关性系数Rij,对N个声道信号进行聚类分组,得到M个分组G1,...,GM,即信号106;
在步骤S6中,根据步骤S5得到的M个分组信息,进行熵编码,采用现有技术中的差分Huffman编码,得到编码结果,将编码结果作为码流的一部分输出给解码端;
在步骤S7中,对于步骤S3得到的N个声道的子带频谱系数X1(k),...,XN(k),即信号104,根据步骤S5得到的M个分组信息,即信号106,对每个分组内的声道进行下混,得到M组下混声道信号,即信号108;
在步骤S8中,根据步骤S7得到的M组下混声道信号,利用现有的通用音频编码方法进行量化编码,将编码结果作为码流的一部分输出给解码端;
在步骤S9中,根据步骤S5得到M个分组信息,对每个分组内的声道进行空间参数提取,得到M组空间参数,即信号107;
在步骤S10中,根据步骤S9得到的M组空间参数,进行利用现有的通用音频编码方法对空间参数进行编码,将编码结果作为码流的一部分输出给解码端。
其中,步骤S4进一步包括以下子步骤,
步骤S4.1,根据步骤S3得到的N个声道的子带频谱系数X1(k),...,XN(k),k∈{1,...,K},K为每个声道每帧信号时频变换后的频点总数,计算每个声道的L个频谱极大值点n∈{1,...,N},l∈{1,...,L};
步骤S4.2,根据步骤S4.1得到的每个声道的L个频谱极大值点{Xn(L1),…,Xn(Ll),…,Xn(LL)},得到每个声道的对应频点编号的集合n∈{1,...,N},N为声道个数,K为每个声道每帧信号时频变换后的频点总数;
步骤S4.3,根据步骤S4.2得到的所有声道的对应频点编号的集合,对第i和j个声道的频点编号的集合Di和Dj,求取得到两个集合元素的交集Di∩Dj,i≠j,i,j∈{1,...,N},统计得到交集元素的个数Cij;
步骤S4.4,根据步骤S4.3得到的两两声道频谱极大值点对应频点交集个数Cij,计算得到两两声道间的相关性系数Rij=Cij/K。
进一步,步骤S5进一步包括以下子步骤,
步骤S5.1,根据步骤S4得到的两两声道间的相关性系数Rij∈U,U={R12,R13,...,R1N,R23,...R2N,...,R(N-1)N},i,j∈{1,...,N},i≠j,求取U的最大值Max(U)为Rab,放入相关性系数最大值集合SU,同时从U中删除掉下标中含有a或b的所有元素,得到剩下的元素组成新的集合U;
步骤S5.2,根据新的集合U,重复步骤S5.1,直到得到N/2个按从大到小顺序排列的两两声道相关性系数的排序结果SU={R1,R2,...,RN/2};
步骤S5.3,按步骤S5.2得到的两两声道间的相关性排序结果SU={R1,R2,...,RN/2},对N个扬声器信号进行聚类分组,逐一将相关性最强的两个声道分为一组,依次得到M-1个分组,然后将剩下的声道分为第M组,最终得到M个分组信息G1,...,GM。
一种三维音频多声道分组聚类编码系统,包括以下模块:
预处理模块,用于对N个声道输入信号进行预处理,得到N个声道的当前帧的音频信号S1,...,SN输出给时频变换模块。
实施例中,预处理模块对输入的多声道音频信号(即音频原始信号101)进行预处理,而预处理一般具体包括高通滤波、分帧处理,将输入信号(101)送入高通滤波器,滤除50Hz以下的低频信号;以20ms为一帧读取采样数据作为当前帧数据;输出信号为N个声道的当前帧的音频信号S1,...,SN(即预处理后信号102),下标1表示第1个声道,下标N表示第N个声道。
时频变换模块:预处理后的N个声道的信号作为本模块的输入,用于对从预处理模块输入的音频信号S1,...,SN进行现有技术中通用的时频变换,得到频谱系数X1,...,XN,输出给子带划分模块。
实施例中,时频变换模块对预处理模块的输出结果S1,...,SN(102),进行FFT变换,得到每一帧各自的频谱系数X1,...,XN。
子带划分模块:时频变换模块得到的预处理后的频域的音频信号作为本模块的输入,采用现有技术中通用的子带划分方法,得到N个声道的子带频谱系数,分三路输出,一路输出给声道相关性分析模块,一路输出给空间参数提取模块,一路输出给分组下混模块。
实施例中,子带划分模块对时频变换模块得到的频谱系数X1,...,XN,进行子带划分,实施例将整个频谱均匀划分为16个子带,每个子带16个频谱系数,得到N个声道的子带频谱系数X1(k),...,XN(k),k∈{1,...,K},K=256,为频点总数。
声道相关性分析模块,用于对N个声道的频谱系数进行分析,得到声道间的相关性系数,输出给聚类分组模块。
实施例中,对于N个声道的子带频谱系数X1(k),...,XN(k)(104),计算每个声道的L个频谱极大值点n∈{1,...,N},l∈{1,...,L},得到每个声道的对应频点编号的集合n∈{1,...,N},N为声道个数,K为频点总数,对第i和j个声道的频点编号的集合Di和Dj,求取得到两个集合元素的交集Di∩Dj,i≠j,i,j∈{1,...,N},统计得到交集元素的个数Cij,计算得到两两声道间的相关性系数Rij=Cij/K。
聚类分组模块,根据声道相关性分析模块得到的两两声道间的相关性系数Rij,对N个声道信号进行聚类分组,将得到的分组信息分三路输出,一路输出给分组信息量化编码模块,一路输出给分组下混模块,一路输出给空间参数提取模块。
实施例中,根据声道相关性分析模块得到的两两声道间的相关性系数Rij,得到的两两声道间的相关性系数Rij∈U,U={R12,R13,...,R1N,R23,...R2N,...,R(N-1)N},i,j∈{1,...,N},i≠j,求取U的最大值Max(U)为Rab,放入相关性系数最大值集合SU,同时从U中删除掉下标中含有a或b的所有元素,得到剩下的元素组成新的集合U;根据新的集合U,重复上述步骤,直到得到N/2个按从大到小顺序排列的两两声道相关性系数的排序结果SU={R1,R2,...,RN/2};依照此结果对N个扬声器信号进行聚类分组,逐一将相关性最强的两个声道分为一组,依次得到M-1个分组,然后将剩下的声道分为第M组,最终得到M个分组信息G1,...,GM。
分组信息量化编码模块,用于对N个声道的分组信息进行量化编码,将编码结果作为码流的一部分输出给解码端。实施例中,对于聚类分组模块得到的M个分组信息,利用现有的熵编码方法进行量化编码,实施例采用现有技术中的差分Huffman编码,得到编码结果,将编码结果作为码流的一部分输出给解码端。
分组下混模块,根据N个声道的分组信息,对N个声道进行下混,得到下混声道信号,输出给下混信号量化编码模块。实施例中,对N个声道的子带频谱系数,根据聚类分组模块得到的M个分组信息,对每个分组内的声道信号,采用现有通用的空间音频编码下混方法进行声道信号下混,得到M组下混声道信号。
下混信号量化编码模块,对下混声道信号进行编码,将编码结果作为码流的一部分输出给解码端。实施例中,对分组下混模块得到的M组下混声道信号,利用现有的通用音频编码方法进行量化编码,将编码结果作为码流的一部分输出给解码端。
空间参数提取模块,根据N个声道的分组信息,对每个分组中的声道信号提取空间参数,输出给空间参数量化编码模块。实施例中,对N个声道的子带频谱系数,根据聚类分组模块得到的M个分组信息,对每个分组内的声道,利用现有通用的空间参数提取方法按子带提取虚拟声源空间参数,得到M组下混声道信号提取的空间参数。
空间参数量化编码模块,对提取出的空间参数进行量化编码,将编码结果作为码流的一部分输出给解码端。实施例中,对于空间参数提取模块得到的M组下混声道信号提取的空间参数,进行利用现有的通用音频编码方法对空间参数进行编码,将编码结果作为码流的一部分输出给解码端。
以上实施例仅供说明本发明之用,而非对本发明的限制,有关技术领域的技术人员,在不脱离本发明的精神和范围的情况下,还可以作出各种变换或变型,因此所有等同的技术方案,都落入本发明的保护范围。
Claims (4)
1.一种三维音频多声道分组聚类编码方法,其特征在于,包括以下步骤:
S1,对N个声道输入信号进行预处理,得到N个声道的当前帧的音频信号S1,...,SN;
S2,由步骤S1所得音频信号S1,...,SN,进行时频变换得到频谱系数X1,...,XN;
S3,对步骤S2所得频谱系数X1,...,XN进行子带划分,得到N个声道的子带频谱系数X1(k),...,XN(k),k∈{1,...,K},K为每个声道每帧信号时频变换后的频点总数;
S4,根据步骤S3得到的N个声道的子带频谱系数X1(k),...,XN(k),计算得到两两声道间的相关性系数Rij;
S5,根据步骤S4得到的两两声道间的相关性系数Rij,对N个声道信号进行聚类分组,得到M个分组G1,...,GM;
S6,根据步骤S5得到M个分组信息,进行熵编码,将编码结果作为码流的一部分输出给解码端;
S7,根据步骤S5得到M个分组信息,对步骤S3得到的每个声道的子带频谱系数X1(k),...,XN(k)进行下混,得到M组下混声道信号;
S8,根据步骤S7得到的M组下混声道信号,利用现有的通用音频编码方法进行量化编码,将编码结果作为码流的一部分输出给解码端;
S9,根据步骤S5得到M个分组信息,对每个分组内的声道进行空间参数提取,得到M组空间参数;
S10,根据步骤S9得到的M组空间参数,利用现有的通用音频编码方法对空间参数进行编码,将编码结果作为码流的一部分输出给解码端。
2.根据权利要求1所述三维音频多声道分组聚类编码方法方法,其特征在于:所述步骤S4进一步包括以下子步骤,
S4.1,根据步骤S3得到的N个声道的子带频谱系数X1(k),...,XN(k),k∈{1,...,K},K为每个声道每帧信号时频变换后的频点总数,计算每个声道的L个频谱极大值点
S4.2,根据步骤S4.1得到的每个声道的L个频谱极大值点{Xn(L1),…,Xn(Ll),…,Xn(LL)},得到每个声道的对应频点编号的集合N为声道个数,K为每个声道每帧信号时频变换后的频点总数;
S4.3,根据步骤S4.2得到的所有声道的对应频点编号的集合,对第i和j个声道的频点编号的集合Di和Dj,求取得到两个集合元素的交集Di∩Dj,i≠j,i,j∈{1,...,N},统计得到交集元素的个数Cij;
S4.4,根据步骤S4.3得到的两两声道频谱极大值点对应频点交集个数Cij,计算得到两两声道间的相关性系数Rij=Cij/K。
3.根据权利要求1或2所述三维音频多声道分组聚类编码方法方法,其特征在于:步骤S5包括以下子步骤,
S5.1,根据步骤S4得到的两两声道间的相关性系数Rij∈U,U={R12,R13,...,R1N,R23,...R2N,...,R(N-1)N},i,j∈{1,...,N},i≠j,求取U的最大值Max(U)为Rab,放入相关性系数最大值集合SU,同时从U中删除掉下标中含有a或b的所有元素,得到剩下的元素组成新的集合U;
S5.2,根据新的集合U,重复步骤S5.1,直到得到N/2个按从大到小顺序排列的两两声道相关性系数的排序结果SU={R1,R2,...,RN/2};
S5.3,按步骤S5.2得到的两两声道间的相关性排序结果SU={R1,R2,...,RN/2},对N个扬声器信号进行聚类分组,逐一将相关性最强的两个声道分为一组,依次得到M-1个分组,然后将剩下的声道分为第M组,最终得到M个分组信息G1,...,GM。
4.一种三维音频多声道分组聚类编码系统,其特征在于,包括以下模块:
预处理模块,用于对N个声道输入信号进行预处理,得到N个声道的当前帧的音频信号S1,...,SN输出给时频变换模块;
时频变换模块,用于对从预处理模块输入的音频信号S1,...,SN进行时频变换,得到频谱系数X1,...,XN,输出给子带划分模块;
子带划分模块,用于对时频变换模块输入的频谱系数X1,...,XN进行子带划分,得到N个声道的子带频谱系数X1(k),...,XN(k),分三路输出,一路输出给声道相关性分析模块,一路输出给空间参数提取模块,一路输出给分组下混模块;
声道相关性分析模块,用于对N个声道的频谱系数X1,...,XN进行分析,得到声道间的相关性系数,输出给聚类分组模块;
聚类分组模块,根据声道间的相关性,对N个声道信号进行聚类分组,将得到的分组信息分三路输出,一路输出给分组信息量化编码模块,一路输出给分组下混模块,一路输出给空间参数提取模块;
分组信息量化编码模块,用于对N个声道的分组信息进行量化编码,将编码结果作为码流的一部分输出给解码端;
分组下混模块,根据N个声道的分组信息,对N个声道进行下混,得到下混声道信号,输出给下混信号量化编码模块;
下混信号量化编码模块,对下混声道信号进行编码,将编码结果作为码流的一部分输出给解码端;
空间参数提取模块,根据N个声道的分组信息,对每个分组中的声道信号提取空间参数,输出给空间参数量化编码模块;
空间参数量化编码模块,对提取出的空间参数进行量化编码,将编码结果作为码流的一部分输出给解码端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410524784.8A CN104240712B (zh) | 2014-09-30 | 2014-09-30 | 一种三维音频多声道分组聚类编码方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410524784.8A CN104240712B (zh) | 2014-09-30 | 2014-09-30 | 一种三维音频多声道分组聚类编码方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104240712A CN104240712A (zh) | 2014-12-24 |
CN104240712B true CN104240712B (zh) | 2018-02-02 |
Family
ID=52228666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410524784.8A Active CN104240712B (zh) | 2014-09-30 | 2014-09-30 | 一种三维音频多声道分组聚类编码方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104240712B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107895580B (zh) * | 2016-09-30 | 2021-06-01 | 华为技术有限公司 | 一种音频信号的重建方法和装置 |
CN114025301B (zh) * | 2016-10-28 | 2024-07-30 | 松下电器(美国)知识产权公司 | 用于回放多个音频源的双声道渲染装置和方法 |
CN106710600B (zh) * | 2016-12-16 | 2020-02-04 | 广州广晟数码技术有限公司 | 多声道音频信号的去相关编码方法和装置 |
CN108206022B (zh) * | 2016-12-16 | 2020-12-18 | 南京青衿信息科技有限公司 | 利用aes/ebu信道传输三维声信号的编解码器及其编解码方法 |
CN109859766B (zh) * | 2017-11-30 | 2021-08-20 | 华为技术有限公司 | 音频编解码方法和相关产品 |
CN108550369B (zh) * | 2018-04-14 | 2020-08-11 | 全景声科技南京有限公司 | 一种可变长度的全景声信号编解码方法 |
CN110942783B (zh) * | 2019-10-15 | 2022-06-17 | 国家计算机网络与信息安全管理中心 | 一种基于音频多级聚类的群呼型骚扰电话分类方法 |
CN114023338A (zh) * | 2020-07-17 | 2022-02-08 | 华为技术有限公司 | 多声道音频信号的编码方法和装置 |
CN115376528A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101149925A (zh) * | 2007-11-06 | 2008-03-26 | 武汉大学 | 一种用于参数立体声编码的空间参数选取方法 |
CN101162904A (zh) * | 2007-11-06 | 2008-04-16 | 武汉大学 | 一种空间参数立体声编解码方法及其装置 |
CN101188878A (zh) * | 2007-12-05 | 2008-05-28 | 武汉大学 | 一种立体声音频信号的空间参数量化及熵编码方法及其所用系统结构 |
CN101247129A (zh) * | 2004-09-17 | 2008-08-20 | 广州广晟数码技术有限公司 | 信号处理方法 |
CN101419801A (zh) * | 2008-12-03 | 2009-04-29 | 武汉大学 | 分频带测量耳间相关度感知特性的方法及其装置 |
CN101673545A (zh) * | 2008-09-12 | 2010-03-17 | 华为技术有限公司 | 一种编解码方法及装置 |
CN102074243A (zh) * | 2010-12-28 | 2011-05-25 | 武汉大学 | 一种基于比特平面的感知音频分级编码系统及方法 |
CN102637432A (zh) * | 2012-03-20 | 2012-08-15 | 武汉大学 | 三维音频编码中双耳线索感知特性的自适应测量方法 |
CN102664017A (zh) * | 2012-04-25 | 2012-09-12 | 武汉大学 | 一种3d音频质量客观评价方法 |
CN102682779A (zh) * | 2012-06-06 | 2012-09-19 | 武汉大学 | 面向3d音频的双声道编解码方法和编解码器 |
CN102737647A (zh) * | 2012-07-23 | 2012-10-17 | 武汉大学 | 双声道音频音质增强编解码方法及装置 |
CN103065634A (zh) * | 2012-12-20 | 2013-04-24 | 武汉大学 | 基于感知特性的三维音频空间参数的量化方法 |
CN103928030A (zh) * | 2014-04-30 | 2014-07-16 | 武汉大学 | 基于子带空间关注测度的可分级音频编码系统及方法 |
CN104064194A (zh) * | 2014-06-30 | 2014-09-24 | 武汉大学 | 用于提高三维音频空间感距离感的参数编解码方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100546233C (zh) * | 2003-04-30 | 2009-09-30 | 诺基亚公司 | 用于支持多声道音频扩展的方法和设备 |
CN101151659B (zh) * | 2005-03-30 | 2014-02-05 | 皇家飞利浦电子股份有限公司 | 多通道音频编码器、设备、方法及其解码器、设备和方法 |
BRPI0905069A2 (pt) * | 2008-07-29 | 2015-06-30 | Panasonic Corp | Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
-
2014
- 2014-09-30 CN CN201410524784.8A patent/CN104240712B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101247129A (zh) * | 2004-09-17 | 2008-08-20 | 广州广晟数码技术有限公司 | 信号处理方法 |
CN101149925A (zh) * | 2007-11-06 | 2008-03-26 | 武汉大学 | 一种用于参数立体声编码的空间参数选取方法 |
CN101162904A (zh) * | 2007-11-06 | 2008-04-16 | 武汉大学 | 一种空间参数立体声编解码方法及其装置 |
CN101188878A (zh) * | 2007-12-05 | 2008-05-28 | 武汉大学 | 一种立体声音频信号的空间参数量化及熵编码方法及其所用系统结构 |
CN101673545A (zh) * | 2008-09-12 | 2010-03-17 | 华为技术有限公司 | 一种编解码方法及装置 |
CN101419801A (zh) * | 2008-12-03 | 2009-04-29 | 武汉大学 | 分频带测量耳间相关度感知特性的方法及其装置 |
CN102074243A (zh) * | 2010-12-28 | 2011-05-25 | 武汉大学 | 一种基于比特平面的感知音频分级编码系统及方法 |
CN102637432A (zh) * | 2012-03-20 | 2012-08-15 | 武汉大学 | 三维音频编码中双耳线索感知特性的自适应测量方法 |
CN102664017A (zh) * | 2012-04-25 | 2012-09-12 | 武汉大学 | 一种3d音频质量客观评价方法 |
CN102682779A (zh) * | 2012-06-06 | 2012-09-19 | 武汉大学 | 面向3d音频的双声道编解码方法和编解码器 |
CN102737647A (zh) * | 2012-07-23 | 2012-10-17 | 武汉大学 | 双声道音频音质增强编解码方法及装置 |
CN103065634A (zh) * | 2012-12-20 | 2013-04-24 | 武汉大学 | 基于感知特性的三维音频空间参数的量化方法 |
CN103928030A (zh) * | 2014-04-30 | 2014-07-16 | 武汉大学 | 基于子带空间关注测度的可分级音频编码系统及方法 |
CN104064194A (zh) * | 2014-06-30 | 2014-09-24 | 武汉大学 | 用于提高三维音频空间感距离感的参数编解码方法及系统 |
Non-Patent Citations (6)
Title |
---|
A 3D audio coding technique based on extracting the distance parameter;Cheng Yang et al.;《Multimedia and Expo (ICME), 2014 IEEE International Conference on》;20140908;全文 * |
Benefit-Cost Analysis of Security Systems for Multiple Protected Assets Based on Information Entropy;Jingjing Dai;《entropy 2012》;20120314;第571-580页 * |
Expanded three-channel mid/side coding for three-dimensional multichannel audio systems;Shi Dong et al.;《Springer EURASIP Journal on Audio, Speech, and Music Processing 2014》;20140110;第1-13页 * |
Protection Intensity Evaluation for a Security System Based on Entropy Theory;Haitao Lv et al.;《entropy》;20130717;第2766-2787页 * |
Sound intensity and particle velocity based three-dimensional panning methods by five loudspeakers;Song Wang et al.;《Multimedia and Expo (ICME), 2013 IEEE International Conference on》;20130926;全文 * |
面向多声道三维音频的和差压缩编码技术;董石 等;《通信学报》;20140630;第35卷(第6期);第148-153页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104240712A (zh) | 2014-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104240712B (zh) | 一种三维音频多声道分组聚类编码方法及系统 | |
CN1110145C (zh) | 可变规模语音编码/解码的方法和装置 | |
CN101199121B (zh) | 编码输入信号方法和编码器/译码器 | |
KR101679083B1 (ko) | 2개의 블록 변환으로의 중첩 변환의 분해 | |
CN106373583B (zh) | 基于理想软阈值掩模irm的多音频对象编、解码方法 | |
CN100571043C (zh) | 一种空间参数立体声编解码方法及其装置 | |
NZ599981A (en) | Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation | |
CN101223598B (zh) | 基于虚拟源位置信息的通道等级差量化和解量化方法 | |
EP2054881A4 (en) | AUDIO DECODING | |
CN101894560B (zh) | 一种无参考源的mp3音频清晰度客观评价方法 | |
CN107610710B (zh) | 一种面向多音频对象的音频编码及解码方法 | |
JP2009510514A (ja) | マルチチャネルオーディオ信号の符号化/復号化方法及び装置 | |
CN106463129A (zh) | 选择码簿以用于译码从高阶立体混响音频信号分解的向量 | |
JP2009518684A (ja) | チャネル間振幅スペクトルを用いた音声チャネルの抽出 | |
EP2661746A1 (en) | Multi-channel encoding and/or decoding | |
CN102737647A (zh) | 双声道音频音质增强编解码方法及装置 | |
JP2017520024A5 (zh) | ||
CN106981292A (zh) | 一种基于张量建模的多路空间音频信号压缩和恢复方法 | |
CN104464742A (zh) | 一种3d音频空间参数全方位非均匀量化编码系统及方法 | |
US9830919B2 (en) | Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method | |
CN101814289A (zh) | 低码率dra数字音频多声道编码方法及其系统 | |
CN108417219B (zh) | 一种适应于流媒体的音频对象编解码方法 | |
CN104347077B (zh) | 一种立体声编解码方法 | |
CN1641749A (zh) | 用于转换音频数据的方法和装置 | |
CN113314131B (zh) | 一种基于两级滤波的多步音频对象编解码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |