CN108550369A - 一种可变长度的全景声信号编解码方法 - Google Patents
一种可变长度的全景声信号编解码方法 Download PDFInfo
- Publication number
- CN108550369A CN108550369A CN201810334634.9A CN201810334634A CN108550369A CN 108550369 A CN108550369 A CN 108550369A CN 201810334634 A CN201810334634 A CN 201810334634A CN 108550369 A CN108550369 A CN 108550369A
- Authority
- CN
- China
- Prior art keywords
- frame
- audio
- data
- samples
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000005070 sampling Methods 0.000 claims abstract description 56
- 230000008521 reorganization Effects 0.000 claims description 11
- 238000002620 method output Methods 0.000 claims description 5
- 241001269238 Data Species 0.000 claims description 4
- 238000003780 insertion Methods 0.000 claims description 4
- 230000037431 insertion Effects 0.000 claims description 4
- 238000005215 recombination Methods 0.000 claims 1
- 230000006798 recombination Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明公开一种可变长度的全景声信号编解码方法,编码包括:计算所需编码全景声信号的音频样点数;将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;将整帧部分按标准方式编码,将短帧部分按短帧方式编码,将短帧的长度信息写在码流中的frame_length字段;解码包括:每次读取一个音频帧对应采样点数的码流数据;若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段进行解码。本发明能够在电影工程中对任意片段进行添加、删除、替换等操作,并可以完整、正确地进行编解码,而且不会影响已经编好的数据。
Description
技术领域
本发明涉及一种全景声信号编解码处理技术领域,具体涉及一种可变长度的全景声信号的编解码方法。
背景技术
经过多年发展,立体声、5.1、7.1环绕声等系统已经获得了广泛的应用,这些系统因缺乏声音的高度信息,最多只能呈现二维的声音。在真实的世界中,全景声(也称三维声)是声音最真实的呈现和表达方式,无论自然界、艺术领域或视听娱乐领域,全景声都是未来的发展趋势。
在现有的系统中,全景声可以是多声道信号(如9.1、11.1、13.1和22.2等),可以是多个声音对象,也可以是两者的组合。在全景声系统中,多声道信号可以是环绕声信号,如5.1、7.1等,也可以是多层多声道信号(即多层声道信号分布在不同高度平面)。例如,有些全景声系统采用中间层及顶层的两层平面,有些全景声系统采用三层系统等。有些全景声系统只有多层多声道信号,但没有声音对象,例如SMPTE的22.2三维声系统和AURO 9.1系统等。有些全景声系统则既有多层多声道信号,也有声音对象,例如MPEG-H、Dolby Atmos和DTS:X系统。当然,作为一个极端的例子,全景声也可以全部是声音对象信号。
一部全景声电影在制作、混录时普遍采用数字音频工作站(Digital AudioWorkstation,DAW),比如Pro Tools、Nuendo、Cubase、Logic Pro、Adobe Audition等。混录师可以将多声道音频和多个声音对象放入电影制作工程中,以达到全景声的听觉效果。电影在制作完毕后,需要对整部电影的音频数据进行符合全景声格式的音频编码,并将编码后的数据和视频一起封装成DCP包,拷贝至影院服务器,再通过全景声音频解码器播放出来,呈现给观众。
目前,这种全景声音频编解码技术可以将整部电影完整、正确地编解码,在放映端效果甚好。但有时,当整部电影完成编码后,导演组会临时调整一些画面或场景,那么相应的音频数据也会发生变化,所以要对所有被修改的数据重新进行编码,同时不能影响已经编好的其他数据。
按照现有的技术,音频编码的帧长是固定的,所以一旦音频数据重新组织后,必然会影响后面所有音频数据的组织方式。那么从修改的部分开始,直到电影结束,都需要重新编码,很浪费时间;而我们希望,仅重编修改过的部分。
发明内容
发明目的:本发明目的在于针对现有技术的不足,提供一种可变长度的全景声音频编解码方法,该方法在保证全景声电影能够完整、正确编解码的情况下,同时能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,从而在很大程度上对全景声音频编码技术进行了完善。
技术方案:本发明所述可变长度的全景声信号编码方法,包括如下步骤:
(1)计算所需编码全景声信号的音频样点数;
(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段。
上述编码方法输出码流的解码方法,包括如下步骤:
(1)每次读取一个音频帧对应采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段按如下规则进行解码:
一个音频帧对应j个采样点数,当读取第m个音频帧时,在j个样点之内的第n个样点位置,遇到了长度为k的音频帧,k≤1024,判断
(21)若n+k=1024,则输出第m帧音频数据;同时,若n>0,则在此之前先输出第m-1帧音频数据;
(22)若n+k>1024,此时输出第m-1帧,等待下次读取数据时解码第m帧;
(23)若n+k<1024,解码第m帧,并继续读取第m+1帧,令n=n+k,k=下一帧码流长度,然后重复步骤(21)、(22),直到n+k≥1024时,根据步骤(21)、(22)输出音频数据。
采用上述编解码方法能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,具体如下:
插入操作的编码方法:(1)计算插入点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(3)计算待插入视频帧的音频样点数;
(4)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则插入起点的前一个音频帧也一同重新组织;
(5)将步骤(4)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(6)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(7)将文件Data0拼接到步骤(6)输出的码流后面。
插入操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
删除操作的编码方法:(1)计算删除开始点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算删除终点对应的样点数;
(4)计算删除终点对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则删除起点的前一个音频帧也一同重新组织;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
删除操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
替换操作的编码方法:(1)计算替换开始处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算替换终点处视频帧对应的音频样点数;
(4)计算替换终点处视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则替换起点的前一个音频帧也一同重新组织;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
替换操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
有益效果:本发明提供的编解码方法在保证全景声电影能够完整、正确编解码的情况下,同时能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,从而在很大程度上对全景声音频编码技术进行了完善。
附图说明
图1为待编码的音频数据;
图2为现有技术的编码方式;
图3为本发明的编码方式;
图4为本发明的解码方式;
图5为实施例2的编解码方式;
图6为实施例3的编解码方式;
图7为实施例4的编解码方式。
具体实施方式
下面通过附图对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
实施例1:将图1所示音频数据进行编码时编码时,若某一帧的长度是k个样点(k<1024,称为短帧),现有技术是统一输出1024个样点,编码时会多编(1024-k)个样点,其frame_length字段如图2所示。如图3所示,按本发明提供的方法进行编码,则只输出长度为k个样点的码流,并将这个音频帧的长度信息写在码流中的frame_length字段(还需乘以位深和AES通道数)。
解码时,每次读取1024个样点的码流数据,并相应地解出至少一帧的音频数据。在这1024个样点之内,若在第n个样点位置(比如对应第m个音频帧)遇到了长度为k的音频帧(k≤1024),则根据码流中的长度信息frame_length进行解码。任何一帧码流只有在完整时才能解出音频数据。
1.n+k=1024,则输出第m帧音频数据。另外,若n>0,则在此之前先输出第m-1帧音频数据。
2.n+k>1024,由于k不能超过1024,所以n一定大于0。
此时输出第m-1帧,并能读到第m帧的前k个样点,但这帧数据不完整,所以本次解码不输出第m帧,等下次解码再输出;
3.若n+k<1024,则可以完整解出第m帧,并继续读取下一帧,令n=n+k,k=下一帧码流长度,然后重复上述过程,直到n+k≥1024再根据1)2)来决定输出的音频数据。在重复过程中,只要n>0,就输出前一帧数据。
图4表示遇到短帧时的解码过程,包括每次解码读取的码流数据(中)和输出的音频数据(下)。
实施例2:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图5所示,在电影的第1000个视频帧处插入200个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数
StartFrame=StartPos/1024=1953,再将第1953个音频帧之后的数据另存为一个文件Data0.pcm;
步骤3:计算需要插入的音频样点数InsertSamples=200*48000/24=400,000;
步骤4:计算所有需要重新组织的音频样点数
DataToReenc=InsertSamples+1024=401,024;
步骤5:重新组织音频数据
401,024=391*1024+640,共包含391个音频整帧和一个长度为640的短帧;
步骤6:将前391个音频帧按标准方式编码,每个音频帧输出1024个样点;将最后640个样点按照短帧方式编码,并输出640个样点;
步骤7:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+391=2344帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据。
步骤2:第2344次解码,读取的数据是长度为640的短帧以及第2345帧的前1024-640=384个数据,此时可以解出前640个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据。
步骤3:第2345次解码,读取的数据是第2345帧的后640个数据和第2346帧的前384个数据,此时第2345帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的640个样点+后一帧的384个样点。
实施例3:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图6所示,在电影的第1000个视频帧处删除300个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数StartFrame=StartPos/1024=1953;
步骤3:计算删除终点对应的样点数EndPos=1300*48000/24=2,600,000;‘’步骤4:计算删除终点对应的音频帧数EndFrame=EndPos/1024=2539,将第2539个音频帧之后的数据另存为一个文件Data0.pcm;
步骤5:计算所有需要重新组织的音频样点数
DataToReenc = (EndFrame-StartFrame+1)*1024 - (EndPos-StartPos) = 1088;
步骤6:重新组织音频数据
1088=1*1024+64,共包含1个音频整帧和一个长度为64的短帧;
步骤7:将第1个音频帧按标准方式编码,输出1024个样点;将最后64个样点按照短帧方式编码,并输出64个样点;
步骤8:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+1=1954帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据;
步骤2:第1954次解码,读取的数据是长度为64的短帧以及第1955帧的前1024-64=960个数据,此时可以解出前64个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据;
步骤3:第1955次解码,读取的数据是第1955帧的后64个数据和第1956帧的前960个数据,此时第1955帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的64个样点+后一帧的960个样点。
实施例4:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图7所示,在电影的第1000~1100个视频帧替换成200个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数StartFrame=StartPos/1024=1953;
步骤3:计算替换终点对应的样点数EndPos=1100*48000/24=2,200,000;
步骤4:计算替换终点对应的音频帧数EndFrame=EndPos/1024=2148,将第2148个音频帧之后的数据另存为一个文件Data0.pcm;
步骤5:计算所有需要重新组织的音频样点数
DataToReenc = (EndFrame-StartFrame+1)*1024 - (EndPos-StartPos) + 200*48000/24 = 400,704;
步骤6:重新组织音频数据
400,704=391*1024+320,共包含391个音频整帧和一个长度为320的短帧;
步骤7:将前391个音频帧按标准方式编码,每帧输出1024个样点;将最后320个样点按照短帧方式编码,并输出320个样点;
步骤8:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+391=2344帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据;
步骤2:第2344次解码,读取的数据是长度为320的短帧以及第2345帧的前1024-320=704个数据,此时可以解出前320个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据;
步骤3:第2345次解码,读取的数据是第2345帧的后320个数据和第2346帧的前704个数据,此时第2345帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的320个样点+后一帧的704个样点。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。
Claims (10)
1.一种可变长度的全景声信号编码方法,其特征在于,包括如下步骤:
(1)计算所需编码全景声信号的音频样点数;
(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段。
2.一种用于权利要求1编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段按如下规则进行解码:
一个音频帧对应j个采样点数,当读取第m个音频帧时,在j个样点之内的第n个样点位置,遇到了长度为k的音频帧,k≤1024,判断
(21)若n+k=1024,则输出第m帧音频数据;同时,若n>0,则在此之前先输出第m-1帧音频数据;
(22)若n+k>1024,此时输出第m-1帧,等待下次读取数据时解码第m帧;
(23)若n+k<1024,解码第m帧,并继续读取第m+1帧,令n=n+k,k=下一帧码流长度,然后重复步骤(21)、(22),直到n+k≥1024时,根据步骤(21)、(22)输出音频数据。
3.根据权利要求1所述全景声信号编码方法进行插入视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算插入点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(3)计算待插入视频帧的音频样点数;
(4)计算所有需要重新组织的音频样点数;
(5)将步骤(4)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(6)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(7)将文件Data0拼接到步骤(6)输出的码流后面。
4.一种用于权利要求3所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
5.根据权利要求1所述全景声信号编码方法进行删除视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算删除开始点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算删除终点对应的样点数;
(4)计算删除终点对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
6.一种用于权利要求5所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
7.根据权利要求1所述全景声信号编码方法进行替换视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算替换开始处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算替换终点处视频帧对应的音频样点数;
(4)计算替换终点处视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
8.一种用于权利要求7所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
9.根据权利要求3、5、7任一所述的编码方法,其特征在于:在计算所有需要重新组织的音频样点数时,如果采用了前后帧在时域上有交叠的编码方法,则重组数据之前的一个音频帧需要重新编码。
10.根据权利要求9所述的编码方法,其特征在于:所述前后帧在时域上有交叠的编码方法为ac3、aac、avs2中任一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810334634.9A CN108550369B (zh) | 2018-04-14 | 2018-04-14 | 一种可变长度的全景声信号编解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810334634.9A CN108550369B (zh) | 2018-04-14 | 2018-04-14 | 一种可变长度的全景声信号编解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108550369A true CN108550369A (zh) | 2018-09-18 |
CN108550369B CN108550369B (zh) | 2020-08-11 |
Family
ID=63514842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810334634.9A Active CN108550369B (zh) | 2018-04-14 | 2018-04-14 | 一种可变长度的全景声信号编解码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108550369B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109243471A (zh) * | 2018-09-26 | 2019-01-18 | 杭州联汇科技股份有限公司 | 一种快速编码广播用数字音频的方法 |
CN111445914A (zh) * | 2020-03-23 | 2020-07-24 | 全景声科技南京有限公司 | 可拆解和再编辑音频信号的处理方法及装置 |
CN111669577A (zh) * | 2020-06-30 | 2020-09-15 | 广州市百果园信息技术有限公司 | 一种硬件解码检测方法、装置、电子设备及存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1344106A (zh) * | 2000-09-15 | 2002-04-10 | 北京算通数字技术研究中心有限公司 | 基于mpeg-2码流的非线性编辑系统编辑方法 |
CN1477872A (zh) * | 2002-08-21 | 2004-02-25 | 中山正音数字技术有限公司 | 多声道数字音频信号的压缩编码和解码设备及其方法 |
CN1918629A (zh) * | 2003-09-29 | 2007-02-21 | 索尼电子有限公司 | 音频编码中的短窗分组方法 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
KR20090104674A (ko) * | 2008-03-31 | 2009-10-06 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
CN101582262A (zh) * | 2009-06-16 | 2009-11-18 | 武汉大学 | 一种空间音频参数帧间预测编解码方法 |
CN101604524A (zh) * | 2008-06-11 | 2009-12-16 | 北京天籁传音数字技术有限公司 | 立体声编码方法及其装置、立体声解码方法及其装置 |
CN101673549A (zh) * | 2009-09-28 | 2010-03-17 | 武汉大学 | 一种移动音源空间音频参数预测编解码方法及系统 |
US20110002393A1 (en) * | 2009-07-03 | 2011-01-06 | Fujitsu Limited | Audio encoding device, audio encoding method, and video transmission device |
CN102332266A (zh) * | 2010-07-13 | 2012-01-25 | 炬力集成电路设计有限公司 | 一种音频数据的编码方法及装置 |
CN103119879A (zh) * | 2010-09-29 | 2013-05-22 | 高通股份有限公司 | 用于确定控制字段和调制编码方案信息的系统、方法和装置 |
CN103632671A (zh) * | 2013-06-28 | 2014-03-12 | 华为软件技术有限公司 | 数据编解码方法、装置及数据通信系统 |
CN104240712A (zh) * | 2014-09-30 | 2014-12-24 | 武汉大学深圳研究院 | 一种三维音频多声道分组聚类编码方法及系统 |
CN106030704A (zh) * | 2013-12-16 | 2016-10-12 | 三星电子株式会社 | 用于对音频信号进行编码/解码的方法和设备 |
CN106463123A (zh) * | 2014-03-21 | 2017-02-22 | 杜比国际公司 | 用于压缩高阶高保真立体声(hoa)信号的方法、用于解压缩压缩的hoa信号的方法、用于压缩hoa信号的装置以及用于解压缩压缩的hoa信号的装置 |
-
2018
- 2018-04-14 CN CN201810334634.9A patent/CN108550369B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1344106A (zh) * | 2000-09-15 | 2002-04-10 | 北京算通数字技术研究中心有限公司 | 基于mpeg-2码流的非线性编辑系统编辑方法 |
CN1477872A (zh) * | 2002-08-21 | 2004-02-25 | 中山正音数字技术有限公司 | 多声道数字音频信号的压缩编码和解码设备及其方法 |
CN1918629A (zh) * | 2003-09-29 | 2007-02-21 | 索尼电子有限公司 | 音频编码中的短窗分组方法 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
KR20090104674A (ko) * | 2008-03-31 | 2009-10-06 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
CN101604524A (zh) * | 2008-06-11 | 2009-12-16 | 北京天籁传音数字技术有限公司 | 立体声编码方法及其装置、立体声解码方法及其装置 |
CN101582262A (zh) * | 2009-06-16 | 2009-11-18 | 武汉大学 | 一种空间音频参数帧间预测编解码方法 |
US20110002393A1 (en) * | 2009-07-03 | 2011-01-06 | Fujitsu Limited | Audio encoding device, audio encoding method, and video transmission device |
CN101673549A (zh) * | 2009-09-28 | 2010-03-17 | 武汉大学 | 一种移动音源空间音频参数预测编解码方法及系统 |
CN102332266A (zh) * | 2010-07-13 | 2012-01-25 | 炬力集成电路设计有限公司 | 一种音频数据的编码方法及装置 |
CN103119879A (zh) * | 2010-09-29 | 2013-05-22 | 高通股份有限公司 | 用于确定控制字段和调制编码方案信息的系统、方法和装置 |
CN103632671A (zh) * | 2013-06-28 | 2014-03-12 | 华为软件技术有限公司 | 数据编解码方法、装置及数据通信系统 |
CN106030704A (zh) * | 2013-12-16 | 2016-10-12 | 三星电子株式会社 | 用于对音频信号进行编码/解码的方法和设备 |
CN106463123A (zh) * | 2014-03-21 | 2017-02-22 | 杜比国际公司 | 用于压缩高阶高保真立体声(hoa)信号的方法、用于解压缩压缩的hoa信号的方法、用于压缩hoa信号的装置以及用于解压缩压缩的hoa信号的装置 |
CN104240712A (zh) * | 2014-09-30 | 2014-12-24 | 武汉大学深圳研究院 | 一种三维音频多声道分组聚类编码方法及系统 |
Non-Patent Citations (2)
Title |
---|
CHAO CHEN: "On spatially varying acoustic impedance due to high sound", 《JOURNAL OF SOUND AND VIBRATION》 * |
胡瑞敏等: "三维音频技术综述", 《数据采集与处理》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109243471A (zh) * | 2018-09-26 | 2019-01-18 | 杭州联汇科技股份有限公司 | 一种快速编码广播用数字音频的方法 |
CN109243471B (zh) * | 2018-09-26 | 2022-09-23 | 杭州联汇科技股份有限公司 | 一种快速编码广播用数字音频的方法 |
CN111445914A (zh) * | 2020-03-23 | 2020-07-24 | 全景声科技南京有限公司 | 可拆解和再编辑音频信号的处理方法及装置 |
CN111445914B (zh) * | 2020-03-23 | 2023-10-17 | 全景声科技南京有限公司 | 可拆解和再编辑音频信号的处理方法及装置 |
CN111669577A (zh) * | 2020-06-30 | 2020-09-15 | 广州市百果园信息技术有限公司 | 一种硬件解码检测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108550369B (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6538128B2 (ja) | オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化 | |
CN107533843B (zh) | 用于捕获、编码、分布和解码沉浸式音频的系统和方法 | |
JP6088444B2 (ja) | 3次元オーディオサウンドトラックの符号化及び復号 | |
KR101824287B1 (ko) | 고차 앰비소닉 오디오 데이터를 위한 데이터 구조 | |
CN110675882B (zh) | 用于对降混合矩阵解码及编码的方法、编码器及解码器 | |
EP3839946A1 (en) | Signaling audio rendering information in a bitstream | |
KR101760248B1 (ko) | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 | |
US7657428B2 (en) | System and method for seamless switching of compressed audio streams | |
CN101292428B (zh) | 用于编码/解码的方法和装置 | |
JP4338647B2 (ja) | オーディオ信号の構成を記述する方法 | |
EP3127109A1 (en) | Efficient coding of audio scenes comprising audio objects | |
CN108806706A (zh) | 处理信道信号的编码/解码装置及方法 | |
CN108550369A (zh) | 一种可变长度的全景声信号编解码方法 | |
KR20090053723A (ko) | 미디어 스트림에 데이터를 임베딩하는 방법 및 장치 | |
WO2021190039A1 (zh) | 可拆解和再编辑音频信号的处理方法及装置 | |
CN106375778B (zh) | 一种符合数字电影规范的三维音频节目码流传输的方法 | |
Kalliris et al. | Media management, sound editing and mixing | |
CN109801639B (zh) | 一种符合ac-3格式的全景声信号的编解码方法 | |
RU2383941C2 (ru) | Способ и устройство для кодирования и декодирования аудиосигналов | |
CN104796732A (zh) | 一种音视频编辑方法及装置 | |
KR101114431B1 (ko) | 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법 | |
CN105468711A (zh) | 一种音频处理方法及装置 | |
KR20080010980A (ko) | 부호화/복호화 방법 및 장치. | |
KR100208004B1 (ko) | 상하위 채널 오디오를 이용한 입체 음향 재생 장치 및 방법 | |
US9786286B2 (en) | Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220413 Address after: 101399 room 1001, building 1, No. 8, jinmayuan Third Street, Gaoliying Town, Shunyi District, Beijing Patentee after: Beijing panoramic sound information technology Co.,Ltd. Address before: No. 69, Shitou City, Gulou District, Nanjing, Jiangsu 210029 Patentee before: WAVARTS TECHNOLOGIES CO.,LTD. |