CN108550369A - 一种可变长度的全景声信号编解码方法 - Google Patents

一种可变长度的全景声信号编解码方法 Download PDF

Info

Publication number
CN108550369A
CN108550369A CN201810334634.9A CN201810334634A CN108550369A CN 108550369 A CN108550369 A CN 108550369A CN 201810334634 A CN201810334634 A CN 201810334634A CN 108550369 A CN108550369 A CN 108550369A
Authority
CN
China
Prior art keywords
frame
audio
data
samples
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810334634.9A
Other languages
English (en)
Other versions
CN108550369B (zh
Inventor
潘兴德
黄旭
吴超刚
陈笑天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing panoramic sound information technology Co.,Ltd.
Original Assignee
Panorama Technology Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panorama Technology Nanjing Co Ltd filed Critical Panorama Technology Nanjing Co Ltd
Priority to CN201810334634.9A priority Critical patent/CN108550369B/zh
Publication of CN108550369A publication Critical patent/CN108550369A/zh
Application granted granted Critical
Publication of CN108550369B publication Critical patent/CN108550369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开一种可变长度的全景声信号编解码方法,编码包括:计算所需编码全景声信号的音频样点数;将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;将整帧部分按标准方式编码,将短帧部分按短帧方式编码,将短帧的长度信息写在码流中的frame_length字段;解码包括:每次读取一个音频帧对应采样点数的码流数据;若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段进行解码。本发明能够在电影工程中对任意片段进行添加、删除、替换等操作,并可以完整、正确地进行编解码,而且不会影响已经编好的数据。

Description

一种可变长度的全景声信号编解码方法
技术领域
本发明涉及一种全景声信号编解码处理技术领域,具体涉及一种可变长度的全景声信号的编解码方法。
背景技术
经过多年发展,立体声、5.1、7.1环绕声等系统已经获得了广泛的应用,这些系统因缺乏声音的高度信息,最多只能呈现二维的声音。在真实的世界中,全景声(也称三维声)是声音最真实的呈现和表达方式,无论自然界、艺术领域或视听娱乐领域,全景声都是未来的发展趋势。
在现有的系统中,全景声可以是多声道信号(如9.1、11.1、13.1和22.2等),可以是多个声音对象,也可以是两者的组合。在全景声系统中,多声道信号可以是环绕声信号,如5.1、7.1等,也可以是多层多声道信号(即多层声道信号分布在不同高度平面)。例如,有些全景声系统采用中间层及顶层的两层平面,有些全景声系统采用三层系统等。有些全景声系统只有多层多声道信号,但没有声音对象,例如SMPTE的22.2三维声系统和AURO 9.1系统等。有些全景声系统则既有多层多声道信号,也有声音对象,例如MPEG-H、Dolby Atmos和DTS:X系统。当然,作为一个极端的例子,全景声也可以全部是声音对象信号。
一部全景声电影在制作、混录时普遍采用数字音频工作站(Digital AudioWorkstation,DAW),比如Pro Tools、Nuendo、Cubase、Logic Pro、Adobe Audition等。混录师可以将多声道音频和多个声音对象放入电影制作工程中,以达到全景声的听觉效果。电影在制作完毕后,需要对整部电影的音频数据进行符合全景声格式的音频编码,并将编码后的数据和视频一起封装成DCP包,拷贝至影院服务器,再通过全景声音频解码器播放出来,呈现给观众。
目前,这种全景声音频编解码技术可以将整部电影完整、正确地编解码,在放映端效果甚好。但有时,当整部电影完成编码后,导演组会临时调整一些画面或场景,那么相应的音频数据也会发生变化,所以要对所有被修改的数据重新进行编码,同时不能影响已经编好的其他数据。
按照现有的技术,音频编码的帧长是固定的,所以一旦音频数据重新组织后,必然会影响后面所有音频数据的组织方式。那么从修改的部分开始,直到电影结束,都需要重新编码,很浪费时间;而我们希望,仅重编修改过的部分。
发明内容
发明目的:本发明目的在于针对现有技术的不足,提供一种可变长度的全景声音频编解码方法,该方法在保证全景声电影能够完整、正确编解码的情况下,同时能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,从而在很大程度上对全景声音频编码技术进行了完善。
技术方案:本发明所述可变长度的全景声信号编码方法,包括如下步骤:
(1)计算所需编码全景声信号的音频样点数;
(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段。
上述编码方法输出码流的解码方法,包括如下步骤:
(1)每次读取一个音频帧对应采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段按如下规则进行解码:
一个音频帧对应j个采样点数,当读取第m个音频帧时,在j个样点之内的第n个样点位置,遇到了长度为k的音频帧,k≤1024,判断
(21)若n+k=1024,则输出第m帧音频数据;同时,若n>0,则在此之前先输出第m-1帧音频数据;
(22)若n+k>1024,此时输出第m-1帧,等待下次读取数据时解码第m帧;
(23)若n+k<1024,解码第m帧,并继续读取第m+1帧,令n=n+k,k=下一帧码流长度,然后重复步骤(21)、(22),直到n+k≥1024时,根据步骤(21)、(22)输出音频数据。
采用上述编解码方法能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,具体如下:
插入操作的编码方法:(1)计算插入点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(3)计算待插入视频帧的音频样点数;
(4)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则插入起点的前一个音频帧也一同重新组织;
(5)将步骤(4)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(6)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(7)将文件Data0拼接到步骤(6)输出的码流后面。
插入操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
删除操作的编码方法:(1)计算删除开始点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算删除终点对应的样点数;
(4)计算删除终点对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则删除起点的前一个音频帧也一同重新组织;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
删除操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
替换操作的编码方法:(1)计算替换开始处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算替换终点处视频帧对应的音频样点数;
(4)计算替换终点处视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则替换起点的前一个音频帧也一同重新组织;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
替换操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
有益效果:本发明提供的编解码方法在保证全景声电影能够完整、正确编解码的情况下,同时能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,从而在很大程度上对全景声音频编码技术进行了完善。
附图说明
图1为待编码的音频数据;
图2为现有技术的编码方式;
图3为本发明的编码方式;
图4为本发明的解码方式;
图5为实施例2的编解码方式;
图6为实施例3的编解码方式;
图7为实施例4的编解码方式。
具体实施方式
下面通过附图对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
实施例1:将图1所示音频数据进行编码时编码时,若某一帧的长度是k个样点(k<1024,称为短帧),现有技术是统一输出1024个样点,编码时会多编(1024-k)个样点,其frame_length字段如图2所示。如图3所示,按本发明提供的方法进行编码,则只输出长度为k个样点的码流,并将这个音频帧的长度信息写在码流中的frame_length字段(还需乘以位深和AES通道数)。
解码时,每次读取1024个样点的码流数据,并相应地解出至少一帧的音频数据。在这1024个样点之内,若在第n个样点位置(比如对应第m个音频帧)遇到了长度为k的音频帧(k≤1024),则根据码流中的长度信息frame_length进行解码。任何一帧码流只有在完整时才能解出音频数据。
1.n+k=1024,则输出第m帧音频数据。另外,若n>0,则在此之前先输出第m-1帧音频数据。
2.n+k>1024,由于k不能超过1024,所以n一定大于0。
此时输出第m-1帧,并能读到第m帧的前k个样点,但这帧数据不完整,所以本次解码不输出第m帧,等下次解码再输出;
3.若n+k<1024,则可以完整解出第m帧,并继续读取下一帧,令n=n+k,k=下一帧码流长度,然后重复上述过程,直到n+k≥1024再根据1)2)来决定输出的音频数据。在重复过程中,只要n>0,就输出前一帧数据。
图4表示遇到短帧时的解码过程,包括每次解码读取的码流数据(中)和输出的音频数据(下)。
实施例2:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图5所示,在电影的第1000个视频帧处插入200个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数
StartFrame=StartPos/1024=1953,再将第1953个音频帧之后的数据另存为一个文件Data0.pcm;
步骤3:计算需要插入的音频样点数InsertSamples=200*48000/24=400,000;
步骤4:计算所有需要重新组织的音频样点数
DataToReenc=InsertSamples+1024=401,024;
步骤5:重新组织音频数据
401,024=391*1024+640,共包含391个音频整帧和一个长度为640的短帧;
步骤6:将前391个音频帧按标准方式编码,每个音频帧输出1024个样点;将最后640个样点按照短帧方式编码,并输出640个样点;
步骤7:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+391=2344帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据。
步骤2:第2344次解码,读取的数据是长度为640的短帧以及第2345帧的前1024-640=384个数据,此时可以解出前640个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据。
步骤3:第2345次解码,读取的数据是第2345帧的后640个数据和第2346帧的前384个数据,此时第2345帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的640个样点+后一帧的384个样点。
实施例3:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图6所示,在电影的第1000个视频帧处删除300个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数StartFrame=StartPos/1024=1953;
步骤3:计算删除终点对应的样点数EndPos=1300*48000/24=2,600,000;‘’步骤4:计算删除终点对应的音频帧数EndFrame=EndPos/1024=2539,将第2539个音频帧之后的数据另存为一个文件Data0.pcm;
步骤5:计算所有需要重新组织的音频样点数
DataToReenc = (EndFrame-StartFrame+1)*1024 - (EndPos-StartPos) = 1088;
步骤6:重新组织音频数据
1088=1*1024+64,共包含1个音频整帧和一个长度为64的短帧;
步骤7:将第1个音频帧按标准方式编码,输出1024个样点;将最后64个样点按照短帧方式编码,并输出64个样点;
步骤8:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+1=1954帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据;
步骤2:第1954次解码,读取的数据是长度为64的短帧以及第1955帧的前1024-64=960个数据,此时可以解出前64个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据;
步骤3:第1955次解码,读取的数据是第1955帧的后64个数据和第1956帧的前960个数据,此时第1955帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的64个样点+后一帧的960个样点。
实施例4:假定视频帧率是24fps,音频采样率是48000Hz,音频位深是24bit。
如图7所示,在电影的第1000~1100个视频帧替换成200个视频帧的编码方法如下:
步骤1:计算第1000个视频帧对应的音频样点数
StartPos=1000*48000/24=2,000,000;
步骤2:计算第1000个视频帧对应的音频帧数StartFrame=StartPos/1024=1953;
步骤3:计算替换终点对应的样点数EndPos=1100*48000/24=2,200,000;
步骤4:计算替换终点对应的音频帧数EndFrame=EndPos/1024=2148,将第2148个音频帧之后的数据另存为一个文件Data0.pcm;
步骤5:计算所有需要重新组织的音频样点数
DataToReenc = (EndFrame-StartFrame+1)*1024 - (EndPos-StartPos) + 200*48000/24 = 400,704;
步骤6:重新组织音频数据
400,704=391*1024+320,共包含391个音频整帧和一个长度为320的短帧;
步骤7:将前391个音频帧按标准方式编码,每帧输出1024个样点;将最后320个样点按照短帧方式编码,并输出320个样点;
步骤8:将Data0拼接到后面。
上述编码输出码流的解码过程如下:(此过程涉及的“帧”均指音频帧,包括整帧和短帧):
步骤1:从影片开头,直到1953+391=2344帧,每次解码读取1024个样点的码流数据,并输出1024个样点的音频数据;
步骤2:第2344次解码,读取的数据是长度为320的短帧以及第2345帧的前1024-320=704个数据,此时可以解出前320个数据,但下一帧的数据不完整,所以这帧没有输出任何音频数据;
步骤3:第2345次解码,读取的数据是第2345帧的后320个数据和第2346帧的前704个数据,此时第2345帧的数据已经完整,可以输出1024个样点的数据。后面以此类推,每次读取的数据都是前一帧的320个样点+后一帧的704个样点。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。

Claims (10)

1.一种可变长度的全景声信号编码方法,其特征在于,包括如下步骤:
(1)计算所需编码全景声信号的音频样点数;
(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段。
2.一种用于权利要求1编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段按如下规则进行解码:
一个音频帧对应j个采样点数,当读取第m个音频帧时,在j个样点之内的第n个样点位置,遇到了长度为k的音频帧,k≤1024,判断
(21)若n+k=1024,则输出第m帧音频数据;同时,若n>0,则在此之前先输出第m-1帧音频数据;
(22)若n+k>1024,此时输出第m-1帧,等待下次读取数据时解码第m帧;
(23)若n+k<1024,解码第m帧,并继续读取第m+1帧,令n=n+k,k=下一帧码流长度,然后重复步骤(21)、(22),直到n+k≥1024时,根据步骤(21)、(22)输出音频数据。
3.根据权利要求1所述全景声信号编码方法进行插入视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算插入点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(3)计算待插入视频帧的音频样点数;
(4)计算所有需要重新组织的音频样点数;
(5)将步骤(4)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(6)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(7)将文件Data0拼接到步骤(6)输出的码流后面。
4.一种用于权利要求3所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
5.根据权利要求1所述全景声信号编码方法进行删除视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算删除开始点处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算删除终点对应的样点数;
(4)计算删除终点对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
6.一种用于权利要求5所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
7.根据权利要求1所述全景声信号编码方法进行替换视频帧的编码方法,其特征在于,包括如下步骤:
(1)计算替换开始处一个视频帧对应的音频样点数;
(2)计算步骤(1)视频帧对应的音频帧数;
(3)计算替换终点处视频帧对应的音频样点数;
(4)计算替换终点处视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;
(5)计算所有需要重新组织的音频样点数;
(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;
(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;
(8)将文件Data0拼接到步骤(7)输出的码流后面。
8.一种用于权利要求7所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:
(1)每次读取一个音频帧对应j个采样点数的码流数据;
(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;
(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;
(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。
9.根据权利要求3、5、7任一所述的编码方法,其特征在于:在计算所有需要重新组织的音频样点数时,如果采用了前后帧在时域上有交叠的编码方法,则重组数据之前的一个音频帧需要重新编码。
10.根据权利要求9所述的编码方法,其特征在于:所述前后帧在时域上有交叠的编码方法为ac3、aac、avs2中任一种。
CN201810334634.9A 2018-04-14 2018-04-14 一种可变长度的全景声信号编解码方法 Active CN108550369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810334634.9A CN108550369B (zh) 2018-04-14 2018-04-14 一种可变长度的全景声信号编解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810334634.9A CN108550369B (zh) 2018-04-14 2018-04-14 一种可变长度的全景声信号编解码方法

Publications (2)

Publication Number Publication Date
CN108550369A true CN108550369A (zh) 2018-09-18
CN108550369B CN108550369B (zh) 2020-08-11

Family

ID=63514842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810334634.9A Active CN108550369B (zh) 2018-04-14 2018-04-14 一种可变长度的全景声信号编解码方法

Country Status (1)

Country Link
CN (1) CN108550369B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243471A (zh) * 2018-09-26 2019-01-18 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
CN111445914A (zh) * 2020-03-23 2020-07-24 全景声科技南京有限公司 可拆解和再编辑音频信号的处理方法及装置
CN111669577A (zh) * 2020-06-30 2020-09-15 广州市百果园信息技术有限公司 一种硬件解码检测方法、装置、电子设备及存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1344106A (zh) * 2000-09-15 2002-04-10 北京算通数字技术研究中心有限公司 基于mpeg-2码流的非线性编辑系统编辑方法
CN1477872A (zh) * 2002-08-21 2004-02-25 中山正音数字技术有限公司 多声道数字音频信号的压缩编码和解码设备及其方法
CN1918629A (zh) * 2003-09-29 2007-02-21 索尼电子有限公司 音频编码中的短窗分组方法
CN101197577A (zh) * 2006-12-07 2008-06-11 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
KR20090104674A (ko) * 2008-03-31 2009-10-06 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
CN101582262A (zh) * 2009-06-16 2009-11-18 武汉大学 一种空间音频参数帧间预测编解码方法
CN101604524A (zh) * 2008-06-11 2009-12-16 北京天籁传音数字技术有限公司 立体声编码方法及其装置、立体声解码方法及其装置
CN101673549A (zh) * 2009-09-28 2010-03-17 武汉大学 一种移动音源空间音频参数预测编解码方法及系统
US20110002393A1 (en) * 2009-07-03 2011-01-06 Fujitsu Limited Audio encoding device, audio encoding method, and video transmission device
CN102332266A (zh) * 2010-07-13 2012-01-25 炬力集成电路设计有限公司 一种音频数据的编码方法及装置
CN103119879A (zh) * 2010-09-29 2013-05-22 高通股份有限公司 用于确定控制字段和调制编码方案信息的系统、方法和装置
CN103632671A (zh) * 2013-06-28 2014-03-12 华为软件技术有限公司 数据编解码方法、装置及数据通信系统
CN104240712A (zh) * 2014-09-30 2014-12-24 武汉大学深圳研究院 一种三维音频多声道分组聚类编码方法及系统
CN106030704A (zh) * 2013-12-16 2016-10-12 三星电子株式会社 用于对音频信号进行编码/解码的方法和设备
CN106463123A (zh) * 2014-03-21 2017-02-22 杜比国际公司 用于压缩高阶高保真立体声(hoa)信号的方法、用于解压缩压缩的hoa信号的方法、用于压缩hoa信号的装置以及用于解压缩压缩的hoa信号的装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1344106A (zh) * 2000-09-15 2002-04-10 北京算通数字技术研究中心有限公司 基于mpeg-2码流的非线性编辑系统编辑方法
CN1477872A (zh) * 2002-08-21 2004-02-25 中山正音数字技术有限公司 多声道数字音频信号的压缩编码和解码设备及其方法
CN1918629A (zh) * 2003-09-29 2007-02-21 索尼电子有限公司 音频编码中的短窗分组方法
CN101197577A (zh) * 2006-12-07 2008-06-11 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
KR20090104674A (ko) * 2008-03-31 2009-10-06 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
CN101604524A (zh) * 2008-06-11 2009-12-16 北京天籁传音数字技术有限公司 立体声编码方法及其装置、立体声解码方法及其装置
CN101582262A (zh) * 2009-06-16 2009-11-18 武汉大学 一种空间音频参数帧间预测编解码方法
US20110002393A1 (en) * 2009-07-03 2011-01-06 Fujitsu Limited Audio encoding device, audio encoding method, and video transmission device
CN101673549A (zh) * 2009-09-28 2010-03-17 武汉大学 一种移动音源空间音频参数预测编解码方法及系统
CN102332266A (zh) * 2010-07-13 2012-01-25 炬力集成电路设计有限公司 一种音频数据的编码方法及装置
CN103119879A (zh) * 2010-09-29 2013-05-22 高通股份有限公司 用于确定控制字段和调制编码方案信息的系统、方法和装置
CN103632671A (zh) * 2013-06-28 2014-03-12 华为软件技术有限公司 数据编解码方法、装置及数据通信系统
CN106030704A (zh) * 2013-12-16 2016-10-12 三星电子株式会社 用于对音频信号进行编码/解码的方法和设备
CN106463123A (zh) * 2014-03-21 2017-02-22 杜比国际公司 用于压缩高阶高保真立体声(hoa)信号的方法、用于解压缩压缩的hoa信号的方法、用于压缩hoa信号的装置以及用于解压缩压缩的hoa信号的装置
CN104240712A (zh) * 2014-09-30 2014-12-24 武汉大学深圳研究院 一种三维音频多声道分组聚类编码方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHAO CHEN: "On spatially varying acoustic impedance due to high sound", 《JOURNAL OF SOUND AND VIBRATION》 *
胡瑞敏等: "三维音频技术综述", 《数据采集与处理》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243471A (zh) * 2018-09-26 2019-01-18 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
CN109243471B (zh) * 2018-09-26 2022-09-23 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
CN111445914A (zh) * 2020-03-23 2020-07-24 全景声科技南京有限公司 可拆解和再编辑音频信号的处理方法及装置
CN111445914B (zh) * 2020-03-23 2023-10-17 全景声科技南京有限公司 可拆解和再编辑音频信号的处理方法及装置
CN111669577A (zh) * 2020-06-30 2020-09-15 广州市百果园信息技术有限公司 一种硬件解码检测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN108550369B (zh) 2020-08-11

Similar Documents

Publication Publication Date Title
JP6538128B2 (ja) オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化
CN107533843B (zh) 用于捕获、编码、分布和解码沉浸式音频的系统和方法
JP6088444B2 (ja) 3次元オーディオサウンドトラックの符号化及び復号
KR101824287B1 (ko) 고차 앰비소닉 오디오 데이터를 위한 데이터 구조
CN110675882B (zh) 用于对降混合矩阵解码及编码的方法、编码器及解码器
EP3839946A1 (en) Signaling audio rendering information in a bitstream
KR101760248B1 (ko) 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩
US7657428B2 (en) System and method for seamless switching of compressed audio streams
CN101292428B (zh) 用于编码/解码的方法和装置
JP4338647B2 (ja) オーディオ信号の構成を記述する方法
EP3127109A1 (en) Efficient coding of audio scenes comprising audio objects
CN108806706A (zh) 处理信道信号的编码/解码装置及方法
CN108550369A (zh) 一种可变长度的全景声信号编解码方法
KR20090053723A (ko) 미디어 스트림에 데이터를 임베딩하는 방법 및 장치
WO2021190039A1 (zh) 可拆解和再编辑音频信号的处理方法及装置
CN106375778B (zh) 一种符合数字电影规范的三维音频节目码流传输的方法
Kalliris et al. Media management, sound editing and mixing
CN109801639B (zh) 一种符合ac-3格式的全景声信号的编解码方法
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
CN104796732A (zh) 一种音视频编辑方法及装置
KR101114431B1 (ko) 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법
CN105468711A (zh) 一种音频处理方法及装置
KR20080010980A (ko) 부호화/복호화 방법 및 장치.
KR100208004B1 (ko) 상하위 채널 오디오를 이용한 입체 음향 재생 장치 및 방법
US9786286B2 (en) Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220413

Address after: 101399 room 1001, building 1, No. 8, jinmayuan Third Street, Gaoliying Town, Shunyi District, Beijing

Patentee after: Beijing panoramic sound information technology Co.,Ltd.

Address before: No. 69, Shitou City, Gulou District, Nanjing, Jiangsu 210029

Patentee before: WAVARTS TECHNOLOGIES CO.,LTD.