CN112400280A - 信息处理装置、信息处理系统、程序和信息处理方法 - Google Patents
信息处理装置、信息处理系统、程序和信息处理方法 Download PDFInfo
- Publication number
- CN112400280A CN112400280A CN201980040819.1A CN201980040819A CN112400280A CN 112400280 A CN112400280 A CN 112400280A CN 201980040819 A CN201980040819 A CN 201980040819A CN 112400280 A CN112400280 A CN 112400280A
- Authority
- CN
- China
- Prior art keywords
- data
- information processing
- top position
- block
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3053—Block-companding PCM systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6058—Saving memory space in the encoder or decoder
Abstract
[问题]提供一种信息处理装置、信息处理系统、程序以及信息处理方法,其能够在不需要大的内存资源的情况下执行解码。[解决方法]根据本技术的信息处理装置包括解码单元。解码单元获取包括在压缩音频数据的每个帧中的多个信道的每个数据集的头部位置,并且从头部位置解码多个信道的每个数据集到预定大小的每个块。
Description
技术领域
本技术涉及一种与压缩音频数据的解码有关的信息处理装置,信息处理系统,程序和信息处理方法。
背景技术
一些用于声音的压缩编解码器,例如自由无损音频编解码器(FLAC),具有较大的帧长度。当由具有大帧长度的这种压缩编解码器压缩的数据被解码时,用于存储压缩数据(基本流)的内存和用于存储脉冲编码调制(PCM)数据的内存都需要具有大的尺寸(例如,参见专利文献1)。
引用列表
专利文献
专利文献1:JP-A-2009-500681
发明内容
技术问题
然而,当使用具有大帧长度的压缩编解码器时,从设备所需的功率、尺寸和成本的观点来看,可能难以分配大的内存资源。
特别地,由于设备的条件在可穿戴终端,IoT(物联网),经由网状网络的M2M(机器对机器)等中受到限制,因此不容易分配内存资源。另一方面,这些设备的应用还具有使用诸如自由无损音频编解码器的高分辨率和无损压缩编解码器的请求。
鉴于上述情况,本技术的目的是提供一种信息处理装置,信息处理系统,程序和信息处理方法,其能够在不需要大的内存资源的情况下执行解码。
解决问题的方法
为了实现上述目的,根据本技术的信息处理装置包括解码器。
解码器获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从顶部位置针对具有预定大小的每个块解码多个信道的数据。
根据该配置,由于解码器对每个块解码压缩音频数据,因此可以减少解码所需的存储器资源。特别地,诸如自由无损音频编解码器的压缩编解码器具有大的帧大小,这通常使得具有小内存资源的设备难以执行解码。另一方面,如果以块为单位执行解码,则即使具有小内存资源的设备也可以执行解码。
压缩音频数据的每个帧可以从帧的顶部依次包括第一信道的数据和第二信道的数据。
解码器可以从第一信道中的顶部位置解码第一块,从第二信道中的顶部位置解码第二块,从第一信道中的第一块的结束位置解码第三块,以及从第二信道中的第二块的结束位置解码第四块。
信息处理装置还可以包括指定顶部位置的解析器单元。
解析器单元可以解码压缩音频数据并指定顶部位置。
压缩音频数据的每个帧可以从帧的顶部依次包括第一信道的数据和第二信道的数据。
解析器单元可以解码第一信道的数据,并且将第一信道的数据的结束位置指定为第二信道的数据的顶部位置。
解析器单元可以根据压缩音频数据的元信息指定顶部位置。
解析器单元可以指定顶部位置,并且生成包括顶部位置的压缩音频数据的元信息。
解码器可以通过使用包括在元信息中的顶部位置,从顶部位置针对具有预定大小的每个块解码多个信道的数据。
解析器单元可以生成包括元信息的压缩音频数据。
解析器单元可以生成包括元信息的元信息文件。
信息处理装置还可以包括渲染单元,在解码器解码第一块和第二块之后,渲染第一块的音频数据和第二块的音频数据。
为了实现上述目的,根据本技术的信息处理系统包括第一信息处理装置和第二信息处理装置。
第一信息处理装置包括解码器,该解码器获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从顶部位置针对具有预定大小的每个块解码多个信道的数据。
第二信息处理装置包括指定顶部位置的解析器单元。
为了实现上述目的,根据本技术的程序使信息处理装置作为解码器操作。
解码器获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从顶部位置针对具有预定大小的每个块解码多个信道的数据。
为了实现上述目的,根据本技术的信息处理方法包括:通过解码器,获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从顶部位置针对具有预定大小的每个块解码多个信道的数据。
发明的有利效果
如上所述,根据本技术,可以提供不需要大的内存资源就能够执行解码的信息处理装置,信息处理系统,程序和信息处理方法。注意,这里描述的效果不一定是限制性的,并且可以提供本公开中描述的任何效果。
附图说明
[图1]图1是示出一般解码过程中内存资源的使用模式的示意图。
[图2]图2是示出用于解码过程中的压缩音频数据的解码方法的示意图。
[图3]图3是示出由解码过程生成的音频数据的数据结构的示意图。
[图4]图4是示出根据本技术的第一实施例的信息处理装置的功能配置的方框图。
[图5]图5是示出压缩音频数据中的信道顶部位置的示意图。
[图6]图6是示出信息处理装置的解析器单元的解码模式(指定信道顶部位置)的示意图。
[图7]图7是示出信息处理装置的解码器的解码模式的示意图。
[图8]图8是示出由信息处理装置的解码器生成的音频数据的数据结构的示意图。
[图9]图9是示出信息处理装置的解码器的解码顺序的示意图。
[图10]图10是示出由信息处理装置的解码器生成的音频数据的数据结构的示意图。
[图11]图11是示出信息处理装置的硬件配置的方框图。
[图12]图12是示出根据本技术的第二实施例的信息处理装置的功能配置的方框图。
[图13]图13是由信息处理装置的解析器单元生成的元信息文件的示例。
[图14]图14是压缩音频数据的元信息嵌入部分的示例,其具有由信息处理装置的解码器单元生成的元信息。
具体实施方式
实现本发明的方式
(关于一般解码中的内存资源)
在描述本技术的实施例之前,将给出在压缩音频数据的一般解码过程中内存资源的使用模式的描述。
图1是示出一般解码过程中内存资源的使用模式的示意图。这里,将描述对由自由无损音频编解码器(FLAC)压缩的压缩音频数据(基本流(ES))进行解码并生成脉冲编码调制(PCM)数据的过程。
解码器301从存储器302读取基本流并将其存储在基本流缓冲器1中。此外,解码器301对基本流缓冲器1的压缩音频数据进行解码,并将通过解码生成的脉冲编码调制数据存储在脉冲编码调制缓冲器1中。
图2是示出立体声音频的基本流数据的数据结构的示意图。如图所示,基本流包括流头(流头),帧头(帧头),左信道数据(左日期)和右信道数据(右日期)。基本流包括多个帧F。每个帧F包括帧头,左信道数据和右信道数据。
解码器301将一个帧的基本流存储在基本流缓冲器1中并对基本流进行解码。此外,在解码期间,解码器301需要预先从存储器302读取下一帧的基本流,并将读取的基本流存储在基本流缓冲器2中。
图3是示出脉冲编码调制数据的数据结构的示意图。如图所示,帧F包括左信道数据(左日期)和右信道数据(右日期)。渲染单元303渲染脉冲编码调制数据以产生音频信号,并使扬声器304输出音频信号。
当渲染单元303渲染脉冲编码调制缓冲器2的脉冲编码调制数据时,解码器301将下一帧的基本流解码为脉冲编码调制数据,并将解码的基本流存储在脉冲编码调制缓冲器1中。
以这种方式,一般解码过程同时需要基本流缓冲器1、基本流缓冲器2、脉冲编码调制缓冲器1和脉冲编码调制缓冲器2中的至少四个内存缓冲器。
这里,在诸如自由无损音频编解码器的一些音频编解码器中,一帧的大小很大,并且所需的内存缓冲器的量也很大。例如,如果一个帧的大小大约为500KB,则四个内存缓冲区大约需要2MB。这种内存缓冲器难以在具有有限内存资源的设备中分配,例如IoT(物联网)或M2M(机器对机器)。
(关于分割解码)
在如上所述以块为单位执行解码的情况下,需要大的内存资源。这里,如果可以以帧或更小的单位执行解码(分割解码),则可以减少用于解码的内存资源。
在通常的音频压缩中,在帧时间的采样频率上执行采样。以这样的方式,数据被转换成频域的特征量的集合,然后基于人类听觉模型算法等进行压缩。
在这种情况下,为了解压缩压缩的音频,必须以帧为单位执行操作,并且必须以帧为单位分配内存资源。然而,在诸如自由无损音频编解码器的不在采样频率上执行采样的音频压缩中,不需要以帧为单位执行操作,并且以帧或更小的单位进行分割解码可以被固有地执行。
此外,即使在在采样频率上执行采样的音频压缩中,在要采样的音频数据的单位小于帧大小的情况下,也可以以帧或更小的单位(以频率转换的单位)进行分割解码。
然而,音频压缩格式通常假定以帧为单位进行解码。因此,即使尝试分割解码,也不知道右信道数据的顶部位置(图2中的右日期),并且因此分割解码的执行失败。在本技术中,指定右信道数据的顶部位置允许执行分割解码,如下所述
(第一实施例)
将描述根据本技术的第一实施例的信息处理装置。
图4是示出根据本实施例的信息处理装置100的功能配置的方框图。如图4所示,信息处理装置100包括存储器101、解析器单元102、解码器103、渲染单元104、以及输出单元105。
注意,存储器101和输出单元105可以与信息处理装置100分开设置,并且连接到信息处理装置100。
存储器101是诸如嵌入式多媒体卡(eMMC)或SD卡的存储设备,并且存储要由信息处理装置100解码的压缩音频数据D。压缩音频数据D是由诸如自由无损音频编解码器的压缩编解码器压缩的音频数据。
注意,能够通过本技术的方法解码的编解码器不限于自由无损音频编解码器,并且包括不对采样频率进行采样的压缩编解码器或对采样频率进行采样的压缩编解码器,其中以小于帧大小的音频数据为单位执行采样。特别地,Vorbis可以由本技术的方法解码。
解析器单元102从存储器101获取压缩音频数据D,并分析在流头和帧头中描述的语法。解析器单元102将作为解析结果的语法信息提供给解码器103.
此外,解析器单元102指定压缩音频数据D的每个帧中包括的每个信道的顶部位置(以下称为信道顶部位置)。图5是示出压缩音频数据D中的信道顶部位置的示意图。如图所示,解析器单元102指定左信道数据的顶部位置SL(左日期:以下,DL),并指定右信道数据的顶部位置SR(右日期:以下,DR)。
这里,由于顶部位置SL紧接在帧头之后,所以解析器单元102能够将帧头的结束位置设置为顶部位置SL。同时,顶部位置SR设置在左信道数据DL的后面,因此解析器单元102不能按原样指定顶部位置SR。
这里,解析器单元102能够通过解码来指定顶部位置SR。图6是示出解析器单元102的解码模式的示意图。如图中的白色箭头所示,解析器单元102从左信道数据DL的顶部执行解码。
当解析器单元102完成左信道数据DL的解码时,右信道数据DR的顶部位置SR被确定,并且因此解析器单元102能够指定顶部位置SR。
因此,解析器单元102只需要对左信道数据DL进行解码。注意,通过该解码生成的数据被删除,因为它没有被使用。因此,该处理不需要内存资源。
解析器单元102将信道顶部位置连同语法信息一起提供给解码器103。
解码器103使用信道顶部位置和语法信息对压缩音频数据进行解码。图7是示出解码器103的解码模式的示意图。如图所示,解码器103从存储器101读取块BL1,该块BL1是从左信道数据DL的顶部位置SL起具有预定大小的块,然后解码该块。
块BL1的大小没有特别限制,并且允许信息处理装置100优化可用内存资源的使用的大小是合适的。通常,块的大小大约是左信道数据的大小的3%到10%。
随后,解码器103从存储器101读取块BR1,该块BR1是从右信道数据DR的顶部位置SR起具有预定大小的块,然后解码该块。块BR1的大小几乎等于块BL1的大小,并且可以是右信道数据DR的大小的大约3%到10%。
图8是示出由解码器103生成的音频数据(脉冲编码调制数据)的数据结构的示意图。如图所示,生成作为块BL1的解码结果的音频数据PL1和作为块BR1的解码结果的音频数据PR1。
渲染单元104交错用于渲染音频数据PL1和音频数据PR1,并将生成的音频信号提供给输出单元105。输出单元105将音频信号提供给诸如扬声器的输出设备用于输出。
由于音频数据PL1和音频数据PR1分别从块BL1和块BR1生成,所以音频数据PL1和音频数据PR1具有比对应于从左信道数据DL和右信道数据DR生成的一个帧的音频数据的大小更小的大小(参见图3和图8)。
以下,解码器103对每个块的左信道数据DL和右信道数据DR进行解码,并且渲染单元104渲染所生成的音频数据。
图9是示出解码器103的解码器103的解码顺序的示意图,并且图10是示出由解码器103生成的音频数据(脉冲编码调制数据)的数据结构的示意图。
如图9所示,在解码块BR1之后,解码器103从块BL1的结束位置读取和解码具有预定大小的块BL2,并生成音频数据PL2。随后,解码器103从块BR1的结束位置读取和解码具有预定大小的块BR2,并生成音频数据PR2。
当生成音频数据PL2和音频数据PR2时,渲染单元104交错用于渲染音频数据PL2和音频数据PR2,并将所生成的音频信号提供给输出单元105.
以下,解码器103以类似的方式将块BL3和块BR3以及后面的块中的左信道数据DL和右信道数据DR解码到每个块的相应端位置,并生成音频数据。渲染单元104依次渲染音频数据。
对于下一帧和随后的帧,信息处理装置100以类似的过程执行解码。即,解析器单元102对压缩音频数据D的每个帧指定顶部位置SL和顶部位置SR,并且解码器103对每个块执行解码。渲染单元104渲染并输出对每个块生成的音频数据。
如上所述,由于解析器单元102指定信道顶部位置,因此解码器103能够对每个块的压缩音频数据D进行解码。结果,渲染单元104能够输出具有小尺寸的音频数据。
因此,存储在基本流缓冲器1和2以及脉冲编码调制缓冲器1和2中的每一个中的数据尺寸(参见图1)对应于大约两个块(两个左信道和右信道),这显著地小于在为每帧解码的情况下的数据尺寸(参见图2和3)。这可以减少解码所需的内存资源量。
此外,由于解析器单元也用于正常的解码过程,因此可以实现根据本技术的解码过程,而不需要特殊的处理引擎。
[修改示例]
在上述描述中,假设压缩音频数据D存储在存储器101中,但是压缩音频数据D可以存储在另一信息处理装置中或网络上,并且解析器单元102和解码器103可以通过通信来获取压缩音频数据。
此外,在以上描述中,假设左信道数据DL被布置在帧头的旁边,并且右信道数据DR被布置在左信道数据DL的旁边,但是左信道数据DL和右信道数据DR的顺序可以颠倒。在这种情况下,解析器单元102能够通过解码来指定左信道数据DL的顶部位置Sl。
此外,压缩音频数据不限于包括左右两个信道,而是可以包括诸如5.1信道或8信道的更多信道。即使在这种情况下,解析器单元102为每个信道指定信道顶部位置,这允许解码器103对每个块执行解码。
此外,假设解析器单元102通过解码来指定信道顶部位置,但是在压缩音频数据D预先包括指示信道顶部位置的信息的情况下,也可以通过使用该信息来指定信道顶部位置而不进行解码。
[关于硬件配置]
上述信息处理装置100的功能配置可以通过硬件和程序的协作来实现。
图11是示出信息处理装置100的硬件配置的示意图。如图所示,信息处理装置100包括作为硬件配置的中央处理单元(CPU)1001,内存1002,存储器1003和输入/输出单元(I/O)1004。它们通过总线1005彼此连接。
CPU1001根据存储在内存1002中的程序控制其它配置,并且还根据该程序执行数据处理并将处理结果存储在内存1002中。CPU 1001可以是微处理器。
内存1002存储要由CPU 1001执行的程序和数据。内存1002可以是随机存取存储器(RAM)。
存储器1003存储程序和数据。存储器1003可以是硬盘驱动器(HDD)或固态硬盘(SSD)。
输入/输出单元1004接收到信息处理装置100的输入,并且将信息处理装置100的输出提供到外部。输入/输出单元1004包括诸如触摸面板或键盘的输入设备,诸如显示器的输出设备,以及诸如网络的连接接口。
信息处理装置100的硬件配置不限于这里所示的硬件配置,并且可以是能够实现信息处理装置100的功能配置的任何硬件配置。此外,上述硬件配置的一部分或全部可以存在于网络上。
(第二实施例)
将描述根据本技术的第二实施例的信息处理装置。
图12是示出根据本实施例的信息处理装置200的功能配置的方框图。如图12所示,信息处理装置200包括存储器201、解析器单元202、解码器203、渲染单元204以及输出单元205。
注意,存储器201和输出单元205可以与信息处理装置200分开设置,并且连接到信息处理装置200。此外,解析器单元202也可以设置在不同于信息处理装置200的信息处理装置中,并且连接到存储器201。
存储器201是诸如嵌入式多媒体卡或SD卡的存储设备,并且存储要由信息处理装置200解码的压缩音频数据D。压缩音频数据D是由压缩编解码器(例如,如上所述的自由无损音频编解码器)压缩的音频数据。
与第一实施例类似,能够由信息处理装置200解码的编解码器不限于自由无损音频编解码器,并且包括不对采样频率采样的压缩编解码器或对采样频率采样的压缩编解码器,其中以小于帧大小的音频数据为单位执行采样。
此外,存储器201存储具有元信息的压缩音频数据E。具有元信息的压缩音频数据E是添加了元信息的压缩音频数据D,稍后将对其详细描述。
解析器单元202从存储器201获取压缩音频数据D,并分析在流头和帧头中描述的语法以生成语法信息。
此外,解析器单元202指定压缩音频数据D的每个帧中包括的每个信道的顶部位置(信道顶部位置)。信道顶部位置包括左信道数据DL的顶部位置SL和右信道数据DR的顶部位置SR(参见图5)。
由于顶部位置SL紧接在帧头之后,所以解析器单元202能够将帧头的结束位置设置为顶部位置SL。此外,解析器单元202能够以与第一实施例类似的方式从左信道数据DL的顶部执行解码(参见图6),并且获取顶部位置SR。
解析器单元202将包括信道顶部位置和语法信息的元信息添加到压缩音频数据D,以生成具有元信息的压缩音频数据E,并将具有元信息的压缩音频数据E存储在存储器201中。虽然稍后将描述元信息的具体示例,但元信息仅需要包括至少每个帧的每个信道的顶部位置。
解析器单元202生成具有元信息的压缩音频数据E可以在解码器203执行解码之前的可选的时间执行。
解码器203使用信道顶部位置和语法信息对压缩音频数据进行解码。解码器203能够从存储器201读取具有元信息的压缩音频数据E,并获取包含在具有元信息的压缩音频数据E中的信道顶部位置。
解码器203以与第一实施例类似的方式使用信道顶部位置来解码压缩音频数据D。即,解码器203从顶部位置SL读取作为左信道数据DL的一部分的块BL1,然后对块BL1进行解码,并且从顶部位置SR读取作为右信道数据DR的一部分的块BR1,然后对块BR1进行解码(参见图7)。
因此,生成作为块BL1的解码结果的音频数据PL1和块BR1的解码结果的音频数据PR1(参见图8)。
渲染单元204交错用于渲染音频数据PL1和音频数据PR1,并将生成的音频信号提供给输出单元205,输出单元205将音频信号提供给诸如扬声器的输出设备用于输出。
以下,以与第一实施例类似的方式,解码器203对每个块读取并解码左信道数据DL和右信道数据DR,并且渲染单元204渲染所生成的音频数据(参见图9)。
对于下一帧和后面的帧,信息处理装置200以类似的方式执行解码。即,解码器203从具有元信息的压缩音频数据E获取每个帧的信道顶部位置,并对每个块的压缩音频数据D进行解码。渲染单元204渲染并输出对每个块生成的音频数据。
如上所述,由于解析器单元202指定信道顶部位置,因此解码器203能够对每个块的压缩音频数据D进行解码。结果,渲染单元204能够输出具有小尺寸的音频数据。
因此,存储在基本流缓冲器1和2以及脉冲编码调制缓冲器1和2(参见图1)中的每一个中的数据尺寸对应于大约两个块(两个左信道和右信道),这显著地小于在对每帧解码的情况下的数据尺寸(参见图2和3)。这可以减少解码所需的内存资源量。
此外,在本实施例中,使用具有元信息的压缩音频数据E允许在解析器单元202和解码器203之间不进行同步操作的情况下执行解码。这使得解析器单元202和解码器203不太容易受到诸如处理量的波动等的影响。
此外,由于解析器单元202能够在接收到实际解码请求之前预先执行解析过程(语法分析和信道顶部位置的指定),因此在实际解码中不必执行解析过程,并且还可以减少音频复制过程中对处理器功率和存储的访问负载。
此外,元信息以预定格式定义,并且不是在边缘终端中(例如,可穿戴终端或物联网设备)而是在例如个人计算机,服务器,云等中被创建,并且因此,可以实现根据本实施例的解码,而不在边缘终端中执行解析过程。
另外,由于元信息保存在压缩的音频数据中,因此可以由音频复制终端选择通过本实施例的方法进行解码或正常解码。这允许压缩音频数据被复制而不论复制环境如何。
[修改示例]
当执行解析处理时,解析器单元202可以生成不包括压缩音频数据的元信息文件,而不是生成具有元信息的压缩音频数据E。
图13是元信息文件示例。如图所示,元信息文件可以是存储每个帧的每个信道数据的流信息和大小信息的文件。解码器203能够参考元信息从每个块的信道顶部位置执行解码。
此外,解析器单元202还能够将元信息存储在由音乐生成设备等拥有的数据库(播放列表数据等)中。
注意,在以上描述中,假定压缩音频数据D和具有元信息的压缩音频数据E存储在存储器201中,但是,这些数据可以存储在其他信息处理装置中或网络上,并且解析器单元202和解码器203可以通过通信来获取这些数据。
此外,在以上描述中,假设左信道数据DL被布置在帧头旁边,并且右信道数据DR被布置在左信道数据DL旁边,但是左信道数据DL和右信道数据DR的顺序可以颠倒。在这种情况下,解析器单元202能够通过解码获取左信道数据DL的顶部位置SL。
此外,压缩音频数据不限于包括左右两个信道,而是可以包括诸如5.1信道或8信道的更多信道。即使在这种情况下,解析器单元202为每个信道指定信道顶部位置,这允许解码器203对每个块执行解码。
[关于在自由无损音频编解码器中嵌入元信息的示例]
图14是由自由无损音频编解码器压缩的音频数据的语法的示例。如图所示,在元数据块中新创建了元数据块头的类型(例如,在块类型7中用作信道大小),以及图13所示的信道信息的数据格式写入到元数据块的实际状态,从而实现具有元信息的压缩音频数据E.
[关于硬件配置]
上述信息处理装置200的功能配置可以通过硬件和程序的协作来实现。信息处理装置200的硬件配置可以类似于根据第一实施例的硬件配置(参见图11)。
此外,如上所述,解析器单元202可以由与包括解码器203和渲染单元204的信息处理装置不同的信息处理装置来实现,即,本实施例可以由包括多个信息处理装置的信息处理系统来实现。
注意,本技术可以采用以下配置。
(1)一种信息处理装置,包括:
解码器,获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从顶部位置针对具有预定大小的每个块解码多个信道的数据。
(2)根据(1)所述的信息处理装置,其中,
压缩音频数据的每个帧从帧的顶部依次包括第一信道数据和第二信道数据,并且
解码器从第一信道中的顶部位置解码第一块,从第二信道中的顶部位置解码第二块,从第一信道中的第一块的结束位置解码第三块,以及从第二信道中的第二块的结束位置解码第四块。
(3)根据(1)或(2)所述的信息处理装置,进一步包括:
解析器单元,指定顶部位置。
(4)根据(3)所述的信息处理装置,其中,
解析器单元解码压缩音频数据并且指定顶部位置。
(5)根据(4)所述的信息处理装置,其中,
压缩音频数据的每个帧从帧的顶部依次包括第一信道的数据和第二信道的数据,并且
解析器单元解码第一信道的数据,并且将第一信道的数据的结束位置指定为第二信道的数据的顶部位置。
(6)根据(3)所述的信息处理装置,其中,
解析器单元根据压缩音频数据的元信息指定顶部位置。
(7)根据(4)或(5)所述的信息处理装置,其中,
解析器单元指定顶部位置,并且生成包括顶部位置的压缩音频数据的元信息,以及
解码器通过使用包括在元信息中的顶部位置,从顶部位置针对具有预定大小的每个块解码多个信道的数据。
(8)根据(7)所述的信息处理装置,其中,
解析器单元生成包括元信息的压缩音频数据。
(9)根据(7)所述的信息处理装置,其中
解析器单元生成包括元信息的元信息文件。
(10)根据(2)至(9)中任一项所述的信息处理装置,进一步包括:
渲染单元,在解码器解码第一块和第二块之后,渲染第一块的音频数据和第二块的音频数据。
(11)一种信息处理系统,包括:
第一信息处理装置,包括:
解码器,获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从顶部位置针对具有预定大小的每个块解码多个信道的数据;以及
第二信息处理装置,包括:
解析器单元,指定顶部位置。
(12)一种程序,其使信息处理装置作为解码器操作,该解码器获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从顶部位置针对具有预定大小的每个块解码多个信道的数据。
(13)一种信息处理方法,包括:
通过解码器,获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从顶部位置针对具有预定大小的每个块解码多个信道的数据。
参考标志列表
100 信息处理装置
101 存储器
102 解析器单元
103 解码器
104 渲染单元
105 输出单元
200 信息处理装置
201 存储器
202 解析器单元
203 解码器
204 渲染单元
205 输出单元
Claims (13)
1.一种信息处理装置,包括:
解码器,获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从所述顶部位置针对具有预定大小的每个块解码所述多个信道的所述数据。
2.根据权利要求1所述的信息处理装置,其中,
所述压缩音频数据的每个帧从所述帧的顶部依次包括第一信道的数据和第二信道的数据,并且
所述解码器从所述第一信道中的顶部位置解码第一块,从所述第二信道中的顶部位置解码第二块,从所述第一信道中的所述第一块的结束位置解码第三块,以及从所述第二信道中的所述第二块的结束位置解码第四块。
3.根据权利要求1所述的信息处理装置,进一步包括:
解析器单元,指定所述顶部位置。
4.根据权利要求3所述的信息处理装置,其中,
所述解析器单元解码所述压缩音频数据并且指定所述顶部位置。
5.根据权利要求4所述的信息处理装置,其中,
所述压缩音频数据的每个帧从所述帧的顶部依次包括第一信道的数据和第二信道的数据,并且
所述解析器单元解码所述第一信道的所述数据,并且将所述第一信道的所述数据的结束位置指定为所述第二信道的所述数据的顶部位置。
6.根据权利要求3所述的信息处理装置,其中,
所述解析器单元根据所述压缩音频数据的元信息指定所述顶部位置。
7.根据权利要求4所述的信息处理装置,其中,
所述解析器单元指定所述顶部位置,并且生成包括所述顶部位置的所述压缩音频数据的元信息,以及
所述解码器通过使用包括在所述元信息中的所述顶部位置,从所述顶部位置针对具有所述预定大小的每个块解码所述多个信道的所述数据。
8.根据权利要求7所述的信息处理装置,其中,
所述解析器单元生成包括所述元信息的压缩音频数据。
9.根据权利要求7所述的信息处理装置,其中,
所述解析器单元生成包括所述元信息的元信息文件。
10.根据权利要求2所述的信息处理装置,进一步包括:
渲染单元,在所述解码器解码所述第一块和所述第二块之后,渲染所述第一块的音频数据和所述第二块的音频数据。
11.一种信息处理系统,包括:
第一信息处理装置,包括:
解码器,所述解码器获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从所述顶部位置针对具有预定大小的每个块解码所述多个信道的所述数据;以及
第二信息处理装置,包括:
解析器单元,所述解析器单元指定所述顶部位置。
12.一种程序,所述程序使信息处理装置作为解码器操作,所述解码器获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从所述顶部位置针对具有预定大小的每个块解码所述多个信道的所述数据。
13.一种信息处理方法,包括,
通过解码器获取包括在压缩音频数据的每个帧中的多个信道的每段数据的顶部位置,并且从所述顶部位置针对具有预定大小的每个块解码所述多个信道的所述数据。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018-119738 | 2018-06-25 | ||
JP2018119738 | 2018-06-25 | ||
PCT/JP2019/023220 WO2020004027A1 (ja) | 2018-06-25 | 2019-06-12 | 情報処理装置、情報処理システム、プログラム及び情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112400280A true CN112400280A (zh) | 2021-02-23 |
Family
ID=68984834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980040819.1A Withdrawn CN112400280A (zh) | 2018-06-25 | 2019-06-12 | 信息处理装置、信息处理系统、程序和信息处理方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210210107A1 (zh) |
JP (1) | JP7247184B2 (zh) |
KR (1) | KR20210021968A (zh) |
CN (1) | CN112400280A (zh) |
DE (1) | DE112019003220T5 (zh) |
WO (1) | WO2020004027A1 (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6108584A (en) * | 1997-07-09 | 2000-08-22 | Sony Corporation | Multichannel digital audio decoding method and apparatus |
DE50101087D1 (de) * | 2000-04-14 | 2004-01-15 | Siemens Ag | Verfahren zum kanaldecodieren eines datenstroms mit nutzdaten und redundanzdaten, vorrichtung zum kanaldecodieren, computerlesbares speichermedium und computerprogramm-element |
US7830921B2 (en) * | 2005-07-11 | 2010-11-09 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
JP2009134115A (ja) * | 2007-11-30 | 2009-06-18 | Oki Semiconductor Co Ltd | デコーダ |
US8145974B2 (en) * | 2008-02-02 | 2012-03-27 | Broadcom Corporation | Virtual limited buffer modification for rate matching |
US9998890B2 (en) * | 2010-07-29 | 2018-06-12 | Paul Marko | Method and apparatus for content navigation in digital broadcast radio |
CN105376613B (zh) * | 2015-12-10 | 2019-05-10 | 华为技术有限公司 | 一种快速频道切换方法、服务器及iptv系统 |
JP7209456B2 (ja) * | 2016-08-08 | 2023-01-20 | ソニーグループ株式会社 | 基地局装置、端末装置、通信方法、及びプログラム |
-
2019
- 2019-06-12 KR KR1020207035312A patent/KR20210021968A/ko unknown
- 2019-06-12 WO PCT/JP2019/023220 patent/WO2020004027A1/ja active Application Filing
- 2019-06-12 DE DE112019003220.8T patent/DE112019003220T5/de not_active Withdrawn
- 2019-06-12 CN CN201980040819.1A patent/CN112400280A/zh not_active Withdrawn
- 2019-06-12 US US17/058,763 patent/US20210210107A1/en not_active Abandoned
- 2019-06-12 JP JP2020527375A patent/JP7247184B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2020004027A1 (ja) | 2021-08-05 |
US20210210107A1 (en) | 2021-07-08 |
JP7247184B2 (ja) | 2023-03-28 |
KR20210021968A (ko) | 2021-03-02 |
DE112019003220T5 (de) | 2021-04-08 |
WO2020004027A1 (ja) | 2020-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9667685B2 (en) | Systems and methods for encoding and decoding | |
WO2020155964A1 (zh) | 音视频的切换方法、装置、计算机设备及可读存储介质 | |
EP3643069B1 (en) | Effective encoding for screen data | |
US20230362224A1 (en) | Systems and methods for encoding and decoding | |
US11869523B2 (en) | Method and apparatus for decoding a bitstream including encoded higher order ambisonics representations | |
CN110888862A (zh) | 数据存储、查询方法、装置、服务器和存储介质 | |
CN107566090B (zh) | 一种定长/变长的文本报文处理方法及装置 | |
CN112689197B (zh) | 一种文件格式转换方法、装置、以及计算机存储介质 | |
US20130188739A1 (en) | Systems and methods for encoding, sharing, and decoding of multimedia | |
JP2007537642A (ja) | Xmlデータの構造化されたブロック単位の圧縮及び解凍方法及び装置 | |
CN112400280A (zh) | 信息处理装置、信息处理系统、程序和信息处理方法 | |
EP2981081B1 (en) | Methods and devices for coding and decoding depth information, and video processing and playing device | |
CA2816284C (en) | Encoding and decoding a multimedia signal using syntax to generate a dynamically configured decoder | |
US11200109B2 (en) | Method, device and computer program product for processing data | |
CN113066140A (zh) | 图像编码方法、装置、计算机设备及存储介质 | |
KR20100029010A (ko) | 멀티미디어 데이터를 처리하기 위한 다중 프로세서 시스템들 및 그것의 방법들 | |
CN111757168B (zh) | 音频解码方法、装置、存储介质及设备 | |
WO2015176009A1 (en) | Systems and methods for selecting digital data for archival | |
US11966597B1 (en) | Multi-domain configurable data compressor/de-compressor | |
US9059728B2 (en) | Random extraction from compressed data | |
US20240111439A1 (en) | Multi-domain configurable data compressor/de-compressor | |
CN111757119B (zh) | 一种软硬件协同工作实现vp9 prob更新的方法和存储设备 | |
CN111447490A (zh) | 流媒体文件处理方法及装置 | |
CN115344406A (zh) | 多媒体文件扫描方法、装置及电子设备 | |
CN111444225A (zh) | 通用指标解析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210223 |