CN101189678A - 具有最小存储要求的直接流数字音频 - Google Patents
具有最小存储要求的直接流数字音频 Download PDFInfo
- Publication number
- CN101189678A CN101189678A CNA200680019321XA CN200680019321A CN101189678A CN 101189678 A CN101189678 A CN 101189678A CN A200680019321X A CNA200680019321X A CN A200680019321XA CN 200680019321 A CN200680019321 A CN 200680019321A CN 101189678 A CN101189678 A CN 101189678A
- Authority
- CN
- China
- Prior art keywords
- signal
- pcm
- dsd
- bit stream
- loop filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3002—Conversion to or from differential modulation
- H03M7/3004—Digital delta-sigma modulation
- H03M7/3006—Compensating for, or preventing of, undesired influence of physical parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10009—Improvement or modification of read or write signals
- G11B20/10481—Improvement or modification of read or write signals optimisation methods
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
- G11B20/1262—Formatting, e.g. arrangement of data block or words on the record carriers with more than one format/standard, e.g. conversion from CD-audio format to R-DAT format
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
- G11B2020/00065—Sigma-delta audio encoding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
- G11B2020/1264—Formatting, e.g. arrangement of data block or words on the record carriers wherein the formatting concerns a specific kind of data
- G11B2020/1288—Formatting by padding empty spaces with dummy data, e.g. writing zeroes or random data when de-icing optical discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2541—Blu-ray discs; Blue laser DVR discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2579—HD-DVDs [high definition DVDs]; AODs [advanced optical discs]
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3002—Conversion to or from differential modulation
- H03M7/3004—Digital delta-sigma modulation
- H03M7/3015—Structural details of digital delta-sigma modulators
- H03M7/302—Structural details of digital delta-sigma modulators characterised by the number of quantisers and their type and resolution
- H03M7/3024—Structural details of digital delta-sigma modulators characterised by the number of quantisers and their type and resolution having one quantiser only
- H03M7/3028—Structural details of digital delta-sigma modulators characterised by the number of quantisers and their type and resolution having one quantiser only the quantiser being a single bit one
Abstract
一种允许PCM信号向无损DSD信号扩展的、用于下一代光盘格式的音频编码方案。对输入DSD信号进行编码的方法包括上采样相应的PCM信号至DSD采样率。然后通过或者使用∑-Δ调制器的随机启动条件或者包括同步参数,来生成用于∑-Δ调制器的噪声整形环路的一组环路滤波器参数。这将允许解码器重新生成一个几乎完美的信号,但是它仍然需要一个校正信号以便能够逐位相同地重新生成DSD输入信号。因此,基于被上采样的PCM信号的∑-Δ调制的版本和输入DSD信号之间的差别,生成校正信号,其中,使用该组环路滤波器参数来获得被上采样的PCM信号的∑-Δ调制版本。可以适配该校正信号以便将其应用于低位PCM信号、被上采样的PCM信号或输出位流。最后,产生一个扩展位流,其中包括该组环路滤波器参数的被编码的版本和校正信号的被编码的版本。基于已经可用的PCM信号和已描述的扩展位流,解码器可以再生原始的DSD信号。这样,因为已经可用的PCM信号被与扩展位流结合使用,所以该编码方案使得能够以最小存储开销实现最优质的音频。因为只有一个附加数据流被要求存储在盘上,例如作为MPEG流的一部分,所以DSD功能性可加入已存在的系统而不引起兼容性问题。
Description
技术领域
本发明涉及高质量音频编码的领域。特别是,本发明涉及直接流数字(DSD)音频数据,亦即位流音频数据的编码的领域。本发明包括DSD信号的编码和解码的方法、用于DSD信号的编码器和解码器、被编码的DSD信号、和包括DSD信号编码器的设备以及包括DSD解码器的设备。
背景技术
随着新的光盘格式HD-DVD和蓝光盘的推出,高分辨率视频被引入。伴随这种高质量的视频,更高质量的PCM音频也变得可用。这种变化的一个明确的指征是DTS++无损音频作为强制格式被纳入。由DSD传递的最优质的音频,在Philips/SONY超级音频CD中所使用的音频格式,尚不是这些标准的一部分。虽然这些新格式的盘容量较大,但音频数据可用的空间却有限。
EP 0 890 949 A2描述一种数字音频处理系统,其能够接收输入位流信号或DSD信号,使用抽选过滤器(decimation filter)生成相应的PCM信号及基于在输入位流和从被生成的PCM信号的位流转换版本而生成的位流之间的差别生成残留数据信号,这种位流转换由∑-Δ(增量求和,sigma-delta)调制器33执行,如EP0 890 949 A2的图3所示。基于被生成的PCM信号和该残留数据信号的被编码的版本,位流信号或DSD信号可以被再生。于是,在记录方和再生方之间的存储介质仅需要存储被生成的PCM信号和残留数据信号的被编码版本,以便再生输入位流信号。
然而,EP 0 890 949 A2中描述的系统有许多不足之处。例如,如果∑-Δ调制器33与用于生成输入位流信号的原始∑-Δ调制器不同,则生成的位流可能与输入位流有很大的不同,这样,残留数据信号将是显著的并且几乎是一个压缩性不强的随机信号。从而,残留数据信号会需要大的存储容量。
采用EP 0 890 949 A2中描述的系统,如果相对原始的∑-Δ调制器、对于∑-Δ调制器33的若干要求被满足,即:它们具有同样的拓扑、同样的顺序、同样的环路滤波器系数,接收同样的输入,且具有同样的内部状态(即以相同的状态启动以及从初始化期间接收相同的输入),则残留数据信号仅会要求少量存储容量。对于实际使用,这样的要求将不会被满足,因为原始的∑-Δ调制器不能被假定为已知,被传送给接收器的状态也不能被假定为已知,因此实际上EP 0 890 949 A2系统将生成需要大的存储容量的残留数据信号。
发明内容
可以看出,本发明的一个目的是:提供能够利用相应的具有最小额外数据存储空间要求的PCM信号、而无损地编码DSD信号的编码方法和编码器。
根据第一方面,本发明提供一种基于相应的PCM信号对输入DSD信号进行编码的方法,该方法包括如下步骤:
1)上采样PCM信号到与DSD输入信号的采样率相等的采样率,
2)生成用于∑-Δ调制器的噪声整形环路(noise shaping loop)的一组环路滤波器参数,
3)基于在被上采样的PCM信号的∑-Δ调制的版本与输入DSD信号之间的差别,生成一个校正信号,其中使用该组环路滤波器参数,得到被上采样的PCM信号的∑-Δ调制的版本,和
4)生成包括该组环路滤波器参数的被编码的版本和校正信号的被编码的版本的扩展位流。
“相应的PCM信号”被理解为采用诸如标准CD或DVD格式的低采样率的PCM信号,该信号已经从输入DSD信号中生成,或至少与之密切相关。
应理解,“该组环路滤波器参数”包括环路滤波器系数和初始化参数,即:起始条件,将允许解码器依照该起始条件而设置它自己的∑-Δ调制器,且这样能够重新生成被上采样的PCM信号的∑-Δ调制的版本。该环路滤波器参数可以被设置为:1)对于环路滤波器系数和环路滤波器的初始状态或条件(即非同步的场合)的随机但已知的值,或2)对于环路滤波器系数和环路滤波器的初始状态或条件(同步的场合)特别确定的值。
在非同步的场合,环路滤波器系数不能是真正随机的,但是本领域的技术人员能够导出几乎无穷数目的有效组。对于环路滤波器的初始条件,可能性的数量甚至更大,但同样本领域的技术人员将知道怎样选择能提供工作系统的初始状态。
该编码方法是有优势的,因为通过利用已经存在的相应的低比特率PCM信号和仅要求最小额外存储空间的扩展位流,它提供了供给被编码的无损DSD音频信号的可能性。因而,对于结合在具有有限存储空间可用的光学存储介质上多格式音频数据的存储来使用方面,本方法是有优势的。
根据本方法的步骤2),∑-Δ调制器的环路滤波器参数例如环路滤波器系数和初始状态,被包括在扩展位流之中并且因此在解码器方变得可用。因此有可能选择或优化这些环路滤波器参数,使得基于输入DSD信号和被上采样的PCM信号,∑-Δ调制器会输出几乎是正确的位流,即与输入DSD信号几乎相等的位流。
基于在几乎正确的位流与输入DSD信号之间的差别,最后提取校正信号或误差信号。由于可能在编码方选出或优化环路滤波器参数,使得保证在∑-Δ调制器的输出即几乎正确的位流和输入DSD信号之间的差别最小,所以仅仅需要少量的校正用于从几乎正确的位流来重建逐位相同(bitidentically)的输入DSD信号。于是,校正信号或校正位流也将会最小,例如大部分时间为“0”,因此在步骤4)中校正信号可以被高度压缩。
选择环路滤波器参数例如初始化参数和环路滤波器系数的另一种方法是随机选择初始化参数。只要滤波器系数和初始化参数被包括在扩展位流之中并且因此使得可被解码器利用,就仍然可能迫使在解码器方的输出DSD信号与输入DSD信号逐位相同。
包括在扩展位流之中的环路滤波器参数也可以用非常少量的数据来表示,因为这些参数仅需要以低频率更新,所以扩展位流完全能够使用与PCM信号表示的比特率比较而言较小的比特率来表示。
总而言之,根据第一方面的方法通过增加一个扩展位流来提供无损的DSD音频质量,与PCM信号自身的存储容量比较而言该扩展位流仅要求最小的额外数据存储容量。
此外,因为该方法基于使用PCM信号来提供DSD音频质量,所以DSD音频质量可以与向后兼容结合。举例来说,编码方法很好地适合用于在存储介质例如DVD盘上存储DSD音频信号。这样的DVD盘仍可以由无DSD能力的传统DVD播放器播放,因为这样的播放器将仅使用PCM信号,而DSD设备例如有超级音频CD能力的播放器,能够基于PCM信号、利用附加的低比特率DSD扩展位流,来重新生成原始的DSD质量。举例来说,扩展位流可以是MPEG流的一部分。
在优选的实施例中,该方法包括基于使在被上采样的PCM信号的∑-Δ调制的版本与输入DSD信号之间的差别最小化来优化环路滤波器参数。这种优化的目的是保证∑-Δ调制器的输出位流尽可能与输入DSD信号接近。从而,校正信号仅需要校正小的误差,并且因此校正信号会具有一种导致其可高度压缩的性质且因此校正信号仅需要小的额外数据速率。
优选地,步骤3)包括生成校正信号使得它与被上采样的PCM信号的∑-Δ调制版本一起提供与DSD输入信号相同的位流。从而,使用PCM信号和扩展位流,DSD输入信号能够在解码器方被逐位相同地重建。
在步骤3)中产生的校正信号可能适于应用在从PCM信号输入到来自于∑-Δ调制器的输出位流的信号通路中的不同位置。当然,为了能够在解码器方重建输入DSD信号,校正信号应当被应用在信号通路中、和在编码期间被计划的相同位置。校正信号可能适于应用于PCM信号,即在PCM信号被上采样之前应用于它。可选地,校正可能适于应用于PCM信号的被上采样的版本。在再有的其它的可选方案中,校正信号可能适于结合∑-Δ调制器应用。校正信号可能适于应用在∑-Δ调制器的噪声整形环路之内或之外。在再有的另一种可选方案中,校正信号可能适于应用于∑-Δ调制器的内部状态。
对于该组环路滤波器参数由不是特别导出的值初始化的实施例,即非同步的场合,优选地生成要被应用于上采样的PCM信号的校正信号。
一个以上的校正信号可以被生成并且被包括在扩展位流中,例如校正信号适于应用于信号通路中的不同位置,诸如两个或更多的上述可能性的组合。步骤3)可以包括一个优化程序,其目的是导出两个或更多的上述可能的校正信号的组合,该组合对其自身的表示总共需要最小的存储器。进行这种可选的优化的原因是,对于某种输入DSD信号,可能是这样:适于应用于信号通路中的不同位置的两个或更多的校正信号的组合可以要求一个比特率,该比特率低于在仅有一个校正信号被使用的场合所能获得的比特率。
校正信号可以基于在被上采样的PCM信号的∑-Δ调制的版本和输入DSD信号之间的差别。更优选地,校正信号被导出使得保证在被上采样的PCM信号的∑-Δ调制的版本和输入DSD信号之间的差别变为零。
优选地,在被应用于该编码方法前输入DSD信号被拆分为帧(例如1/75秒,37632个DSD样本)。
因为步骤4)包含把环路滤波器参数包括在扩展位流中,所以被选择的环路滤波器参数在解码器方是已知的——无论是被优化的还是(或多或少)被随机选择的。同样,PCM信号会是可用的,因为它会例如被现有DVD标准要求、被存储于DVD光盘之上。如此,随着环路滤波器参数和校正信号在解码器方可用,逐位相同地重建输入DSD信号是可能的。
编码方法进一步可包括在存储介质上存储PCM信号和扩展位流的步骤。
第二方面,本发明提供一种基于PCM信号和扩展位流生成输出DSD信号的方法,该方法包括以下步骤:
1)通过解码扩展位流而生成一组环路滤波器参数和一个校正信号,
2)上采样PCM信号到与DSD输出信号的采样率相等的采样率,
3)基于使用该组环路滤波器参数、通过∑-Δ调制被上采样的PCM信号而获得的位流,生成输出DSD信号,
该方法进一步包括与步骤2)和3)中的至少一个结合来应用校正信号。
已提到的与第一方面有关的优势、功能和实施例,适用于根据第二方面的解码方法,因为第二方面定义基于PCM信号和例如根据第一方面的方法生成的扩展位流来生成DSD信号的方法。校正信号当然应当依照由编码方法所计划的被应用,如此,正如与第一方面联系起来阐述的,对校正信号存在同样的可能性:对(低速率)PCM信号、对被上采样的信号、在∑-Δ调制器的噪声整形环路之内、在∑-Δ调制器的噪声整形环路之外、对∑-Δ调制器的内部状态、或者对来自∑-Δ调制器的输出位流。此外,PCM信号的上采样应当使用例如与编码过程中所使用的同样的滤波器来执行。
第三方面,本发明提供一种音频编码器,其适于基于相应的PCM信号、编码输入DSD信号,该音频编码器包括:
-上采样单元,适于以与DSD输入信号相等的采样率生成PCM信号的被上采样的版本,
-具有一组环路滤波器参数的∑-Δ调制器,适于基于被上采样的PCM信号生成位流信号,
-校正信号生成器,适于基于在位流信号和输入DSD信号之间的差别生成校正信号,和
-编码装置,适于编码该组环路滤波器参数和编码校正信号以及把这些被编码的信号包括在扩展位流中。
与第一方面有关地阐述的同样的优势、功能和实施例适用于第三方面,其主要定义适于运行在第一方面中定义的方法的音频编码器。如此,编码器可以包括优化装置,其适于优化该组环路滤波器参数,并且校正信号生成器可能适于生成校正信号,使校正信号适于应用于:(低速率)PCM信号、被上采样的信号、在∑-Δ调制器的噪声整形环路之内、在∑-Δ调制器的噪声整形环路之外、∑-Δ调制器的内部状态、或者来自∑-Δ调制器的输出位流。可以使用两个或更多这些校正信号选项的组合。
可以使用软件或硬件或二者的组合实现编码器。优选地,编码器包括计算装置,例如信号处理器。
第四方面,本发明提供一种音频解码器,其适于基于PCM信号和扩展位流信号生成输出DSD信号,该音频解码器包括:
-解码器,适于解码扩展位流信号和响应其而生成一组环路滤波器参数以及校正信号,
-上采样单元,适于以与DSD输出信号相等的采样率生成PCM信号的被上采样的版本,
-∑-Δ调制器,适于通过使用该组环路滤波器参数、响应PCM信号的被上采样的版本来生成位流信号,
-输出生成器,适于基于被生成的位流来应用校正信号和生成输出DSD信号,和
-信号校正器,适于把校正信号应用在下述至少其中之一:上采样单元、∑-Δ调制器、和输出生成器。
与第二方面有关地阐述的同样的优势、功能和实施例适用于第四方面,其主要定义适于运行在第二方面中定义的方法的音频解码器。可以使用软件或硬件或二者的组合实现该解码器。优选地,解码器包括计算装置,例如信号处理器。
第五方面,本发明提供一种包括根据第三方面的编码器的设备。该设备可以是音频/视频设备,例如DVD记录器、DVD硬盘记录器、环绕声设备、HD-DVD记录器、蓝光盘记录器,等等。
第六方面,本发明提供一种包括根据第四方面的解码器的设备。该设备可以是音频设备,例如超级音频CD播放器、DVD播放器和记录器、DVD硬盘记录器、HD-DVD播放器和记录器、蓝光盘播放器和记录器、环绕声设备、等等。
第七方面,本发明提供被编码的音频信号,包括:
-PCM信号,和
-扩展位流,其包括用于∑-Δ调制器的一组环路滤波器参数的被编码的版本和校正信号的被编码的版本。
从以上与第一方面有关的解释可知,这样被编码的音频信号的优势是明显的。根据第七方面的被编码的音频信号很适合在存储介质上存储,因为它允许DSD声音质量以相对有限的存储容量进行存储。基于同样的理由,被编码的音频信号很适合,例如在因特网上传输,因为它允许DSD声音质量以相对低的数据速率进行传输。扩展位流可以是MPEG层的一部分。
第八方面,本发明提供已经在其上存储了根据第七方面的被编码的音频信号的存储介质。该存储介质可以是硬盘、软盘、CD、DVD、SD卡、记忆棒、存储器芯片等。
再一方面,本发明提供适于执行根据第一方面的方法的计算机可执行程序代码。此外,本发明提供适于执行根据第二方面的方法的计算机可执行程序代码。
附图说明
下面参考附图对本发明进行更为详细的阐述,其中
图1示出有优选的编码器和优选的解码器的系统,其在存储介质上存储中间信号,
图2示出编码器实施例,
图3示出另一个编码器实施例,
图4示出解码器实施例,
图5示出具有不同校正信号选项的指示的解码器实施例。
具体实施方式
尽管本发明能容许进行各种修改和其它可选形式,但在附图中作为例子显示出具体的实施例,并且在此处将详细阐述。然而,应当理解,本发明不打算限定于所公布的特定形式。而是,本发明要覆盖在由所附权利要求定义的本发明的主旨和范围之内的所有修改、等同物和可选方案。
图1示出根据本发明的编码器ENC和解码器DEC以及中间存储来自编码器ENC的被编码信号的存储介质SM,例如光盘的框图。使编码器ENC适于接收输入DSD信号IDSD和相应的PCM信号PCM,例如DTS信号,以及响应它们而生成扩展位流EBS,扩展位流EBS使解码器DEC能够从PCM信号PCM中重建输入DSD信号。扩展位流EBS包括一组∑-Δ调制器噪声整形环路滤波器参数LFP和校正信号CS,环路滤波器参数LFP和校正信号CS二者都优选以编码的形式被包括在扩展位流EBS之中。校正信号CS可以使用例如游程长度编码(Run Length Encoding)、LZW或算术编码被编码。
因而,扩展位流EBS可以与PCM信号PCM一起被存储在存储介质SM上,与PCM信号PCM独自存储相比仅需要少量额外的存储容量。基于PCM信号PCM和扩展位流EBS,解码器DEC创建输出DSD信号ODSD,其与输入DSD信号IDSD逐位相同。
在编码器内,如下步骤被执行:1)导出环路滤波器参数LFP,2)确定校正信号CS,最后打包和压缩环路滤波器参数LFP和(多个)校正信号CS。对于校正信号存在不同的选项。它可以由编码器ENC确定以在解码器DEC中被应用于PCM信号PCM、PCM信号的被上采样的版本或作为位校正信号,即被加入使从中间的位流减去的信号——在∑-Δ调制器噪声整形环路滤波器之内或之外。如果优选,校正信号CS可以包括多个单独的校正信号,诸如所提及的校正信号的任意组合,因为这可以证明:在给定的输入DSD信号IDSD的情况下,提供存储所要求的校正的最具存储效率的方式。因而,编码方法可以包括优化校正信号CS的步骤,这种优化通过比较所提及类型的单个校正信号或所提及类型的几个校正信号的组合的不同选项来实现。
图2显示一个优选的编码器实施例,其适于基于相应的但低采样率的PCM信号PCM来编码输入DSD信号IDSD。首先使用上采样滤波器生成PCM信号PCM的被上采样的版本UPCM。该被上采样的PCM信号UPCM被上采样到输入DSD信号IDSD的采样率。然后,该被上采样的PCM信号UPCM在∑-Δ调制器SDM内被∑-Δ调制,该∑-Δ调制器具有一噪声整形环路,其带有一组环路滤波器参数LFP。可以选择用于筛选环路滤波器参数LFP的不同策略。被上采样的PCM信号UPCM的被∑-Δ调制的版本然后被输入DSD信号IDSD减去,以便生成表示误差信号或校正信号CS的位流。
在知悉相应的校正信号CS和被∑-Δ调制器SDM使用的环路滤波器参数LFP的情况下,对于解码器而言有可能重建输入DSD信号IDSD,这通过把校正信号和∑-Δ调制器的输出相加、使用环路滤波器参数LFP对PCM信号的被上采样的版本UPCM进行∑-Δ调制得以实现。解码器应当使用编码器曾使用的同样的上采样滤波器来生成UPCM信号。
图3示出一个实施例,其中提取用于∑-Δ调制器的环路滤波器LF的环路滤波器系数LFC和积分器同步参数ISYNC。到该过程的输入包括输入DSD信号IDSD、和相应的PCM信号PCM。通过运行DTS和DTS++数据的解压缩以获得原始的无损PCM信号,可以生成PCM信号PCM。应注意,有损压缩的PCM信号(例如AC3)的波形通常不与原始PCM信号的波形相似,因此较不适合用于此方案。
在上采样滤波器内,低速率PCM信号PCM随后被上采样到DSD采样率。通过利用输入DSD信号IDSD,生成误差信号E,且可以计数误差数量#E。在给定的输入数据情况下,然后计算导致最小数量的误差#E的设置,即LFC和ISYNC。可选的(多个)PCM校正信号的优化可以被嵌入这个步骤中。一旦最佳的设置已经被导出,则位校正信号(用于噪声整形环路内部的校正)等于图3中指示的误差信号。要注意,在正确选择的(多个)PCM校正信号、正确选择的LFC和同步参数ISYNC的情况下,该信号可以为零。
图4显示一个解码器实施例,它能够从可用的PCM流PCM(DTS)和扩展位流EBS重建逐位相同的DSD信号。DTS++解码的流低速率PCM信号PCM(DTS++)被输入并且被上采样到DSD速率。校正信号可以被应用于低速率PCM信号PCM(DTS++)或被上采样的PCM信号或它们两者。被上采样的PCM信号被输入到具有同步的∑-Δ调制器SDM。∑-Δ调制器SDM可能适于应用位校正——在其噪声整形环路内部或外部。如此,总共四种可能的校正信号可以被从扩展位流EBS中重新获得,由从扩展位流EBS开始的四个箭头所表示。校正信号的这些选项的任意组合可以被用于保证逐位相同的重建,使得确保∑-Δ调制器SDM的输出DSD信号ODSD与已经被编码的原始源DSD信号逐位相同。扩展位流EBS的解压缩未显示。
图5示出具有带同步和位校正可能性的∑-Δ调制器的解码器实施例,所述∑-Δ调制器诸如也在图3的编码器实施例中被示出。∑-Δ调制器接收多位输入信号n-位并且输出由1-位指示的位流。∑-Δ调制器具有用于同步环路滤波器积分器的输入ISYNC和用于设置环路滤波器系数的输入LFC。这两个输入ISYNC、LFC将需要以低速率更新。此外,∑-Δ调制器接收一个位校正信号CS。这一位校正信号CS可以被应用在如所指示的两个不同的位置,即在噪声整形环路CS之内(IL)或在噪声整形环路CS之外(OL)。该信号以DSD采样率运行。
该方案中的关键点是环路滤波器同步参数ISYNC的导出。因为源DSD信号连同源PCM信号在编码器方可用,所以同步参数ISYNC可以被计算达到非常高的精确程度。飞利浦专利US6 606 043 B2描述怎样把任意的∑-Δ调制器的积分器状态与位流进行同步。这种恩想可以被扩展来也重新得到环路滤波器系数用于更好的同步。低速率PCM和被上采样的PCM校正信号同样可以使用相似的方案导出。
如果∑-Δ调制器被正确地同步,则其由PCM输入引起的输出将会与源DSD几乎完全相同。因为不是所有的位都将正确,所以或者PCM输入信号、或者位流输出信号有时会需要被校正。如果校正仅被应用于低速率PCM信号,则输出决不会100%的正确。如果校正被应用于被上采样的PCM信号,则在正确同步的情况下,输出可以100%正确。通过把校正应用于低速率和被上采样的PCM信号二者,则可能所要求的存储器比仅应用于被上采样的PCM信号时所要求的更小。
通过把校正应用于被上采样的PCM信号,可以使得输出位正确。对被上采样的信号所要求的改变会较小,因而这种校正信号可以被压缩。通过也把校正应用于低速率的PCM信号,可以使得在被上采样的PCM信号上所要求的校正更小,从而潜在地减少总体所要求的存储。通过校正被量化的位,校正可以被应用在噪声整形环路之内或环路之外。因为被量化的信号是1-位,所以位校正信号也是1-位信号。典型地,位校正信号由零(‘0’)组成。只有当被量化的输出不正确,位校正信号才将包括一(‘1’)。由于这种信号的性质,它能够以压缩的形式有效地被存储。所提及的选项的任意组合都可以被用于发现最小尺寸的校正信号。
包括根据本发明的编码器和解码器的系统可以被视为PCM信号到DSD扩展系统,因为它会在现有的存储介质上允许无损的DSD功能性,而这是因为基于已经存在的PCM信号和少量的额外数据即扩展位流,有可能提供DSD声音质量。
权利要求中的参考符号仅用来增加易读性。这些参考符号不应当以任何方式解读为限制权利要求的范围,而是仅作为举例说明的例子的目的被包括。
Claims (14)
1.一种基于相应的PCM信号(PCM)编码输入DSD信号(DSD)的方法,该方法包括以下步骤:
1)上采样PCM信号(PCM)到与DSD输入信号(IDSD)的采样率相等的采样率,
2)生成用于∑-Δ调制器的噪声整形环路的一组环路滤波器参数(LFP),
3)基于在被上采样的PCM信号的∑-Δ调制的版本与该输入DSD信号(IDSD)之间的差别,生成校正信号(CS),其中,使用该组环路滤波器参数(LFP)来获得被上采样的PCM信号的∑-Δ调制的版本,和
4)生成包括该组环路滤波器参数(LFP)的被编码的版本和校正信号(CS)的被编码的版本的扩展位流(EBS)。
2.根据权利要求1的方法,其中,步骤2)包括基于使在被上采样的PCM信号的∑-Δ调制的版本与输入DSD信号(IDSD)之间的差别最小化来优化该组环路滤波器参数(LFP)。
3.根据权利要求1的方法,其中,步骤3)包括生成校正信号(CS),使得它与被上采样的PCM信号的∑-Δ调制的版本一起提供一个与DSD输入信号(IDSD)相同的位流。
4.根据权利要求1的方法,其中,步骤3)包括生成适于应用于PCM信号(PCM)的校正信号(CS)。
5.根据权利要求1的方法,其中,步骤3)包括生成适于应用于PCM信号(PCM)的被上采样的版本的校正信号(CS)。
6.根据权利要求1的方法,其中,步骤3)包括生成适于应用于∑-Δ调制器的内部状态的校正信号(CS)。
7.根据权利要求1的方法,其中,步骤3)包括生成适于结合∑-Δ调制器的噪声整形环路应用的校正信号(CS)。
8.一种基于PCM信号(PCM)和扩展位流(EBS)生成输出DSD(ODSD)信号的方法,该方法包括以下步骤:
1)通过解码扩展位流(EBS)来生成一组环路滤波器参数(LFP)和一个校正信号(CS),
2)上采样PCM信号(PCM)到与DSD输出信号(ODSD)的采样率相等的采样率,
3)基于使用该组环路滤波器参数(LFP)、由∑-Δ调制被上采样的PCM信号获得的位流,生成输出DSD信号(ODSD),
该方法进一步包括结合步骤2)和3)中的至少一个来应用校正信号(CS)。
9.一种音频编码器(ENC),适于基于相应的PCM信号(PCM)来编码输入DSD信号(IDSD),该音频编码器包括:
-上采样单元,适于以与DSD输入信号(IDSD)相等的采样率生成PCM信号的被上采样的版本,
-具有一组环路滤波器参数(LFP)的∑-Δ调制器,适于基于被上采样的PCM信号生成位流信号,
-校正信号生成器,适于基于在位流信号和输入DSD信号(IDSD)之间的差别生成校正信号(CS),和
-编码装置,适于编码该组环路滤波器参数(LFP)和编码校正信号(CS)以及把这些被编码的信号包括在扩展位流(EBS)中。
10.一种音频解码器(DEC),适于基于PCM信号(PCM)和扩展位流信号(EBS)生成输出DSD信号(ODSD),该音频解码器(DEC)包括:
-解码器,适于解码扩展位流信号(EBS)和响应其而生成一组环路滤波器参数(LFP)以及校正信号(CS),
-上采样单元,适于以与DSD输出信号(ODSD)相等的采样率生成PCM信号的被上采样的版本,
-∑-Δ调制器,适于通过使用该组环路滤波器参数(LFP)、响应于PCM信号的被上采样的版本而生成一个位流信号,
-输出生成器,适于基于被生成的位流来应用校正信号(CS)和生成输出DSD信号(ODSD),和
-信号校正器,适于把校正信号(CS)应用在上采样单元、∑-Δ调制器和输出生成器中的至少之一。
11.包括根据权利要求9的编码器(ENC)的设备。
12.包括根据权利要求10的解码器(DEC)的设备。
13.一种被编码的音频信号,包括:
-PCM信号(PCM),和
-扩展位流(EBS),其包括用于∑-Δ调制器的一组环路滤波器参数(LFP)的被编码的版本和校正信号(CS)的被编码的版本。
14.一种存储介质(SM),在其上存储有根据权利要求13的被编码的音频信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05104612.6 | 2005-05-30 | ||
EP05104612 | 2005-05-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101189678A true CN101189678A (zh) | 2008-05-28 |
Family
ID=37116162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200680019321XA Pending CN101189678A (zh) | 2005-05-30 | 2006-05-16 | 具有最小存储要求的直接流数字音频 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20090287493A1 (zh) |
EP (1) | EP1891639A2 (zh) |
JP (1) | JP2008546014A (zh) |
KR (1) | KR20080017392A (zh) |
CN (1) | CN101189678A (zh) |
BR (1) | BRPI0610905A2 (zh) |
EA (1) | EA200702651A1 (zh) |
TW (1) | TW200705394A (zh) |
WO (1) | WO2006129215A2 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869647A (zh) * | 2016-05-05 | 2016-08-17 | 西安睿芯微电子有限公司 | 一种智能手机原生dsd音频解码方法、系统及智能手机 |
CN106504759A (zh) * | 2016-11-04 | 2017-03-15 | 维沃移动通信有限公司 | 一种混音处理方法及终端设备 |
CN110800043A (zh) * | 2017-07-05 | 2020-02-14 | 索尼公司 | 信号处理设备、信号处理方法和程序 |
US10735794B2 (en) | 2016-03-28 | 2020-08-04 | Sony Corporation | Information processing device, information processing method, and information processing system |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8326075B2 (en) * | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video encoding using adaptive loop filter |
US8780996B2 (en) | 2011-04-07 | 2014-07-15 | Google, Inc. | System and method for encoding and decoding video data |
US8780971B1 (en) | 2011-04-07 | 2014-07-15 | Google, Inc. | System and method of encoding using selectable loop filters |
US8781004B1 (en) | 2011-04-07 | 2014-07-15 | Google Inc. | System and method for encoding video using variable loop filter |
US8885706B2 (en) | 2011-09-16 | 2014-11-11 | Google Inc. | Apparatus and methodology for a video codec system with noise reduction capability |
US9131073B1 (en) | 2012-03-02 | 2015-09-08 | Google Inc. | Motion estimation aided noise reduction |
US9344729B1 (en) | 2012-07-11 | 2016-05-17 | Google Inc. | Selective prediction signal filtering |
US10102613B2 (en) | 2014-09-25 | 2018-10-16 | Google Llc | Frequency-domain denoising |
US11246905B2 (en) | 2016-08-15 | 2022-02-15 | President And Fellows Of Harvard College | Treating infections using IdsD from Proteus mirabilis |
US10074378B2 (en) * | 2016-12-09 | 2018-09-11 | Cirrus Logic, Inc. | Data encoding detection |
JP2018129663A (ja) * | 2017-02-08 | 2018-08-16 | 旭化成エレクトロニクス株式会社 | 信号処理装置 |
WO2018198788A1 (ja) * | 2017-04-26 | 2018-11-01 | ソニー株式会社 | 信号処理装置、信号処理方法、およびプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09153806A (ja) * | 1995-11-29 | 1997-06-10 | Sony Corp | 信号処理装置 |
JP3371672B2 (ja) * | 1996-03-22 | 2003-01-27 | ソニー株式会社 | マスタリング装置 |
US6160953A (en) * | 1997-04-21 | 2000-12-12 | Victor Company Of Japan, Ltd. | DVD-compatible optical recording disk conveying audio signals encoded both as PCM data and as single bit stream data generated by sigma-delta modulation, and encoder apparatus and decoder apparatus for same |
CN1098518C (zh) * | 1997-07-11 | 2003-01-08 | 三星电子株式会社 | 与数字通用盘视频标准兼容的数字音频处理系统 |
US6204793B1 (en) * | 1999-04-15 | 2001-03-20 | C-Media Electronics Inc. | Sigma-Delta CODEC system |
JP4454109B2 (ja) * | 2000-06-14 | 2010-04-21 | 日本テキサス・インスツルメンツ株式会社 | パルス密度変調信号(pdm)のデジタル−アナログ変換処理におけるsn比改善の方法および装置 |
ES2258103T3 (es) * | 2000-08-11 | 2006-08-16 | Koninklijke Philips Electronics N.V. | Metodo y disposicion para sincronizar un modulador sigmadelta. |
JP4950407B2 (ja) * | 2000-09-08 | 2012-06-13 | アイピージー エレクトロニクス 503 リミテッド | オーディオ信号圧縮 |
JP2003060509A (ja) * | 2001-08-10 | 2003-02-28 | Teac Corp | ディジタル信号のエラー補償装置及び方法 |
US6982662B2 (en) * | 2003-03-06 | 2006-01-03 | Texas Instruments Incorporated | Method and apparatus for efficient conversion of signals using look-up table |
US20040213350A1 (en) * | 2003-04-24 | 2004-10-28 | Frith Peter J. | Interface format for PCM and DSD devices |
GB2408858B (en) * | 2003-12-05 | 2006-11-29 | Wolfson Ltd | Word length reduction circuit |
-
2006
- 2006-05-16 US US11/915,478 patent/US20090287493A1/en not_active Abandoned
- 2006-05-16 EA EA200702651A patent/EA200702651A1/ru unknown
- 2006-05-16 CN CNA200680019321XA patent/CN101189678A/zh active Pending
- 2006-05-16 BR BRPI0610905-5A patent/BRPI0610905A2/pt not_active IP Right Cessation
- 2006-05-16 EP EP06744949A patent/EP1891639A2/en not_active Withdrawn
- 2006-05-16 KR KR1020077030240A patent/KR20080017392A/ko not_active Application Discontinuation
- 2006-05-16 JP JP2008514242A patent/JP2008546014A/ja not_active Withdrawn
- 2006-05-16 WO PCT/IB2006/051537 patent/WO2006129215A2/en not_active Application Discontinuation
- 2006-05-26 TW TW095118858A patent/TW200705394A/zh unknown
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10735794B2 (en) | 2016-03-28 | 2020-08-04 | Sony Corporation | Information processing device, information processing method, and information processing system |
CN105869647A (zh) * | 2016-05-05 | 2016-08-17 | 西安睿芯微电子有限公司 | 一种智能手机原生dsd音频解码方法、系统及智能手机 |
CN105869647B (zh) * | 2016-05-05 | 2019-10-08 | 西安睿芯微电子有限公司 | 一种智能手机原生dsd音频解码方法、系统及智能手机 |
CN106504759A (zh) * | 2016-11-04 | 2017-03-15 | 维沃移动通信有限公司 | 一种混音处理方法及终端设备 |
CN106504759B (zh) * | 2016-11-04 | 2019-07-26 | 维沃移动通信有限公司 | 一种混音处理方法及终端设备 |
CN110800043A (zh) * | 2017-07-05 | 2020-02-14 | 索尼公司 | 信号处理设备、信号处理方法和程序 |
CN110800043B (zh) * | 2017-07-05 | 2023-10-20 | 索尼公司 | 信号处理设备、信号处理方法和程序 |
Also Published As
Publication number | Publication date |
---|---|
WO2006129215A2 (en) | 2006-12-07 |
EA200702651A1 (ru) | 2008-04-28 |
WO2006129215A3 (en) | 2007-04-26 |
US20090287493A1 (en) | 2009-11-19 |
JP2008546014A (ja) | 2008-12-18 |
BRPI0610905A2 (pt) | 2008-12-02 |
EP1891639A2 (en) | 2008-02-27 |
TW200705394A (en) | 2007-02-01 |
KR20080017392A (ko) | 2008-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101189678A (zh) | 具有最小存储要求的直接流数字音频 | |
JP3935215B2 (ja) | 音声信号のデータ圧縮及び伸張装置 | |
EP2859548B1 (en) | Doubly compatible lossless audio bandwidth extension | |
RU2387022C2 (ru) | Масштабируемый аудиокодер без потерь и авторское инструментальное средство | |
JP3987582B2 (ja) | ライスエンコーダ/デコーダを用いるデータ圧縮/拡張 | |
JP5032314B2 (ja) | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 | |
KR100717600B1 (ko) | 오디오 파일 포맷 변환 | |
US7974840B2 (en) | Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information | |
KR101237413B1 (ko) | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 | |
JP4179639B2 (ja) | マルチチャンネル情報信号の算術符号化/復号化 | |
CA2606238A1 (en) | Method and apparatus for providing a motion signal with a sound signal using an existing sound signal encoding format | |
KR20100089772A (ko) | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 | |
US6385588B2 (en) | Data compression and expansion of an N-level information signal | |
CN108886638A (zh) | 再现装置和再现方法、以及文件生成装置和文件生成方法 | |
RU2267171C2 (ru) | Передача цифрового информационного сигнала, имеющего м битовые выборки икм | |
JP4248026B2 (ja) | 符号化された形式と符号化されない形式のディジタル情報信号を交互に伝送する伝送装置 | |
JP5384943B2 (ja) | オーディオデータ符号化及び/または復号化方法、記録媒体及びシステム | |
CN113763970B (zh) | 一种音频传输方法、装置及音频传输设备 | |
US20040125707A1 (en) | Retrieving content of various types with a conversion device attachable to audio outputs of an audio CD player | |
JP2009031377A (ja) | オーディオデータ処理装置およびビット幅変換方法並びにビット幅変換装置 | |
JP3304727B2 (ja) | ディジタルデータ受信装置、送信装置及び伝送方法 | |
KR100826942B1 (ko) | 디지털 오디오 데이터의 비트 변환 방법, 이를 수행하는디코더 장치 및 디지털 오디오 데이터의 재생 방법 | |
KR20160112177A (ko) | 데이터 은닉을 이용한 오디오 메타데이터 삽입/추출 장치 및 방법 | |
JP2002268687A (ja) | 情報量変換装置及び情報量変換方法 | |
JP2000508146A (ja) | 複数のディジタル情報信号に関するデータの圧縮/伸長 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080528 |