CN102792371B - 编码设备和编码方法、以及解码设备和解码方法 - Google Patents

编码设备和编码方法、以及解码设备和解码方法 Download PDF

Info

Publication number
CN102792371B
CN102792371B CN201180013285.7A CN201180013285A CN102792371B CN 102792371 B CN102792371 B CN 102792371B CN 201180013285 A CN201180013285 A CN 201180013285A CN 102792371 B CN102792371 B CN 102792371B
Authority
CN
China
Prior art keywords
envelope
noise shaping
information
spectrum
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180013285.7A
Other languages
English (en)
Other versions
CN102792371A (zh
Inventor
铃木志朗
松村祐树
户栗康裕
前田祐儿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN102792371A publication Critical patent/CN102792371A/zh
Application granted granted Critical
Publication of CN102792371B publication Critical patent/CN102792371B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及用于减小由于音频信号的编码而产生的声音质量退化的编码设备和编码方法、以及解码设备和解码方法。包络强调部(51)对包络(ENV)进行强调。噪声整形部(52)将通过对包络(ENV)进行强调而形成的强调包络(D)除以大于1的值,并从相除的结果中减去由信息(NS)指定的噪声整形(G)。量化部(14)将相减的结果设置为量化比特计数(WL),并基于量化比特计数(WL),对通过将谱(S0)归一化而形成的归一化谱(S1)进行量化。复用部(53)复用信息(NS)、通过对归一化谱(S1)进行量化而形成的量化谱(QS)、以及所述包络(ENV)。例如,本发明可以应用于对音频信号进行编码的编码设备。

Description

编码设备和编码方法、以及解码设备和解码方法
技术领域
本发明涉及一种编码设备和编码方法、解码设备和解码方法及程序,更具体地涉及用于减小由于音频信号的编码而产生的声音质量退化的编码设备和编码方法、解码设备和解码方法及程序。
背景技术
作为音频信号编码方法,一般而言,存在诸如MP3(运动图像专家组音频第3层)、AAC(高级音频编码)和ATRAC(自适应变换声学编码)的公知的转换编码方法。
图1是示出了对音频信号进行编码的编码设备的配置示例的框图。
例如,图1中所示的编码设备10由MDCT(改进的离散余弦变换)部11、归一化部12、比特分配部13、量化部14和复用部15构成。
声音PCM(脉冲编码调制)信号作为音频信号被输入到编码设备10的MDCT部11中。MDCT部11对作为时域信号的音频信号执行MDCT,以获得作为频域信号的谱S0。MDCT部11将谱S0提供给归一化部12。
归一化部12从谱S0中提取按被称作量化单元的多个谱得到的包络ENV,并且将包络ENV提供给比特分配部13和复用部15。此外,归一化部12使用按量化单元得到的包络ENV对谱S0进行归一化,并将生成的归一化谱S1提供给量化部14。
如果从归一化部12提供了包络ENV,则比特分配部13根据预设的比特分配算法,基于包络ENV来决定归一化谱S1的量化信息WL,使得由复用部15生成的比特流BS中的比特计数落在期望范围内。量化信息WL是表示量化精确度的信息,并且这里指代量化比特计数。比特分配部13将量化信息WL提供给量化部14。
如果存在来自量化部14的、关于量化谱QS中的比特计数N的反馈,则比特分配部13基于比特计数N来确定比特流BS中的比特计数是否落在期望范围内,其中该量化谱QS是基于先前的量化信息WL对归一化谱S1进行量化而产生的。如果确定比特流BS中的比特计数没有落在期望范围内,则比特分配部13重新决定量化信息WL以使得比特流BS中的比特计数落在期望范围内。此外,比特分配部13将新的量化信息WL提供给量化部14。
相比之下,如果确定比特流BS中的比特计数落在期望范围内,则比特分配部13命令量化部14产生输出,并将当前的量化信息WL提供给复用部15。
量化部14基于从比特分配部13提供的量化信息WL,对从归一化部12提供的按量化单元得到的归一化谱S1进行量化。量化部14将生成的量化谱QS中的比特计数N提供给比特分配部13。如果从比特分配部13发出用于产生输出的指令,则量化部14将基于当前的量化信息WL的量化谱QS提供给复用部15。
复用部15复用从归一化部12提供的包络ENV、从比特分配部13提供的量化信息WL和从量化部14提供的量化谱QS,从而生成比特流BS。复用部15输出比特流BS作为编码的结果。
如前文中那样,编码设备10不仅生成包络ENV和量化谱QS,而且生成包括量化信息WL的比特流BS。这使得能够在解码比特流BS时从量化谱QS中恢复归一化谱S1。
图2是示出了由图1中所示的复用部15生成的比特流BS的配置示例的图。
如图2中所示,比特流BS由包括谱的上限值等的头Header、包络ENV、量化信息WL和量化谱QS构成。
如图3中所示,包络ENV和量化信息WL均具有按量化单元得到的值。因此,不仅量化谱QS需要对应于量化单元的数目,而且包络ENV和量化信息WL也需要对应于量化单元的数目。因此,假定量化单元计数被表示为U,则传输量化信息WL所需要的比特计数NWL变为量化信息WL中的比特计数与量化单元计数U相乘的值。结果,量化单元计数U变得越大,比特计数NWL就增加得越多。
在图3中,[k]中的k表示量化单元的索引,并且i是任意值。在该布置中,索引被设置成使得对较低频的量化单元给出1或随后的数字。
此外,经常预先确定按量化单元得到的包络ENV的比特计数。因此,比特分配部13修改量化信息WL以改变量化谱QS中的比特计数N,从而将比特流BS中的比特计数控制为确定值。
图4是示出了对由图1中所示的编码设备10编码的结果进行解码的解码设备的配置示例的框图。
图4中所示的解码设备20由分离部21、逆量化部22、逆归一化部23和逆MDCT部24构成。
作为由编码设备10进行的编码的结果的比特流BS被输入到解码设备20的分离部21。分离部21从比特流BS中分离出包络ENV和量化信息WL。分离部21还基于量化信息WL从比特流BS中分离出量化谱QS。分离部21将包络ENV提供给逆归一化部23,并将量化信息WL和量化谱QS提供给逆量化部22。
逆量化部22基于从分离部21提供的量化信息WL对量化谱QS进行逆量化,并将生成的归一化谱S1提供给逆归一化部23。
逆归一化部23使用从分离部21提供的包络ENV对从逆量化部22提供的归一化谱S1进行逆归一化,然后将生成的谱S0提供给逆MDCT部24。
逆MDCT部24对从逆归一化部23提供的作为频域信号的谱S0进行逆MDCT,从而获得作为时域信号的声音PCM信号。逆MDCT部24输出声音PCM信号作为音频信号。
如前文中那样,编码设备10使比特流BS中包括量化信息WL,这使得即使量化信息WL在编码设备10处被任意修改,也能够将要编码的音频信号与解码的音频信号匹配。因此,编码设备10可以使用量化信息WL来控制比特流BS中的比特计数。此外,编码设备10可以被单独地改进成设置量化信息WL中的最优值,从而实现声音质量的提高。
然而,当传送量化信息WL需要大量的比特时,量化谱QS中的比特计数相对减小,这导致声音质量的劣化。
因此,提出了一种编码方法,该方法包括:将量化信息WL分割成在编码设备和解码设备处唯一确定的固定值和通过从量化信息WL中减去该固定值而获得的差值;以及以低的比特计数对该差值进行编码(例如,参见专利文献1)。
引用列表
专利文献
专利文献1:日本专利3186290
发明内容
本发明要解决的问题
然而,该差值需要对应于量化单元的数目,因此传送量化信息WL所需要的比特计数并未变得充分小。结果,难以减小声音质量的退化。对实现高频编码(即低比特速率编码)而言,这导致了很大的障碍。
鉴于该情形设计了本发明,并且本发明的目的是减小由于音频信号的编码而产生的声音质量的退化。
问题的解决方案
本发明的第一方面中的编码设备是这样的编码设备,其包括:归一化装置,用于从音频信号的谱中提取包络,并使用所述包络将所述谱归一化;包络强调装置,用于强调所述包络;噪声整形装置,用于将由所述包络强调装置强调的所述包络除以大于1的值,并从相除的结果中减去由预定信息指定的噪声整形;量化装置,用于将由所述噪声整形装置进行的相减的结果设置为量化比特计数,并基于所述量化比特计数来对由所述归一化装置归一化的所述谱进行量化;以及复用装置,用于复用所述预定信息、由所述量化装置量化的所述谱、以及所述包络。
本发明的第一方面中的编码方法和程序对应于本发明的第一方面中的编码设备。
在本发明的第一方面中,从音频信号的谱提取包络,使用该包络将该谱归一化,强调该包络,将该强调包络除以大于1的值,从相除的结果中减去由预定信息指定的噪声整形,将相减的结果设置为量化比特计数,基于量化比特的数目来量化归一化谱,并且复用预定信息、量化谱和包络。
本发明的第二方面中的解码设备是这样的解码设备,其包括:信息分离装置,用于从被复用的预定信息、音频信号的量化谱和所述谱的包络中分离出所述预定信息和所述包络;包络强调装置,用于强调所述包络;噪声整形装置,用于将由所述包络强调装置强调的所述包络除以大于1的值,并从相除的结果中减去由所述预定信息指定的噪声整形;谱分离装置,用于使用由所述噪声整形装置进行的相减的结果作为量化比特计数,来从被复用的所述预定信息、所述量化谱和所述包络中分离出所述量化谱;逆量化装置,用于基于所述量化比特计数来对所述量化谱进行逆量化;以及逆归一化装置,用于使用所述包络,来对由所述逆量化装置逆量化的所述谱进行逆归一化。
本发明的第二方面中的解码方法和程序对应于本发明的第二方面中的解码设备。
在本发明的第二方面中,从被复用的预定信息、音频信号的量化谱和该谱的包络中分离出预定信息和包络;强调该包络;将强调包络除以大于1的值;从相除的结果中减去由预定信息指定的噪声整形;使用相减的结果作为量化比特计数,从被复用的预定信息、量化谱和包络中分离出量化谱;基于量化比特计数对量化谱进行逆量化;以及使用包络对逆量化谱进行逆归一化。
第一方面中的编码设备和第二方面中的解码设备可以是独立的设备或者是构成一个设备的内部块。
本发明的效果
根据本发明的第一方面,能够减小由于音频信号的编码而产生的声音质量的退化。
此外,根据本发明的第二方面,能够对被编码的音频信号进行解码,以减小由于编码而产生的声音质量的退化。
附图说明
图1是示出了对音频信号进行编码的编码设备的配置示例的框图。
图2是示出了由图1中所示的复用部生成的比特流的配置示例的图。
图3是用于描述包络和量化信息的图。
图4是示出了对由图1中所示的编码设备编码的结果进行解码的解码设备的配置示例的框图。
图5是示出了应用本发明的显示装置的第一实施例的配置示例的框图。
图6是由图5中所示的复用部生成的比特流的配置示例的图。
图7是示出了图5中所示的包络强调部的详细配置示例的框图。
图8是用于描述由图7中所示的包络强调部执行的处理的图。
图9是示出了图5中所示的噪声整形部的详细配置示例的框图。
图10是用于描述由图9中所示的噪声整形部生成噪声整形的方法的图。
图11是用于描述由噪声整形部生成量化信息的方法的图。
图12是用于描述由噪声整形部对比特流中的比特计数进行的调整的图。
图13是用于描述对包络进行强调的优点的图。
图14是用于描述对包络进行强调的优点的图。
图15是用于描述由图5中所示的编码设备执行的编码处理的流程图。
图16是用于描述图15中所示的步骤S14处的强调包络生成处理的细节的流程图。
图17用于描述图15中所示的步骤S15处的噪声整形处理的细节的流程图。
图18是示出了对由图5中所示的编码设备编码的比特流进行解码的解码设备的配置示例的框图。
图19是示出了图18中所示的噪声整形部的详细配置示例的框图。
图20是用于描述由图18中所示的解码设备执行的解码处理的流程图。
图21是用于描述图20中所示的步骤S103处的噪声整形处理的流程图。
图22是示出了应用本发明的显示装置的第二实施例的配置示例的框图。
图23是示出了由图22中所示的复用部生成的比特流的配置示例的图。
图24是示出了图22中所示的噪声整形部的详细配置示例的框图。
图25是用于描述准备用于量化信息的多种算术运算的优点的图。
图26是用于描述对包络进行强调的优点的图。
图27是用于描述由图22中所示的编码设备执行的噪声整形处理的流程图。
图28是示出了对由图22中所示的编码设备编码的比特流进行解码的解码设备的配置示例的框图。
图29是示出了图28中所示的噪声整形部的详细配置示例的框图。
图30是用于描述由图28中所示的解码设备执行的噪声整形处理的流程图。
图31是示出了计算机的一个实施例的配置示例的图。
具体实施方式
<第一实施例>
[编码设备的第一实施例的配置示例]
图5是示出了应用本发明的显示装置的第一实施例的配置示例的框图。
在图5中所示的配置中,对与图1中所示的配置中相同的部件给出与图1中所示的配置中相同的附图标记。适当地省略重复了描述。
图5中所示的编码设备50的配置与图1中所示的配置的不同之处在于:设置了包络强调部51和噪声整形部52来取代比特分配部13,并且设置了复用部53来取代复用部15。
包络强调部51对从归一化部12提取的按量化单元得到的包络ENV[k]进行强调。具体地,包络强调部51使用从归一化部12提取的按量化单元得到的包络ENV[k]来生成按量化单元得到的强调包络D[k],在强调包络D[k]中强调了包络ENV[k]的值的增加和减小。然后,包络强调部51将强调包络D[k]提供给噪声整形部52。将参照稍后描述的图7来提供包络强调部51的细节。
例如,噪声整形部52从以下值D[k]/2通过中减去由信息NS指定的按量化单元得到的噪声整形G[k]:该值D[k]/2是通过将从包络强调部51提供的按量化单元得到的强调包络D[k]除以2而获得的。信息NS指代所有量化单元的噪声整形G的最低值L和最高值H。噪声整形部52将生成的值作为量化信息WL[k]提供给量化部14。
此外,如果从包络强调部51提供了强调包络D[k],则噪声整形部52基于强调包络D[k]来确定信息NS,以使得由复用部53生成的比特流BS'中的比特计数落在期望范围内。此外,如果存在来自量化部14的、关于以下量化谱QS[k]中的比特计数N的反馈,则噪声整形部52基于比特计数N来确定比特流BS'中的比特计数是否落在期望范围内:该量化谱QS[k]是基于先前的量化信息WL来对归一化谱S1进行量化而产生的。如果确定比特流BS'中的比特计数没有落在期望范围内,则噪声整形部52重新决定信息NS,以使得比特流BS'中的比特计数落在期望范围内。相应地,将新的量化信息WL提供给量化部14。
同时,如果确定比特流BS'中的比特计数落在期望范围内,则噪声整形部52命令量化部14产生输出,并将当前的信息NS提供给复用部53。将参照稍后描述的图9来提供噪声整形部52的细节。
复用部53通过复用从归一化部12提供的包络ENV[k]、从噪声整形部52提供的信息NS和从量化部14提供的量化谱QS[k]来生成比特流BS'。复用部53输出比特流BS'作为编码的结果。
如前文中那样,编码设备50不是通过直接控制量化信息WL而是通过控制在生成量化信息WL时使用的用于指定噪声整形G的信息NS,来调整比特流BS'中的比特计数。此外,编码设备50使比特流BS'中包括信息NS来取代量化信息WL。
[比特流的配置示例]
图6是示出了由图5中所示的复用部53生成的比特流BS'的配置示例的图。
如图6中所示,比特流BS'由包括谱的上限值等的头Header、包络ENV[k]、信息NS和量化谱QS[k]构成。
如前文中那样,比特流BS'包括由噪声整形G的最低值L和最高值H构成的信息NS以取代量化信息WL,因而传送量化信息WL所需要的比特计数变为最低值L的比特计数NL和最高值H的比特计数NH的求和值NNS。因此,如果量化单元计数U充分大,则相比于量化信息WL中的比特计数和量化单元计数U的相乘值,求和值NNS变得充分小。即,与将量化信息WL包括在比特流BS中的情况相比,在编码设备50处传送量化信息WL所需要的比特计数变得充分小。
结果,在比特流BS'中,量化谱QS[k]中的比特计数相对于传统情况而变大,从而减小由于编码而产生的声音质量的退化。
[包络强调部的详细配置示例]
图7是示出了图5中所示的包络强调部51的详细配置示例的框图。
如图7中所示,包络强调部51例如由向前强调部61和向后强调部62构成。
向前强调部61由差计算部71、加法部72和附加量表部73构成。
向前强调部61的差计算部71从自图5中所示的归一化部12提供的具有索引k+1的量化单元的包络ENV[k+1]中减去具有索引k的量化单元的包络ENV[k],从而确定差diff[k+1]。差计算单元71将所确定的差diff[k+1]和包络ENV[k+1]提供给加法部72。
如果从差计算单元71提供的差diff[k+1]是正值,则加法部72从附加量表部73读取对应于差diff[k+1]的附加量,并将该附加量加到包络ENV[k+1]。加法部72将生成的值作为向前强调包络Do[k+1]提供给向后强调部62。
附加量表部73将附加量表存储为使差diff与附加量相关联的表。例如,附加量表记录对应于差diff“1”的附加量“1”、以及对应于差diff“2”的附加量“2”。此外,附加量表记录对应于差diff“3”的附加量“3”、记录对应于差diff“4”的附加量“4”,并且记录对应于差diff“5或更大”的附加量“5”。当然,附加量表的布置不限于此。
向后强调部62由差计算单元81、加法部82和附加量表部83构成。
向后强调部62的差计算部81从自归一化部12提供的包络ENV[k]中减去包络ENV[k+1],从而确定差diff[k]。差计算单元81将所确定的差diff[k]提供给加法部82。
如果从差计算单元81提供的差diff[k]是正值,则加法部82从附加量表部83读取对应于差diff[k]的附加量。加法部82将该附加量加到从加法部72提供的向前强调包络Do[k]。加法部82将生成的值作为强调包络D[k]提供给噪声整形部52(图5)。
附加量表部83将附加量表存储为使差diff与附加量相关联的表。尽管在本配置中存储在附加量表部73中的附加量表和存储在附加量表部83中的附加量表是相同的,但是这些表可以是不同的。
[由包络强调部执行的处理的描述]
图8是用于描述由图7中所示的包络强调部51执行的处理的图。
参照图8,将基于如图8中的A所示的从归一化部12提供的包络ENV[i]至ENV[i+4]依次是1、5、10、5和1的假定,来描述由包络强调部51执行的处理。
在此情况下,由向前强调部61的差计算部71(图7)确定的差diff[i+1]至diff[i+4]依次是4、5、-5和-4。因为不存在小于i的索引,所以将差diff[i]设置为0。因此,如图8中的B所示,向前强调包络Do[i]仍为1,并且向前强调包络Do[i+1]构成为包络ENV[i+1]与对应于差diff[i+1]“4”的附加量“4”的求和值9。此外,向前强调包络Do[i+2]构成为包络ENV[i+2]与对应于差diff[i+2]“5”的附加量“5”的求和值15,而向前强调包络Do[i+3]仍为5。向前强调包络Do[i+4]仍为1。
此外,由向后强调部62的差计算部82确定的差diff[i]至diff[i+3]依次是-4、-5、5和4。因为不存在大于i+4的索引,所以差diff[i+4]在这里为0。因此,如图8中的C所示,强调包络D[i]仍为1,并且强调包络D[i+1]与向前强调包络Do[i+1]一样仍为9。此外,强调包络D[i+2]构成为向前强调包络Do[i+2]与对应于差diff[i+2]“5”的附加量“5”的求和值20,并且强调包络D[i+3]构成为向前强调包络Do[i+3]与对应于差diff[i+3]“4”的附加量“4”的求和值9。此外,强调包络D[i+4]仍为1。
如前文中那样,根据图8中的A所示的包络ENV,包络强调部51生成强调包络D,其中包络ENV的突出部分如图8中的C所示被进一步强调。
[噪声整形部的详细配置示例]
图9是示出了图5中所示的噪声整形部52的详细配置示例的框图。
如图9中所示,噪声整形部52由NS决定部91、噪声整形生成部92、除法部93和减法部94构成。
如果从图5中所示的包络强调部51提供每个量化单元的强调包络D[k],则噪声整形部52的NS决定部91基于强调包络D[k]来决定信息NS,使得比特流BS'中的比特计数落在期望范围内。
此外,如果存在来自图5中所示的量化部14的、关于量化谱QS[k]的比特计数N的反馈,则NS决定部91基于比特计数N来确定比特流BS'中的比特计数是否落在期望范围内,其中该量化谱QS[k]是基于由先前的信息NS指定的量化信息WL而量化的。如果确定比特流BS'中的比特计数没有落在期望范围内,则NS决定部91重新决定信息NS以使得比特流BS'中的比特计数落在期望范围内。
例如,如果比特流BS'中的比特计数低于期望范围,则NS决定部91降低信息NS中的最高值H。相比之下,如果比特流BS'中的比特计数高于期望范围,则NS决定部91首先增大最高值H。然后,如果尽管增大了最高值H,比特流BS'中的比特计数仍高于期望范围,则NS决定部91增大最低值L。NS决定部91将所决定的NS提供给噪声整形生成部92。
相比之下,如果确定比特流BS'中的比特计数落在期望范围内,则NS决定部91将当前的信息NS提供给复用部53(图5),并命令量化部14产生输出。
噪声整形生成部92基于从NS决定部91提供的信息NS来生成每个量化单元的噪声整形G[k]。具体地,噪声整形生成部92将信息NS中包括的最低值L设置为针对最低频率(即第一量化单元)的噪声整形,并且将最高值H设置为针对最高频率(即最后的量化单元)的噪声整形。然后,噪声整形生成部92对连接第一量化单元的噪声整形和最后的量化单元的噪声整形的直线进行量化,从而生成每个量化单元的噪声整形G[k]。此后,噪声整形生成部92将所生成的噪声整形G[k]提供给减法单元94。
除法部93将从图5中所示的包络强调部51提供的每个量化单元的强调包络D[k]除以2。除法部93将生成的相除值D[k]/2提供给减法部94。
减法部94从自除法部93提供的相除值D[k]/2中减去从噪声整形生成部92提供的噪声整形G[k],并且将生成的相减值作为量化信息WL[k]提供给量化部14(图5)。
如前文中那样,噪声整形部52将强调包络D[k]除以大于1的值,从而使量化信息WL的分配平滑。结果,与比特仅被分配给特定谱而未被充分地分配给相邻谱的情况相比,能够在质量方面改进解码的结果。
[由噪声整形部执行的处理的描述]
图10是用于描述用于由图9中所示的噪声整形部52生成噪声整形G的方法的图。
在图10中所示的示例中,最低值L为1并且最高值H为5。量化单元的数目为5。
如图10中的A所示,噪声整形生成部92首先将最低值L设置为第一量化单元1的噪声整形G[1],并且将最高值H设置为最后的量化单元5的噪声整形G[5]。然后,噪声整形生成部92获得连接第一量化单元1的噪声整形G[1]和最后的量化单元5的噪声整形G[5]的直线。此后,如图10中的B所示,噪声整形生成部92对该直线进行量化以获得每个量化单元的噪声整形G[k]。在图10中的B的示例中,噪声整形G[1]至G[5]依次为1、2、3、4和5。
例如,使用预定等式来量化噪声整形G的直线。替选地,可以量化噪声整形G的直线,以使得预先存储将量化结果和信息NS相关联的表,并且从该表读取对应于信息NS的量化结果。
如图10中所示,如果将噪声整形G[k]生成为针对具有较大索引数的量化单元(即在较高频率处)而变大,则能够在较高频率处降低S/N比率。相应地,能够实现对应于人类的听觉特性的噪声整形:在较高频率处较不易于听到噪声。
因此,编码设备50将噪声整形G[k]生成为如图10中所示的在较高频率处较大,从而减小量化谱QS[k]的信息量并实现高频编码,而不会使用户所感知的声音的质量退化。
图11是用于描述由噪声整形部52生成量化信息WL的方法的图。
如果图8中的C所示的强调包络D[i]至D[i+4]作为强调包络D[1]至D[5]被提供给噪声整形部52,则如图11中的A所示,相除值D[1]/2至D[5]/2依次是1、4、10、4和1。在本实施例中,忽略小数点后的值。
如果由噪声整形生成部92生成图10中所示的噪声整形G[1]至G[5],则如图11中的B所示,量化信息WL[1]至WL[5]依次为1、2、7、1和1。在本实施中,如果量化信息WL[k]变得小于1,则将量化信息WL[k]设置为1。
图12是用于描述由噪声整形部52进行的比特流BS'中的比特计数的调整的图。
如图12中所示,可以通过修改最高值H来调整比特流BS'中的比特计数。
具体地,例如如果最低值L为1且最高值H为5,则量化之前的噪声整形G的直线是直线101。同时,如果最低值L为1且最高值H为6,则量化之前的噪声整形G的直线是具有比直线101更大的倾斜的直线102。因此,噪声整形G[k]变得更大,而量化信息WL[k]变得更小。相应地,可以使比特流BS'中的比特计数更小。
如果最低值L为1且最高值H为4,则量化之前的噪声整形G的直线是具有比直线101更小的倾斜的直线103。因此,噪声G[k]变得更小,而量化信息WL[k]变得更大。相应地,可以使比特流BS'中的比特计数更大。
[对包络进行强调的优点]
图13和图14是用于描述对包络ENV进行强调的优点的图。
参照图13,将针对如图13中的A所示的包络ENV[1]至ENV[5]依次为16、13、10、7和2的情况来提供以下描述。在此情况下,当并未对包络ENV[1]至ENV[5]进行强调而是按照原样使用包络ENV[1]至ENV[5]以用于生成量化信息WL[1]至WL[5]时,例如如果噪声整形G[1]至G[5]的值如图10中的B所示,则量化信息WL[1]至WL[5]如图13中的B所示变为15、11、7、3和1。
如前文中那样,当按照原样使用包络ENV[k]以用于生成量化信息WL[k]时,包络ENV[k]的波形的特性对量化信息WL[k]的波形产生影响,相邻量化单元的量化信息WL[k]之间的差变得与包络ENV[k]之间的差相同。取决于噪声整形G[k]的波形,相邻量化单元的量化信息WL[k]之间的差可以大于包络ENV[k]之间的差。
与之相比,当图13中的A所示的包络ENV[1]至ENV[5]被包络强调部51强调时,如图14中的A所示强调包络D[1]至D[5]依次变为19、16、13、12和2。因此,如14中的B所示,相除值D[1]/2至D[5]/2依次变为9、8、6、6和1。如果噪声整形G[1]至G[5]的值如图10中的B所示,则量化信息WL[1]至WL[5]如图14中的C所示依次变为8、6、3、2和1。
如前文中那样,当包络ENV[k]在被用于生成量化信息WL[k]之前被强调并除以2时,相邻量化单元的量化信息WL[k]之间的差变得相对小。即,量化单元的量化信息WL[k]被统一。结果,与比特仅被分配给特定谱而未被充分分配给相邻谱的情况相比,能够在质量方面改进解码的结果。
[由编码设备执行的处理的描述]
图15是用于描述由图5中所示的编码设备50执行的编码处理的流程图。例如当音频信号被输入到编码设备50时,开始编码处理。
在图15中所示的步骤S11处,编码设备50的MDCT部11对作为时域信号的输入音频信号执行MDCT,从而获得作为频域信号的谱S0。MDCT部11将谱S0提供给归一化部12。
在步骤S12处,归一化部12从谱S0提取按量化单元得到的包络ENV[k],并将包络ENV[k]提供给包络强调部51和复用部53。
在步骤S13处,归一化部12使用每个量化单元的包络ENV[k]来将谱S0[k]归一化,并将生成的归一化谱S1[k]提供给量化部14。
在步骤S14处,包络强调部51使用包络ENV[k]执行用于生成强调包络D[k]的强调包络生成处理。将参照稍后描述的图16中所示的流程图来提供强调包络生成处理的细节。
在步骤S15处,噪声整形部52执行噪声整形处理,其中从以下值减去噪声整形G[k]:该值是通过将步骤S14处的强调包络生成处理所生成的强调包络D[k]除以2而获得的。将参照稍后描述的图17中所示的流程图来提供噪声整形处理的细节。
在步骤S16处,复用部53通过复用从归一化部12提供的包络ENV[k]、从噪声整形部52提供的信息NS和从量化部14提供的量化谱QS[k]来生成比特流BS'。复用部15输出比特流BS'作为编码的结果。相应地,处理结束。
图16是用于描述图15中所示的步骤S14处的强调包络生成处理的细节的流程图。
在图16中所示的步骤S20处,包络强调部51的向前强调部61的差计算部71(图7)将从归一化部12提供的量化单元的包络ENV[1]按照原样作为向前强调包络Do[1]提供给向后强调部62。
在步骤S21处,向前强调部61针对要处理的包络ENV将索引设置为2。
在步骤S22处,向前强调部61的差计算部71从自归一化部12提供的包络ENV[k+1]减去包络ENV[k],从而确定差diff[k+1]。差计算部71将所确定的差diff[k+1]和包络ENV[k+1]提供给加法部72。
在步骤S23处,加法部72确定从差计算部71提供的差diff[k+1]是否大于0,即差diff[k+1]是否为正值。如果在步骤S23处确定差diff[k+1]大于0,则在步骤S24处,加法部72从附加量表部73读取对应于差diff[k+1]的附加量。
在步骤S25处,加法部72对在步骤S24处读取的附加量和包络ENV[k+1]求和,并将生成的值作为向前强调包络Do[k+1]提供给向后强调部62。然后,处理移动至步骤S26。
同时,如果在步骤S23处确定差diff[k+1]不大于0,则加法部72将包络ENV[k+1]按照原样作为向前强调包络Do[k+1]提供给向后强调部62。然后,处理移动至步骤S26。
在步骤S26处,向前强调部61确定要处理的包络ENV的索引k是否为最后的索引E,即是否所有量化单元的向前强调包络Do[k]均被提供给向后强调部62。
如果在步骤S26处确定要处理的包络ENV的索引k不是最后的索引E,则在步骤S27处向前强调部61使索引仅递增1,并且使处理返回到步骤S22。相应地,向前强调部61重复步骤S22至S27,直到要处理的包络ENV的索引k变为最后的索引E为止。
同时,如果在步骤S26处确定要处理的包络ENV的索引k是最后的索引E,则在步骤S28处向后强调部62将要处理的包络ENV的索引k设置为1。
在步骤S29处,向后强调部62的差计算部81从自归一化部12提供的包络ENV[k]减去包络ENV[k+1],从而确定差diff[k]。差计算部81将所确定的差diff[k]提供给加法部82。
在步骤S30处,加法部82确定从差计算部81提供的差diff[k]是否大于0。如果在步骤S30处确定差diff[k]大于0,则在步骤S31处加法部82从附加量表部83读取对应于差diff[k]的附加量。
在步骤S32处,加法部82对从加法部72提供的向前强调包络Do[k]和在步骤S30处读取的附加量求和。加法部82将生成的值作为强调包络D[k]提供给噪声整形部52(图5)。然后,处理移动至步骤S33。
相比之下,如果在步骤S30处确定差diff[k]不大于0,则加法部82将从加法部72提供的向前强调包络Do[k]按照原样作为强调包络D[k]提供给噪声整形部52。然后,处理移动至步骤S33。
在步骤S33处,向后强调部62确定要处理的包络ENV的索引k是否为紧接在最后的索引之前的索引。如果在步骤S33处确定要处理的包络ENV的索引k不是紧接在最后的索引之前的索引,则在步骤S34处向后强调部62使要处理的包络ENV的索引k递增1,并且使处理返回到步骤S29。相应地,向后强调部62重复步骤S29至S34,直到要处理的包络ENV的索引k变为紧接在最后的索引之前的索引为止。
相比之下,如果在步骤S33处确定要处理的包络ENV的索引k是紧接在最后的索引E之前的索引,则处理移动至步骤S35。
在步骤S35处,加法部82将最后的索引E的向前强调包络Do[E]作为强调包络D[E]提供给噪声整形部52。然后,处理返回到图15中所示的步骤S14,并且移动至步骤S15。
图17是用于描述图15中所示的步骤S15处的噪声整形处理的细节的流程图。
在图17中所示的步骤S41处,噪声整形部52的NS决定部91(图9)基于从图5中所示的包络强调部51提供的强调包络D[k]来决定信息NS,以使得比特流BS'中的比特计数落在期望范围内。NS决定部91将信息NS提供给噪声整形生成部92。
在步骤S42处,噪声整形生成部92基于从NS决定部91提供的信息NS来生成噪声整形G[k]。然后,噪声整形生成部92将所生成的噪声整形G[k]提供给减法部94。
在步骤S43处,除法部93将从图5中所示的包络强调部51提供的强调包络D[k]除以2,并将生成的相除值D[k]/2提供给减法部94。
在步骤S44处,减法部94从自除法部93提供的相除值D[k]/2中减去从噪声整形生成部92提供的噪声整形G[k]。
在步骤S45处,减法部94将步骤S44所生成的相减值作为量化信息WL[k]输出至量化部14(图5)。
在步骤S46处,NS决定部91确定是否存在来自量化部14的、关于根据步骤S45处输出的量化信息WL而量化的量化谱QS[k]中的比特计数N的反馈。
如果在步骤S46处确定不存在来自量化部14的关于比特计数N的反馈,则NS决定部91等待关于比特计数N的反馈。
相比之下,如果在步骤S46处确定存在来自量化部14的关于比特计数N的反馈,则NS决定部91在步骤S47处基于比特计数N来确定比特流BS'中的比特计数是否落在期望范围内。
如果在步骤S47处确定比特流BS'中的比特计数没有落在期望范围内,则NS决定部91在步骤S48处决定新的信息NS以使得比特流BS'中的比特计数落在期望范围内。然后,NS决定部91将所决定的信息NS提供给噪声整形生成部92,并使处理返回到步骤S42。
NS决定部91重复步骤S42至S48,直到比特流BS'中的比特计数落在期望范围内为止。
相比之下,如果在步骤S47处确定比特流BS'中的比特计数落在期望范围内,则NS决定部91在步骤S49处将当前的信息NS提供给复用部53(图5)并且命令量化部14产生输出。然后,处理返回到图15中所示的步骤S15并且移动至步骤S16。
[解码设备的配置示例]
图18是示出了对由图5中所示的编码设备编码的比特流BS'进行解码的解码设备的配置示例的框图。
在图18中所示的配置中,对与图4的配置中相同的部件给出与图4的配置中相同的附图标记。适当地省略相同部件的重复描述。
图18中所示的解码设备110的配置与图4的配置的不同之处主要在于:设置了分离部111、包络强调部112、噪声整形部113和分离部114,来取代分离部21。
由编码设备50编码的比特流BS'被输入到解码设备110的分离部111。分离部111从比特流BS'中分离出按量化单元得到的包络ENV[k]和信息NS。分离部111将包络ENV[k]提供给包络强调部112和逆归一化部23,并将信息NS提供给噪声整形部113。
以与图7中所示的包络强调部51相同的方式来配置包络强调部112。包络强调部112使用从分离部111提供的按量化单元得到的包络ENV[k]来生成按量化单元得到的强调包络D[k],并将强调包络D[k]提供给噪声整形部113。
噪声整形部113将从包络强调部112提供的按量化单元得到的强调包络D[k]除以2。然后,噪声整形部113从每个量化单元的相除值中减去由从分离部111提供的信息NS指定的噪声整形G[k]。噪声整形部52将生成的值作为量化信息WL[k]提供给分离部114和逆量化部22。将参照稍后描述的图19来提供噪声整形部113的细节。
分离部114基于从噪声整形部113提供的量化信息WL[k],从自编码设备50输入的比特流BS'中分离出量化谱QS[k]。分离部114将量化谱QS[k]提供给逆量化部22。
[噪声整形部的详细配置示例]
图19是示出了图18中所示的噪声整形部113的详细配置示例的框图。
如图19中所示,噪声整形部113由噪声整形生成部121、除法部122和减法部123构成。
与图9中所示的噪声整形生成部92一样,噪声整形生成部121基于从图18中所示的分离部111提供的信息NS来生成每个量化单元的噪声整形G[k]。然后,噪声整形生成部121将所生成的噪声整形G[k]提供给减法部123。
除法部122将从图18中所示的包络强调部112提供的每个量化单元的强调包络D[k]除以2,并将生成的相除值D[k]/2提供给减法部123。
减法部123针对每个量化单元,从自除法部122提供的相除值D[k]/2中减去从噪声整形生成部121提供的噪声整形G[k]。减法部123将针对每个量化单元生成的相减值作为量化信息WL[k]提供给分离部114(图18)。
[由解码设备执行的处理的描述]
图20是用于描述由图18中所示的解码设备110执行的解码处理的流程图。例如当从图5中所示的编码设备50输入比特流BS'时,开始解码处理。
在图20中所示的步骤S101处,解码设备110的分离部111(图18)从自编码设备50输入的比特流BS'中分离出按量化单元得到的包络ENV[k]和信息NS。分离部111将包络ENV[k]提供给包络强调部112和逆归一化部23,并将信息NS提供给噪声整形部113。
在步骤S102处,包络强调部112使用从分离部111提供的按量化单元得到的包络ENV[k],来执行用于生成按量化单元得到的强调包络D[k]的强调包络生成处理。强调包络生成处理与图16中所示的强调包络生成处理相同,因而这里将省略其描述。通过强调包络生成处理生成的强调包络D[k]被提供给噪声整形部113。
在步骤S103处,噪声整形部113执行噪声整形处理,该噪声整形处理用于从自包络强调部112提供的按量化单元得到的强调包络D[k]中减去噪声整形G[k]。将参照稍后描述的图21中所示的流程图来提供噪声整形处理的细节。
在步骤S104处,分离部114基于在步骤S103处从噪声整形部113提供的量化信息WL[k],从自编码设备50输入的比特流BS'中分离出量化谱QS[k]。分离部114将量化谱QS[k]提供给逆量化部22。
在步骤S105处,逆量化部22基于从分离部114提供的量化信息WL对量化谱QS[k]进行逆量化,并将生成的归一化谱S1[k]提供给逆归一化部23。
在步骤S106处,逆归一化部23通过从分离部111提供的包络ENV[k]对从逆量化部22提供的归一化谱S1[k]进行逆归一化,并将生成的谱S0提供给逆MDCT部24。
在步骤S107处,逆MDCT部24对从逆归一化部23提供的作为频域信号的谱S0执行逆MDCT,从而获得作为时域信号的声音PCM信号。逆MDCT部24输出声音PCM信号作为音频信号,然后结束该处理。
图21是用于描述图20中所示的步骤S103处的噪声整形处理的流程图。
在步骤S121处,噪声整形部113的噪声整形生成部121(图19)基于从图18中所示的分离部111提供的信息NS来生成噪声整形G[k]。然后,噪声整形生成部121将所生成的噪声整形G[k]提供给减法部23。
在步骤S122处,除法部122将从图18中所示的包络强调部112提供的强调包络D[k]除以2,并将生成的相除值D[k]/2提供给减法部123。
在步骤S123处,减法部123从自除法部122提供的相除值D[k]/2中减去从噪声整形生成部121提供的噪声整形G[k]。
在步骤S124处,减法部123将步骤S123所生成的相减值作为量化信息WL[k]提供给分离部114(图18)。然后,处理返回到图20中所示的步骤S103并移动到步骤S104。
<第二实施例>
[编码设备的第二实施例的配置示例]
图22是示出了应用本发明的显示装置的第二实施例的配置示例的框图。
在图22中所示的配置中,对与图5的配置中相同的部件给出与图5的配置中相同的附图标记。将适当地省略相同部件的重复描述。
图22中所示的编码设备150的配置与图5中所示的配置的不同之处主要在于:设置了噪声整形部151和复用部152来取代噪声整形部52和复用部53。编码设备150具有用于量化信息WL的多种算术运算,并且在编码的结果中包括用于表示所使用的算术运算的算术运算信息P和信息NS,作为信息NS'。
具体地,编码设备150的噪声整形部151使用从包络强调部51提供的按量化单元得到的强调包络D[k]和由信息NS指定的按量化单元得到的噪声整形G[k],通过预定算术运算确定量化信息WL[k]。
此外,如果从包络强调部51提供了强调包络D[k],则噪声整形部151基于强调包络D[k]和由复用部152生成的比特流BS''中的比特计数的期望范围,从用于量化信息WL的多个算术运算当中选择一个算术运算。此外,噪声整形部151将与所选的算术运算相关联地预设的信息NS的初始值设置为当前的信息NS。
此外,如果存在来自量化部14的、关于量化谱QS[k]中的比特计数N的反馈,则噪声整形部151根据比特计数N来确定比特流BS''中的比特计数是否落在期望范围内,其中量化谱QS[k]是基于先前的量化信息WL对归一化谱S1量化而产生的。如果确定比特流BS''中的比特计数没有落在期望范围内,则噪声整形部151更新信息NS以使得比特流BS''中的比特计数落在期望范围内。相应地,向量化部14提供新的量化信息WL。
相比之下,如果确定比特流BS''中的比特计数落在期望范围内,则噪声整形部151命令量化部14产生输出,并将当前的信息NS和用于表示用于量化信息WL的算术运算的算术信息P作为信息NS'提供给复用部152。
复用部152复用从归一化部12提供的包络ENV[k]、从噪声整形部151提供的信息NS'以及从量化部14提供的量化谱QS[k],从而生成比特流BS''。复用部152输出比特流BS''作为编码的结果。
[比特流的配置示例]
图23是示出了由图22中所示的复用部152生成的比特流BS''的配置示例的图。
如图23中所示,比特流BS''由包括谱的上限值的头Header、包络ENV[k]、信息NS'和量化谱QS[k]构成。
[噪声整形部的详细配置示例]
图24是示出了图22中所示的噪声整形部151的详细配置示例的框图。
在图24中所示的配置中,对与图9的配置中相同的部件给出与图9的配置中相同的附图标记。将适当地省略相同部件的重复描述。
图24中所示的噪声整形部151的配置与图9的配置的不同之处主要在于:设置了NS'决定部161来取代NS决定部91,新设置了切换部162,并且设置了WL算术部163-1至163-4来取代除法部93和减法部94。
如果从图22中所示的包络强度部51提供了每个量化单元的强调包络D[k],则噪声整形部151的NS'决定部161基于强调包络D[k]和比特流BS''中的比特计数的期望范围,在对应于WL算术部163-1至163-4的、用于量化信息WL的算术运算中选择一个算术运算。然后,NS'决定部161将表示所选的算术运算的算术信息P提供给切换部162。此外,NS'决定部161决定与算术信息P所表示的算术运算相关联地预设的信息NS的初始值作为当前的信息NS,并将其提供给噪声整形生成部92。
此外,如果存在来自图22中所示的量化部14的、关于基于先前的信息NS和由算术信息P指定的量化信息WL而量化的量化谱QS[k]的比特计数N的反馈,则NS'决定部161基于比特计数N来确定比特流BS''中的比特计数是否落在期望范围内。如果确定比特流BS''中的比特计数没有落在期望范围内,则NS'决定部161重新决定信息NS以使得比特流BS''中的比特计数落在期望范围内,并将其提供给噪声整形生成部92。
相比之下,如果确定比特流BS''中的比特计数落在期望范围内,则NS'决定部161将当前的信息NS和算术信息P作为信息NS'提供给复用部152(图22),并命令量化部14产生输出。
如前文中那样,NS'决定部161通过选择用于量化信息WL的算术运算来执行对比特流BS''的粗略控制,然后通过信息NS执行精细控制。如果从量化部14反馈比特计数N,则不仅可以基于比特计数N来更新信息NS,而且还可以基于比特计数N来更新算术信息P。
基于从NS'决定部161提供的算术信息P,切换部162(选择装置)从WL算术部163-1至163-4当中选择用于通过由算术信息P表示的算术运算来确定量化信息WL的WL算术部。切换部162将由噪声整形生成部92生成的噪声整形G[k]提供给WL算术部163-1至163-4中所选择的那个WL算术部以执行算术运算。
WL算术部163-1从自图22中所示的包络强调部51提供的强调包络D[k]中减去从切换部162提供的噪声整形G[k],并且将生成的相减值设置为量化信息WL[k]。即,WL算术部163-1通过算术运算WL[k]=D[k]-G[k]来确定量化信息WL[k]。WL算术部163-1将量化信息WL[k]提供给量化部14(图22)。
WL算术部163-2具有图9中所示的除法部93和减法部94。WL算术部163-2将从包络强调部51提供的强调包络D[k]除以2。然后,WL算术部163-2从生成的相除值中减去从切换部162提供的噪声整形G[k],并将相减值设置为量化信息WL[k]。即,WL算术部163-2通过算术运算WL[k]=D[k]/2-G[k]来确定量化信息WL[k]。WL算术部163-2将量化信息WL[k]提供给量化部14。
WL算术部163-3将从包络强调部51提供的强调包络D[k]除以3。然后,WL算术部163-3从生成的相除值中减去从切换部162提供的噪声整形G[k],并将生成的相减值设置为量化信息WL[k]。即,WL算术部163-3通过算术运算WL[k]=D[k]/3-G[k]来确定量化信息WL[k]。WL算术部163-3将量化信息WL[k]提供给量化部14。
WL算术部163-4将从包络强调部51提供的强调包络D[k]除以4。WL算术部163-4从生成的相除值减去从切换部162提供的噪声整形G[k],并将生成的相减值设置为量化信息WL[k]。即,WL算术部163-4通过算术运算WL[k]=D[k]/4-G[k]来生成量化信息WL[k]。WL算术部163-4将量化信息WL[k]提供给量化部14。
[准备用于量化信息的多种算术运算的优点]
图25是用于描述准备用于量化信息WL的多种算术运算的优点的图。
在参照图25进行的以下描述中,图8中的C所示的强调包络D[i]至D[i+4]被输入到噪声整形部151,并且在噪声整形部151处生成图10中的B所示的噪声整形G[k]。
在这种情况下,如图25中的A所示,由WL算术部163-1生成的量化信息WL[i]至WL[i+4]依次变为1、7(=9-2)、17(=20-3)、5(=9-4)和1。因此,量化信息WL[i]至WL[i+4]的最大值是17,并且量化信息WL[i]至WL[i+4]的平均值是6.2(=(1+7+17+5+1)/5。如果每个量化单元由两个谱构成,则具有索引i至i+4的量化单元的谱中的总比特计数变为62(=6.2×2×5)。
此外,如图25中的B所示,由WL算术部163-2生成的量化信息WL[i]至WL[i+4]依次变为1、2(≈9/2-2)、7(=20/2-3)、1和1。因此,如图25中的B所示,相比于图25中的A所示的情况,由WL算术部163-2生成的量化信息WL[i]至WL[i+4]被平坦化。此外,量化信息WL[i]至WL[i+4]的最大值是7,并且量化信息WL[i]至WL[i+4]的平均值是2.4(=(1+2+7+1+1)/5。如果每个量化单元由两个谱构成,则具有索引i至i+4的量化单元的谱中的总比特计数变为24(=2.4×2×5)。
此外,如图25中的C所示,由WL算术部163-3生成的量化信息WL[i]至WL[i+4]依次变为1、1(=9/3-2)、3(=20/3-3)、1和1。因此,如图25中的C所示,相比于图25中的B所示的情况,由WL算术部163-3生成的量化信息WL[i]至WL[i+4]被进一步平坦化。此外,量化信息WL[i]至WL[i+4]的最大值是3,并且量化信息WL[i]至WL[i+4]的平均值变为1.4(=(1+1+3+1+1)/5。如果每个量化单元由两个谱构成,则具有索引i至i+4的量化单元的谱中的总比特计数变为14(=1.4×2×5)。
此外,如图25中的D所示,由WL算术部163-4生成的量化信息WL[i]至WL[i+4]依次变为1、1、2(=20/4-3)、1和1。因此,如图25中的D所示,相比于图25中的C所示的情况,由WL算术部163-4生成的量化信息WL[i]至WL[i+4]被进一步平坦化。量化信息WL[i]至WL[i+4]的最大值是2,并且量化信息WL[i]至WL[i+4]的平均值变为1.2(=(1+1+2+1+1)/5。如果每个量化单元由两个谱构成,则具有索引i至i+4的量化单元的谱中的总比特计数变为12(=1.2×2×5)。
如前文中那样,编码设备150通过准备用于量化信息WL的四种算术运算,而允许在不必改变噪声整形G的情况下修改比特计数N。与仅使用噪声整形G来调整比特计数N的情况相比,这提高了调整比特计数N的自由度。
此外,按在WL算术部163-1处、在WL算术部163-2处、在WL算术部163-3处和在WL算术部163-4处这一顺序,对谱集中的量化单元进行较密集地比特分配。此外,按在WL算术部163-4处、在WL算术部163-3处、在WL算术部163-2处和在WL算术部163-1处这一顺序,比特分配较平坦化。然而,由于在编码设备150中强调了包络ENV[k],因此,即使比特分配更平坦化,与相邻量化单元相比也会将更大数目的比特分配给谱集中的量化单元。因此,准备用于量化信息WL的四种算术运算允许编码设备150控制对谱集中的量化单元的比特分配的密集程度。
如前文中那样,编码设备150使得可以改进调整比特计数N的自由度并控制对谱集中的量化单元的比特分配的密集程度,从而如在直接控制量化信息WL[k]的情况下那样实现比特调整。即,编码设备150可以如编码设备50那样减小由于进行音频信号的编码而导致的声音质量的退化,并且如在直接控制量化WL[k]的情况下那样实现比特调整。
[对包络进行强调的优点的描述]
图26是用于描述对包络ENV进行强调的优点的图。
在参照图26进行的以下描述中,提取图8中的A所示的包络ENV[i]至ENV[i+4]。在这种情况下,如图26中的A所示,由WL算术部163-1生成的量化信息WL[i]至WL[i+4]依次变为1、3(=5-2)、7(=10-3)、1(=5-4)和1。此外,如图26中的B所示,由WL算术部163-2生成的量化信息WL[i]至WL[i+4]依次变为1、1、2(=10/2-3)、1和1。如图26中的C所示,由WL算术部163-3生成的量化信息WL[i]至WL[i+4]依次变为1、1、1、1和1。如图26中的D所示,由WL算术部163-4生成的量化信息WL[i]至WL[i+4]依次变为1、1、1、1和1。
如前文中那样,当在不进行强调的情况下使用包络ENV时,相邻量化单元的量化信息WL之间的差变得更小,这导致平坦化的比特分配。因此,即使改变用于量化信息WL的算术运算的种类,也不可能改进比特调整的自由度。
[由编码设备执行的处理的描述]
由图22中所示的编码设备150执行的编码处理除了图15中所示的步骤S15处的噪声整形以外,与图15中所示的编码处理相同,因此下面将仅描述噪声整形。
图27是用于描述由图22中所示的编码设备150执行的噪声整形的流程图。
在图27中所示的步骤S151处,噪声整形部151的NS'决定部161(图24)基于从图22中所示的包络强调部51提供的强调包络D[k]来决定信息NS和要执行的算术运算。
具体地,NS'决定部161基于强调包络D[k]和比特流BS''中的比特计数的期望范围,在与WL算术部163-1至163-4相对应的用于量化信息WL的算术运算中选择任一算术运算。然后,NS'决定部161将表示所选择的算术运算的算术信息P提供给切换部162。此外,NS'决定部161决定与算术信息P所表示的算术运算相关联地预设的信息NS的初始值作为当前的信息NS,并将其提供给噪声整形生成部92。
在步骤S152处,噪声整形生成部92基于从NS'决定部161提供的信息NS来生成噪声整形G[k]。然后,噪声整形生成部92将所生成的噪声整形G[k]提供给切换部162。
在步骤S153处,切换部162确定由从NS'决定部161提供的算术信息P表示的算术运算是否是要在WL算术部163-1处执行的算术运算。
如果在步骤S153处确定由算术信息P表示的算术运算是要在WL算术部163-1处执行的算术运算,则切换部162将从噪声整形生成部92提供的噪声整形G[k]提供给WL算术部163-1。然后,在步骤S154处,WL算术部163-1从自包络强调部51提供的强调包络D[k]中减去从切换部162提供的噪声整形G[k]。此外,WL算术部163-1将相减值作为量化信息WL[k]提供给量化部14(图22),然后将处理移动到步骤S163。
相比之下,如果在步骤S153处确定由算术信息P表示的算术运算不是要在WL算术部163-1处执行的算术运算,则切换部162在步骤S155处确定由从NS'决定部161提供的算术信息P表示的算术运算是否是要在WL算术部163-2处执行的算术运算。
如果在步骤S155处确定由算术信息P表示的算术运算是要在WL算术部163-2处执行的算术运算,则切换部162将从噪声整形生成部92提供的噪声整形G[k]提供给WL算术部163-2。然后,在步骤S156处,WL算术部163-2将从包络强调部51提供的强调包络D[k]除以2。
在步骤S157处,WL算术部163-2从步骤S156所产生的相除值中减去从切换部162提供的噪声整形G[k]。然后,WL算术部163-2将相减值作为量化信息WL[k]提供给量化部14,并且将处理移动到步骤S163。
相比之下,如果在步骤S155处确定由算术信息P表示的算术运算不是要在WL算术部163-2处执行的算术运算,则切换部162在步骤S158处确定由从NS'决定部161提供的算术信息P表示的算术运算是否是要在WL算术部163-3处执行的算术运算。
如果在步骤S158处确定由算术信息P表示的算术运算是要在WL算术部163-3处执行的算术运算,则切换部162将从噪声整形生成部92提供的噪声整形G[k]提供给WL算术部163-3。然后,在步骤S159处,WL算术部163-3将从包络强调部51提供的强调包络D[k]除以3。
在步骤S160处,WL算术部163-3从步骤S159所生成的相除值中减去从切换部162提供的噪声整形G[k]。然后,WL算术部163-3将相减值作为量化信息WL[k]提供给量化部14,并且将处理移动到步骤S163。
相比之下,如果在步骤S158处确定由算术信息P表示的算术运算不是要在WL算术部163-3处执行的算术运算,即,由算术信息P表示的算术运算是要在WL算术部163-4处执行的算术运算,则切换部162将从噪声整形生成部92提供的噪声整形G[k]提供给WL算术部163-4。然后,在步骤S161处,WL算术部163-4将从包络强调部51提供的强调包络D[k]除以4。
在步骤S162处,WL算术部163-4从步骤S161所生成的相除值中减去从切换部162提供的噪声整形G[k]。然后,WL算术部163-4将相减值作为量化信息WL[k]提供给量化部14,并且将处理移动到步骤S163。
在步骤S163处,NS'决定部161确定是否存在来自量化部14的、关于如下量化谱QS[k]中的比特计数N的反馈:该量化谱QS[k]是基于在步骤S154、S157、S160或S162处提供给量化部14的量化信息WL而量化的。
如果在步骤S163处确定没有从量化部14反馈比特计数N,则等待比特计数N的反馈。
相比之下,如果在步骤S163处确定从量化部14反馈了比特计数N,则NS'决定部161于是在步骤S164处根据比特计数N来确定比特流BS''中的比特计数是否落在期望范围内。
如果在步骤S164处确定比特流BS''中的比特计数没有落在期望范围内,则在步骤S165处NS'决定部161决定新的信息NS以使得比特流BS''中的比特计数落在期望范围内。然后,NS'决定部161将所决定的信息NS提供给噪声整形生成部92,并使处理返回到步骤S152。NS'决定部161重复步骤S152至S165,直到比特流BS''中的比特计数落在期望范围内为止。
相比之下,如果在步骤S164处确定比特流BS''中的比特计数落在期望范围内,则在步骤S166处,NS'决定部161将当前的信息NS和算术信息P作为信息NS'提供给复用部152(图22),并命令量化部14产生输出。处理返回到图15中所示的步骤S15,然后移动至步骤S16。
[解码设备的配置示例]
图28是示出了对由图22中所示的编码设备150编码的比特流BS''进行解码的解码设备的配置示例的框图。
对图28中所示的配置中的、与图18中所示的配置中相同的部件给出与图18中所示的配置中相同的附图标记。这里将适当地省略相同部件的重复描述。
图28中所示的解码设备210的配置与图18中所示的配置的不同之处主要在于:设置了分离部211、噪声整形部212和分离部213来取代分离部111、噪声整形部113和分离部114。
由编码设备150编码的比特流BS''被输入到解码设备210的分离部211。分离部211从比特流BS''中分离出按量化单元得到的包络ENV[k]和信息NS'。分离部211将包络ENV提供给包络强调部112和逆归一化部23,并将信息NS'提供给噪声整形部212。
噪声整形部212使用由包络强调部212生成的按量化单元得到的强调包络D[k]和由来自分离部211的信息NS'中的NS指定的按量化单元得到的噪声整形G[k],通过执行由信息NS'中的算术信息P表示的算术运算来生成量化信息WL[k]。噪声整形部212将量化信息WL[k]提供给分离部213和逆量化部22。将参照稍后描述的图29来提供噪声整形部212的细节。
分离部213基于从噪声整形部212提供的量化信息WL[k],从自编码设备150输入的比特流BS''中分离出量化谱QS[k]。分离部213将量化谱QS[k]提供给逆量化部22。
[噪声整形部的详细配置示例]
图29是示出了图28中所示的噪声整形部212的详细配置示例的框图。
对图29中所示的配置中的、与图19中所示的配置中相同的部件给出与图19中所示的配置中相同的附图标记。这里将适当地省略相同部件的重复描述。
图29中所示的噪声整形部212的配置和图19中所示的配置的不同之处主要在于:新设置了切换部221,并且设置了WL算术部222-1至222-4来取代除法部122和减法部123。
以与图24中所示的切换部162相同的方式来配置切换部221(选择装置)。由噪声整形生成部121基于从分离部211提供的信息NS'中的信息NS而生成的噪声整形G[k]被输入到切换部221中。此外,从分离部211提供的信息NS'中的算术信息P被输入到切换部221中。切换部221基于所输入的算术信息P,从WL算术部222-1至222-4当中选择用于通过由算术信息P表示的算术运算来确定量化信息WL的WL算术部。切换部221将噪声整形G[k]提供给WL算术部222-1至222-4中所选择的那个WL算术部,以执行算术运算。
以与图24中所示的WL算术部163-1至163-4相同的方式配置WL算术部222-1至222-4,因而这里将省略其详细描述。
[由解码设备执行的处理的描述]
由图28中所示的解码设备210执行的解码处理除了图20中所示的步骤S103处的噪声整形以外,与图20中所示的解码处理相同,因而下面将仅描述噪声整形。
图30是用于描述由图28中所示的解码设备210执行的噪声整形的流程图。
在图30中所示的步骤S201处,噪声整形部212的噪声整形生成部121(图29)基于从图28中所示的分离部211提供的信息NS'中的信息NS来生成噪声整形G[k]。然后,噪声整形生成部121将所生成的噪声整形G[k]提供给切换部221。
步骤S202至S211等同于由取代图24中所示的WL算术部163-1至163-4的WL算术部222-1至222-4所执行的、图27中所示的步骤S153至S162,因而这里将省略其描述。此外,要在步骤S202、S204和S207处确定的算术信息P是从分离部211提供的信息NS'中的算术信息P。
在前面的描述中,第一量化单元的噪声整形G具有最低值L,而最后的量化单元的噪声整形G具有最高值H。替选地,可将任意量化单元设置为对应于最低值L的量化单元和对应于最高值H的量化单元。在这种情况下,信息NS(NS')包括位置信息X和位置信息Y,其中位置信息X表示对应于最低值L的量化单元的索引,而位置信息Y表示对应于最高值H的量化单元的索引。这使得可以进一步改变比特分配的自由度。
此外,用于量化信息WL的算术运算的种类不限于前述四个。替选地,可以准备用于噪声整形G的多种算术运算,而不是用于量化信息WL的多种算术运算,并且用于表示所使用的算术运算的信息可以包括在信息NS(NS')中。此外,可以准备用于生成强调包络D的多种方法,并且用于表示所使用的生成方法的信息可以包括在信息NS(NS')中。在这种情况下,例如,通过用于量化信息WL的算术运算的种类来选择用于生成强调包络D的方法。
替选地,可以准备用于量化信息WL的多种算术运算、用于噪声整形G的算术运算、以及用于生成强调包络D的方法,并且用于表示所使用的算术运算和所使用的生成方法的信息可以包括在信息NS(NS')中。
如果传送信息NS(NS')所需要的比特计数充分小于传送量化信息WL所需要的比特计数NWL,则信息NS(NS')中所包括的信息不限于前述信息。
<第三实施例>
[应用本发明的计算机的描述]
可以通过硬件或软件来进行由编码设备50(150)和解码设备110(210)执行的以上系列处理。如果通过软件进行由编码设备50(150)和解码设备110(210)执行的该系列处理,则构成软件的程序被安装到通用计算机等中。
图31是示出了安装有用于执行以上系列处理的程序的计算机的一个实施例的配置示例的图。
程序可以被预先安装在作为内嵌到计算机中的记录介质的存储器部308或ROM(只读存储器)中。
替选地,程序可以被存储(记录)在可拆卸介质311中。可拆卸介质311可以被设置为所谓的封装软件。可拆卸介质311这里可以是软盘、CD-ROM(致密盘只读存储器)、MO(磁光)盘、DVD(数字多功能盘)、磁盘、半导体存储器等。
可以经由驱动器310将程序从可拆卸介质311安装到计算机中,或者经由通信网络或广播网络将程序下载到计算机中、然后安装在内嵌式存储器部308中。具体地,例如程序可以经由用于数字卫星广播的人造卫星以无线方式传送到计算机,或者可以经由诸如LAN(局域网)或因特网的网络而以有线方式传送到计算机。
计算机包含CPU(中央处理单元)301,输入/输出接口305经由总线304被连接到CPU301。
当正操作输入部306等的用户经由输入/输出接口305发出命令时,CPU301相应地执行存储在ROM302中的程序。或者,CPU301将存储在存储器部308中的程序加载到RAM(随机存取存储器)303中以用于执行。
因此,CPU301执行根据流程图的前述处理或者根据框图中所示的配置的前述处理。然后,CPU301根据需要经由输入/输出接口305使得输出部307输出处理的结果,使得通信部309传输处理的结果,使得存储器部308记录处理的结果等。
输入部306由键盘、鼠标、麦克风等构成。输出部307由LCD(液晶显示器)、扬声器等构成。
本文中由计算机根据程序执行的处理不一定按照流程图中描述的时间顺序来执行。即,由计算机根据程序执行的处理包括并行地或单独地执行的处理(例如,并行处理或对象处理)。
此外,程序可以由一个计算机(处理器)来处理或由多个计算机进行分布式处理。此外,程序可以被传送到远距离计算机以用于执行。
本发明的实施例不限于前述实施例,而可以在不脱离本发明的本质的情况下以各种方式进行修改。
附图标记列表
12  归一化部
14  量化部
22  逆量化部
23  逆归一化部
50  编码设备
51  包络强调部
52  噪声整形部
53  复用部
91  NS决定部
110  解码设备
111  分离部
112  包络强调部
113  噪声整形部
114  分离部
150  编码设备
151  噪声整形部
152  复用部
161  NS'决定部
162  切换部
163-1  至163-4WL算术部
210  解码部
211  分离部
212  噪声整形部
213  分离部
221  切换部
222-1至222-4WL  算术部

Claims (10)

1.一种编码设备,包括:
归一化装置,用于从音频信号的谱中提取包络,并使用所述包络将所述谱归一化;
包络强调装置,用于强调所述包络;
噪声整形装置,用于将由所述包络强调装置强调的所述包络除以大于1的值,并从相除的结果中减去由预定信息指定的噪声整形,其中所述预定信息是表示所述噪声整形的最低值和最高值的信息;
量化装置,用于将由所述噪声整形装置进行的相减的结果设置为量化比特计数,并基于所述量化比特计数来对由所述归一化装置归一化的所述谱进行量化;以及
复用装置,用于复用所述预定信息、由所述量化装置量化的所述谱、以及所述包络。
2.根据权利要求1所述的编码设备,还包括:信息决定装置,用于根据由所述包络强调装置强调的所述包络来决定所述预定信息。
3.根据权利要求2所述的编码设备,其中,所述信息决定装置根据由所述量化装置基于先前的量化比特计数而量化的所述谱的比特计数来更新所述预定信息。
4.根据权利要求1所述的编码设备,其中,
所述噪声整形装置包括:
第一算术装置,用于执行第一算术运算,以将由所述包络强调装置强调的所述包络除以大于1的第一值,并从相除的结果中减去所述噪声整形;
第二算术装置,用于执行第二算术运算,以将由所述包络强调装置强调的所述包络除以不同于所述第一值的大于1的第二值,并从相除的结果中减去所述噪声整形;以及
选择装置,用于选择所述第一算术装置或所述第二算术装置,并使得所选择的第一算术装置或第二算术装置执行算术运算,其中
所述复用装置复用所述预定信息、所述谱、所述包络、以及用于表示与所述选择装置所选择的第一算术装置或第二算术装置相对应的第一算术运算或第二算术运算的算术信息。
5.根据权利要求4所述的编码设备,还包括:信息决定装置,用于基于由所述包络强调装置强调的所述包络来决定所述预定信息和所述算术信息,其中
所述选择装置基于所述算术信息来选择所述第一算术运算或所述第二算术运算。
6.根据权利要求5所述的编码设备,其中,所述信息决定装置根据由所述量化装置基于先前的量化比特计数而量化的所述谱中的比特计数来更新至少所述预定信息。
7.一种用于编码设备的编码方法,包括:
归一化步骤,用于从音频信号的谱中提取包络,并使用所述包络将所述谱归一化;
包络强调步骤,用于强调所述包络;
噪声整形步骤,用于将在所述包络强调步骤中强调的所述包络除以大于1的值,并从相除的结果中减去由预定信息指定的噪声整形,其中所述预定信息是表示所述噪声整形的最低值和最高值的信息;
量化步骤,用于将在所述噪声整形步骤中进行的相减的结果设置为量化比特计数,并基于所述量化比特计数来对在所述归一化步骤中归一化的所述谱进行量化;以及
复用步骤,用于复用所述预定信息、在所述量化步骤中量化的所述谱、以及所述包络。
8.一种解码设备,包括:
信息分离装置,用于从被复用的预定信息、音频信号的量化谱和所述谱的包络中分离出所述预定信息和所述包络;
包络强调装置,用于强调所述包络;
噪声整形装置,用于将由所述包络强调装置强调的所述包络除以大于1的值,并从相除的结果中减去由所述预定信息指定的噪声整形,其中所述预定信息是表示所述噪声整形的最低值和最高值的信息;
谱分离装置,用于使用由所述噪声整形装置进行的相减的结果作为量化比特计数,来从被复用的所述预定信息、所述量化谱和所述包络中分离出所述量化谱;
逆量化装置,用于基于所述量化比特计数来对所述量化谱进行逆量化;以及
逆归一化装置,用于使用所述包络,来对由所述逆量化装置逆量化的所述谱进行逆归一化。
9.根据权利要求8所述的解码设备,其中,
所述信息分离装置从被复用的所述预定信息、所述谱、所述包络和表示由所述噪声整形装置执行的算术预算的算术信息中分离出所述预定信息、所述包络和所述算术信息,并且
所述噪声整形装置包括:
第一算术装置,用于执行第一算术运算,以将由所述包络强调装置强调的所述包络除以大于1的第一值,并从相除的结果中减去所述噪声整形;
第二算术装置,用于执行第二算术运算,以将由所述包络强调装置强调的所述包络除以不同于所述第一值的大于1的第二值,并从相除的结果中减去所述噪声整形;以及
选择装置,用于基于所述算术信息选择所述第一算术装置或所述第二算术装置,并使得所选择的第一算术装置或第二算术装置执行算术运算。
10.一种用于解码设备的解码方法,包括:
信息分离步骤,用于从被复用的预定信息、音频信号的量化谱和所述谱的包络中分离出所述预定信息和所述包络;
包络强调步骤,用于强调所述包络;
噪声整形步骤,用于将在所述包络强调步骤中强调的所述包络除以大于1的值,并从相除的结果中减去由所述预定信息指定的噪声整形,其中所述预定信息是表示所述噪声整形的最低值和最高值的信息;
谱分离步骤,用于使用在所述噪声整形步骤中进行的相减的结果作为量化比特计数,来从被复用的所述预定信息、所述量化谱和所述包络中分离出所述量化谱;
逆量化步骤,用于基于所述量化比特计数来对所述量化谱进行逆量化;以及
逆归一化步骤,用于使用所述包络,来对在所述逆量化步骤中逆量化的所述谱进行逆归一化。
CN201180013285.7A 2010-03-17 2011-03-08 编码设备和编码方法、以及解码设备和解码方法 Active CN102792371B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010061171A JP5316896B2 (ja) 2010-03-17 2010-03-17 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP2010-061171 2010-03-17
PCT/JP2011/055294 WO2011114933A1 (ja) 2010-03-17 2011-03-08 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム

Publications (2)

Publication Number Publication Date
CN102792371A CN102792371A (zh) 2012-11-21
CN102792371B true CN102792371B (zh) 2014-10-29

Family

ID=44649031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180013285.7A Active CN102792371B (zh) 2010-03-17 2011-03-08 编码设备和编码方法、以及解码设备和解码方法

Country Status (6)

Country Link
US (1) US8892429B2 (zh)
EP (2) EP2525356B1 (zh)
JP (1) JP5316896B2 (zh)
CN (1) CN102792371B (zh)
RU (1) RU2546324C2 (zh)
WO (1) WO2011114933A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140130248A (ko) * 2012-03-29 2014-11-07 텔레폰악티에볼라겟엘엠에릭슨(펍) 하모닉 오디오 신호의 변환 인코딩/디코딩
RU2651187C2 (ru) 2012-06-28 2018-04-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Основанное на линейном предсказании кодирование аудио с использованием улучшенной оценки распределения вероятностей
US9378748B2 (en) * 2012-11-07 2016-06-28 Dolby Laboratories Licensing Corp. Reduced complexity converter SNR calculation
EP3121813B1 (en) * 2013-01-29 2020-03-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling without side information for celp-like coders
EP2981961B1 (en) 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
DK2981958T3 (en) * 2013-04-05 2018-05-28 Dolby Int Ab AUDIO CODES AND DECODS
EP2830060A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
WO2015081699A1 (zh) 2013-12-02 2015-06-11 华为技术有限公司 一种编码方法及装置
JP6433063B2 (ja) * 2014-11-27 2018-12-05 日本放送協会 音声加工装置、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192410A (zh) * 2006-12-01 2008-06-04 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
CN101662288A (zh) * 2008-08-28 2010-03-03 华为技术有限公司 音频编码、解码方法及装置、系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0671507B2 (ja) 1989-12-18 1994-09-14 工業技術院長 片持ち支持のワークに縫い目を形成する縫製装置
US5479560A (en) 1992-10-30 1995-12-26 Technology Research Association Of Medical And Welfare Apparatus Formant detecting device and speech processing apparatus
JPH06208395A (ja) * 1992-10-30 1994-07-26 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho ホルマント検出装置及び音声加工装置
JP3186290B2 (ja) * 1993-01-20 2001-07-11 ソニー株式会社 符号化方法、符号化装置、復号化装置及び記録媒体
US5784532A (en) * 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
DE19613643A1 (de) * 1996-04-04 1997-10-09 Fraunhofer Ges Forschung Verfahren zum Codieren eines mit einer niedrigen Abtastrate digitalisierten Audiosignals
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
WO2002029782A1 (en) * 2000-10-02 2002-04-11 The Regents Of The University Of California Perceptual harmonic cepstral coefficients as the front-end for speech recognition
US7103539B2 (en) * 2001-11-08 2006-09-05 Global Ip Sound Europe Ab Enhanced coded speech
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
AU2007332508B2 (en) * 2006-12-13 2012-08-16 Iii Holdings 12, Llc Encoding device, decoding device, and method thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192410A (zh) * 2006-12-01 2008-06-04 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
CN101662288A (zh) * 2008-08-28 2010-03-03 华为技术有限公司 音频编码、解码方法及装置、系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JP特开平6-208395A 1994.07.26
JP特许第3-186290B2 2001.07.11

Also Published As

Publication number Publication date
RU2546324C2 (ru) 2015-04-10
JP5316896B2 (ja) 2013-10-16
EP3070712B1 (en) 2020-04-29
CN102792371A (zh) 2012-11-21
JP2011197106A (ja) 2011-10-06
EP3070712A1 (en) 2016-09-21
WO2011114933A1 (ja) 2011-09-22
RU2012138396A (ru) 2014-03-20
EP2525356B1 (en) 2016-07-06
US8892429B2 (en) 2014-11-18
US20130006647A1 (en) 2013-01-03
EP2525356A1 (en) 2012-11-21
EP2525356A4 (en) 2013-09-04

Similar Documents

Publication Publication Date Title
CN102792371B (zh) 编码设备和编码方法、以及解码设备和解码方法
JP6805387B1 (ja) 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置
JP6407928B2 (ja) オーディオ処理システム
RU2555221C2 (ru) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
EP1334484B1 (en) Enhancing the performance of coding systems that use high frequency reconstruction methods
CN101283407B (zh) 变换编码装置和变换编码方法
JP5542306B2 (ja) オーディオ信号のスケーラブル符号化及び復号
RU2752127C2 (ru) Усовершенствованный квантователь
JP3951690B2 (ja) 符号化装置および方法、並びに記録媒体
TW200304120A (en) Encoding device, decoding device and methods thereof
CN102714038A (zh) 用以基于下混信号表示型态而提供上混信号表示型态的装置、用以提供表示多声道音频信号的位流的装置、方法、计算机程序及利用线性组合参数表示多声道音频信号的位流
CN104221081A (zh) 带宽扩展音频信号的高频带扩展的生成
AU2015235133B2 (en) Audio decoding device, audio encoding device, audio decoding method, audio encoding method, audio decoding program, and audio encoding program
CN105493182A (zh) 混合波形编码和参数编码语音增强
TW201329961A (zh) 以適應性低頻補償編碼音頻資料的方法與系統
CN105164749A (zh) 多声道音频的混合编码
WO2013061062A2 (en) Lossless buried data
CN102855876B (zh) 音频编码器和音频编码方法
CN102394656B (zh) 编码装置、编码方法、解码装置、解码方法
CN103021416A (zh) 音频编码装置和方法、音频解码装置和方法以及程序
CN101595524B (zh) 信号处理设备、信号处理方法
JPH11330972A (ja) 復号装置
CN103733256A (zh) 音频信号处理方法、音频编码设备、音频解码设备和采用所述方法的终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant