CN102467910B - 音频编码设备、音频编码方法 - Google Patents
音频编码设备、音频编码方法 Download PDFInfo
- Publication number
- CN102467910B CN102467910B CN201110342537.2A CN201110342537A CN102467910B CN 102467910 B CN102467910 B CN 102467910B CN 201110342537 A CN201110342537 A CN 201110342537A CN 102467910 B CN102467910 B CN 102467910B
- Authority
- CN
- China
- Prior art keywords
- frequency spectrum
- noise
- frequency
- unit
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 129
- 238000001228 spectrum Methods 0.000 claims abstract description 194
- 230000005236 sound signal Effects 0.000 claims abstract description 95
- 239000000203 mixture Substances 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims abstract description 12
- 238000010606 normalization Methods 0.000 claims description 100
- 230000002123 temporal effect Effects 0.000 claims description 53
- 238000006243 chemical reaction Methods 0.000 claims description 26
- 230000008859 change Effects 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims 1
- 230000008569 process Effects 0.000 description 113
- 238000010586 diagram Methods 0.000 description 66
- 238000013139 quantization Methods 0.000 description 26
- 239000012782 phase change material Substances 0.000 description 17
- 238000002135 phase contrast microscopy Methods 0.000 description 17
- 230000003247 decreasing effect Effects 0.000 description 8
- 238000011946 reduction process Methods 0.000 description 7
- 230000008447 perception Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本公开涉及编码设备、编码方法和程序。该编码设备包括:噪声检测器,其被配置为按照音频信号检测特定带中包括的噪声;增益控制器,其被配置为在通过噪声检测器检测到噪声时,对音频信号执行增益控制,使得音频信号在特定带中的成分衰减;比特分配计算单元,其被配置为按照经历了通过增益控制器执行的增益控制的音频信号的频谱,计算要被分配给频谱的比特数;以及量化单元,其被配置为按照比特数,对经历了增益控制的音频信号的频谱进行量化。
Description
技术领域
本公开涉及编码设备、编码方法和程序,特别地涉及能够对在特定带中包括噪声的音频信号精确地进行编码的编码设备、编码方法和程序。
背景技术
一般地,用于对音频信号进行编码的方法的示例包括用于对通过对音频信号执行时间频率变换得到的频谱执行规范化和量化的方法(例如,参考日本未审查专利公开第2006-11170号)。
图1是图示了以这种编码方法执行编码的音频编码设备的配置的框图。
图1中所示的音频编码设备10包括时间频率变换单元11、规范化单元12、比特分配计算单元13、量化单元14和码串编码单元15。音频编码设备10对作为时间序列信号输入的音频信号进行编码并且输出码串。
具体地,音频编码设备10中包括的时间频率变换单元11对作为时间序列信号输入的音频信号执行时间频率变换,并且生产频谱mdspec。例如,时间频率变换单元11使用诸如MDCT(修正离散余弦变换)的正交变换,对2N个采样的时间序列信号执行时间频率变换,并且将作为时间频率变换的结果得到的N个MDCT系数输出为频谱mdspec。
规范化单元12针对每个预定的处理单位,对从时间频率变换单元11提供的频谱mdspec,使用按照频谱mdspec的幅度得到的规范化系数执行规范化。规范化单元12输出规范化信息idsf和规范化频谱nspec,规范化信息idsf是关于与规范化系数相对应的整数的信息,规范化频谱nspec是通过对频谱mdspec进行规范化得到的。
比特分配计算单元13执行比特分配计算,使得针对每个预定的处理单位按照从规范化单元12提供的规范化信息idsf计算要被分配给规范化频谱nspec的比特数,以便输出表示比特数的量化信息idwl。此外,比特分配计算单元13输出从规范化单元12提供的规范化信息idsf。
量化单元14按照从比特分配计算单元13提供的量化信息idwl,对从规范化单元12提供的规范化频谱nspec进行量化。具体地,量化单元14针对每个预定的处理单位,使用与量化信息idwl相对应的量化系数,对规范化频谱nspec进行量化。量化单元14输出作为量化结果的量化频谱qspec。
码串编码单元15对从比特分配计算单元13提供的规范化信息idsf和量化信息idwl以及从量化单元14提供的频谱qspec进行编码,并且输出作为编码结果得到的码串。所输出的码串可以传送到另一设备或者可以记录在特定记录介质中。
此外,近年来,通过音频编码设备处理的音频信号从频率44.1kHz且PCM(脉冲码调制)字长16比特的PCM信号和频率48kHz且PCM字长16比特的PCM信号扩展到了具有高品质多比特的PCM信号(诸如频率96kHz且PCM字长24比特的PCM信号和频率192kHz且PCM字长24比特的PCM信号)。
这样的高品质多比特PCM信号不是从一开始就作为多比特PCM信号生成的,而是在很多情况下使用诸如DSD(直接流数字)信号的PDM(脉冲密度调制)信号作为来源生成的。
这是因为,在用来将模拟音频信号转换为数字音频信号的A/D(模数)转换器领域中,用德尔塔-西格玛A/D转换器代替逐次逼近A/D转换器发展迅速。
更具体地,一般的逐次逼近A/D转换器可以直接生成多比特PCM信号,但是转换精度很大程度上被元件精度所限制。因此,当PCM字长等于或大于24比特时,难以确保A/D转换的线性。另一方面,在德尔塔-西格玛A/D转换器中,易于使用单个阈值以高精度执行A/D转换。鉴于该背景,作为A/D转换器,已经广泛使用了德尔塔-西格玛A/D转换器而非一般的逐次逼近A/D转换器。
图2是图示了1比特德尔塔-西格玛A/D转换器的输入信号和输出信号的图。如图2中所示,在1比特德尔塔-西格玛A/D转换器中,用作输入信号的模拟音频信号被转换为具有由+1的时间密度表示的幅度并且用作输出信号的1比特PDM信号。
图3是图示了德尔塔-西格玛A/D转换器中的量化噪声的图。如图3中所示,首先,在德尔塔-西格玛A/D转换器中,通过执行超采样来将音频带(在图3中所示的示例中是0至fs/2)中包括的量化噪声分散到宽的带(图3中所示的示例中是0至nfs/2)中。接下来,通过执行噪声整形将量化噪声转移出音频带。因此,德尔塔-西格玛A/D转换器可以在音频带中实现高的S/N(信/噪)比。
如上所述,当高品质多比特PCM信号的来源是通过德尔塔-西格玛A/D转换器得到的PDM信号时,通过对PDM信号执行LPF(低通滤波)处理来生成多比特PCM信号。
如上所述得到的多比特PCM信号被表示为如图4中所示的德尔塔-西格玛类型A。该量化噪声对于多比特PCM信号是不想要的噪声。
发明内容
然而,在图1中所示的音频编码设备10中,因为按照输入音频信号的规范化信息idsf执行比特分配计算,所以在输入多比特PCM信号时,大量比特被分配给包括不想要的量化噪声的、在音频带之外的规范化频谱nspec。
因此,减少了可以分配给在听觉感知方面重要的音频带中的规范化频谱nspec的比特数,并且劣化了编码精度。作为结果,即使要经历编码的音频信号是高品质多比特PCM信号,也有可能没有记录并传送具有高品质的音频信号。
想要的是对在特定带中包括噪声的音频信号精确地进行编码。
根据本公开的实施例,提供了一种编码设备,其包括:噪声检测器,其被配置为按照音频信号检测特定带中包括的噪声;增益控制器,其被配置为在通过噪声检测器检测到噪声时,对音频信号执行增益控制,使得音频信号在特定带中的成分衰减;比特分配计算单元,其被配置为按照经历了通过增益控制器执行的增益控制的音频信号的频谱,计算要被分配给该频谱的比特数;以及量化单元,其被配置为按照比特数,对经历了增益控制的音频信号的频谱进行量化。
根据本公开的另一实施例,提供了与本公开的实施例的编码设备相对应的编码方法和程序。
根据本公开的又一实施例,按照音频信号检测特定带中包括的噪声;在检测到噪声时,对音频信号执行增益控制,使得音频信号在特定带中的成分衰减;按照经历了增益控制的音频信号的频谱,计算要被分配给频谱的比特数;并且按照比特数,对经历了增益控制的音频信号的频谱进行量化。
根据本公开的实施例的编码设备可以独立地提供,或者可以被配置为设备的内部模块。
因此,在特定带中包括噪声的音频信号可以以高精度进行编码。
附图说明
图1是图示了一般的音频编码设备的配置的框图;
图2是图示了1比特德尔塔-西格玛A/D转换器的输入信号和输出信号的图;
图3是图示了德尔塔-西格玛A/D转换器中的量化噪声的图;
图4是图示了多比特PCM信号的图;
图5是图示了根据本公开的第一实施例的音频编码设备的配置的框图;
图6是详细图示了噪声检测器和增益控制器的配置的框图;
图7是图示了规范化信息和规范化系数之间的关系的图;
图8是图示了通过图5中所示的音频编码设备执行的编码处理的流程图;
图9是图示了图8中所示的降噪处理的流程图;
图10是详细图示了图5中所示的噪声检测器和增益控制器的另一配置的图;
图11是图示了频谱的图;
图12是图示了对频谱执行的第一噪声检测处理的图;
图13是图示了对频谱执行的第二噪声检测处理的图;
图14是图示了对频谱执行的第三噪声检测处理的图;
图15是图示了对频谱执行的第一增益控制的图;
图16是图示了对频谱执行的第二增益控制的图;
图17是图示了对频谱执行的第三增益控制的图;
图18是图示了另一图8中所示的降噪处理的流程图;
图19是图示了根据本公开的第二实施例的音频编码设备的配置的框图;
图20是图示了通过图19中所示的音频编码设备执行的编码处理的流程图;
图21是图示了根据本公开的第三实施例的音频编码设备的配置的框图;
图22是图示了从时间频率变换单元输出的频谱的图;
图23是图示了对规范化信息执行的第一噪声检测处理的图;
图24是图示了对规范化信息执行的第二噪声检测处理的图;
图25是图示了对规范化信息执行的第三噪声检测处理的图;
图26是图示了对规范化信息执行的增益控制的图;
图27是图示了通过图21中所示的音频编码设备执行的编码处理的流程图;
图28是图示了解码设备的配置的框图;
图29是图示了规范化信息的图;
图30是图示了作为逆规范化结果得到的频谱的图;
图31是图示了通过图28中所示的音频解码设备执行的解码处理的流程图;并且
图32是图示了根据实施例的计算机的配置的图。
具体实施方式
根据本公开的实施例,提供了一种编码设备,其包括:噪声检测器,其被配置为按照音频信号检测特定带中包括的噪声;增益控制器,其被配置为在通过噪声检测器检测到噪声时,对音频信号执行增益控制,使得音频信号在特定带中的成分衰减;比特分配计算单元,其被配置为按照经历了通过增益控制器执行的增益控制的音频信号的频谱,计算要被分配给该频谱的比特数;以及量化单元,其被配置为按照比特数,对经历了增益控制的音频信号的频谱进行量化。
第一实施例
第一实施例的音频编码设备的配置的示例
图5是图示了根据本公开的第一实施例的音频编码设备的配置的框图,该音频编码设备是根据本公开的实施例提供的音频编码设备的一个示例。
在图5中所示的配置中,与图1中所示的配置相同的配置由与图1中所示的附图标记相同的附图标记来指代。适当地省略了多余的描述。
图5中所示的音频编码设备50的配置与图1中所示的配置的不同之处在于,在时间频率变换单元11之前布置了噪声检测器51和增益控制器52。在按照输入音频信号检测到PDM信号特有的噪声时,音频编码设备50对包括PDM信号特有的噪声的在音频带之外的高频成分进行衰减和编码。
具体地,音频编码设备50的噪声检测器51执行噪声检测处理,以按照作为时间序列信号输入的音频信号来检测PDM信号特有的噪声,并且输出表示检测结果的控制信号c。注意,PDM信号特有的噪声信号是通过德尔塔-西格玛A/D转换器生成的量化噪声。该噪声在音频带之外的高频带中在时间上是持续的。
增益控制器52按照从噪声检测器51提供的控制信号c,对作为时间序列信号输入的音频信号执行增益控制。具体地,在控制信号c表示检测到噪声时,增益控制器51控制音频信号的增益使得音频信号在音频带之外的高频带中的成分衰减,并且向时间频率变换单元11提供所得到的音频信号。另一方面,在控制信号c表示尚未检测到噪声时,增益控制器52将音频信号未作改变地提供给时间频率变换单元11。
噪声检测器和增益控制器的配置
图6是详细图示了噪声检测器和增益控制器的配置的框图。
图6中所示的噪声检测器51包括HPF(高通滤波器)单元61和检测器62,而增益控制器52包括LPF单元71。图6中所示的噪声检测器51和增益控制器52分别对音频信号的时域信号执行检测处理和增益控制。
具体地,图6中所示的噪声检测器51的HPF单元61对作为时间序列信号输入的音频信号执行HPF处理,以便提取和输出音频信号在音频带之外的高频成分。
检测器62按照从HPF单元61提供的音频信号在音频带之外的高频成分的功率等,执行噪声检测处理,以便输出控制信号c。具体地,在音频信号在音频带之外的高频成分的功率等于或大于阈值时,例如,检测器62输出表示检测到噪声的控制信号c。另一方面,在音频信号在音频带之外的高频成分的功率小于阈值时,检测器62输出表示尚未检测到噪声的控制信号c。
增益控制器52的LPF单元71按照从检测器62提供的控制信号c,在控制信号c表示检测到噪声时,对音频信号执行LPF处理以便衰减音频信号在音频带之外的高频成分。随后,LPF单元71向时间频率变换单元11提供其中衰减了在音频带之外的高频成分的音频信号。另一方面,在控制信号c表示尚未检测到噪声时,LPF单元71将音频信号未作改变地提供给时间频率变换单元11。
规范化信息和规范化系数之间的关系
图7是图示了规范化信息idsf和规范化系数sf(idsf)之间的关系的图。
如图7中所示,每个规范化系数sf(idsf)都是二的幂,而规范化信息idsf是每个规范化系数特有的整数。
音频编码设备的处理
根据本公开的实施例,提供了一种通过编码设备执行的编码方法,该编码方法包括:按照音频信号检测特定带中包括的噪声;在检测到噪声时,对音频信号执行增益控制,使得音频信号在特定带中的成分衰减;按照经历了增益控制的音频信号的频谱,计算要被分配给频谱的比特数;以及按照比特数,对经历了增益控制的音频信号的频谱进行量化。
图8是图示了通过图5中所示的音频编码设备50执行的编码处理的流程图,该编码处理是根据本公开的实施例提供的编码方法的一个示例。在向音频编码设备50提供作为时间序列信号的音频信号时开始编码处理。
在图8的步骤S11中,音频编码设备50的噪声检测器51和增益控制器52执行降噪处理,以降低PDM信号特有的噪声。下文中将参照图9和18详细描述降噪处理。
在步骤S12中,时间频率变换单元11对作为在步骤S11中执行的降噪处理的结果而从增益控制器52提供的音频信号执行时间频率变换,并且输出所得到的频谱mdspec。
在步骤S13中,规范化单元12针对每个预定的处理单位,对从时间频率变换单元11提供的频谱mdspec,使用按照频谱mdspec的幅度得到的规范化系数sf(idsf)执行规范化。规范化单元12输出与规范化系数sf(idsf)相对应的规范化信息idsf和规范化频谱nspec。
在步骤S14中,比特分配计算单元13针对每个预定的处理单位,按照从规范化单元12提供的规范化信息idsf执行比特分配计算,并且输出量化信息idwl。此外,比特分配计算单元13输出从规范化单元12提供的规范化信息idsf。
在步骤S15中,量化单元14针对每个预定的处理单位,使用与从比特分配计算单元13提供的量化信息idwl相对应的量化系数,对从规范化单元12提供的规范化频谱nspec执行量化。量化单元14输出作为量化结果得到的量化频谱qspec。
在步骤S16中,码串编码单元15对从比特分配计算单元13提供的规范化信息idsf和量化信息idwl以及从量化单元14提供的量化频谱qspec进行编码,并且输出作为编码结果得到的码串。随后,结束处理。
图9是图示了在图8的步骤S11中执行的降噪处理的流程图。
在图9的步骤S31中,图6中所述的噪声检测器51的HPF单元61对作为时间序列信号输入的音频信号执行HPF处理,以便提取和输出音频信号在音频带之外的高频分量。
在步骤S32中,检测器62按照从HPF单元61提供的音频信号在音频带之外的高频成分的功率等,执行噪声检测处理,以便输出控制信号c。
在步骤S33中,增益控制器52的LPF单元71按照从检测器62提供的控制信号c,确定通过在步骤S32中执行的噪声检测处理是否检测到PDM信号特有的噪声。在控制信号c表示检测到噪声时,在步骤S33中确定检测到PDM信号特有的噪声,并且处理前进到步骤S34。
在步骤S34中,LPF单元71对音频信号执行LPF处理以便衰减音频信号在音频带之外的高频成分,并且向时间频率变换单元(图5中所示)提供这些成分。随后,处理返回图8中所示的步骤S11,并且前进到步骤S12。
另一方面,在控制信号c表示尚未检测到噪声时,在步骤S33中确定尚未检测到PDM信号特有的噪声,并且LPF单元71将音频信号未作改变地提供给时间频率变换单元11。随后,处理返回图8中所示的步骤S11,并且前进到步骤S12。
噪声检测器和增益控制器的详细示例和配置
图10是详细图示了噪声检测器51和增益控制器52的其他配置的图。
图10中所示的噪声检测器51包括时间频率变换单元101和检测器102,而增益控制器52包括控制器111和频率时间变换单元112。图10中所示的噪声检测器51和增益控制器52分别对音频信号的频域信号执行检测处理和增益控制。
具体地,图10中所示的噪声检测器51的时间频率变换单元101对作为时间序列信号输入的音频信号执行诸如FFT(快速傅里叶变换)或MDCT的时间频率变换,并且输出所得到的频谱。
检测器102按照从时间频率变换单元101提供的频谱在音频带之外的高频成分的功率等,执行噪声检测处理,以便输出控制信号c。
增益控制器52的控制器111按照从检测器102提供的控制信号c,对从时间频率变换单元101提供的频谱执行增益控制。具体地,在控制信号c表示检测到噪声时,控制器111对频谱执行增益控制,使得在音频带之外的高频成分的功率以特定斜率单调减少。随后,控制器111输出增益控制之后得到的频谱。另一方面,在控制信号c表示尚未检测到噪声时,控制器111未作改变地输出频谱。
频率时间变换单元112对从控制器111提供的频谱执行诸如IFFT(逆快速傅里叶变换)或IMDCT(逆修正离散余弦变换)的频率时间变换。借此,在检测到PDM信号特有的噪音时,得到了其中衰减了在音频带之外的高频成分的音频信号,而在未检测到PDM信号特有的噪音时,得到了输入音频编码设备50的原始音频信号。频率时间变换单元112向图5中所示的时间频率变换单元11提供作为频率时间变换的结果得到的音频信号。
噪声检测处理
图11至14是图示了通过图10中所示的检测器102执行的噪声检测处理的第一至第三示例的图。注意,在图11至14中,横坐标轴指代频谱的索引,而纵坐标轴指代频谱的功率。下文中将描述的图15至17也是一样。
图11是图示了从时间频率变换单元101输出的频谱的图。
在图11中所示的示例中,作为时间序列信号输入的音频信号的采样频率是96kHz,而在具有索引0至N-1的N个频谱当中,具有索引N/2至N-1的N/2个频谱对应于具有在音频带之外的高频的频谱。
图12是图示了对图11中所示的频谱执行的第一噪声检测处理的图。注意,在图12中,实线表示图11中所示的频谱的功率,中等粗细的线表示在音频带之外的频谱的总功率,而粗线表示预定的阈值。
如图12中所示,在噪声检测处理的第一示例中,在音频带之外的频谱的总功率等于或大于预定的阈值时,检测到PDM信号特有的噪声。
图13是图示了对图11中所示的频谱执行的第二噪声检测处理的图。注意,在图13中,实线表示图11中所示的频谱的功率,中等粗细的线表示频谱的组的总功率,而粗线表示预定的阈值。
如图13中所示,在噪声检测处理的第二示例中,在音频带之外的频谱的所有的组的总功率等于或大于预定的阈值时,检测到PDM信号特有的噪声。
图14是图示了对图11中所示的频谱执行的第三噪声检测处理的图。注意,在图14中,实线表示图11中所示的频谱的功率,而中等粗细的线表示频谱的组的总功率。
如图14中所示,在噪声检测处理的第三示例中,在音频带之外的频谱的所有的组的总功率单调增加时,检测到PDM信号特有的噪声。
注意,在噪声检测处理的第二和第三示例中,基于各组的总功率做出确定。然而,可以按照各个频谱的功率做出确定。
此外,通过检测器102执行的噪声检测处理可以是第一至第三示例之一,或者可以是第一至第三示例的组合。此外,通过检测器102执行的噪声检测处理不限于上述第一至第三示例。
增益控制
图15至17是通过控制器111对图11中所示的频谱执行的增益控制的第一和第二示例。
图15是图示了增益控制的第一示例的图。注意,在图15中,虚线指代尚未经历增益控制的、图11中所示的频谱的功率,实线指代经历了增益控制的频谱,而粗线指代增益控制的斜率。
如图15中所示,在增益控制的第一示例中,控制频谱的增益使得在音频带之外的频谱的功率以预定的斜率单调减少。
图16和17是图示了增益控制的第二示例的图。注意,在图15中,虚线指代尚未经历增益控制的、图11中所示的频谱的功率,而粗线指代增益控制的斜率。此外,图16中所示的中等粗细的线指代包括多个频谱的组的总功率,而图17中所示的实线指代经历了增益控制的频谱。
如图16中所示,在增益控制的第二示例中,将在音频带之外的频谱划分为各自包括一些频谱的组。随后,如图17中所示,控制频谱的增益使得这些组的总功率以预定的斜率单调减少。
注意,通过控制器111执行的增益控制不限于上述第一和第二示例。
另一降噪处理
图18是图示了通过图10中所示的噪声检测器51和增益控制器52在图8的步骤S11中执行的降噪处理的流程图。
在图18中所示的步骤S51中,图10中所示的噪声检测器51的时间频率变换单元101对作为时间序列信号输入的音频信号执行时间频率变换,并且输出所得到的频谱。
在步骤S52中,检测器102按照从时间频率变换单元101提供的频谱在音频带之外的高频成分的功率等,执行参照图11至14所述的噪声检测处理,以便输出控制信号c。
在步骤S53中,增益控制器52的控制器111按照从检测器102提供的控制信号c,确定通过在步骤S52中执行的噪声检测处理是否检测到PDM信号特有的噪声。在控制信号c表示检测到噪声时,确定在步骤S53中检测到PDM信号特有的噪声,并且处理前进到步骤S54。
在步骤S54中,控制器111对从时间频率变换单元101输出的频谱执行增益控制,使得在音频带之外的高频成分的功率以如图15至17中所示的预定的斜率单调减少。随后,控制器111输出增益控制之后得到的频谱,并且处理前进到步骤S55。
另一方面,在控制信号c表示尚未检测到噪声时,确定在步骤S53中尚未检测到PDM信号特有的噪声,并且控制器111未作改变地提供从时间频率变换单元101提供的频谱。随后,处理前进到步骤S55。
在步骤S55中,频率时间变换单元112对从控制器111提供的频谱执行频率时间变换。频率时间变换单元112向图5中所示的时间频率变换单元11提供所得到的音频信号。随后,处理返回图8中所示的步骤S11,并且前进到步骤S12。
如上所述,音频编码设备50在执行比特分配计算之前,按照音频信号执行噪声检测处理。此外,在通过噪声检测处理检测到PDM信号特有的噪声时,音频信号经历增益控制,使得音频信号在音频带之外的高频成分衰减。借此,分配给PDM信号特有的噪声的比特数可以减少,并且分配给在听觉感知方面重要的音频带的比特数可以增加。作为结果,可以对从PDM信号生成的、包括PDM信号特有的噪声的多比特PCM信号执行高精度编码。因此,可以以高品质记录和传送高品质多比特PCM信号。
第二实施例
第二实施例的音频编码设备的配置的示例
图19是图示了根据本公开的第二实施例的音频编码设备的配置的框图,该音频编码设备是根据本公开的实施例提供的音频编码设备的一个示例。
在图19中,与图1中所示的部件相同的部件由与图1中的附图标记相同的附图标记指代。适当地省略了多余的描述。
图19中所示的音频编码设备150的配置与图1中所示的配置不同之处在于,在时间频率变换单元11和规范化单元12之间布置了噪声检测器51和增益控制器52。音频编码设备150对通过时间频率变换单元11得到的频谱mdspec执行噪声检测处理和增益控制。
具体地,音频编码设备150的噪声检测器151被配置为与图10中所示的检测器102相似。检测器151按照从时间频率变换单元11提供的频谱的功率等,执行如图11至14所示的噪声检测处理,以便输出控制信号c。
增益控制器152被配置为与图10中所示的控制器111相似。增益控制器152按照从噪声检测器151提供的控制信号c,对从时间频率变换单元11提供的频谱执行增益控制。具体地,在控制信号c表示检测到噪声时,增益控制器152对频谱执行参照图15至17中所述的增益控制,使得在音频带之外的高频成分的功率以特定斜率单调减少。随后,增益控制器152输出增益控制之后得到的频谱。另一方面,在控制信号c表示尚未检测到噪声时,增益控制器152未作改变地输出频谱mdspec作为频谱mdspec’。向规范化单元12提供从增益控制器152输出的频谱mdspec’。音频编码设备的处理
图20是图示了通过图19中所示的音频编码设备150执行的编码处理的流程图,该编码处理是根据本公开的实施例提供的编码方法的一个示例。在向音频编码设备150提供作为时间序列信号的音频信号时开始编码处理。
在图20的步骤S71中,时间频率变换单元11对作为时间序列信号输入的音频信号执行时间频率变换,并且输出所得到的频谱mdspec。
在步骤S72中,噪声检测器151基于从时间频率变换单元11提供的频谱mdspec在音频带之外的高频成分的功率等,执行图11至14中所述的噪声检测处理,以便输出控制信号c。
在步骤S73中,增益控制器152按照从噪声检测器151提供的控制信号c,确定通过在步骤S72中执行的噪声检测处理是否检测到PDM信号特有的噪声。在控制信号c表示检测到噪声时,在步骤S73中确定检测到PDM信号特有的噪声,并且处理前进到步骤S74。
在步骤S74中,增益控制器152对从时间频率变换单元11提供的频谱mdspec执行增益控制,使得在音频带之外的高频成分的功率以如图15至17中所示的预定的斜率衰减。随后,增益控制器152输出增益控制之后得到的频谱mdspec’,并且处理前进到步骤S75。
另一方面,在控制信号c表示尚未检测到噪声时,在步骤S73中确定尚未检测到PDM信号特有的噪声,并且增益控制器152未作改变地输出频谱mdspec作为频谱mdspec’。随后,处理前进到步骤S75。
在步骤S75中,规范化单元12针对每个预定的处理单位,对从增益控制器152提供的频谱mdspec’,使用与频谱mdspec’的幅度相对应的规范化系数sf(idsf)执行规范化。规范化单元12输出与规范化系数sf(idsf)相对应的规范化信息idsf和作为规范化结果得到的规范化频谱nspec。
从步骤S76至步骤S78的处理与图8中所示的从步骤S14至步骤S16的处理相同,并且因此省略了其描述。
如上所述,音频编码设备50在执行比特分配计算之前,按照音频信号的频谱执行噪声检测处理。此外,在通过噪声检测处理检测到PDM信号特有的噪声时,频谱经历增益控制,使得音频信号在音频带之外的高频成分衰减。借此,分配给PDM信号特有的噪声的比特数可以减少,并且分配给在听觉感知方面重要的音频带的比特数可以增加。作为结果,可以对从PDM信号生成的、包括PDM信号特有的噪声的多比特PCM信号执行高精度编码。因此,可以以高品质记录和传送高品质多比特PCM信号。
此外,因为音频编码设备150使用通过时间频率变换单元11得到的频谱mdspec来执行噪声检测处理和增益控制,所以在与音频编码设备50相比时,可以减少要添加到一般的音频编码设备10的模块的数量。具体地,例如,不像音频编码设备50,可以不附加地使用时间频率变换单元101和频率时间变换单元112。因此,音频编码设备150可以容易地通过转换一般的音频编码设备10来得到。
此外,因为音频编码设备150在编码的过程中执行噪声检测处理和增益控制,所以在与音频编码设备50相比时,可以减少处理延迟。
第三实施例
第三实施例的音频编码设备的品质的示例
图21是图示了根据本公开的第三实施例的音频编码设备的配置的框图,该音频编码设备是根据本公开的实施例提供的音频编码设备的一个示例。
在图21中,与图1中所示的部件相同的部件由与图1中的附图标记相同的附图标记指代。适当地省略了多余的描述。
图21中所示的音频编码设备200的配置与图1中所示的配置不同之处在于,在规范化单元12和比特分配计算单元13之间布置了噪声检测器201和增益控制器202。音频编码设备200对音频信号的规范化信息idsf执行噪声检测处理和增益控制。
具体地,音频编码设备200的噪声检测器201按照从规范化单元12提供的规范化信息idsf,执行噪声检测处理,并且输出控制信号c。
增益控制器202按照从噪声检测器201提供的控制信号c,对从规范化单元12提供的规范化信息idsf执行增益控制。具体地,在控制信号c表示检测到噪声时,增益控制器202对规范化信息idsf执行增益控制,使得在音频带之外的高频成分的功率以特定斜率单调减少。随后,增益控制器202输出增益控制之后得到的规范化信息idsf’。另一方面,在控制信号c表示尚未检测到噪声时,增益控制器202未作改变地输出规范化信息idsf作为规范化信息idsf’。向比特分配计算单元13提供从增益控制器202输出的规范化信息idsf’。
噪声检测处理
图22至图25是图示了通过图21中所示的噪声检测器201执行的第一至第三噪声检测处理的图。注意,在图22中,横坐标轴指代频谱的索引,而纵坐标轴指代频谱的功率。注意,在图23至25中,横坐标轴指代规范化信息的索引,而纵坐标轴指代规范化信息。
图22是图示了从时间频率变换单元11输出的频谱的图。注意,在图22中,实线指代频谱mdspec的功率。
在图22中所示的示例中,如图11的情况那样,作为时间序列信号输入的音频信号的采样频率是96kHz,而在具有索引0至N-1的N频谱当中,具有索引N/2至N-1的N/2频谱对应于具有在音频带之外的高频的频谱。
此外,针对各个由图22中的粗线指代的所谓临界带宽,对频谱mdspec执行规范化和量化。考虑到音频感知特性,每个临界带宽一般在较低的带中较窄而在较高的带中较宽。例如,在图22中,包括索引号0的最低的临界带宽包括两个频谱mdspec,而包括索引号N-1的最高的临界带宽包括八个频谱mdspec。
注意,此处,作为用于规范化和量化的处理单位的临界带宽被称为量化单位,而N个频谱mdspec被按组划分为M个量化单位。
图23是图示了对作为图22中所示的频谱mdspec的量化单位的规范化信息idsf执行的第一噪声检测处理的图。注意,在图23中,实线表示规范化信息idsf,中等粗细的线表示在音频带之外的规范化信息之和,而粗线表示阈值。
如图23中所示,在噪声检测处理的第一示例中,在音频带之外的频谱mdspec的规范化信息idsf之和等于或大于预定的阈值时,检测到PDM信号特有的噪声。
图24是图示了对图22中所示的频谱mdspec的规范化信息idsf执行的第二噪声检测处理的图。注意,在图24中,实线表示规范化信息idsf,而粗线表示阈值。
如图24中所示,在噪声检测处理的第二示例中,在音频带之外的频谱mdspec的所有规范化信息idsf都等于或大于预定的阈值时,检测到PDM信号特有的噪声。
图25是图示了对图22中所示的频谱mdspec的规范化信息idsf执行的第三噪声检测处理的图。注意,在图25中,实线表示规范化信息idsf。
如图25中所示,在噪声检测处理的第三示例中,在音频带之外的频谱mdspec的规范化信息idsf单调增加时,检测到PDM信号特有的噪声。
注意,在噪声检测处理的第二和第三示例中,按照规范化信息idsf做出确定。然而,多个规范化信息idsf可以划分为组,并且可以针对各个组按照规范化信息idsf做出确定。
此外,通过噪声检测器201执行的噪声检测处理可以是第一至第三示例之一,或者可以是第一至第三示例的组合。此外,通过噪声检测器201执行的噪声检测处理不限于上述第一至第三示例。
增益控制
图26是图示了对图22中所示的频谱mdspec的规范化信息idsf通过增益控制器202执行的增益控制的图。注意,在图26中,横坐标轴指代规范化信息的索引,而纵坐标轴指代规范化信息。注意,在图26中,虚线表示尚未经历增益控制的规范化信息idsf,实线表示通过增益控制得到的规范化信息idsf’,而粗线表示增益控制的斜率。
如图26中所示,在通过增益控制器202执行的增益控制中,控制频规范化信息idsf的增益使得在音频带之外的频谱mdspec的规范化信息idsf以特定斜率单调减少。
注意,在通过增益控制器202执行的增益控制不限于图26中所示的示例。
音频编码设备的处理
图27是图示了通过图21中所示的音频编码设备200执行的编码处理的流程图,该编码处理是根据本公开的实施例提供的编码方法的一个示例。在向音频编码设备200提供作为时间序列信号的音频信号时开始编码处理。
在图27的步骤S101中,时间频率变换单元11对作为时间序列信号输入的音频信号执行时间频率变换,并且输出所得到的频谱mdspec。
在步骤S102中,规范化单元12针对每个预定的处理单位,对从时间频率变换单元11提供的频谱mdspec,使用与频谱mdspec的幅度相对应的规范化系数sf(idsf)执行规范化。规范化单元12输出与规范化系数sf(idsf)相对应的规范化信息idsf和作为规范化结果得到的规范化频谱nspec。
在步骤S103中,噪声检测器201按照从规范化单元12提供的在音频带之外的高频成分等,执行图22至25中所述的噪声检测处理,以便输出控制信号c。
在步骤S104中,增益控制器202按照从噪声检测器201提供的控制信号c,确定通过在步骤S103中执行的噪声检测处理是否检测到PDM信号特有的噪声。在控制信号c表示检测到噪声时,确定在步骤S103中检测到PDM信号特有的噪声,并且处理前进到步骤S105。
在步骤S105中,增益控制器202对从规范化单元12输出的规范化信息idsf执行参照图26所述的增益控制,使得在音频带之外的高频成分以特定斜率衰减。随后,增益控制器202输出增益控制之后得到的规范化信息idsf’,并且处理前进到步骤S106。
另一方面,在控制信号c表示尚未检测到噪声时,在步骤S104中确定尚未检测到PDM信号特有的噪声,并且增益控制器202未作改变地输出规范化信息idsf作为规范化信息idsf’。随后,处理前进到步骤S106。
在步骤S106中,比特分配计算单元13针对每个预定的处理单位,按照从增益控制器202提供的规范化信息idsf’执行比特分配计算,并且向码串编码单元15提供量化信息idwl。此外,比特分配计算单元13向码串编码单元15输出从增益控制器202提供的规范化信息idsf’。
根据步骤S107和步骤S108的处理与根据图8中所示的步骤S15和S16的处理相同,并且因此省略了其描述。
如上所述,音频编码设备200在执行比特分配计算之前,按照音频信号的规范化信息执行噪声检测处理。此外,在通过噪声检测处理检测到PDM信号特有的噪声时,规范化信息经历增益控制,使得规范化信息在音频带之外的高频成分衰减。借此,分配给PDM信号特有的噪声的比特数可以减少,并且分配给在听觉感知方面重要的音频带的比特数可以增加。作为结果,可以对从PDM信号生成的、包括PDM信号特有的噪声的多比特PCM信号执行高精度编码。因此,可以以高品质记录和传送高品质多比特PCM信号。
此外,因为音频编码设备200使用通过规范化单元12得到的规范化信息idsf来执行噪声检测处理和增益控制,所以如音频编码设备150那样,在与音频编码设备50相比时,可以减少要添加到一般的音频编码设备10的模块的数量。因此,音频编码设备200可以容易地通过转换一般的音频编码设备10来得到。
此外,因为音频编码设备200在编码的过程中执行噪声检测处理和增益控制,所以在与音频编码设备50相比时,可以减少处理延迟。
此外,因为规范化信息idsf是整数数字,所以在与使用作为实数的频谱来执行噪声检测处理和增益控制的音频编码设备50相比时,音频编码设备200可以以小的计算数量来执行噪声检测处理和增益控制。另一方面,因为音频编码设备150使用频谱mdspec来执行噪声检测处理和增益控制,所以在与音频编码设备200相比时,音频编码设备150可以以更高的精确度来执行编码。
音频解码设备的配置的示例
图28是图示了对通过图21中所示的音频编码设备200编码后的码串进行解码的音频解码设备250的配置的框图。
图28中所示的音频解码设备250包括码串解码单元251、逆量化单元252、逆规范化单元253和频率时间变换单元254。音频解码设备250对从音频编码设备200提供的码串进行解码,以便得到作为时间序列信号的音频信号。
具体地,音频解码设备250的码串解码单元251对从音频编码设备200提供的码串执行解码,以便得到要输出的规范化信息idsf’、量化信息idwl和量化频谱qspec。
逆量化单元252针对每个处理单位,使用与从码串解码单元251提供的量化信息idwl相对应的逆量化系数,对从码串解码单元251提供的量化频谱qspec执行逆量化。逆量化单元252输出作为逆量化结果得到的规范化频谱nspec。
逆规范化单元253针对每个处理单位,使用与从码串解码单元251提供的规范化信息idsf’相对应的逆规范化系数,对从逆量化单元252提供的规范化频谱nspec执行逆规范化。逆规范化单元253输出作为逆规范化结果得到的频谱mdspec”。
频率时间变换单元254对从逆规范化单元253提供的频谱mdspec”执行频率时间变换,并且输出作为频率时间变换的结果得到的、作为时间序列信号的音频信号。例如,频率时间变换单元254对用作频谱mdspec”的N个MDCT系数,通过诸如IMDCT的逆正交变换来执行频率时间变换,并且输出2N个采样的时间序列信号。
逆规范化
图29和30是图示了通过逆规范化单元253执行的逆规范化的图。注意,在图29和30中,横坐标轴指代频谱的索引,而纵坐标轴指代频谱的功率。
图29是图示了提供给逆规范化单元253的规范化信息idsf’的图。注意,在图29中,虚线表示提供给音频编码设备200的音频信号的频谱mdspec,而粗线表示针对每个与规范化信息idsf’相对应的量化单位的频谱的功率。
在图29中,规范化信息idsf’是在码串解码单元251对经历了参照图26所述的增益控制的规范化信息idsf’进行复原时得到的。
图30是图示了作为对图29中所示的规范化信息idsf’执行的逆规范化的结果得到的频谱mdspec”的图。注意,在图30中,虚线表示提供给音频编码设备200的音频信号的频谱mdspec,而实线表示从逆规范化单元253输出的频谱mdspec”。
如图30中所示,对于各个频谱,由于相应频谱的规范化频谱nspec而改变针对每个与图29中所示的规范化信息idsf’相对应的量化单位的频谱的功率。注意,每个量化单位中包括的频谱mdspec”的功率限于与量化单位的规范化信息idsf’相对应的频谱的功率以内。
因此,在音频编码设备200中对规范化信息idsf的增益控制的效果与针对频谱mdspec的每个量化单位执行的增益控制的效果相同。
音频解码设备的处理
图31是图示了通过图28中所示的音频解码设备执行的解码处理的流程图。在向音频解码设备250提供从音频编码设备200输出的码串时开始解码处理。
在图31的步骤S121中,音频解码设备250的码串解码单元251对从音频编码设备200提供的码串执行解码,以便得到要输出的规范化信息idsf’、量化信息idwl和量化频谱qspec。
在步骤S122中,逆量化单元252针对每个处理单位,使用与从码串解码单元251提供的量化信息idwl相对应的逆量化系数,对从码串解码单元251提供的量化频谱qspec执行逆量化。逆量化单元252输出作为逆量化结果得到的规范化频谱nspec。
在步骤S123中,逆规范化单元253针对每个处理单位,使用与从码串解码单元251提供的规范化信息idsf’相对应的逆规范化系数,对从逆量化单元252提供的规范化频谱nspec执行逆规范化。逆规范化单元253输出作为逆规范化结果得到的频谱mdspec”。
在步骤S124中,频率时间变换单元254对从逆规范化单元253提供的频谱mdspec”执行频率时间变换,并且输出作为频率时间变换的结果得到的、作为时间序列信号的音频信号。随后,结束处理。
如上所述,音频解码设备250对从音频编码设备200提供的码串进行解码,并且使用与作为解码结果得到的规范化信息idsf’相对应的逆规范化系数,对规范化频谱nspec执行逆规范化。借此,在规范化信息idsf’对应于在音频带之外的衰减了的高频成分时,具有在音频带之外的衰减了的高频成分的频谱mdspec”可以作为逆规范化结果得到。作为结果,可以输出其中衰减了包括PDM信号特有的噪声的、在音频带之外的高频成分的高精度多比特PCM信号。
注意,尽管未示出,但对从音频编码设备50和150输出的码串进行解码的音频解码设备被配置为与音频解码设备250相似,并且执行相似的处理。因此,音频编码设备50(150)检测到PDM信号特有的噪声时,可以与音频解码设备250相似地得到其中衰减了在音频带之外的高频成分的频谱。
此外,尽管在图11和22中所述的示例中,输入音频信号的采样频率是96kHz,但是采样频率不限于此,并且在音频带之外的高频成分的频谱的数量也不限于N/2。例如,采样频率可以是192kHz。在该情况下,在具有索引0至N-1的N个频谱当中,具有索引N/4至N-1的3N/4个频谱对应于在音频带之外的高频成分的频谱。
此外,尽管在该实施例中检测PDM信号特有的噪声,但是噪声检测器可以检测其他噪声,只要噪声包括在预定的带中即可。在该情况下,要经历增益控制的带包括要通过噪声检测器检测的噪声。
第四实施例
本技术要应用的计算机
接下来,可以通过硬件或者软件来执行上述系列处理。在通过软件执行系列处理时,软件中包括的程序安装在通用计算机等中。
随后,图32图示了根据实施例安装有用来执行上述系列处理的程序的计算机的配置。
程序可以存储在内置在计算机中的、用作记录介质的存储单元308或ROM(只读存储器)302中。
可替选地,程序可以存储(记录)在可移除介质311中。可移除介质311可以提供为封装软件。此处,可移除介质311的示例包括软盘、CD-ROM(压缩盘只读存储器)、MO(磁光)盘、DVD(数字多功能盘)、磁盘和半导体存储器。
注意,程序可以从可移除介质311通过驱动器310安装在计算机中,或者可以通过通信网络或者广播网络下载到计算机并且安装在内置存储单元308中。具体地,程序可以以无线方式通过用于数字卫星广播的人造卫星、或者以有线方式通过诸如LAN(局域网)的网络从下载站点传送到计算机。
计算机包括CPU(中央处理单元)301,并且CPU 301通过总线304连接到输入/输出接口305。
在用户通过输入/输出接口305操作输入单元306而输入了指令时,CPU 301按照指令执行存储在ROM 302中的程序。可替选地,CPU 301将存储在存储单元308中的程序载入RAM(随机存取存储器)303中,并且执行程序。
借此,CPU 301按照上述流程图执行处理,或者执行通过上述框图中的配置执行的处理。随后,CPU 301通过输入/输出接口305从输出电压307输出处理结果,从通信单元309传送处理结果,或者使得存储单元308存储处理结果。
注意,输入单元306包括键盘、鼠标和麦克风。此外,输出电压307包括LCD(液晶显示器)和扬声器。
此处,在本说明书中,处理不需要按照流程图中描述的顺序以时间序列通过计算机执行。具体地,处理可以按照并行程序或者单独通过计算机执行(例如,使用对象的处理或者并行处理)。
此外,程序可以通过单个的计算机(处理器)处理,或者可以以分布式方式通过多个计算机处理。此外,程序可以传送到执行程序的远程计算机。
本公开的实施例不限于前述实施例,并且可以在不脱离本公开的范围的情况下做出各种修改。
本公开包含与在2010年11月9日提交日本专利局的日本专利在先申请JP 2010-250614中公开的主题内容相关的主题内容,该在先申请的全部内容通过引用并入本文。
Claims (13)
1.一种音频编码设备,其包括:
噪声检测器,其被配置为按照音频信号检测特定带中包括的噪声;
增益控制器,其被配置为在通过所述噪声检测器检测到所述噪声时,对所述音频信号执行增益控制,使得所述音频信号在所述特定带中的成分衰减;
比特分配计算单元,其被配置为按照经历了通过所述增益控制器执行的增益控制的所述音频信号的频谱,计算要被分配给所述频谱的比特数;以及
量化单元,其被配置为按照所述比特数,对经历了所述增益控制的音频信号的频谱进行量化。
2.根据权利要求1所述的音频编码设备,其还包括:
时间频率变换单元,其被配置为对所述音频信号执行时间频率变换,以便得到所述音频信号的频谱,
其中,所述噪声检测器按照通过所述时间频率变换单元得到的频谱,检测所述噪声,
所述增益控制器在所述噪声检测器检测到所述噪声时,对通过所述时间频率变换单元得到的所述频谱执行所述增益控制,使得所述频谱在所述特定带中的成分衰减,并且
所述比特分配计算单元按照经历了通过所述增益控制器执行的增益控制的所述频谱,计算所述比特数。
3.根据权利要求2所述的音频编码设备,
其中,所述噪声包括在所述特定带中并具有单调增加的倾向,并且
所述噪声检测器在所述特定带中的所述频谱的组的功率之和单调增加时检测到所述噪声。
4.根据权利要求2所述的音频编码设备,其还包括:
规范化单元,其被配置为对经历了通过所述增益控制器执行的增益控制的所述频谱,使用与所述频谱的幅度相对应的规范化系数进行规范化,
其中,所述比特分配计算单元按照所述规范化系数计算所述比特数,并且
所述量化单元按照所述比特数,对通过所述规范化单元进行了规范化的所述频谱进行量化。
5.根据权利要求1所述的音频编码设备,其还包括:
时间频率变换单元,其被配置为对所述音频信号执行时间频率变换,以便得到所述音频信号的频谱;以及
规范化单元,其被配置为对通过所述时间频率变换单元得到的所述频谱,使用与所述频谱的幅度相对应的规范化系数进行规范化,
其中,所述噪声检测器按照规范化信息检测所述噪声,所述规范化信息是关于与所述规范化系数相对应的整数的信息,
所述增益控制器在通过所述噪声检测器检测到所述噪声时,对所述规范化信息执行增益控制,使得所述规范化信息在所述特定带中的成分衰减,
所述比特分配计算单元按照通过所述增益控制器执行增益控制之后得到的所述规范化信息,计算所述比特数,并且
所述量化单元按照所述比特数,对通过所述规范化单元进行了规范化的所述频谱进行量化。
6.根据权利要求5所述的音频编码设备,
其中,所述噪声包括在所述特定带中并具有单调增加的倾向,并且
所述噪声检测器在所述规范化信息单调增加时检测到所述噪声。
7.根据权利要求1所述的音频编码设备,其还包括:
时间频率变换单元,其被配置为对经历了通过所述增益控制器执行的增益控制的所述音频信号执行时间频率变换,以便得到经历了所述增益控制的音频信号的频谱。
8.根据权利要求7所述的音频编码设备,
其中,所述噪声包括在所述特定带中并具有单调增加的倾向。
9.根据权利要求7所述的音频编码设备,其还包括:
规范化单元,其被配置为对通过所述时间频率变换单元得到的所述频谱,使用与所述频谱的幅度相对应的规范化系数进行规范化,
其中,所述比特分配计算单元按照所述规范化系数计算所述比特数,并且
所述量化单元按照所述比特数,对通过所述规范化单元进行了规范化的所述频谱进行量化。
10.根据权利要求7所述的音频编码设备,
其中,所述噪声检测器提取所述音频信号在所述特定带中的成分,并且按照所述成分检测所述噪声。
11.根据权利要求7所述的音频编码设备,
其中,所述噪声检测器对所述音频信号执行时间频率变换,以便按照作为所述时间频率变换的结果得到的所述音频信号的频谱来检测所述噪声,并且
所述增益控制器在通过所述噪声检测器检测到所述噪声时,对所述音频信号的频谱执行增益控制,使得所述频谱在所述特定带中的成分衰减,并且通过对经历了增益控制的所述频谱执行频率时间变换来对所述音频信号执行增益控制。
12.根据权利要求1所述的音频编码设备,
其中,所述噪声包括在音频带之外的高频带中。
13.一种通过音频编码设备执行的音频编码方法,所述音频编码方法包括:
按照音频信号检测特定带中包括的噪声;
在检测到所述噪声时,对所述音频信号执行增益控制,使得所述音频信号在所述特定带中的成分衰减;
按照经历了所述增益控制的所述音频信号的频谱,计算要被分配给所述频谱的比特数;以及
按照所述比特数,对经历了所述增益控制的音频信号的频谱进行量化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610104582.7A CN105679325B (zh) | 2010-11-09 | 2011-11-02 | 解码设备以及解码方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010250614A JP2012103395A (ja) | 2010-11-09 | 2010-11-09 | 符号化装置、符号化方法、およびプログラム |
JP2010-250614 | 2010-11-09 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610104582.7A Division CN105679325B (zh) | 2010-11-09 | 2011-11-02 | 解码设备以及解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102467910A CN102467910A (zh) | 2012-05-23 |
CN102467910B true CN102467910B (zh) | 2016-08-24 |
Family
ID=46020453
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610104582.7A Expired - Fee Related CN105679325B (zh) | 2010-11-09 | 2011-11-02 | 解码设备以及解码方法 |
CN201110342537.2A Expired - Fee Related CN102467910B (zh) | 2010-11-09 | 2011-11-02 | 音频编码设备、音频编码方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610104582.7A Expired - Fee Related CN105679325B (zh) | 2010-11-09 | 2011-11-02 | 解码设备以及解码方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US9076432B2 (zh) |
JP (1) | JP2012103395A (zh) |
CN (2) | CN105679325B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014074782A (ja) * | 2012-10-03 | 2014-04-24 | Sony Corp | 音声送信装置、音声送信方法、音声受信装置および音声受信方法 |
CN103778918B (zh) * | 2012-10-26 | 2016-09-07 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
WO2014148848A2 (ko) * | 2013-03-21 | 2014-09-25 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 크기 제어 방법 및 장치 |
PL3046104T3 (pl) * | 2013-09-16 | 2020-02-28 | Samsung Electronics Co., Ltd. | Sposób kodowania sygnału oraz sposób dekodowania sygnału |
KR101803410B1 (ko) * | 2013-12-02 | 2017-12-28 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인코딩 방법 및 장치 |
JP6816277B2 (ja) * | 2017-07-03 | 2021-01-20 | パイオニア株式会社 | 信号処理装置、制御方法、プログラム及び記憶媒体 |
US9985646B1 (en) | 2017-10-18 | 2018-05-29 | Schweitzer Engineering Laboratories, Inc. | Analog-to-digital converter verification using quantization noise properties |
US10033400B1 (en) | 2017-10-18 | 2018-07-24 | Schweitzer Engineering Laboratories, Inc. | Analog-to-digital converter verification using quantization noise properties |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6098039A (en) * | 1998-02-18 | 2000-08-01 | Fujitsu Limited | Audio encoding apparatus which splits a signal, allocates and transmits bits, and quantitizes the signal based on bits |
CN1524261A (zh) * | 2002-05-07 | 2004-08-25 | 索尼株式会社 | 编码方法、编码装置、解码方法、和解码装置 |
CN1677490A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
CN101010727A (zh) * | 2004-06-28 | 2007-08-01 | 索尼株式会社 | 信号编码器件和方法与信号解码器件和方法 |
CN101030382A (zh) * | 2005-12-09 | 2007-09-05 | Qnx软件操作系统(威美科)有限公司 | 通过高频压缩提高语音的可理解性的系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3189401B2 (ja) * | 1992-07-29 | 2001-07-16 | ソニー株式会社 | 音声データ符号化方法及び音声データ符号化装置 |
JP2004297273A (ja) * | 2003-03-26 | 2004-10-21 | Kenwood Corp | 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
US8275611B2 (en) * | 2007-01-18 | 2012-09-25 | Stmicroelectronics Asia Pacific Pte., Ltd. | Adaptive noise suppression for digital speech signals |
US8583426B2 (en) * | 2007-09-12 | 2013-11-12 | Dolby Laboratories Licensing Corporation | Speech enhancement with voice clarity |
JP5071346B2 (ja) * | 2008-10-24 | 2012-11-14 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP5245714B2 (ja) * | 2008-10-24 | 2013-07-24 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
-
2010
- 2010-11-09 JP JP2010250614A patent/JP2012103395A/ja not_active Withdrawn
-
2011
- 2011-10-31 US US13/285,310 patent/US9076432B2/en active Active
- 2011-11-02 CN CN201610104582.7A patent/CN105679325B/zh not_active Expired - Fee Related
- 2011-11-02 CN CN201110342537.2A patent/CN102467910B/zh not_active Expired - Fee Related
-
2015
- 2015-05-28 US US14/724,077 patent/US9418670B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6098039A (en) * | 1998-02-18 | 2000-08-01 | Fujitsu Limited | Audio encoding apparatus which splits a signal, allocates and transmits bits, and quantitizes the signal based on bits |
CN1524261A (zh) * | 2002-05-07 | 2004-08-25 | 索尼株式会社 | 编码方法、编码装置、解码方法、和解码装置 |
CN1677490A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
CN101010727A (zh) * | 2004-06-28 | 2007-08-01 | 索尼株式会社 | 信号编码器件和方法与信号解码器件和方法 |
CN101030382A (zh) * | 2005-12-09 | 2007-09-05 | Qnx软件操作系统(威美科)有限公司 | 通过高频压缩提高语音的可理解性的系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105679325A (zh) | 2016-06-15 |
US9076432B2 (en) | 2015-07-07 |
US20150262585A1 (en) | 2015-09-17 |
CN102467910A (zh) | 2012-05-23 |
US9418670B2 (en) | 2016-08-16 |
US20120116781A1 (en) | 2012-05-10 |
CN105679325B (zh) | 2020-02-21 |
JP2012103395A (ja) | 2012-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102467910B (zh) | 音频编码设备、音频编码方法 | |
TWI417872B (zh) | 修改型離散餘弦轉換領域之音訊信號響度測量及修改技術 | |
CN1938758B (zh) | 确定估计值的方法和装置 | |
TWI380602B (en) | Apparatus and method for encoding an information signal | |
TWI397903B (zh) | 編碼音訊之節約音量測量技術 | |
KR101251790B1 (ko) | 노이즈 필러, 노이즈 필링 파라미터 계산기, 오디오 신호의 노이즈-필드된 스펙트럴 표현을 제공하는 방법, 노이즈 필링 파라미터를 제공하는 방법, 저장 매체 | |
JP5345722B2 (ja) | オーディオ情報生成方法 | |
US8467892B2 (en) | Content-based audio comparisons | |
US8631061B2 (en) | Apparatus, method, and program for arithmetic processing | |
JP4925671B2 (ja) | デジタル信号の符号化/復号化方法及びその装置並びに記録媒体 | |
TWI518676B (zh) | 低複雜度聽覺事件邊界檢測技術 | |
TR201902394T4 (tr) | Gürültü doldurma konsepti. | |
CN101689369A (zh) | 用于编码和解码分音的幅度的方法和装置 | |
TWI288915B (en) | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
MX2012005074A (es) | Dispositivo y metodo de procesamiento de señal, programa y medio de grabacion de datos. | |
TW200816167A (en) | Method and device for transcoding audio signals | |
JP5587599B2 (ja) | 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置 | |
CN104321813B (zh) | 编码方法、编码装置 | |
JP4639073B2 (ja) | オーディオ信号符号化装置および方法 | |
CN102063905A (zh) | 一种用于音频解码的盲噪声填充方法及其装置 | |
CN1918629B (zh) | 音频编码中的短窗分组方法 | |
US20020152085A1 (en) | Encoding apparatus and decoding apparatus | |
JP2022537033A (ja) | 信号依存的な数および精度制御を伴うオーディオエンコーダ、オーディオデコーダ、ならびに関連する方法およびコンピュータプログラム | |
TW200414126A (en) | Method for determining quantization parameters | |
KR100349329B1 (ko) | 엠펙-2 고품질 오디오 처리 알고리즘의 병렬 처리 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160824 Termination date: 20201102 |