CN105849801A - 解码设备和方法以及程序 - Google Patents
解码设备和方法以及程序 Download PDFInfo
- Publication number
- CN105849801A CN105849801A CN201480069805.XA CN201480069805A CN105849801A CN 105849801 A CN105849801 A CN 105849801A CN 201480069805 A CN201480069805 A CN 201480069805A CN 105849801 A CN105849801 A CN 105849801A
- Authority
- CN
- China
- Prior art keywords
- gain
- sampling location
- yield value
- value
- linear interpolation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 165
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000005070 sampling Methods 0.000 claims description 406
- 230000008569 process Effects 0.000 claims description 130
- 230000008901 benefit Effects 0.000 claims description 24
- 238000005516 engineering process Methods 0.000 abstract description 46
- 102100031476 Cytochrome P450 1A1 Human genes 0.000 description 18
- 101000941690 Homo sapiens Cytochrome P450 1A1 Proteins 0.000 description 18
- 230000005236 sound signal Effects 0.000 description 18
- 238000012888 cubic function Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 8
- 238000012937 correction Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012887 quadratic function Methods 0.000 description 2
- 206010023118 Jamais vu Diseases 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000011430 maximum method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G11/00—Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
- H03G11/008—Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Stereophonic System (AREA)
Abstract
本技术涉及可以获得品质较高的音频的解码设备、方法和程序。解复用电路将输入代码串解复用成增益代码串和信号代码串。信号解码电路对信号代码串进行解码并且输出时序信号。增益解码电路对增益代码串进行解码。换言之,增益解码电路从增益代码串读出时序信号中的预定增益采样位置处的插值模式信息和增益值以及增益倾斜值。插值处理单元根据插值模式信息通过线性插值或非线性插值基于增益值和增益倾斜值获得两个增益采样位置之间的每个采样位置的增益值。增益施加电路基于增益值来调整时序信号的增益。本技术可以应用于解码设备。
Description
技术领域
本技术涉及解码设备、解码方法和程序,并且更具体地涉及可以获得较高品质的声音的解码设备、解码方法和程序。
背景技术
在相关技术中,在运动图像专家组(MPEG)高级音频编码(AAC)(ISO/IEC14496-3:2001)的音频编码技术中,可以记录比特流中的下混合或动态范围压缩(DRC)的辅助信息,并且根据再现侧的环境来在再现侧使用上述辅助信息(例如,参见非专利文献1)。
使用这样的辅助信息使得能够在再现侧处对音频信号进行下混合或者使得能够通过DRC适当地控制音量。
引用列表
非专利文献
非专利文献1:Information technology Coding of audiovisual objects Part3:Audio(ISO/IEC 14496-3:2001)(视听对象的信息技术编码第3部分:音频(ISO/IEC14496-3:2001))
发明内容
技术问题
例如,使用上述编码技术,可以指定用于音量控制的DRC增益信息作为以音频信号的帧为单位的DRC辅助信息,并且在再现侧处,通过基于该DRC增益信息来对音频信号的音量进行校正,可以获得音量适当的声音。
然而,对于作为时域信号的音频信号的一个帧内的每个采样而言,由这样的DRC增益信息表示的增益变成同一值。即,使用同一增益对一个帧中包括的所有采样进行校正。
因此,例如,当由DRC增益信息表示的增益的大小在帧之间变化很大时,音频信号的时域波形的一部分在帧之间变得不连续,这可能造成听觉方面的恶化。
本技术鉴于这样的情形而作出并且涉及使得可以获得品质较高的声音。
问题的解决方案
根据本技术的第一方面的解码设备包括:增益读出单元,被配置成读出时序信号的至少两个增益采样位置处的编码增益值;插值信息读出单元,被配置成读出表示时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得的插值信息;以及插值处理单元,被配置成根据插值信息通过线性插值或非线性插值基于增益采样位置处的增益值来获得位于时序信号的两个增益采样位置之间的每个采样位置处的增益值。
增益读出单元能够被使得还读出表示增益采样位置处的增益值的倾斜度的增益倾斜值。当增益值通过非线性插值获得时,插值处理单元能够被使得基于增益采样位置处的增益值和增益倾斜值来获得位于两个增益采样位置之间的每个采样位置处的增益值。
解码设备还可以包括限制处理单元,该限制处理单元被配置成对通过非线性插值而获得的增益值执行限制处理,使得增益值变成等于或大于预定下限的值或者等于或小于预定上限的值。
限制处理单元能够被使得:使用0作为下限来执行限制处理,使用1作为下限来执行限制处理,或者使用1作为上限来执行限制处理。
解码设备还可以包括运算单元,该运算单元被配置成在增益采样位置处获得具有增益采样位置处的增益值并且具有由增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差。当插值信息是表示增益值是通过线性插值获得的信息时,插值处理单元能够被使得通过线性插值获得增益值,当插值信息是表示增益值通过非线性插值获得的信息时,插值处理单元能够被使得根据所述差通过非线性插值或线性插值获得增益值。
根据本技术的第一方面的解码方法或程序包括以下步骤:读出时序信号的至少两个增益采样位置处的编码增益值;读出表示时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得的插值信息;以及根据所述插值信息通过线性插值或非线性插值基于增益采样位置处的增益值来获得位于时序信号的两个增益采样位置之间的每个采样位置处的增益值。
根据本技术的第一方面,时序信号的至少两个增益采样位置处的编码增益值被读出。表示时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得的插值信息被读出。位于时序信号的两个增益采样位置之间的每个采样位置处的增益值根据所述插值信息通过线性插值或非线性插值基于增益采样位置处的增益值来获得。
根据本技术的第二方面的解码设备包括:增益读出单元,被配置成读出时序信号的至少两个增益采样位置处的编码增益值以及表示增益值的倾斜度的增益倾斜值;运算单元,被配置成在增益采样位置处获得具有增益采样位置处的增益值并且具有由增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差;以及插值处理单元,被配置成根据所述差通过线性插值或非线性插值来获得位于时序信号的两个增益采样位置之间的每个采样位置处的增益值。
根据本技术的第二方面的解码方法或程序包括以下步骤:读出时序信号的至少两个增益采样位置处的编码增益值以及表示增益值的倾斜度的增益倾斜值;在增益采样位置处获得具有增益采样位置处的增益值并且具有由增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差;以及根据所述差通过线性插值或非线性插值来获得位于时序信号的两个增益采样位置之间的每个采样位置处的增益值。
根据本技术的第二方面,时序信号的至少两个增益采样位置处的编码增益值以及表示增益值的倾斜度的增益倾斜值被读出。在增益采样位置处,具有增益采样位置处的增益值并且具有由增益采样位置处的增益倾斜值表示的倾斜度的直线被获得,以及针对两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差被获得。位于时序信号的两个增益采样位置之间的每个采样位置处的增益值根据所述差通过线性插值或非线性插值来获得。
本发明的有益效果
根据本技术的第一方面和第二方面,可以获得品质较高的声音。
注意,有利效果不限于此处所描述的有利效果,而且可以是本公开内容中描述的任意有利效果。
附图说明
[图1]图1是根据本技术的实施例的用于说明增益的线性插值的图。
[图2]图2是示出了根据本技术的实施例的增益波形的示例的图。
[图3]图3是用于说明根据本技术的实施例的增益的非线性插值的图。
[图4]图4是示出了根据本技术的实施例的编码设备的配置示例的图。
[图5]图5是说明根据本技术的实施例的编码处理的流程图。
[图6]图6是示出了根据本技术的实施例的DRC特征的图。
[图7]图7是示出了根据本技术的实施例的解码设备的配置示例的图。
[图8]图8是说明根据本技术的实施例的解码处理的流程图。
[图9]图9是说明根据本技术的实施例的增益解码处理的流程图。
[图10]图10是示出了根据本技术的实施例的解码设备的配置示例的图。
[图11]图11是说明根据本技术的实施例的增益解码处理的流程图。
[图12]图12是用于说明根据本技术的实施例的增益波形的插值的图。
[图13]图13是用于说明根据本技术的实施例的增益波形的插值的图。
[图14]图14是用于说明根据本技术的实施例的增益波形的插值的图。
[图15]图15是示出了根据本技术的实施例的解码设备的配置示例的图。
[图16]图16是说明了根据本技术的实施例的增益解码处理的流程图。
[图17]图17是说明根据本技术的实施例的增益波形的插值的图。
[图18]图18是说明根据本技术的实施例的增益解码处理的流程图。
[图19]图19是示出了根据本技术的实施例的计算机的配置示例的图。
具体实施方式
在下文中,将参照附图来描述应用了本技术的实施例。
<第一实施例>
<本技术的概述>
本技术涉及下述技术:当音频信号的音量在再现侧被校正时对增益值进行编码、将通过对增益值进行编码而获得的增益代码串与通过对音频信号进行编码获得的信号代码串复用、以及发送复用代码串的技术;以及对这些增益代码串和信号代码串进行解码并且对音频信号的音量进行校正的技术。
在本技术中,通过指定音频信号的帧内的每个采样的任意值作为用于音量校正的增益值,可以获得时域波形较平滑的声音。借助于此,可以获得不会引起陌生感的品质较高的声音。在此,虽然用于音量校正的增益值可以是dB值或线性值,但是在下面所继续的描述中假设增益值是线性值。
此外,当增益值被编码时,如果通过对采样位置的仅一部分处如例如特征位置如增益波形的拐点的增益值以及帧内的各个采样位置处的增益值中预定间隔处布置的增益值进行编码来获得增益代码串,则可以减少增益代码串的代码量。
在这种情况下,增益代码串的解码侧需要基于通过对增益代码串进行解码而获得的一些采样位置处的增益值来获得原始增益波形。
在此,作为用于获得原始增益波形的方法,例如,存在用于通过执行如图1所示的线性插值获得不包括在增益代码串中的采样位置处的增益值的可能的方法。
应当注意,图1的纵轴表示增益值,横轴表示音频信号的帧内的采样位置。
此外,在下文中,还将增益代码串中包括的编码增益值的采样位置特别称为增益采样位置。更进一步,在下面,还将由编码采样位置和包括在增益代码串中的增益值表达的增益波形上的点简称为增益采样位置。
在图1的示例中,通过对增益代码串进行解码来获得增益采样位置G11和增益采样位置G12的信息。
在此,将帧内的第k个增益采样位置处的增益值设为g[k],将采样轴方向上从第k个增益采样位置至第k+1个增益采样位置的采样长度(采样的数量)表达为T[k]。
在这种情况下,假定第k个增益采样位置G11的采样位置是n=0,则增益采样位置G11是用坐标(0,g[k])来表达的点,增益采样位置G12是用坐标(T[k],g[k+1])来表达的点。在此,n是表示从帧的头部的第n个采样位置的索引。
此外,通过线性插值而获得的增益采样位置G11与增益采样位置G12之间的增益波形变成使用直线L11表示的波形。即,在假定增益值线性变化的情况下,在增益采样位置G11与增益采样位置G12之间,通过插值来获得每个采样位置处的增益值。
然而,如果通过线性插值来估计增益波形,例如,如图2中用曲线C11所示,当试图要对平滑的增益波形进行编码时,增益波形中要被编码的点的数量即增益采样位置的数量增加。应当注意,图2用纵轴表示增益值并且用横轴表示音频信号的帧内的采样位置。
在该示例中,因为用曲线C11表示的增益波形是平滑波形,所以如果解码侧试图以某一水平的精度再现增益波形,就必须对许多增益采样位置处的增益值进行编码。这将增加通过将增益代码串与信号代码串复用而获得的比特流的代码量,即,增加了比特率。
因此,在本技术中,为了使得可以用较少的代码量获得品质较高的声音,除了线性插值以外,近来视情况而定还执行非线性插值。即,通过使用在线性插值与非线性插值之间所选择的更适当的方法执行插值处理来生成增益波形。应当注意,非线性插值可以是例如使用二次函数或三次函数的插值。
例如,当执行使用三次函数的非线性插值时,可以将使用图3中的曲线C21表示的波形获得为图1中所示的增益采样位置G11与增益采样位置G12之间的增益波形。应当注意,图3用纵轴表示增益值并且用横轴表示音频信号的帧内的采样位置。此外,在图3中,给与图1中的附图标记对应的部分分配与图1中的那些附图标记相同的附图标记,并且视情况而定,将省略对其的说明。
在本示例中,增益代码串包括表示增益采样位置G11处的采样位置、增益值和增益倾斜值的信息以及表示增益采样位置G12处的采样位置、增益值和增益倾斜值的信息。
在此,增益倾斜值是表示增益采样位置处的原始增益波形的倾斜度的信息。在下文中,将第k个增益采样位置处的增益倾斜值表达为s[k]。
在图3中,箭头D11表示增益采样位置G11处的增益倾斜值s[k],而箭头D12表示增益采样位置G12处的增益倾斜值s[k+1]。
在解码侧,通过利用三次函数的非线性插值获得增益采样位置G11与增益采样位置G12之间的增益波形,因此,获得用曲线C21表示的增益波形。
例如,用曲线C21表示的增益波形是三次函数的经过增益采样位置G11和增益采样位置G12并且其在增益采样位置G11和增益采样位置G12处的倾斜度分别为s[k]和s[k+1]的曲线。
以此方式,视情况而定通过使用非线性插值,甚至当增益波形是平滑波形时,仍然可以通过对较少的增益采样位置——即使用较少的代码量——进行编码以高精度再现增益波形。
在本技术中,例如,作为用于在线性插值与非线性插值之间切换的参数,表示使用线性插值的插值方案或者使用非线性插值的插值方案的插值模式信息被包括在增益代码串中。解码侧根据该插值模式信息在线性插值与非线性插值之间切换。
在此,插值模式信息可以是例如用于在线性插值、使用二次函数的插值以及使用三次函数的插值中切换的2比特索引,或者可以是用于在线性插值与作为非线性插值的使用三次函数的插值之间切换的1比特标记。即,如果信息表示用于对增益波形进行插值的方法,则可以将任意信息用作插值模式信息。
此外,在本技术中,当插值模式信息是表示使用非线性插值的插值方案的信息时,除了增益值以外,增益倾斜值也被包括在每个增益采样位置的增益代码串中。
在此,增益倾斜值s[k]表示每一个采样的增益值的变化。例如,第k个增益采样位置处的增益倾斜值s[k]是连接第k个增益采样位置处的增益波形上的点与第k个增益采样位置的下一个采样位置处的增益波形上的点的直线的倾斜度。应当注意,如果增益倾斜值表示增益波形上的增益采样位置处的倾斜度,则可以使用任意方法来获得增益倾斜值。
应当注意,与可以将增益倾斜值存储在增益代码串中一样,也可以将增益倾斜值的量化值或增益倾斜值的熵编码值如霍夫曼编码值存储在增益代码串中。
<线性插值>
此外,将描述用于对两个增益采样位置之间的每个采样位置处的增益值执行线性插值的方法以及用于对两个增益采样位置之间的每个采样位置处的增益值执行非线性插值的方法的具体示例。首先,将描述用于执行线性插值的方法。
当在解码侧使用插值模式信息来执行线性插值时,从增益代码串读出每个增益采样位置的增益值。
在此,将第k个增益采样位置处的索引设为k,将从增益代码串读出的第k个增益采样位置处的增益值设为g[k]。此外,将第k个增益采样位置与第k+1个增益采样位置之间的采样长度设为T[k],假定将采样长度T[k]包括在增益代码串中作为表示第k+1个增益采样位置的采样位置的信息。
现在假定第k个增益采样位置是帧的头部位置,即,n=0的采样位置。在这样的情况下,使用下面的等式(1)来计算位于第k个增益采样位置与第k+1个增益采样位置之间并且作为从头部开始的第n(其中,0≤n≤t[k])个采样的采样n的增益值g_interpolated[n]。
[等式1]
g_interpolated[n]=a[k]×n+b[k]
(0≤n<T[k]) (1)
应当注意,在等式(1)中,a[k]和b[k]是分别使用下面的等式(2)和等式(3)获得的值。
[等式2]
a[k]=(g[k+1]-g[k])/T[k] (2)
[等式3]
b[k]=g[k] (3)
即,a[k]和b[k]表示连接第k个增益采样位置与第k+1个增益采样位置的直线的倾斜度和截距。因此,在该示例中,如参照图1所描述的,确定增益值在第k个增益采样位置与第k+1个增益采样位置之间线性地变化,每个采样n的增益值通过线性插值获得。
<非线性插值>
因此,将描述通过非线性插值获得第k个增益采样位置与第k+1个增益采样位置之间的采样n的增益值的情况。在此,将继续描述使用三次函数的插值作为非线性插值的示例被执行的情况。
当根据插值模式信息执行非线性插值时,在解码侧,从增益代码串读出每个增益采样位置的增益值和增益倾斜值。
在此,以与线性插值的情况类似的方式,将第k个增益采样位置处的增益值设为g[k],将第k个增益采样位置与第k+1个增益采样位置之间的采样长度设为T[k]。此外,将第k个增益采样位置处的增益倾斜值设为s[k]。
现在假定第k个增益采样位置是帧的头部位置,即,n=0的采样位置。在这样的情况下,使用下面的等式(4)来计算位于第k个增益采样位置与第k+1个增益采样位置之间并且作为从头部开始的第n(其中,0≤n≤T[k])个采样的采样n的增益值g_interpolated[n]。
[等式4]
g_interpolated[n]=c[k]×n3+d[k]×n2+e[k]×n+f[k]
(0≤n<T[k]) (4)
应当注意,在等式(4)中,c[k]、d[k]、e[k]和f[k]是分别使用下面的等式(5)至等式(8)获得的值。
[等式5]
c[k]=(1/T[k])×{(s[k+1]+s[k])/T[k]
-2×(g[k+1]-g[k])/(T[k]2)} (5)
[等式6]
d[k]=3×(g[k+1]-g[k])-(s[k+1]+2×s[k])/T[k] (6)
[等式7]
e[k]=s[k] (7)
[等式8]
f[k]=g[k] (8)
在该示例中,如参照图3所描述的,通过非线性插值即使用三次函数的插值来获得每个采样n的增益值,该插值假定增益值在第k个增益采样位置与第k+1个增益采样位置之间根据等式(4)中表示的三次函数而变化。
如上所述,视情况而定,通过根据非线性插值获得增益值,可以以较低比特率对如例如图2中所示的平滑增益波形进行编码,使得可以提高编码效率。
<编码设备的配置示例>
因此,将描述上述应用了本技术的具体实施例。
图4是示出了应用了本技术的编码设备的实施例的配置示例的图。
编码设备11包括声压水平计算电路21、增益计算电路22、增益编码电路23、信号编码电路24和复用电路25。
声压水平计算电路21基于作为所提供的多声道音频信号的输入时序信号来计算组成该输入时序信号的声道的声压水平,并且获得声道中的每一个的声压水平的代表值作为代表声压水平。
应当注意,针对输入时序信号的每个帧获得声压水平的代表值。此外,用作声压水平计算电路21处的处理单元的帧与要在后续描述的信号编码电路24处被处理的输入时序信号的帧同步,并且被形成为长度短于信号编码电路24处的帧的长度的帧。
声压水平计算电路21将所获得的代表声压水平提供至增益计算电路22。以此方式获得的代表声压水平表示由预定数量的声道如例如11.1ch(11.1声道)的音频信号构成的输入时序信号的声道的代表声压水平。
增益计算电路22基于从声压水平计算电路21提供的代表声压水平来计算增益值并且将增益值提供至增益编码电路23。
在此,当在解码侧再现输入时序信号时,增益值表示用于校正输入时序信号的音量的增益值以能够获得音量适当的声音,并且在增益计算电路22处针对帧内的每个采样位置来计算增益值。
增益编码电路23对从增益计算电路22提供的增益值进行编码,并且将作为编码的结果而获得的增益代码串提供至复用电路25。
在此,增益代码串包括用于获得每个增益采样位置的增益值的增益信息以及插值模式信息。
信号编码电路24使用预定编码方案——例如,以使用MEPG AAC的编码方法为代表的典型编码方法——对所提供的输入时序信号进行编码,并且将作为编码的结果而获得的信号代码串提供至复用电路25。
复用电路25将从增益编码电路23提供的增益代码串与从信号编码电路24提供的信号代码串复用,并且输出作为复用的结果而获得的输出代码串。
<编码处理的描述>
接下来将描述编码设备11的具体操作。
当与一个帧对应的输入时序信号被提供时,编码设备11执行对输入时序信号进行编码并且对输出代码串进行输出的编码处理。在下文中,将参照图5的流程图来描述通过编码设备11的编码处理。
在步骤S11中,声压水平计算电路21基于所提供的输入时序信号计算输入时序信号的代表声压水平,并且将代表声压水平提供至增益计算电路22。
具体地,声压水平计算电路21计算构成输入时序信号的各个声道的声压水平,并且将这些声道的声压水平的代表值设置为代表声压水平。
例如,在用于计算声压水平的方法中,使用构成输入时序信号的声道的音频信号的帧的最大值、均方根(RMS)等,并且针对输入时序信号的各个帧来获得构成输入时序信号的每个声道的声压水平。
此外,作为用于计算代表值作为代表声压水平的方法,例如,可以使用将同一帧中的声道的声压水平中的最大值设置为代表值的方法,根据声道的声压水平使用特定计算等式计算一个代表值的方法等。具体地,例如,可以使用ITU-R BS.1770-2(03/2011)中描述的响度计算等式来计算代表值。
在步骤S12中,增益计算电路22基于从声压水平计算电路21提供的代表声压水平来计算增益值,并且将增益值提供至增益编码电路23。
例如,增益计算电路22根据由高阶控制设备指定的DRC特征来计算增益值。
由高阶控制设备指定的DRC特征可以是如例如图6所示的DRC特征。应当注意,图6用横轴表示输入声压水平(dBFS)即代表声压水平,而用纵轴表示输出声压水平(dBFS)即当输入时序信号的声压水平(音量)被校正时的校正声压水平。
虚线L31和虚线L32分别表示输入声压水平和输出声压水平的关系。例如,根据用虚线L31表示的DRC特征,当存在0dBFS的代表声压水平的输入时,对音量进行校正以使得输入时序信号的声压水平变为-27dBFS。
另一方面,例如,根据用虚线L32表示的DRC特征,当存在0dBFS的代表声压水平的输入时,对音量进行校正以使得输入时序信号的声压水平变为-21dBFS。
增益计算电路22根据用这样的虚线L31和虚线L32表示的DRC特征来确定增益值。增益值被输出为与信号编码电路24处的帧同步的增益波形。即,增益计算电路22针对构成输入时序信号的要被处理的帧的每个采样来计算增益值。
更具体地,例如,增益计算电路22通过执行下面等式(9)的计算来获得帧J中的增益波形g(J,n)。
[等式9]
g(J,n)=A×Gt(J)+(1-A)×g(J,n-1) (9)
应当注意,在等式(9)中,当将帧长度设为N时,n表示采用从0至N-1的值的采样的位置,Gt(J)表示上述DRC特征,即,由输入声压水平和输出声压水平确定的帧J中的目标增益。
此外,等式(9)中的A是通过下面的等式(10)确定的值。
[等式10]
A=1-exp(-1/(2×Fs×Tc(J))) (10)
在等式(10)中,Fs表示采样频率(Hz),Tc(J)表示帧J中的时间常量,exp(x)表示指数函数。此外,在等式(9)中,当n=0时,将所述帧紧邻着的前一个帧中的最后一个采样的增益值用作增益波形g(J,n-1)。
返回至对图5中的流程图的说明,在步骤S13中,增益编码电路23执行增益编码处理以对从增益计算电路22提供的增益值进行编码。然后,增益编码电路23将通过增益编码处理而获得的增益代码串提供至复用电路25。
例如,增益编码电路23提取要根据从增益计算电路22提供的每个采样位置处的增益值——即,要被处理的帧的增益波形——而被编码的增益采样位置。例如,可以将特征采样如增益波形中的拐点用作增益采样点,或者可以将以预定间隔布置的采样用作增益采样位置。
增益编码电路23针对以此方式被提取的每个增益采样位置生成插值模式信息以及增益信息。
例如,增益编码电路23通过执行所谓的局部解码生成插值模式信息。
即,增益编码电路23通过线性插值和非线性插值的插值生成彼此邻接的两个增益采样位置之间的增益波形,并且计算该增益波形与实际增益波形之间的差。然后,增益编码电路23生成表示所获得的差较小的插值方案的信息作为插值模式信息。
应当注意,可以使用任何其他方法来确定是执行线性插值还是执行非线性插值。例如,当要被处理的增益采样位置与所述要被处理的增益采样位置紧邻着的前一个增益采样位置之间的增益值相同并且上述要被处理的增益采样位置紧邻着的前一个增益采样位置的增益倾斜值为0时,还可以确定线性插值被执行,而在其他情况下非线性插值被执行。可替代地,还可以采用其中高阶控制设备指定线性插值或非线性插值的配置。
此外,增益编码电路23针对每个增益采样位置视情况而定对采样长度T[k]、表示采样位置的增益值g[k]和增益倾斜值s[k]进行编码以获得增益信息。应当注意,当插值模式信息是表示使用线性插值的插值方案的信息时,生成仅包括采样长度和增益值而不包括增益倾斜值的增益信息。
增益编码电路23将包括以此方式获得的每个增益采样位置的增益信息以及插值模式信息的增益代码串提供至复用电路25。
在步骤S14中,信号编码电路24根据预定编码方案对所提供的输入时序信号进行编码,并且将作为编码的结果而获得的信号代码串提供至复用电路25。
在步骤S15中,复用电路25将从增益编码电路23提供的增益代码串与从信号编码电路24提供的信号代码串复用并且输出作为复用的结果而获得的输出代码串。当以此方式将与一个帧对应的输出代码串输出为比特流时,编码处理结束。然后,执行下一个帧的编码处理。
如上所述,编码设备11获得输入时序信号的帧内的每个采样的增益值以提取增益采样位置,并且生成由每个增益采样位置的增益信息和插值模式信息构成的增益代码串。
在解码侧,通过以此方式来确定帧内的每个采样的增益值,将音频信号的帧之间的时域波形平滑连接,使得可以获得品质较高的声音。此外,通过将插值模式信息包括在增益代码串中,可以通过视情况而定利用非线性插值使用较少的代码量以高精度再现增益波形。
<解码设备的配置示例>
接下来将描述接收从编码设备11输出的输出代码串作为输入代码串并且对输入代码串进行解码的解码设备。
图7是示出了应用本技术的解码设备的实施例的配置示例的图。
图7所示的解码设备51包括解复用电路61、信号解码电路62、增益解码电路63和增益施加电路64。
解复用电路61对所提供的输入代码串——即,从编码设备11接收的输出代码串——进行解复用,并且将作为解复用的结果而获得的信号代码串提供至信号解码电路62,同时将增益代码串提供至增益解码电路63。
信号解码电路62对从解复用电路61提供的信号代码串进行解码并且将作为解码的结果而获得的时序信号提供至增益施加电路64。在此,时序信号是例如11.1ch或者7.1ch的音频信号,并且将构成时序信号的声道的音频信号设置为脉冲编码调制(PCM)信号。
增益解码电路63对从解复用电路61提供的增益代码串进行解码并且将作为解码的结果而获得的增益值提供至增益施加电路64。增益解码电路63具有插值处理单元71,该插值处理单元71基于从增益代码串获得的增益信息和插值模式信息通过线性插值或非线性插值来计算时序信号的每个采样位置处的增益值。
增益施加电路64基于从增益解码电路63提供的增益值通过调整从信号解码电路62提供的时序信号的增益来校正时序信号的音量,并且输出作为音量校正的结果而获得的输出时序信号。
<解码处理的说明>
随后,将描述解码设备51的操作。
当与一个帧对应的输入代码串被提供时,解码设备51执行对输入代码串进行解码并且对输出时序信号进行输出的解码处理。下面将参照图8的流程图来描述通过解码设备51的解码处理。
在步骤S41中,解复用电路61接收从编码设备11发送的输入代码串并且对输入代码串进行解复用,并且将作为解复用的结果而获得的信号代码串提供至信号解码电路62,同时将增益代码串提供至增益解码电路63。
在步骤S42中,信号解码电路62对从解复用电路61提供的信号代码串进行解码并且将作为解码的结果而获得的时序信号提供至增益施加电路64。
在步骤S43中,增益解码电路63执行增益解码处理以对从解复用电路61提供的增益代码串进行解码并且将作为解码的结果而获得的要被处理的帧的每个采样位置处的增益值提供至增益施加电路64。应当注意,后面将描述增益解码处理的细节。
在步骤S44中,增益施加电路64基于从增益解码电路63提供的增益值来调整从信号解码电路62提供的时序信号的增益并且输出所获得的输出时序信号。即,时序信号的每个采样被乘以要用于形成音量适当的输出时序信号的增益值。
当输出时序信号被输出时,解码处理结束。
如上所述,解码设备51对增益代码串进行解码,并且向时序信号施加每个采样位置处的所获得的增益值以调整时域中的增益(音量)。通过以此方式使用针对每个采样位置确定的增益值来调整增益,可以平滑地连接输出时序信号的帧之间的时间波形,使得可以获得品质较高的声音。
此外,因为通过视情况而定利用非线性插值获得增益波形,所以甚至当增益波形是平滑波形时,仍然可以使用较少的代码量以高精度再现增益波形。
<增益解码处理的说明>
此外,将参照图9的流程图来描述与图8的步骤S43中的处理对应的增益解码处理。
在步骤S71中,增益解码单元63从由解复用电路61提供的增益代码串读出要被处理的增益采样位置处的增益信息,并且必要时对作为增益信息而包括的采样长度T[k]、增益值g[k]和增益倾斜值s[k]进行解码。应当注意,当由插值模式信息表示的插值方案是使用线性插值的插值方案时,增益信息中不包括增益倾斜值。
例如,在增益代码串中,每个增益采样位置处的增益信息和插值模式信息被存储,同时按照距帧的头部的距离的升序被布置。因为增益解码电路63顺序地从增益代码串读出增益信息和插值模式信息,所以将增益采样位置设置为按照距帧的头部的距离的升序要被处理的增益采样位置。
在步骤S72中,增益解码电路63从增益代码串读出要被处理的增益采样位置处的插值模式信息。
应当注意,虽然在此将描述插值模式信息被包括在增益模式字符串中的示例,但是插值模式信息也可以被包括在其中包括每个帧的输入代码串的比特流的头部等中,或者可以从高阶控制设备等获得插值模式信息。
在步骤S73中,插值处理单元71确定由所读出的插值模式信息表示的插值方案是否为使用线性插值的方案。
在步骤S73中,当确定插值方案是使用线性插值的方案时,在步骤S74中,插值处理单元71执行线性插值以生成增益波形。
具体地,插值处理单元71基于要被处理的增益采样位置处的增益值g[k]和采样长度T[k-1]以及相比要被处理的增益采样位置而言距帧的头部近了一个位置的增益采样位置处的增益值和采样位置来执行与上述等式(1)的计算相同的计算以生成增益采样位置之间的增益波形。即,计算位于时序信号的两个增益采样位置之间的每个采样位置处的增益值,并且将由采样位置处的增益值构成的波形设置为增益波形。
当以此方式获得两个相邻的增益采样位置之间的增益波形时,处理进行至步骤S76。
另一方面,当在步骤S73中确定方案是不使用线性插值的方案即使用非线性插值的方案时,在步骤S75中,插值处理单元71执行非线性插值以生成增益波形。
具体地,插值处理单元71基于要被处理的增益采样位置处的增益值g[k]、采样长度T[k-1]和增益倾斜值s[k]以及相比要被处理的增益采样位置而言距帧的头部近了一个位置的增益采样位置处的增益值、采样位置和增益倾斜值来执行与上述等式(4)的计算相同的计算以生成增益采样位置之间的增益波形。即,计算位于时序信号的两个增益采样位置之间的每个采样位置处的增益值,并且将由采样位置的增益值构成的波形设置为增益波形。
当以此方式获得两个相邻的增益采样位置之间的增益波形时,处理进行至步骤S76。
当通过步骤S74或步骤S75中的插值获得增益采样位置之间的增益波形时,在步骤S76中,增益解码电路63确定是否针对所有增益采样位置执行了处理。
当在步骤S76中确定不是所有增益采样位置已经被处理时,处理返回至步骤S71并且重复上述处理。即,将下一个增益采样位置选作处理目标,并且通过插值获得增益波形。
另一方面,当在步骤S76中确定所有增益采样位置被处理时,增益解码电路63将到目前为止与由通过所述处理获得的采样位置处的增益值构成的一个帧对应的增益波形提供至增益施加电路64,并且增益解码处理结束。当增益解码处理结束时,然后,处理进行至图8中的步骤S44。
解码设备51根据如上述插值模式信息通过线性插值或非线性插值获得增益波形。通过以此方式根据插值模式信息视情况而定通过非线性插值获得增益波形,可以使用较少的代码量以高精度再现增益波形。
应当注意,虽然上面已经描述了以下示例:针对每个增益采样位置生成插值模式信息并且插值方案在线性插值与非线性插值之间切换,但是也可以针对每个帧生成一条插值模式信息。在这种情况下,插值方案以帧为单位在线性插值与非线性插值之间切换。
此外,插值方案可以以多个帧为单位或者以文件为单位在线性插值与非线性插值之间切换。例如,当插值方案以文件为单位切换时,例如,将一条插值模式信息存储在比特流的头部中。插值处理单元71使用由插值模式信息表示的插值方案——即,使用线性插值的方案或者使用非线性插值的方案——执行每个帧的插值处理,以获得与一个文件对应的增益波形。
<第二实施例>
<限制>
附带提及,通过非线性插值获得的增益波形与通过线性插值获得的增益波形不同,并且存在以下情况:两个增益采样位置之间的采样位置处的增益值可以大于或小于包括在增益代码串中的两个增益采样位置处的增益值。
例如,在图3所示的示例中,在通过非线性插值获得的用曲线C21表示的增益波形的一部分中,存在其中增益值变得小于增益采样位置G11处的增益值g[k]的部分。此外,在用曲线C21表示的增益波形的一部分中,也存在其中增益值变得大于增益采样位置G12处的增益值g[k+1]的部分。
因此,存在以下情况:通过非线性插值获得的增益值变成不适合作为增益值的负(负的)值。因此,为了防止通过插值获得的增益值变成不合适的值,还可以通过执行下面等式(11)的计算使用0作为下限对增益值执行限制。
[等式11]
g_interpolated[n]=max(0,g_interpolated[n]) (11)
在等式(11)中,使得在通过插值获得的增益值g_interpolated[n]与0之间的较大的一个值作为最终增益值g_interpolated[n]。因此,最终增益值等于或大于0,并且增益值并不变成负值。
此外,存在期望通过增益调整(音量校正)来增强(放大)时序信号的情况以及期望通过增益调整(音量校正)来压缩(抑制)时序信号的情况。
例如,当期望增强时序信号时,如果增益值小于1,则增益值变成不合适的值。因此,当时序信号被增强时,还可以通过执行下面等式(12)的计算使用1作为下限对增益值执行限制。
[等式12]
g_interpolated[n]=max(1,g_interpolated[n]) (12)
在等式(12)中,使用在通过插值获得的增益值g_interpolated[n]与1之间的较大的一个值作为最终增益值g_interpolated[n]。因此,增益值不会变成小于1的值。换言之,增益值总是等于或大于作为下限的1。
此外,例如,当期望压缩时序信号时,如果增益值大于1,则增益值变成不合适的值。因此,当时序信号被压缩时,还可以通过执行下面等式(13)的计算使用1作为上限对增益值执行限制。
[等式13]
g_interpolated[n]=min(1,g_interpolated[n]) (13)
在等式(13)中,使得在通过插值获得的增益值g_interpolated[n]与1之间的较小的一个值作为最终增益值g_interpolated[n]。因此,增益值不会变成大于1的值。换言之,增益值总是等于或小于作为上限的1。
当执行如等式(12)或等式(13)中所示的限制处理时,仅必需将表示增益波形是用于增强还是用于压缩的限制信息提供至增益解码电路63作为关于编码增益波形的信息。例如,可以将限制信息从高阶控制设备提供至增益解码电路63,或者可以将限制信息包括在增益代码串、比特流的头部等中。
在下面,在将继续的描述中假设限制信息被包括在增益代码串中。在这种情况下,在图15中的步骤S13的处理中,生成包括限制信息的增益代码串。
通过如上所述对增益值执行限制处理,可以获得更合适的增益值。通过这种方式,可以执行更合适的增益调整(音量控制),因此,可以获得品质较高的声音。
<解码设备的配置示例>
当对增益值执行限制处理时,如例如图10中所示的那样对解码设备51进行配置。应当注意,在图10中,对与图7中的附图标记对应的部分分配与图7中的附图标记相同的附图标记,并且视情况而定,将省略对其的说明。
图10所示的解码设备51的配置与图7中的解码设备51的配置的不同之处在于在图10中在增益解码电路63处新设置了限制处理单元101,并且图10中所示的解码设备51的配置与图7中的解码设备51的配置在其他点上相同。
限制处理单元101对通过由插值处理单元71执行的非线性插值计算的增益值执行限制处理以获得最终增益值。
<增益解码处理的说明>
接下来将描述在解码设备51具有图10所示的配置的情况下执行的增益解码处理。
例如,在解码设备51处,执行参照图8描述的解码处理。然而,在与步骤S43对应的增益解码处理中,执行图11所示的增益解码处理。下面将参照图11的流程图来描述图10中的解码设备51的增益解码处理。
应当注意,从步骤S101至步骤S105的处理与图9中从步骤S71至步骤S75的处理相同,将省略对其的说明。
在步骤S106中,限制处理单元101视情况而定通过对通过步骤S105中的处理获得的每个采样位置处的增益值执行上述等式(11)的计算来改变增益值,使得增益值不变成负值。
此外,限制处理单元101根据包括在增益代码串中的限制信息通过对通过等式(11)的计算所限制的增益值进一步执行等式(12)或等式(13)的计算获得最终增益值。
特别地,当包括在增益代码串中的限制信息表示增益波形要被用于增强时,限制处理单元101执行等式(12)的计算,以使得增益值不变成小于1的值。
另一方面,当包括在增益代码串中的限制信息表示增益波形要被用于压缩时,限制处理单元101执行等式(13)的计算,使得增益值不变成大于1的值。
当通过步骤S104中的线性插值生成增益波形或者在步骤S106中执行限制处理时,执行步骤S107中的处理,并且增益解码处理结束。因为步骤S107中的处理与图9中的步骤S76中的处理相同,将省略对其的说明。
如上所述,解码设备51对通过非线性插值而获得的增益值执行限制处理。通过这种方式,可以使用更合适的增益值执行增益调整(音量校正)。因此,可以获得品质较高的声音。
<第三实施例>
<增益值的插值>
此外,虽然在上面的描述中已经描述了下述示例:当用于对增益值进行插值的插值方案针对每个增益采样位置在线性插值与非线性插值之间被切换时获得增益波形,但是还可以采用基本上执行非线性插值并且仅在特定条件下执行线性插值的配置。
例如,将研究以下情况:使用图12所示的虚线L41表示的增益波形被编码并且通过非线性插值在解码侧获得增益波形。应当注意,图12用纵轴表示增益值并且用横轴表示采样位置。
在编码设备11处,假定第k个增益采样位置G21和第k+1个增益采样位置G22被提取并且包括这些增益采样位置处的增益值、采样长度和增益倾斜值的增益代码串被获得。
在此,箭头D21表示增益采样位置G21处的增益倾斜值s[k],箭头D22表示增益采样位置G22处的增益倾斜值s[k+1]。
现在假定基于包括在增益代码串中的增益值、采样长度和增益倾斜值在解码设备51处执行使用三次函数的非线性插值,并且用曲线C31表示的增益波形被获得。
在该示例中,通过非线性插值获得的用曲线C31表示的增益波形与用虚线L41表示的增益波形之间的差异变大。
在用于通过非线性插值获得增益波形的方案中,当其增益值线性变化的增益波形与本示例一样被编码时,原始增益波形与解码时通过非线性插值获得的增益波形之间的差异变大。
为了使得该差异小,必需通过计算非线性插值而获得的增益波形来执行对增益值以及要在编码设备11处被编码的增益倾斜值进行调整的处理(局部解码),这增加了编码的处理量。
因此,在本技术中,当通过使得线性插值能够在特定条件下被执行而在解码设备51处执行非线性插值时,使用较少的编码处理量以高精度再现增益波形。
特别地,例如,当第k个增益采样位置与第k+1个增益采样位置之间的采样位置处的增益值通过插值被获得时,根据这些增益采样位置处的增益值和增益倾斜值获得直线1[k]与直线1[k+1]这两条直线的交点X[k,k+1]。
在此,直线1[k]是经过增益波形上的第k个增益采样位置(点)并且具有用增益倾斜值s[k]表示的倾斜度的直线。即,当采样轴方向上的坐标的值与第k个增益采样位置的值相同时,直线l[k]是具有第k个增益采样位置处的增益值g[k]作为增益轴方向上的坐标值并且具有使用增益倾斜值s[k]表示的倾斜度的直线。
以类似的方式,直线1[k+1]是经过第k+1个增益采样位置并且具有用增益倾斜值s[k+1]表示的倾斜度的直线。
此外,确定第k个增益采样位置或者第k+1个增益采样位置与所获得的交点X[k,k+1]之间的距离是否等于或小于预定阈值。在此处的确定中,确定例如下面的等式(14)是否成立。
[等式14]
((d_sample[k]≤thre_sample)&&(d_gain[k]≤thre_gain))
||((d_sample[k+1]≤thre_sample)
&&(d_gain[k+l]≤thre_gain)) (14)
应当注意,在等式(14)中,d_sample[k]和d_sample[k+1]分别表示在采样轴方向上从第k个增益采样位置和第k+1个增益采样位置至交点X[k,k+1]的距离。此外,d_gain[k]和d_gain[k+1]分别表示在增益轴方向上从第k个增益采样位置和第k+1个增益采样位置至交点X[k,k+1]的距离,即,增益值的差。
此外,thre_sample和thre_gain分别表示在采样轴方向上的距离的阈值与在增益轴方向上的距离的阈值。
因此,在等式(14)中,当距离d_sample[k]等于或小于thre_sample并且距离d_gain[k]等于或小于thre_gain时,或者当距离d_sample[k+1]等于或小于thre_sample并且距离d_gain[k+1]等于或小于阈值thre_gain时,从增益采样位置至交点X[k,k+1]的距离等于或小于阈值。
例如,当第k个增益采样位置是帧的头部位置即n=0的采样位置时,分别使用下面的等式(15)至等式(18)来获得等式(14)中的距离d_sample[k]、距离d_gain[k]、距离d_sample[k+1]和距离d_gain[k+1]。此外,阈值thre_sample是例如阈值thre_sample=32以及阈值thre_gain是例如阈值thre_gain=0.01。
[等式15]
d_sample[k]=abs((g[k+1]-g[k]-s[k+1]×T[k])
/(s[k]-s[k+1])) (15)
[等式16]
d_gain[k]=abs(s[k]×(g[k+1]-g[k]-s[k+1]×T[k])
/(s[k]-s[k+1])) (16)
[等式17]
d_sample[k+1]=abs((g[k+1]-g[k]-s[k+1]×T[k])
/(s[k]-s[k+1])-T[k]) (17)
[等式18]
d_gain[k+1]=abs(s[k]×(g[k+1]-g[k]-s[k+1]×T[k])
/(s[k]-s[k+1])+g[k]-g[k+1]) (18)
应当注意,在等式(15)至等式(18)中,abs(x)表示x的绝对值被获得。
当确定用等式(14)表示的这样的条件表达式成立时,通过线性插值——即通过上述等式(1)的计算——来获得增益波形,另一方面,当用等式(14)表示的条件表达式不成立时,通过非线性插值——即通过上述等式(4)的计算——来获得增益波形。
例如,如图13所示,当增益采样位置G31与增益采样位置G32之间的每个采样位置处的增益值通过插值被获得时,通过指定将交点CP11包括在区域TR11和区域TR12中的哪一个区域中来确定用等式(14)表示的条件表达式是否成立。应当注意,图13用纵轴表示增益值并且用横轴表示时序信号的帧内的采样位置。
在图13中,增益采样位置G31表示第k个增益采样位置,箭头D31表示增益采样位置G31处的增益倾斜值s[k]。因此,直线L51是直线1[k]。
以类似的方式,增益采样位置G32表示第k+1个增益采样位置,箭头D32表示增益采样位置G32处的增益倾斜值s[k+1]。因此,直线L52是直线1[k+1]。作为直线L51与直线L52的交点的交点CP11是交点X[k,k+1]。
现在假定在图中区域TR11在中心处具有增益采样位置G31并且其竖直方向上的长度为2×thre_gain而水平方向上的长度为2×thre_sample。以类似方式,假定在图中区域TR12在中心处具有增益采样位置G21并且其竖直方向上的长度为2×thre_gain而水平方向上的长度为2×thre_sample。
在这种情况下,当交点CP11位于区域TR11内或者交点CP11位于区域TR12内时,用等式(14)表示的条件表达式成立。在图13的示例中,因为交点CP11位于区域TR12内,所以用等式(14)表示的条件表达式成立。
在图13所示的示例中,要被再现(恢复)的原始增益波形应当已经是与由直线L51和直线L52构成的波形接近的波形。即,更具体地,波形应当已经接近从增益采样位置G31至交点CP11的直线L51,并且应当已经接近从交点CP11至增益采样位置G32的直线L52。
然而,因为在该示例中交点CP11位于区域TR12内,所以交点CP11至增益采样位置G32之间的距离足够短,可以确定原始增益波形与连接增益采样位置G31与增益采样位置G32的直线近似。
在这种情况下,因为在增益采样位置G31与增益采样位置G32之间的增益波形处增益值可以基本上线性地变化,所以可以通过借助线性插值获得增益波形而不是借助非线性插值获得增益波形从而以较高精度再现增益波形。因此,在本技术中,当使用上述等式(14)表示的条件表达式成立时,通过线性插值获得增益波形。
因此,在图13的示例中,通过线性插值获得增益采样位置G31与增益采样位置G32之间的每个采样位置处的增益值,并且通过这种方式,例如,可以获得图14所示的增益波形。应当注意,在图14中,向与图13中的附图标记对应的部分分配与图13中的附图标记相同的附图标记,并且视情况而定将省略对其的说明。
在图14中,连接增益采样位置G31与增益采样位置G32的直线L61被获得作为增益采样位置G31与增益采样位置G32之间的增益波形。
此外,例如,还在图12所示的上述示例中,因为用等式(14)表示的条件表达式成立,所以通过线性插值获得增益波形。
在图12的示例中,因为交点X[k,k+1]位于增益采样位置G22处,所以等式(14)成立,并且将连接增益采样位置G21与增益采样位置G22的直线设置为增益采样位置之间的增益波形。因此,在该示例中,精确地再现原始增益波形。
如上所述,当虽然在特定条件下执行线性插值但主要执行非线性插值时,可以使得原始增益波形与解码增益波形之间的差异较小而不会增加编码的处理量。
此外,通过采用这样的解码方案,因为可以仅使用执行非线性插值的方案执行线性插值与非线性插值两者,所以使得不必在增益代码串中包括插值模式信息,从而可以降低输出代码串的比特率。即,可以减少输出代码串的代码量。
<解码设备的配置示例>
当在特定条件下执行线性插值时,如例如图15所示的那样对解码设备51进行配置。应当注意,在图15中,向与图7中的附图标记对应的部分分配与图7中的附图标记相同的附图标记,视情况而定将省略对其的说明。
图15所示的解码设备51的配置与图7中的解码设备51的配置的不同之处在于图15中在增益解码电路63处新布置了运算单元131,而图15中所示的解码设备51的配置与图7中的解码设备51的配置在其他点上相同。
运算单元131执行上述用等式(14)表示的条件表达式的计算。
<增益解码处理的说明>
接下来将描述当如图15所示的那样对解码设备51进行配置时执行的增益解码处理。
例如,在编码设备11处,当在步骤S13中的增益编码处理中执行参照图5描述的编码处理时,仅包括增益信息而不包括插值模式信息的增益代码串被生成并且通过复用而获得的输出代码串被输出。此外,在这种情况下,增益信息总是包括增益倾斜值。
在解码设备51处,参照图8描述的解码处理被执行。然而,在与步骤S43对应的增益解码处理中,图16所示的增益解码处理被执行。下面将参照图16的流程图来描述通过图15中的解码设备51的增益解码处理。
应当注意,因为步骤S131中的处理与图9中的步骤S71中的处理相同,所以将省略对其的说明。
在步骤S132中,运算单元131基于读出的增益信息来计算用等式(14)表示的条件表达式。
即,运算单元131基于作为增益信息被读出的增益采样位置处的增益值、采样长度和增益倾斜值来执行与上述等式(15)至等式(18)相同的计算。然后,运算单元131基于从作为所述计算的结果而获得的增益采样位置至交点X[k,k+1]的距离来执行等式(14)的计算。
等式(15)至等式(18)的该计算等同于获得直线1[k]和直线1[k+1]并且获得这些直线的交点X[k,k+1]以及还获得第k个增益采样位置和第k+1个增益采样位置处的增益值与交点X[k,k+1]处的增益值之间的差。此外,等式(14)的条件表达式的计算等同于确定增益采样位置处的增益值与交点X[k,k+1]处的增益值之间的差是否等于或小于预定阈值。
因此,在解码设备51处,可以根据增益采样位置处的增益值与交点X[k,k+1]处的增益值之间的差通过线性插值或非线性插值来获得两个增益采样位置之间的每个采样位置处的增益值。
在步骤S133中,插值处理单元71确定是否基于步骤S132中的条件表达式的计算结果来执行线性插值。例如,当用等式(14)表示的条件表达式成立时,确定执行线性插值。
当在步骤S133中确定线性插值被执行时,在步骤S134中,插值处理单元71执行线性插值以生成增益波形,然后,处理进行至步骤S136。在步骤S134中,执行与图9中的步骤S74中的处理相同的处理。
另一方面,当在步骤S133中确定不执行线性插值时,在步骤S135中,插值处理单元71执行非线性插值以生成增益波形,然后,处理进行至步骤S136。应当注意,在步骤S135中,执行与图9中的步骤S75中的处理相同的处理。
当在步骤S134或步骤S135中生成增益波形时,执行步骤S136中的处理,并且增益解码处理结束。因为步骤S136中的处理与图9中步骤S76中的处理相同,所以将省略对其的说明。
如上所述,解码设备51在特定条件下通过线性插值生成增益波形。通过这种方式,可以使用较少的处理量以较高精度获得原始增益波形,并且可以减少输出代码串的代码量。
<第三实施例的修改示例1>
<增益值的插值>
应当注意,尽管在第三实施例中描述了在特定条件下执行线性插值的情况,但是还可以通过使用增益采样位置和交点对增益值执行线性插值。
即,在第三实施例中,使用等式(1)通过线性插值来计算两个增益采样位置之间的每个采样位置处的增益值。替代地,在本实施例中,将由分别连接如图17所示的两条直线L51和L52的交点CP11以及两个增益采样位置的直线构成的波形设置为通过线性插值而获得的增益波形。应当注意,在图17中,向与图13中的附图标记对应的部分分配与图13中的附图标记相同的附图标记,视情况而定将省略对其的说明。
在本示例中,将由连接增益采样位置G31与交点CP11的直线以及连接增益采样位置G32与交点CP11的直线构成的虚线L71设置为增益采样位置G31与增益采样位置G32之间的增益波形。
在图17所示的增益波形的示例中,当使用连接两个增益采样位置的直线执行线性插值时,为了更精确地再现增益波形,必须在对增益波形编码时在增益采样位置G31与增益采样位置G32之间的区段中设置三个或更多个增益采样位置。
即,如果采样位置——增益采样位置G31、交点CP11和增益采样位置G32——被设置为在对增益波形进行编码时的增益采样位置,则在编码前的增益波形与通过解码而获得的增益波形之间出现差异(误差)。
另一方面,当通过利用交点CP11将虚线L71设置为增益波形时,通过仅将增益采样位置G31和增益采样位置G32这两个位置设置为增益采样位置,可以使得编码前的增益波形与通过解码而获得的增益波形之间的差异较小。因此,在同时利用交点执行线性插值的方法中,可以减少增益采样位置的数量,从而可以抑制输出代码串的比特率并且提高编码效率。
应当注意,当同时利用交点执行线性插值时,必须将两条直线的交点定位在两个增益采样位置之间。
例如,在图17的示例中,必须沿采样轴方向将交点CP11定位在增益采样位置G31与增益采样位置G32之间。
因此,图13中的示例与图17中的示例在用于确定是执行非线性插值还是执行线性插值的区域方面不同。在图17的示例中,当交点CP11被包括在区域TR21或区域TR22中时,执行利用交点的线性插值。
在此,区域TR21是图13所示的区域TR11的右半区域,即,图13中区域TR11的处于增益采样位置G31右侧的区域。以类似方式,区域TR22是图13所示的区域TR12的左半区域,即,图13中区域TR12的处于增益采样位置G32左侧的区域。
以此方式,当执行利用交点的线性插值时,与等式(14)对应的条件表达式与用下面的等式(19)所示的条件表达式一样。即,当下面的等式(19)成立时,执行利用交点的线性插值。
[等式19]
((0<d_sample[k])&&(d_sample[k]≤thre_sample)
&&(d_gain[k]≤thre_gain))
||((0<d_sample[k+1])&&(d_sample[k+1]≤thre_sample)
&&(d_gain[k+1]≤thre_gain)) (19)
在等式(19)中,当距离d_sample[k]大于0并且等于或小于thre_sample并且距离d_gain[k]等于或小于阈值thre_gain时,或者当距离d_sample[k+1]大于0并且等于或小于阈值thre_sample并且距离d_gain[k+1]等于或小于阈值thre_gain,从增益采样位置至交点X[k,k+1]的距离等于或小于阈值。
例如,当第k个增益采样位置是帧的头部位置即n=0的采样时,使用下面的等式(20)至等式(23)分别获得等式(19)中的距离d_sample[k]、距离d_gain[k]、距离d_sample[k+1]和距离d_gain[k+1]。
[等式20]
d_sample[k]=(g[k+1]-g[k]-s[k+1]×T[k])
/(s[k]-s[k+1]) (20)
[等式21]
d_gain[k]=abs(s[k]×(g[k+1]-g[k]-s[k+1]×T[k])
/(s[k]-s[k+1])) (21)
[等式22]
d_sample[k+1]=T[k]-(g[k+1]-g[k]-s[k+1]×T[k])
/(s[k]-s[k+1]) (22)
[等式23]
d_gain[k+1]=abs(s[k]×(g[k+1]-g[k]-s[k+1]×T[k])
/(s[k]-s[k+1])+g[k]-g[k+1]) (23)
当确定用等式(19)表示的条件表达式不成立时,通过非线性插值即上述等式(4)的计算获得增益波形。
另一方面,当确定使用等式(19)表示的条件表达式成立时,通过线性插值获得增益波形。
例如,当第k个增益采样位置是帧的头部位置即n=0的采样位置时,当交点X[k,k+1]的采样位置即从第k个增益采样位置至交点X[k,k+1]的采样长度被设置为T’[k]时,根据下面的等式(24)获得采样位置T’[k]。
[等式24]
T’[k]=(g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1]) (24)
此外,根据下面的等式(25)来计算位于第k个增益采样位置与交点X[k,k+1]之间的并且作为从帧的头部开始的第n(其中,0≤n<T’[k])个采样的采样n的增益值g_interpolated[n]。
[等式25]
g_interpolated[n]=a1[k]×n+b1[k]
(0≤n<T’[k]) (25)
应当注意,在等式(25)中,a1[k]和b1[k]是分别根据下面的等式(26)和等式(27)获得的值。
[等式26]
a1[k]=s[k] (26)
[等式27]
b1[k]=g[k] (27)
a1[k]和b1[k]表示连接第k个增益采样位置与交点X[k,k+1]的直线的倾斜度和截距。因此,在该示例中,如参照图17所描述的,确定增益值在第k个增益采样位置G31与交点CP11之间线性地变化,并且通过线性插值获得每个采样n的增益值。
此外,根据下面的等式(28)来计算位于交点X[k,k+1]与第k+1个增益采样位置之间并且作为从帧的头部开始的第n(其中,T’[k]≤n<T[k])个采样的采样n的增益值g_interpolated[n]。
[等式28]
g_interpolated[n]=a2[k]×n+b2[k]
(T’[k]≤n<T[k]) (28)
应当注意,在等式(28)中,a2[k]和b2[k]是分别根据下面的等式(29)和等式(30)获得的值。
[等式29]
a2[k]=s[k+1] (29)
[等式30]
b2[k]=g[k+1]-s[k+1]×T[k] (30)
a2[k]和b2[k]表示连接交点X[k,k+1]与第k+1个增益采样位置的直线的倾斜度和截距。因此,在本示例中,如参照图17所描述的,确定增益值在交点CP11与第k+1个增益采样位置G32之间线性地变化,并且通过线性插值获得每个采样n的增益值。
如上所述,当在特定条件下执行利用交点的线性插值时,在参照图16描述的增益解码处理中,在步骤S132中,运算单元131基于所读出的增益信息执行用等式(19)表示的条件表达式的计算。
当用等式(19)表示的条件表达式成立时,在步骤S134中,插值处理单元71基于作为增益信息被读出的增益采样位置处的增益值、采样长度和增益倾斜值使用等式(24)计算交点X[k,k+1]的采样位置T’[k]。此外,插值处理单元71使用所获得的采样位置T’[k]来执行等式(25)和等式(28)的计算并且通过线性插值生成增益波形。
另一方面,当用等式(19)表示的条件表达式不成立时,在步骤S135中,插值处理单元71执行非线性插值以生成增益波形。
以此方式,通过在特定条件下执行利用交点的线性插值,可以使得编码前的原始增益波形与通过解码而获得的增益波形之间的差异较小而不会增加编码时的处理量。
此外,因为可以仅使用执行非线性插值的方案来执行线性插值与非线性插值两者,所以不必在增益代码串中包括插值模式信息,使得可以降低输出代码串的比特率。即,可以减少输出代码串的代码量。
<第四实施例>
<增益解码处理的说明>
此外,在第三实施例以及第三实施例的修改示例1中,描述了以下情况:插值模式信息不被包括在增益代码串中并且主要执行非线性插值。
然而,在插值模式信息被包括在增益代码串中并且增益波形主要使用插值模式信息中表示的插值方案来获得的情况下,当插值模式信息中表示的插值方案是使用非线性插值的方案时,在特定条件下可以执行线性插值。
在这样的情况下,在解码设备51处,执行参照图8描述的解码处理。然而,在与步骤S43对应的增益解码处理中,执行图18中所示的增益解码处理。下面将参照图18的流程图来描述图15中通过解码设备51的增益解码处理。
应当注意,因为步骤S161至步骤S164中的处理与图9中的步骤S71至步骤S74中的处理相同,所以将省略对其的说明。
在步骤S163中,当确定方案是使用非线性插值的方案时,在步骤S165中,运算单元131基于所读出的增益信息来执行用等式(14)表示的条件表达式的计算。
然后,虽然步骤S166至步骤S168中的处理被执行,但是因为这些处理与图16中的步骤S133至步骤S135中的处理相同,所以将省略对其的说明。应当注意,从步骤S165至步骤S168,可以执行在第三实施例中描述的处理,或者可以执行在第三实施例的修改示例1中描述的处理。此外,当执行非线性插值时,可以执行限制处理。
当通过步骤S164、步骤S167或步骤S168中的插值生成增益波形时,处理进行至步骤S169。
在步骤S169中,增益解码电路63确定是否针对所有增益采样位置执行了处理。
当在步骤S169中确定并非所有增益采样位置被处理时,处理返回至步骤S161,并且重复上述处理。
另一方面,当在步骤S169中确定所有增益采样位置被处理时,增益解码电路63将到目前为止与由通过所述处理获得的采样位置处的增益值构成的一个帧对应的增益波形提供至增益施加电路64,并且增益解码处理结束。当增益解码处理结束时,处理进行至图8中的步骤S44。
如上所述,解码设备51根据插值模式信息通过线性插值或非线性插值获得增益波形。通过根据插值模式信息以此方式视情况而定通过非线性插值获得增益波形,可以使用较少的代码量以高精度再现增益波形。
此外,即使当插值模式信息中表示的插值方案是使用非线性插值的方案时,在特定条件下仍可以通过执行线性插值,使用较少的编码处理量以较高的精度再现原始增益波形。此外,可以减少输出代码串的代码量。
上述一系列处理可以通过硬件来执行而且还可以通过软件来执行。当上述一系列处理通过软件来执行时,可以将构造这样的软件的程序安装在计算机中。在此,表达“计算机”包括结合有专用硬件的计算机以及当各种程序被安装时能够执行各种功能的通用个人计算机等。
图19是示出了使用程序执行上述一系列处理的计算机的硬件配置示例的框图。
在这样的计算机中,CPU(中央处理单元)501、ROM(只读存储器)502和RAM(随机存取存储器)503通过总线504彼此连接。
输入/输出接口505也被连接至总线504。输入单元506、输出单元507、记录单元508、通信单元509和驱动器510被连接至输入/输出接口505。
根据键盘、鼠标、麦克风、成像装置等来配置输入单元506。根据显示器、扬声器等来配置输出单元507。根据硬盘、非易失性存储器等来配置记录单元508。根据网络接口等来配置通信单元509。驱动器510对如磁盘、光盘、磁光盘、半导体存储器等的可移除介质511进行驱动。
在如上所述配置的计算机中,作为一个示例,CPU 501经由输入/输出接口505和总线504将记录在记录单元508中的程序加载至RAM 503中并且执行该程序以实施先前描述的一系列处理。
要由计算机(CPU 501)执行的程序被提供记录在作为封装式介质等的可移除介质511中。此外,程序可以经由有线或无线传输介质如局域网、因特网或者数字卫星广播被提供。
在计算机中,通过将移动记录介质511加载至驱动器510中,可以经由输入/输出接口505将程序安装至记录单元508中。还可以使用通信单元509从有线或无线传递介质接收程序并且将程序安装至记录单元508中。作为另一个替选,可以预先将程序安装至ROM 502或记录单元508中。
应当注意,由计算机执行的程序可以是以根据本说明书中描述的顺序的时间序列被处理的程序或者并行地被处理的程序或者可以是在必要时刻如当调用时被处理的程序。
本技术的实施例不限于上述实施例,并且在不偏离本技术的范围的情况下可以做出各种改变和修改。
例如,本技术可以采用云计算配置,其通过由贯穿网络的多个设备分配并且连接一个功能来进行处理。
此外,可以通过一个设备或者通过分配多个设备来执行由上面提到的流程图描述的每个步骤。
另外,在一个步骤中包括有多个处理的情况下,可以通过一个设备或者通过分配多个设备来执行包括在所述一个步骤中的多个处理。
本文中描述的有利效果不受限制,而仅为示例。还可以获得任何其他有利效果。
另外,本技术还可以如下配置。
(1)一种解码设备,包括:
增益读出单元,被配置成:读出时序信号的至少两个增益采样位置处的编码增益值;
插值信息读出单元,被配置成:读出表示所述时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得过非线性插值获得的插值信息;以及
插值处理单元,被配置成:根据所述插值信息通过线性插值或非线性插值基于所述增益采样位置处的增益值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
(2)根据(1)所述的解码设备,
其中,所述增益读出单元还读出表示所述增益采样位置处的增益值的倾斜度的增益倾斜值,并且
其中,当所述增益值通过非线性插值获得时,所述插值处理单元基于所述增益采样位置处的增益值和增益倾斜值来获得位于所述两个增益采样位置之间的每个采样位置处的增益值。
(3)根据(1)或(2)所述的解码设备,还包括:
限制处理单元,被配置成:对通过非线性插值而获得的增益值执行限制处理,使得所述增益值变成等于或大于预定下限的值或者等于或小于预定上限的值。
(4)根据(3)所述的解码设备,
其中,所述限制处理单元:使用0作为所述下限来执行限制处理,使用1作为所述下限来执行限制处理,或者使用1作为所述上限来执行限制处理。
(5)根据(2)至(4)中任一项所述的解码设备,还包括:
运算单元,被配置成:在所述增益采样位置处获得具有所述增益采样位置处的增益值并且具有由所述增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对所述两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差,
其中,当所述插值信息是表示所述增益值是通过线性插值获得的信息时,所述插值处理单元通过线性插值获得所述增益值,以及当所述插值信息是表示所述增益值通过非线性插值获得的信息时,所述插值处理单元根据所述差通过非线性插值或线性插值来获得所述增益值。
(6)一种解码方法,包括以下步骤:
读出时序信号的至少两个增益采样位置处的编码增益值;
读出表示所述时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得的插值信息;以及
根据所述插值信息通过线性插值或非线性插值基于所述增益采样位置处的增益值获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
(7)一种程序,所述程序使计算机执行包括以下步骤的处理:
读出时序信号的至少两个增益采样位置处的编码增益值;
读出表示所述时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得的插值信息;以及
根据所述插值信息通过线性插值或非线性插值基于所述增益采样位置处的增益值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
(8)一种解码设备,包括:
增益读出单元,被配置成:读出时序信号的至少两个增益采样位置处的编码增益值以及表示所述增益值的倾斜度的增益倾斜值;
运算单元,被配置成:在所述增益采样位置处获得具有所述增益采样位置处的增益值并且具有由所述增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对所述两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差;以及
插值处理单元,被配置成:根据所述差通过线性插值或非线性插值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
(9)一种解码方法,所述方法包括以下步骤:
读出时序信号的至少两个增益采样位置处的编码增益值以及表示所述增益值的倾斜度的增益倾斜值;
在所述增益采样位置处获得具有所述增益采样位置处的增益值并且具有由所述增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对所述两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差;以及
根据所述差通过线性插值或非线性插值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
(10)一种程序,所述程序使计算机执行包括以下步骤的处理:
读出时序信号的至少两个增益采样位置处的编码增益值以及表示所述增益值的倾斜度的增益倾斜值;
在所述增益采样位置处获得具有所述增益采样位置处的增益值并且具有由所述增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对所述两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差;以及
根据所述差通过线性插值或非线性插值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
附图标记列表
51 解码设备
61 解复用电路
62 信号解码电路
63 增益解码电路
64 增益施加电路
71 插值处理单元
101 限制处理单元
131 运算单元
Claims (10)
1.一种解码设备,包括:
增益读出单元,被配置成:读出时序信号的至少两个增益采样位置处的编码增益值;
插值信息读出单元,被配置成:读出表示所述时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得过非线性插值获得的插值信息;以及
插值处理单元,被配置成:根据所述插值信息通过线性插值或非线性插值基于所述增益采样位置处的增益值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
2.根据权利要求1所述的解码设备,
其中,所述增益读出单元还读出表示所述增益采样位置处的增益值的倾斜度的增益倾斜值,并且
其中,当所述增益值通过非线性插值获得时,所述插值处理单元基于所述增益采样位置处的增益值和增益倾斜值来获得位于所述两个增益采样位置之间的每个采样位置处的增益值。
3.根据权利要求1所述的解码设备,还包括:
限制处理单元,被配置成:对通过非线性插值而获得的增益值执行限制处理,使得所述增益值变成等于或大于预定下限的值或者等于或小于预定上限的值。
4.根据权利要求3所述的解码设备,
其中,所述限制处理单元:使用0作为所述下限来执行限制处理,使用1作为所述下限来执行限制处理,或者使用1作为所述上限来执行限制处理。
5.根据权利要求2所述的解码设备,还包括:
运算单元,被配置成:在所述增益采样位置处获得具有所述增益采样位置处的增益值并且具有由所述增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对所述两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差,
其中,当所述插值信息是表示所述增益值是通过线性插值获得的信息时,所述插值处理单元通过线性插值获得所述增益值,以及当所述插值信息是表示所述增益值通过非线性插值获得的信息时,所述插值处理单元根据所述差通过非线性插值或线性插值来获得所述增益值。
6.一种解码方法,包括以下步骤:
读出时序信号的至少两个增益采样位置处的编码增益值;
读出表示所述时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得的插值信息;以及
根据所述插值信息通过线性插值或非线性插值基于所述增益采样位置处的增益值获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
7.一种程序,所述程序使计算机执行包括以下步骤的处理:
读出时序信号的至少两个增益采样位置处的编码增益值;
读出表示所述时序信号的每个采样位置处的增益值是通过线性插值获得还是通过非线性插值获得的插值信息;以及
根据所述插值信息通过线性插值或非线性插值基于所述增益采样位置处的增益值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
8.一种解码设备,包括:
增益读出单元,被配置成:读出时序信号的至少两个增益采样位置处的编码增益值以及表示所述增益值的倾斜度的增益倾斜值;
运算单元,被配置成:在所述增益采样位置处获得具有所述增益采样位置处的增益值并且具有由所述增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对所述两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差;以及
插值处理单元,被配置成:根据所述差通过线性插值或非线性插值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
9.一种解码方法,所述方法包括以下步骤:
读出时序信号的至少两个增益采样位置处的编码增益值以及表示所述增益值的倾斜度的增益倾斜值;
在所述增益采样位置处获得具有所述增益采样位置处的增益值并且具有由所述增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对所述两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差;以及
根据所述差通过线性插值或非线性插值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
10.一种程序,所述程序使计算机执行包括以下步骤的处理:
读出时序信号的至少两个增益采样位置处的编码增益值以及表示所述增益值的倾斜度的增益倾斜值;
在所述增益采样位置处获得具有所述增益采样位置处的增益值并且具有由所述增益采样位置处的增益倾斜值表示的倾斜度的直线,并且获得针对所述两个增益采样位置而分别获得的直线的交点处的增益值与所述两个增益采样位置处的各个增益值之间的差;以及
根据所述差通过线性插值或非线性插值来获得位于所述时序信号的两个增益采样位置之间的每个采样位置处的增益值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013-272943 | 2013-12-27 | ||
JP2013272943 | 2013-12-27 | ||
PCT/JP2014/082925 WO2015098564A1 (ja) | 2013-12-27 | 2014-12-12 | 復号化装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105849801A true CN105849801A (zh) | 2016-08-10 |
CN105849801B CN105849801B (zh) | 2020-02-14 |
Family
ID=53478428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480069805.XA Active CN105849801B (zh) | 2013-12-27 | 2014-12-12 | 解码设备和方法以及程序 |
Country Status (14)
Country | Link |
---|---|
US (3) | US10692511B2 (zh) |
EP (2) | EP3608909B1 (zh) |
JP (4) | JP6593173B2 (zh) |
KR (3) | KR102356012B1 (zh) |
CN (1) | CN105849801B (zh) |
AU (1) | AU2014371411A1 (zh) |
BR (1) | BR112016014476B1 (zh) |
CA (2) | CA3162763A1 (zh) |
MX (1) | MX2016008172A (zh) |
MY (1) | MY188538A (zh) |
RU (2) | RU2667627C1 (zh) |
SG (1) | SG11201605015XA (zh) |
TW (1) | TWI644308B (zh) |
WO (1) | WO2015098564A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110312146A (zh) * | 2019-06-06 | 2019-10-08 | 百度在线网络技术(北京)有限公司 | 音频处理方法、装置、电子设备和存储介质 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
US9401152B2 (en) | 2012-05-18 | 2016-07-26 | Dolby Laboratories Licensing Corporation | System for maintaining reversible dynamic range control information associated with parametric audio coders |
KR102158002B1 (ko) | 2013-01-21 | 2020-09-21 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 프로그램 라우드니스 및 경계 메타데이터를 가진 오디오 인코더 및 디코더 |
KR102071860B1 (ko) | 2013-01-21 | 2020-01-31 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
CN116665683A (zh) | 2013-02-21 | 2023-08-29 | 杜比国际公司 | 用于参数化多声道编码的方法 |
CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
CN105190618B (zh) | 2013-04-05 | 2019-01-25 | 杜比实验室特许公司 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
WO2015038475A1 (en) | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
US9521501B2 (en) | 2013-09-12 | 2016-12-13 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
CA3162763A1 (en) * | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
CN105142067B (zh) | 2014-05-26 | 2020-01-07 | 杜比实验室特许公司 | 音频信号响度控制 |
EP4372746A2 (en) | 2014-10-10 | 2024-05-22 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
KR20190085889A (ko) | 2019-06-28 | 2019-07-19 | 신원제 | 태양광 패널 청소기 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1283007A (zh) * | 1999-06-17 | 2001-02-07 | 索尼公司 | 解码方法和设备以及程序装备介质 |
CN1458646A (zh) * | 2003-04-21 | 2003-11-26 | 北京阜国数字技术有限公司 | 一种滤波参数矢量量化和结合量化模型预测的音频编码方法 |
JP2007316254A (ja) * | 2006-05-24 | 2007-12-06 | Sony Corp | オーディオ信号補間方法及びオーディオ信号補間装置 |
US20100083344A1 (en) * | 2008-09-30 | 2010-04-01 | Dolby Laboratories Licensing Corporation | Transcoding of audio metadata |
JP2013015633A (ja) * | 2011-07-01 | 2013-01-24 | Yamaha Corp | 信号送信装置および信号処理装置 |
Family Cites Families (227)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4628529A (en) | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US4817151A (en) * | 1987-11-09 | 1989-03-28 | Broadcast Technology Partners | Selective decoder for compatible FM stereophonic system utilizing companding of difference signal |
JPH0364800A (ja) | 1989-08-03 | 1991-03-20 | Ricoh Co Ltd | 音声符号化及び復号化方式 |
JPH03254223A (ja) | 1990-03-02 | 1991-11-13 | Eastman Kodak Japan Kk | アナログデータ伝送方式 |
JP3137805B2 (ja) * | 1993-05-21 | 2001-02-26 | 三菱電機株式会社 | 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法 |
US6022222A (en) * | 1994-01-03 | 2000-02-08 | Mary Beth Guinan | Icon language teaching system |
JP2655485B2 (ja) * | 1994-06-24 | 1997-09-17 | 日本電気株式会社 | 音声セル符号化装置 |
JP3498375B2 (ja) | 1994-07-20 | 2004-02-16 | ソニー株式会社 | ディジタル・オーディオ信号記録装置 |
JP3189598B2 (ja) | 1994-10-28 | 2001-07-16 | 松下電器産業株式会社 | 信号合成方法および信号合成装置 |
US5640490A (en) * | 1994-11-14 | 1997-06-17 | Fonix Corporation | User independent, real-time speech recognition system and method |
US5664055A (en) | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5749064A (en) * | 1996-03-01 | 1998-05-05 | Texas Instruments Incorporated | Method and system for time scale modification utilizing feature vectors about zero crossing points |
JPH1020888A (ja) | 1996-07-02 | 1998-01-23 | Matsushita Electric Ind Co Ltd | 音声符号化・復号化装置 |
US6073100A (en) | 1997-03-31 | 2000-06-06 | Goodridge, Jr.; Alan G | Method and apparatus for synthesizing signals using transform-domain match-output extension |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
CN1144179C (zh) | 1997-07-11 | 2004-03-31 | 索尼株式会社 | 声音信号解码方法和装置、声音信号编码方法和装置 |
US5913194A (en) * | 1997-07-14 | 1999-06-15 | Motorola, Inc. | Method, device and system for using statistical information to reduce computation and memory requirements of a neural network based speech synthesis system |
JPH11168622A (ja) | 1997-12-05 | 1999-06-22 | Canon Inc | 画像処理装置、画像処理方法および記憶媒体 |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
DE60024963T2 (de) | 1999-05-14 | 2006-09-28 | Matsushita Electric Industrial Co., Ltd., Kadoma | Verfahren und vorrichtung zur banderweiterung eines audiosignals |
US6904405B2 (en) * | 1999-07-17 | 2005-06-07 | Edwin A. Suominen | Message recognition using shared language model |
JP3454206B2 (ja) | 1999-11-10 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
EP1258078B1 (en) * | 2000-02-24 | 2004-03-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | System for estimating a non-linear characteristic of an amplifier |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
SE0101175D0 (sv) | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
JP4231987B2 (ja) | 2001-06-15 | 2009-03-04 | 日本電気株式会社 | 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体 |
CN1235192C (zh) | 2001-06-28 | 2006-01-04 | 皇家菲利浦电子有限公司 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
CN1272911C (zh) | 2001-07-13 | 2006-08-30 | 松下电器产业株式会社 | 音频信号解码装置及音频信号编码装置 |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
JP3926726B2 (ja) | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
CN100395817C (zh) | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
US7469206B2 (en) | 2001-11-29 | 2008-12-23 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
US7013011B1 (en) * | 2001-12-28 | 2006-03-14 | Plantronics, Inc. | Audio limiting circuit |
CN1288625C (zh) | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
JP3815347B2 (ja) | 2002-02-27 | 2006-08-30 | ヤマハ株式会社 | 歌唱合成方法と装置及び記録媒体 |
JP2003255973A (ja) | 2002-02-28 | 2003-09-10 | Nec Corp | 音声帯域拡張システムおよび方法 |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP2003316394A (ja) | 2002-04-23 | 2003-11-07 | Nec Corp | 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
CN1328707C (zh) | 2002-07-19 | 2007-07-25 | 日本电气株式会社 | 音频解码设备以及解码方法 |
JP4728568B2 (ja) | 2002-09-04 | 2011-07-20 | マイクロソフト コーポレーション | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 |
JP3881943B2 (ja) | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
EP1543307B1 (en) | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
US7330812B2 (en) | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
KR20050106393A (ko) * | 2002-12-27 | 2005-11-09 | 닐슨 미디어 리서치 인코퍼레이티드 | 메타데이터를 트랜스코딩하는 방법 및 장치 |
CN1748443B (zh) | 2003-03-04 | 2010-09-22 | 诺基亚有限公司 | 多声道音频扩展支持 |
US7020448B2 (en) * | 2003-03-07 | 2006-03-28 | Conwise Technology Corporation Ltd. | Method for detecting a tone signal through digital signal processing |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US7277537B2 (en) * | 2003-09-02 | 2007-10-02 | Texas Instruments Incorporated | Tone, modulated tone, and saturated tone detection in a voice activity detection device |
KR20050027179A (ko) | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
US7844451B2 (en) | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
EP2221808B1 (en) | 2003-10-23 | 2012-07-11 | Panasonic Corporation | Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof |
KR100587953B1 (ko) | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
US7148415B2 (en) * | 2004-03-19 | 2006-12-12 | Apple Computer, Inc. | Method and apparatus for evaluating and correcting rhythm in audio data |
WO2005109403A1 (en) * | 2004-04-21 | 2005-11-17 | Dolby Laboratories Licensing Corporation | Audio bitstream format in which the bitstream syntax is described by an ordered transveral of a tree hierarchy data structure |
WO2005111568A1 (ja) | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
CN102280109B (zh) | 2004-05-19 | 2016-04-27 | 松下电器(美国)知识产权公司 | 编码装置、解码装置及它们的方法 |
EP1749296B1 (en) | 2004-05-28 | 2010-07-14 | Nokia Corporation | Multichannel audio extension |
KR100608062B1 (ko) | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
TWI294119B (en) * | 2004-08-18 | 2008-03-01 | Sunplus Technology Co Ltd | Dvd player with sound learning function |
US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US20060106620A1 (en) | 2004-10-28 | 2006-05-18 | Thompson Jeffrey K | Audio spatial environment down-mixer |
WO2006048814A1 (en) | 2004-11-02 | 2006-05-11 | Koninklijke Philips Electronics N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
SE0402651D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
JP4977472B2 (ja) | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | スケーラブル復号化装置 |
EP1798724B1 (en) | 2004-11-05 | 2014-06-18 | Panasonic Corporation | Encoder, decoder, encoding method, and decoding method |
US7873515B2 (en) * | 2004-11-23 | 2011-01-18 | Stmicroelectronics Asia Pacific Pte. Ltd. | System and method for error reconstruction of streaming audio information |
KR100657916B1 (ko) | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US7616710B2 (en) * | 2004-12-08 | 2009-11-10 | Electronics And Telecommunications Research Institute | Frequency offset estimating method and receiver employing the same |
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
US8082156B2 (en) | 2005-01-11 | 2011-12-20 | Nec Corporation | Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal |
KR100708121B1 (ko) | 2005-01-22 | 2007-04-16 | 삼성전자주식회사 | 음성 신호의 대역 확장 방법 및 장치 |
EP1864281A1 (en) | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
ATE421845T1 (de) | 2005-04-15 | 2009-02-15 | Dolby Sweden Ab | Zeitliche hüllkurvenformgebung von entkorrelierten signalen |
US20070005351A1 (en) | 2005-06-30 | 2007-01-04 | Sathyendra Harsha M | Method and system for bandwidth expansion for voice communications |
JP4899359B2 (ja) | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR100813259B1 (ko) | 2005-07-13 | 2008-03-13 | 삼성전자주식회사 | 입력신호의 계층적 부호화/복호화 장치 및 방법 |
US8019614B2 (en) | 2005-09-02 | 2011-09-13 | Panasonic Corporation | Energy shaping apparatus and energy shaping method |
US7653146B2 (en) * | 2005-09-06 | 2010-01-26 | Liquid Xstream Systems Inc. | System and method for delivery of video, content on demand and IP packets |
RU2378790C1 (ru) * | 2005-09-27 | 2010-01-10 | Квэлкомм Инкорпорейтед | Методики масштабируемости на основе информации содержимого |
US8396717B2 (en) | 2005-09-30 | 2013-03-12 | Panasonic Corporation | Speech encoding apparatus and speech encoding method |
CN102623014A (zh) | 2005-10-14 | 2012-08-01 | 松下电器产业株式会社 | 变换编码装置和变换编码方法 |
EP1943643B1 (en) | 2005-11-04 | 2019-10-09 | Nokia Technologies Oy | Audio compression |
US8103516B2 (en) | 2005-11-30 | 2012-01-24 | Panasonic Corporation | Subband coding apparatus and method of coding subband |
JP4876574B2 (ja) | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
JP4863713B2 (ja) | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
EP1977312A2 (en) * | 2006-01-16 | 2008-10-08 | Zlango Ltd. | Iconic communication |
US7953604B2 (en) | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7590523B2 (en) | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
WO2007114291A1 (ja) | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号化装置、およびこれらの方法 |
CN101421781A (zh) * | 2006-04-04 | 2009-04-29 | 杜比实验室特许公司 | 音频信号的感知响度和/或感知频谱平衡的计算和调整 |
WO2007126015A1 (ja) | 2006-04-27 | 2007-11-08 | Panasonic Corporation | 音声符号化装置、音声復号化装置、およびこれらの方法 |
EP2200026B1 (en) | 2006-05-10 | 2011-10-12 | Panasonic Corporation | Encoding apparatus and encoding method |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
JP2007333785A (ja) | 2006-06-12 | 2007-12-27 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
KR101244310B1 (ko) | 2006-06-21 | 2013-03-18 | 삼성전자주식회사 | 광대역 부호화 및 복호화 방법 및 장치 |
US8010352B2 (en) | 2006-06-21 | 2011-08-30 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
JP5061111B2 (ja) | 2006-09-15 | 2012-10-31 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
JP4918841B2 (ja) | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
US8295507B2 (en) | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
JP5141180B2 (ja) | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
JP4930320B2 (ja) | 2006-11-30 | 2012-05-16 | ソニー株式会社 | 再生方法及び装置、プログラム並びに記録媒体 |
EP2101322B1 (en) | 2006-12-15 | 2018-02-21 | III Holdings 12, LLC | Encoding device, decoding device, and method thereof |
RU2394283C1 (ru) * | 2007-02-14 | 2010-07-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов |
JP4984983B2 (ja) | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
JP2008261978A (ja) | 2007-04-11 | 2008-10-30 | Toshiba Microelectronics Corp | 再生音量自動調整方法 |
US8015368B2 (en) | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
US8788264B2 (en) | 2007-06-27 | 2014-07-22 | Nec Corporation | Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system |
JP5071479B2 (ja) | 2007-07-04 | 2012-11-14 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
JP5045295B2 (ja) | 2007-07-30 | 2012-10-10 | ソニー株式会社 | 信号処理装置及び方法、並びにプログラム |
US8041577B2 (en) | 2007-08-13 | 2011-10-18 | Mitsubishi Electric Research Laboratories, Inc. | Method for expanding audio signal bandwidth |
US20090154726A1 (en) * | 2007-08-22 | 2009-06-18 | Step Labs Inc. | System and Method for Noise Activity Detection |
HUE041323T2 (hu) | 2007-08-27 | 2019-05-28 | Ericsson Telefon Ab L M | Eljárás és eszköz hangjel észlelési spektrális dekódolására, beleértve a spektrális lyukak kitöltését |
MX2010001394A (es) | 2007-08-27 | 2010-03-10 | Ericsson Telefon Ab L M | Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda. |
CN101790756B (zh) | 2007-08-27 | 2012-09-05 | 爱立信电话股份有限公司 | 瞬态检测器以及用于支持音频信号的编码的方法 |
US8554349B2 (en) | 2007-10-23 | 2013-10-08 | Clarion Co., Ltd. | High-frequency interpolation device and high-frequency interpolation method |
JP4733727B2 (ja) | 2007-10-30 | 2011-07-27 | 日本電信電話株式会社 | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
JP5404412B2 (ja) | 2007-11-01 | 2014-01-29 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
US20090132238A1 (en) | 2007-11-02 | 2009-05-21 | Sudhakar B | Efficient method for reusing scale factors to improve the efficiency of an audio encoder |
KR101290622B1 (ko) | 2007-11-02 | 2013-07-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 복호화 방법 및 장치 |
CN101896968A (zh) | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 音频编码装置及其方法 |
JP2009116275A (ja) | 2007-11-09 | 2009-05-28 | Toshiba Corp | 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置 |
US8504377B2 (en) | 2007-11-21 | 2013-08-06 | Lg Electronics Inc. | Method and an apparatus for processing a signal using length-adjusted window |
US8688441B2 (en) | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
WO2009081568A1 (ja) | 2007-12-21 | 2009-07-02 | Panasonic Corporation | 符号化装置、復号装置および符号化方法 |
WO2009084221A1 (ja) | 2007-12-27 | 2009-07-09 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
EP2077551B1 (en) | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
JP5448850B2 (ja) | 2008-01-25 | 2014-03-19 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
KR101413968B1 (ko) | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US8433582B2 (en) | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
WO2009110738A2 (ko) | 2008-03-03 | 2009-09-11 | 엘지전자(주) | 오디오 신호 처리 방법 및 장치 |
KR101449434B1 (ko) | 2008-03-04 | 2014-10-13 | 삼성전자주식회사 | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 |
ES2796493T3 (es) | 2008-03-20 | 2020-11-27 | Fraunhofer Ges Forschung | Aparato y método para convertir una señal de audio en una representación parametrizada, aparato y método para modificar una representación parametrizada, aparato y método para sintetizar una representación parametrizada de una señal de audio |
US8085941B2 (en) * | 2008-05-02 | 2011-12-27 | Dolby Laboratories Licensing Corporation | System and method for dynamic sound delivery |
KR20090122142A (ko) | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP2294770B1 (en) | 2008-06-20 | 2013-08-07 | Rambus, Inc. | Frequency responsive bus coding |
US8532932B2 (en) * | 2008-06-30 | 2013-09-10 | Nellcor Puritan Bennett Ireland | Consistent signal selection by signal segment selection techniques |
EP3246918B1 (en) | 2008-07-11 | 2023-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method for decoding an audio signal and computer program |
ES2796552T3 (es) | 2008-07-11 | 2020-11-27 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio |
JP5203077B2 (ja) | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
BRPI0917953B1 (pt) | 2008-08-08 | 2020-03-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparelho de atenuação de espectro, aparelho de codificação, aparelho terminal de comunicação, aparelho de estação base e método de atenuação de espectro. |
JP2010079275A (ja) | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
WO2010028299A1 (en) | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
WO2010028292A1 (en) | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
GB2466201B (en) | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
PL4224475T3 (pl) * | 2008-12-15 | 2024-03-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
CN101770776B (zh) | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
BR122019023704B1 (pt) | 2009-01-16 | 2020-05-05 | Dolby Int Ab | sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US8463599B2 (en) | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2402940B9 (en) | 2009-02-26 | 2019-10-30 | Panasonic Intellectual Property Corporation of America | Encoder, decoder, and method therefor |
JP5564803B2 (ja) | 2009-03-06 | 2014-08-06 | ソニー株式会社 | 音響機器及び音響処理方法 |
CN101853663B (zh) | 2009-03-30 | 2012-05-23 | 华为技术有限公司 | 比特分配方法、编码装置及解码装置 |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
CO6440537A2 (es) | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
US8392200B2 (en) | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
US8971551B2 (en) | 2009-09-18 | 2015-03-03 | Dolby International Ab | Virtual bass synthesis using harmonic transposition |
TWI643187B (zh) | 2009-05-27 | 2018-12-01 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
JP5223786B2 (ja) | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
US8515768B2 (en) | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
JP5928539B2 (ja) | 2009-10-07 | 2016-06-01 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8600749B2 (en) | 2009-12-08 | 2013-12-03 | At&T Intellectual Property I, L.P. | System and method for training adaptation-specific acoustic models for automatic speech recognition |
US8447617B2 (en) | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
EP2357649B1 (en) | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
ES2935637T3 (es) | 2010-03-09 | 2023-03-08 | Fraunhofer Ges Forschung | Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada |
JP5375683B2 (ja) | 2010-03-10 | 2013-12-25 | 富士通株式会社 | 通信装置および電力補正方法 |
JP2011203483A (ja) | 2010-03-25 | 2011-10-13 | Yamaha Corp | 音声処理装置 |
WO2011121782A1 (ja) | 2010-03-31 | 2011-10-06 | 富士通株式会社 | 帯域拡張装置および帯域拡張方法 |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN103069484B (zh) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
US8560330B2 (en) | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
BR112012024360B1 (pt) | 2010-07-19 | 2020-11-03 | Dolby International Ab | sistema configurado para gerar uma pluralidade de sinais de áudio de sub-banda de alta frequência, decodificador de áudio, codificador, método para gerar uma pluralidade de sinais de sub-banda de alta frequência, método para decodificar um fluxo de bits, método para gerar dados de controle a partir de um sinal de áudio e meio de armazenamento |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP2012058358A (ja) | 2010-09-07 | 2012-03-22 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
US8407020B1 (en) * | 2010-09-28 | 2013-03-26 | The United States Of America As Represented By The Secretary Of The Navy | Fast method to search for linear frequency-modulated signals |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US9230551B2 (en) | 2010-10-18 | 2016-01-05 | Nokia Technologies Oy | Audio encoder or decoder apparatus |
US8521541B2 (en) * | 2010-11-02 | 2013-08-27 | Google Inc. | Adaptive audio transcoding |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9171549B2 (en) * | 2011-04-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
EP2702585B1 (en) | 2011-04-28 | 2014-12-31 | Telefonaktiebolaget LM Ericsson (PUBL) | Frame based audio signal classification |
JP6037156B2 (ja) | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5975243B2 (ja) | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
WO2013045693A2 (en) | 2011-09-29 | 2013-04-04 | Dolby International Ab | High quality detection in fm stereo radio signals |
US9354968B2 (en) * | 2011-09-30 | 2016-05-31 | Johnson Controls Technology Company | Systems and methods for data quality control and cleansing |
JP2013102411A (ja) * | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
US9583108B2 (en) * | 2011-12-08 | 2017-02-28 | Forrest S. Baker III Trust | Voice detection for automated communication system |
JP5810946B2 (ja) * | 2012-01-31 | 2015-11-11 | 富士通株式会社 | 特定通話検出装置、特定通話検出方法及び特定通話検出用コンピュータプログラム |
US9576593B2 (en) * | 2012-03-15 | 2017-02-21 | Regents Of The University Of Minnesota | Automated verbal fluency assessment |
CN104205210A (zh) | 2012-04-13 | 2014-12-10 | 索尼公司 | 解码设备和方法、音频信号处理设备和方法以及程序 |
JP5997592B2 (ja) | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
CA2843226A1 (en) | 2012-07-02 | 2014-01-09 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
AU2013284703B2 (en) | 2012-07-02 | 2019-01-17 | Sony Corporation | Decoding device and method, encoding device and method, and program |
KR20150032651A (ko) | 2012-07-02 | 2015-03-27 | 소니 주식회사 | 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램 |
US9991861B2 (en) * | 2012-08-10 | 2018-06-05 | Bellevue Investments Gmbh & Co. Kgaa | System and method for controlled dynamics adaptation for musical content |
JP2014123011A (ja) | 2012-12-21 | 2014-07-03 | Sony Corp | 雑音検出装置および方法、並びに、プログラム |
KR102071860B1 (ko) * | 2013-01-21 | 2020-01-31 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CA3162763A1 (en) | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
PL3123469T3 (pl) | 2014-03-25 | 2018-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie kodera audio i urządzenie dekodera audio z wydajnym kodowaniem wzmocnienia w sterowaniu zakresem dynamiki |
-
2014
- 2014-12-12 CA CA3162763A patent/CA3162763A1/en active Pending
- 2014-12-12 MY MYPI2016702261A patent/MY188538A/en unknown
- 2014-12-12 US US15/106,498 patent/US10692511B2/en active Active
- 2014-12-12 AU AU2014371411A patent/AU2014371411A1/en not_active Abandoned
- 2014-12-12 KR KR1020167015462A patent/KR102356012B1/ko active IP Right Grant
- 2014-12-12 CN CN201480069805.XA patent/CN105849801B/zh active Active
- 2014-12-12 BR BR112016014476-7A patent/BR112016014476B1/pt active IP Right Grant
- 2014-12-12 KR KR1020237009428A patent/KR20230042410A/ko not_active Application Discontinuation
- 2014-12-12 KR KR1020227002138A patent/KR102513009B1/ko active IP Right Grant
- 2014-12-12 JP JP2015554741A patent/JP6593173B2/ja active Active
- 2014-12-12 MX MX2016008172A patent/MX2016008172A/es active IP Right Grant
- 2014-12-12 WO PCT/JP2014/082925 patent/WO2015098564A1/ja active Application Filing
- 2014-12-12 EP EP19199358.3A patent/EP3608909B1/en active Active
- 2014-12-12 SG SG11201605015XA patent/SG11201605015XA/en unknown
- 2014-12-12 RU RU2016124464A patent/RU2667627C1/ru active
- 2014-12-12 RU RU2018132534A patent/RU2764260C2/ru active
- 2014-12-12 EP EP14873206.8A patent/EP3089161B1/en active Active
- 2014-12-12 CA CA2934602A patent/CA2934602C/en active Active
- 2014-12-15 TW TW103143688A patent/TWI644308B/zh active
-
2019
- 2019-09-25 JP JP2019174075A patent/JP6753499B2/ja active Active
-
2020
- 2020-05-06 US US16/867,730 patent/US11705140B2/en active Active
- 2020-08-06 JP JP2020133606A patent/JP6927385B2/ja active Active
-
2021
- 2021-08-05 JP JP2021128702A patent/JP7215534B2/ja active Active
-
2023
- 2023-03-31 US US18/129,380 patent/US20230245665A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1283007A (zh) * | 1999-06-17 | 2001-02-07 | 索尼公司 | 解码方法和设备以及程序装备介质 |
CN1458646A (zh) * | 2003-04-21 | 2003-11-26 | 北京阜国数字技术有限公司 | 一种滤波参数矢量量化和结合量化模型预测的音频编码方法 |
JP2007316254A (ja) * | 2006-05-24 | 2007-12-06 | Sony Corp | オーディオ信号補間方法及びオーディオ信号補間装置 |
US20100083344A1 (en) * | 2008-09-30 | 2010-04-01 | Dolby Laboratories Licensing Corporation | Transcoding of audio metadata |
JP2013015633A (ja) * | 2011-07-01 | 2013-01-24 | Yamaha Corp | 信号送信装置および信号処理装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110312146A (zh) * | 2019-06-06 | 2019-10-08 | 百度在线网络技术(北京)有限公司 | 音频处理方法、装置、电子设备和存储介质 |
US11137974B2 (en) | 2019-06-06 | 2021-10-05 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for audio processing, electronic device and storage medium |
CN110312146B (zh) * | 2019-06-06 | 2021-11-09 | 百度在线网络技术(北京)有限公司 | 音频处理方法、装置、电子设备和存储介质 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105849801A (zh) | 解码设备和方法以及程序 | |
JP6531649B2 (ja) | 符号化装置および方法、復号化装置および方法、並びにプログラム | |
JP6259930B2 (ja) | ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 | |
KR101751228B1 (ko) | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 | |
KR101760248B1 (ko) | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 | |
RU2649944C2 (ru) | Устройство декодирования, способ декодирования, устройство кодирования, способ кодирования и программа | |
JPWO2005081229A1 (ja) | オーディオエンコーダ及びオーディオデコーダ | |
KR20170078648A (ko) | 멀티채널 오디오 신호의 파라메트릭 인코딩 및 디코딩 | |
EP1021044A1 (en) | Method and apparatus for encoding or decoding audio or video frame data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |