CN102985970B - 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准 - Google Patents
在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准 Download PDFInfo
- Publication number
- CN102985970B CN102985970B CN201180023451.1A CN201180023451A CN102985970B CN 102985970 B CN102985970 B CN 102985970B CN 201180023451 A CN201180023451 A CN 201180023451A CN 102985970 B CN102985970 B CN 102985970B
- Authority
- CN
- China
- Prior art keywords
- signal
- patch
- phase
- phase angle
- piece
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 32
- 230000004044 response Effects 0.000 title description 11
- 230000002123 temporal effect Effects 0.000 title 1
- 238000004458 analytical method Methods 0.000 claims abstract description 44
- 238000012937 correction Methods 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims description 46
- 230000009466 transformation Effects 0.000 claims description 34
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000003786 synthesis reaction Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 claims description 5
- 238000013461 design Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 2
- 230000001915 proofreading effect Effects 0.000 claims 1
- 230000001419 dependent effect Effects 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 27
- 230000006870 function Effects 0.000 description 15
- 238000007792 addition Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 9
- 230000005484 gravity Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000017105 transposition Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- VEMKTZHHVJILDY-UHFFFAOYSA-N resmethrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UHFFFAOYSA-N 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
一种用以由输入信号产生带宽扩展音频信号的装置,包括用以由该输入信号产生一个或多个补丁的补丁产生器,其中,该补丁产生器被配置用来对来自分析滤波器组的子带信号执行时间延伸(1800,1808),及其中该补丁产生器进一步包括用以使用取决于滤波器组-通道的相角校正来调整子带信号的相角的相角调整器(1806)。
Description
技术领域
背景技术
利用相角声码器[1-3]或其它用于时间或音高修改演绎法则的技术,例如同步化重迭加法(SOLA),音频信号例如可就回放速率做修改,其中保留原先音高。此外,这些方法可用来进行信号变换,同时维持原始回放持续时间。后者可通过下述方式实现:使用整数因子延伸该音频信号,随后,施加相同因子调整经延伸的信号的回放速率。对于时间离散信号,假设取样率维持不变,则后者对应于时间延伸音频信号有关该延伸因子的向下取样。
基于例如[4-5]的带宽扩展方法的相角声码器取决于所需要的总带宽,而产生可变数目的频带受限制的子带(补丁),其加总形成具有所需总带宽的和(sum)信号。
由相角声码器应用所得的单一补丁的时间对准变成特殊挑战。一般而言,这些补丁具有不同持续时间的时间延迟。原因在于相角声码器的窗设置在取决于延伸因素的固定中继段(hop)大小,因此每一个体补丁具有预定的持续时间的延迟。这导致带宽扩展的和信号的频率选择性时间延迟。由于这种频率选择性延迟影响总体信号的垂直相干性性质,其对带宽扩展方法的瞬时响应产生负面影响。
考虑个体补丁,出现另一项挑战,缺乏交叉频率相干性对相角声码器的幅值响应造成负面影响。
发明内容
本发明的目的是提出一种用于产生带宽扩展的音频信号,其提供改进的音频质量的构想。
为了实现该目的,本申请提供了一种用于由输入信号产生带宽扩展的音频信号的装置,包括:补丁产生器,用于由所述输入信号产生一个或多个补丁信号,其中补丁信号具有与不同补丁的补丁中心频率不同的或与输入音频信号的中心频率不同的补丁中心频率,其中,所述补丁产生器被配置用于对来自分析滤波器组的子带信号执行时间延伸,以及其中,所述补丁产生器包括用于使用取决于滤波器组-通道的相角校正调整所述子带信号的相角的相角调整器。
为了实现该目的,本申请还的提供了一种用于由输入信号产生带宽扩展的音频信号的方法,所述方法包括下列步骤:由所述输入信号产生一个或多个补丁信号,其中,所述补丁信号具有与不同补丁的补丁中心频率或输入音频信号的中心频率不同的补丁中心频率,其中,对来自分析滤波器组的子带信号执行时间延伸,以及其中,使用取决于滤波器组-通道的相角校正调整所述子带信号的相角。
一种用于由输入信号产生带宽扩展的音频信号的装置包括用于由该输入信号产生一个或多个补丁信号的补丁产生器。该补丁产生器被配置用以对来自分析滤波器组的子带信号执行时间延伸,且还包括用以使用取决于滤波器组-通道的相角校正调整子带信号的相角的相角调整器。
本发明的又一优点为避免由用于带宽扩展的相角声码器类似结构或用于带宽扩展的其它结构通道对幅值响应所导入的负面冲击。
本发明的又一优点为获得例如利用相角声码器或相角声码器类似结构而形成个体补丁的最佳化幅值响应。在又一实施例中,也可解决个体(individual)补丁的时间对准的问题,但可施加在补丁内的相角校正,亦即在使用一个且同一变换(transposition)因子处理的子带信号中的相角校正,有或无对补丁整体内的全部子带信号有价值的时间校正。
本发明的实施例为一种利用相角声码器所形成的单一补丁的幅度响应及时间对准最佳化的新颖方法。这种方法基本上包括在复杂调制滤波器组实现中对变换子带的相角校正的选择,及包括因具有不同变换因子的相角声码器所导致的将额外时间延迟导入单一补丁。导引至特定补丁的额外延迟的持续时间取决于所施加的变换因子且可经理论上测定。可选地,延迟经调整使得施加狄拉克(Dirac)脉冲输入信号,在频谱图表示型态,每个补丁的经变换的狄拉克脉冲的时间重心对准同一个时间位置。
许多方法通过单一变换因子进行音频信号的变换,诸如相角声码器。若须组合若干经变换信号,则可校正不同输出信号间的时间延迟。各补丁间的正确垂直对准为这些演绎法则的有用的但非必要部分。只要不考虑瞬时(transients)则如此无害。本领域现况参考文献尚未能解决不同补丁的正确对准问题。
利用相角声码器的频谱变换并未保证保护(preserve)瞬时的垂直相干性。此外,在高频率频带出现后回声,原因在于在相角声码器所利用的重迭加法以及促成和(sum)信号的单一补丁的不同时间延迟。因此期望对准各补丁,使得带宽扩展参数后处理可探勘各补丁间的更佳垂直对准。藉此使得涵盖回声前至回声后的整个时间跨幅变成最小化。
相角声码器通过在复杂调制滤波器组的分析/合成对域内子带样本的乘法整数相角调制而典型地实现。此程序并未自动保证来自各合成子带的所得输出贡献的相角的适当对准,如此导致相角声码器的非平坦幅值响应。此缺陷导致变换慢正弦扫掠的时间变化幅值。就一般音频的音频质量而言,缺点为输出信号被调制效应着色。
附图说明
后文将就附图讨论本发明的优选实施例,附图中:
图1示出低通滤波狄拉克脉冲的频谱图;
图2示出以变换因子2、3及4的业界现况狄拉克脉冲变换的频谱图;
图3示出以变换因子2、3及4作狄拉克脉冲的时间对准变换的频谱图;
图4示出以变换因子2、3及4作狄拉克脉冲的时间对准变换及延迟调整的频谱图;
图5示出具有不良调整相角(phase)的慢正弦扫掠的时间图;
图6示出具有较佳相角校正的慢正弦扫掠的变换;
图7示出具有更进一步改良相角校正的慢正弦扫掠的变换;
图8示出根据实施例的一种带宽扩展系统;
图9示出用以处理单一子带信号的处理实现的另一实施例;
图10示出说明一实施例,此处显示非线性子带处理及在一子带域内部的随后波封调整;
图11a及11b示出说明第10图的非线性子带处理的又一实施例;
图12示出用以选择子带通道相依性相角校正的不同实施例;
图13示出相角调整器的实施例;
图14a示出说明一分析滤波器组允许非取决于变换因子的相角校正的实现细节;以及
图14b示出说明一分析滤波器组要求取决于变换因子的相角校正实现细节。
具体实施方式
本案提出在带宽扩展的情况下及在与带宽扩展不相关的其它音频应用的情况下用以处理音频信号的装置、方法或计算机程序的不同方面。下文描述的及所要求的个体方面的特征可部分组合或完整组合,但也可彼此分开使用,原因在于个体方面当在计算机系统或微处理器实现时已经提供了有关知觉质量、运算复杂度及处理器/内存资源等的优点。
实施例采用由相角声码器所形成的不同谐波补丁的时间对准。该时间对准基于变换(transpose)狄拉克脉冲的重心进行。随后图1示出低通滤波狄拉克脉冲的频谱图因而具有有限带宽。此信号用作用于该变换的输入信号。
通过借助于相角声码器变换此狄拉克脉冲,将频率选择性延迟导入所得子带。这些的持续时间取决于所利用的变换因子(transposition factor)。随后,具有变换因子2、3及4的狄拉克脉冲的变换示例性地示出于图2。
频率选择性延迟通过将额外的个体时间延迟插入各个所得补丁而予补偿。通过方式,对准每个单一子带使得在每个补丁的狄拉克脉冲重心系位于与最高补丁中的狄拉克脉冲重心的相同位置。对准基于最高补丁进行,原因在于其通常具有最高时间延迟。应用本发明的延迟补偿,对频谱图内部的全部补丁而言,狄拉克脉冲重心位于相同时间位置。此种结果所得信号的表示型态如图3所示。如此导致整个瞬时能扩展的最小化。
最终,需要额外补偿变换高频区与原先输入信号间的其余时间延迟。为了达成此项目的,输入信号也可延迟,使得事先已经对准某个时间位置的经变换的狄拉克脉冲重心(center of gravity)与频带受限制的狄拉克脉冲的时间位置匹配。随后,所得信号的频谱图示出于图4。
对所述方法的应用,相角声码器用作为带宽扩展方法的基本组件在时域实现还是在滤波器组表示型态(例如,在pQMF滤波器组)内部实现无关紧要。
使用SOLA技术,瞬时主观音频质量因重迭加法而受回声效应损害,而在瞬时满足垂直相干性标准。可能地,单一补丁重心位置略为偏离最高补丁的实际重心在屏蔽前或屏蔽后的范围内。
以幅值响应表示的经不良调整的相角声码器结果在图5通过输出信号而例示说明,其是对应于恒定幅值的正弦扫掠输入。如图可知,在该输出中有强力幅值变化甚至抵消。来自经略佳调整的相角声码器的输出信号在图6中绘出。
以复合调制滤波器组为基础的相角声码器内操作为子带样本的乘法相角修改。输入时域正弦曲线导致下述形式的复合值子带信号的极佳预测
此处ω为正弦曲线的频率,n为子带指数,k为子带时隙指数,qA为分析滤波器组的时间跨幅,C为复合常数,为滤波器组原型滤波器的频率响应,及θn为所关注的相角项特征,以要求变实数值定义。对典型正交镜像滤波器组(QMF)滤波器组设计,其可推定为正值。当相角修改时,典型结果则具有下述形式
此处T为变换次幂,及qS为分析滤波器组的时间跨幅。因合成滤波器组典型地被选择为分析滤波器组的镜像,适当正弦曲线合成要求此种最末表示型态对应正弦曲线的分析子带。未能符合此种情况将导致如图5所示的幅值调制。
本发明的一实施例基于下式而使用加法后修改相角校正
△θn=(1-T)θn
此将未经修改的子带信号映射至具有期望的交叉子带相角演进。
对异常堆栈复合调制QMF滤波器组的特定实例,具有
及本发明的相角校正基于下式而给定
根据此规则的相角经调整的相角声码器的输出信号在图7中绘出。
若分析/合成滤波器组对具有更多的相角转动(phase twiddle)的非对称性分布,则将存在有相角校正Ψn,其当加至分析子带时,及在合成前加上负号,则将情况带回前述对称性情况。该种情况下,前述本发明的相角校正须基于下式而调整
△θn=(1-T)(θn-ψn)
其实例基于下式,以用在统一语音及音频编码(USAC)的即将到临的MPEG标准的64频带QMF滤波器组对而给定
其中,C为实数及可具有2至3.5的值。特定值为321/128或385/128。
如此对该滤波器组对,可使用
此外,在上述情况的特定实现中,观察到与变换次幂T独立无关的相角校正可结合入分析滤波器组阶级(step)本身。由于在声码器相角乘法之前的校正对应于相角乘法后的相同校正的T倍,故出现下列分解为优异,
然后,分析滤波器组调制经修改,与标准化QMF滤波器组对相比加相角本发明的相角校正变成等于单独第二项,
获得相角校正的优点:贡献于输出信号的各声码器次幂的平坦幅值响应。
本发明的处理适用于全部音频应用,通过分别以递增的速率施加相角声码器的时间延伸与向下取样或回放而扩展音频信号的带宽。
图8示出根据本发明一个方面的带宽扩展系统。该带宽扩展系统包括产生核心译码信号的核心译码器80。该核心译码器80连接至补丁产生器82,容后详述。补丁产生器82包括图8的全部特征结构,但核心译码器80、低带连接83和低次校正器84以及合并器85除外。具体地,补丁产生器被配置用于由该输入音频信号86产生一个或多个补丁信号,其中补丁信号具有补丁中心频率,其与不同补丁的补丁中心频率不同,或与输入音频信号的中心频率不同。具体地,补丁产生器包括第一补丁器87a、第二补丁器87b及第三补丁器87c,此处于图8的实施例中,个体补丁器87a、87b、87c包括向下取样器88a、88b、88c、正交镜像滤波器组(QMF)分析块89a、89b、89c、时间延伸块90a、90b、90c,以及补丁通道校正器块91a、91b、91c。来自块91a至91c及低频带校正器84的输出信号被输入合并器85,合并器85输出带宽扩展信号。此一信号可由额外的处理模块处理,诸如波封校正模块、调性校正模块、或从带宽扩展信号处理为已知的任何其它模块。
优选地,补丁校正的执行方式为补丁产生器82产生一个或多个补丁信号,使得输入音频信号与该一个或多个补丁信号间的时间未对准,或不同补丁信号间的时间未对准,当与未经校正的处理比较时,缩短或消除。在图8的实施例中,此种时间未对准的缩短或消除由补丁校正器91a至91c获得。另外或此外,补丁产生器82被配置为用于施行具有时间延伸功能的取决于滤波器组-通道的相角校正。此通过相角校正输入信号92a、92b、92c指示。
须注意图8的实施例表示诸如QMF分析块89a的各QMF分析块输出多个子带信号。须对各个个体子带信号执行时间延伸功能。例如当QMF分析89a输出32个子带信号时,则存在有32个时间延伸器90a。但对于此补丁器87a的全部个体地时间延伸信号,单个补丁校正器足够。容后详述,图9示出对于由诸如QMF分析组89a、89b、89c的QMF分析器输出的各个体子带信号欲在时间延伸器内实施的处理程序。
虽然对使用相同时间延伸量所处理的全部经时间延伸的信号结果,单次延迟足够,但须对各个子带信号施加个体相角校正,原因在于个体相角校正虽然与信号独立无关,但取决于子带滤波器组的通道号;或换言之,取决于子带信号的子带指数,此处子带指数表示与本描述上下文中的通道号相同。
图9示出用以处理单一子带信号的示例性处理实施的另一实施例。在由分析滤波器组(未显示于第9图)滤波之前或之后,该单个子带信号已经接受任一种降采样(decimation)。因此,该单一子带信号的时间长度比形成降采样前的时间长度更短。该单一子带信号被输入块抽取器1800,块抽取器1800可与块抽取器201相同,但也可以以不同方式实施。图9的块抽取器1800使用例如称作为e的样本/块先行值操作。该样本/块先行值为可变或可固定式地设定,在图9中以指向块抽取器框1800的箭头指示。在块抽取器1800的输出端,存在有多个抽取出的块。这些块高度重迭,原因在于样本/块先行值e显著小于块抽取器的块长度。一个实例为块抽取器抽取含12样本的块。第一块包含样本0至11,第二块包含样本1至12,第三块包含样本2至13,等等。此实施例中,样本/块先行值e等于1,及有11倍重迭。
个体块被输入开窗器1802,用以使用开窗功能来对各块开窗。此外,设有相角计算器1804,其计算各块的相角。相角计算器1804可在开窗前或在开窗后使用个体块。然后,求出相角调整值p x k及输入相角调整器1806。该相角调整器施加调整值至该块的各个样本。此外,因子k等于带宽扩展因子。例如,当欲获得因子2的带宽扩展时,对由块抽取器1800所抽取的块计算得的相角p乘以因子2,施加至相角调整器1806中各块样本的调整值为p乘以2。
在实施例中,单一子带信号为复合子带信号,块的相角可以多种不同方式计算。其中一种方式是在该块中央或环绕中央取样并计算此复合样本的相角。
虽然图9以相角调整器在开窗器之后操作而举例说明,但此二块也可交换,使得对由块抽取器进行抽取的块实施相角调整,随后执行开窗操作。因两项操作(即,开窗及相角调整)为实数值乘法或复数值乘法,此二操作可使用复合乘法因子而加总成为单一操作,该复合乘法因子本身为相角调整乘数与开窗因子的乘积。
相角经调整的块被输入重迭/加法及幅值校正块1808,此处已开窗且已经相角调整的块系重迭-相加。但要紧地,块1808的样本/块先行值与用在块抽取器1800的值不同。特别地,块1808的样本/块先行值大于用在块1800的值e,故获得由块1808输出信号的时间延伸。如此,由块1808所输出的处理后的子带信号的长度比输入块1800的子带信号长度长。当欲获得二者的带宽扩展时,使用样本/块先行值,该值为块1800中对应值的两倍。如此导致时间延伸达因子2。但当需要其它时间延伸因子时,可使用其它样本/块先行值,使得块1808的输出信号具有要求的时间长度。在实施例中,只有一个具指数m=0的样本将被修改而具有其相角的k(或T)倍。在实施例中,此点对整个块无效。对其它样本,修正可与图13在块143所示的不同。
为了解决重迭问题,优选地,实施幅值校正来解决在块1800及1808的不同重迭问题。但此幅值校正也可导入开窗器/相角调整器乘法因子,但幅值校正也可在重迭/处理之后实施。
前述实例中,具有12的块长度,块抽取器内的样本/块先行值为1,当施行带宽扩展达因子2时,重迭/加法块1808的样本/块先行值等于2。如此将导致5块重迭。当欲进行达因子3的带宽扩展时,块1808所使用的样本/块先行值等于3,而重迭下降至3的重迭。当欲施行4倍带宽扩展时,重迭/加法块1808将须使用4的样本/块先行值,其将导致大于2块的重迭。
此外,取决于滤波器组通道的相角校正被输入该相角调整器。优选地,执行单一相角校正操作,此处该相角校正值为由相角计算器所确定的取决于信号的调整相角值与不取决于信号(但取决于滤波器组通道号)的相角校正的组合。
虽然图8示出用于产生带宽扩展的音频信号的装置的带宽扩展实施例,该音频信号具有比较原先核心译码器信号更高的带宽,此处使用数个QMF分析滤波器组89a至89c,但就图10及图11来说,描述其中只有单一分析滤波器组的又一实施例。此外,图8摘述当合并器85包括合成滤波器组时,只要求用于核心译码器的该QMF分析滤波器组89d。但当与低带信号的合并在时域进行时,则无需项89d。
此外,合并器85可额外地包括波封调整器,或基本地包括高频重建组成器,高频重建组成器基于所发射的高频重建参数处理输入高频重建器的信号。这些重建参数可包含封包调整参数、噪声添加参数、反滤波参数、遗失谐波参数或其它参数。这些参数的用途、参数本身及其如何应用于执行波封调整,或通常带宽扩展信号的产生在ISO/IEC14496-3:2005(E)章节4.6.8叙述的专用频带复制(SBR)工具。
但另外,合并器85可包括合成滤波器组,及在合成滤波器组之后包括用来使用时域而非滤波器组域的HFR参数处理信号的HFR处理器,此处HFR处理器位于合成滤波器组之前。
此外,考虑图8时,在QMF分析后,也可应用降采样功能。同时,对各变换分支个体地例示说明的时间延伸功能92a至92c也可对全部三支分支在单一操作执行。
图10示出根据又一实施例的用以由低带输入信号100产生带宽扩展音频信号的装置。该装置包括分析滤波器组101、逐子带非线性子带处理器102a、102b、随后连接的波封调整器103,或一般而言,在高频重建参数作为例如在参数线104的输入信号操作的高频重建处理器。图10或图11的非线性子带处理器102a、102b类似于图8的块82的补丁产生器。波封调整器或一般而言高频重建处理器对各子带通道处理个体子带信号,及将对各子带通道经处理的子带信号输入合成滤波器组105。合成滤波器组105在其较低通道输入信号接收例如由图8示出的QMF分析滤波器组89d所产生的低带核心译码器信号的子带表示型态。根据实施而定,低带也可由图10的分析滤波器组101的输出信号而导出。变换子带信号被馈入合成滤波器组的较高滤波器组通道用以执行高频重建。
滤波器组105最后包括以变换因子2、3及4的带宽扩展的输出变换器输出信号,由块105所输出的信号带宽不再受限于交叉(crossover)频率,即,与SBR或HFR所产生的信号分量的最低频率相应的核心译码器信号的最高频率。
在图10的实施例中,分析滤波器组执行两次过取样并具有某个分析子带间隔106。合成滤波器组105具有合成子带间隔107,其在此一实施例中,为分析子带间隔的两倍大小,结果导致变换贡献,后文将于图11的上下文中讨论。
图11示出图10中非线性子带处理器102a的优选实施例的实现细节。图11所示电路接收单一子带信号108作为输入信号,其在三“分支”处理:上分支110a用于以变换因子2变换。图11中间分支110b用于以变换因子3变换,及图11中的下分支用于以变换因子4变换,且以组件符号110c指示。但由图11中的各处理组件所得实际变换对分支110a只有1(即,无变换)。对中间分支110b由图11的处理组件获得的实际变换等于1.5,而对分支110c的实际变换等于2。此由图11左侧的方括号内的数字指示,此处指示变换因子T。1.5和2的变换表示由在分支110b、110c进行降采样运算及由重迭加法处理器进行时间延伸所得的第一变换贡献。第二贡献(即,双倍变换)由合成滤波器组105获得,合成滤波器组105具有合成子带间隔107为分析滤波器组子带间隔的两倍。因此,因合成滤波器组具有两倍合成子带间隔,故任何降采样功能都未在分支110a进行。
但分支110b具有降采样功能来获得变换达1.5。由于合成滤波器组具有分析滤波器组的两倍实体子带间隔的事实,故获得3的变换因子,如图11指示在第二分支110b的块抽取器左方。
同理,第三分支具有与变换因子2对应的降采样功能,不同子带间隔在分析滤波器组及合成滤波器组的最后贡献最终对应于第三分支110c的变换因子4。
具体地,各分支具有块抽取器120a、120b及120c,及这些块抽取器各自可类似图9的块抽取器1800。此外,各分支具有相角计算器122a、122b及122c,该相角计算器可类似于图9的相角计算器1804。又复,各分支具有相角调整器124a、124b及124c,该相角调整器可类似于图9的相角调整器1806。此外,各分支具有开窗器126a、126b及126c,此处这些开窗器各自可类似于图9的开窗器1802。虽然如此,开窗器126a、126b及126c也可被配置为与若干“零填充”一起施加矩形窗。图11的实施例中,来自各分支110a、110b及110c的变换信号或补丁信号被输入加法器128,加法器128将来自各分支的贡献加至目前子带信号而最终在加法器128的输出端获得所谓的变换块。然后,实施在重迭-加法器130的重迭加法程序,重迭-加法器130可类似于图9的重迭/加法块1808。重迭加法器施加2·e的重迭-加法先行值,此处e为块抽取器120a、120b及120c的重迭-先行值或“跨幅值”,重迭-加法器130输出该已变换的信号,其在图11的实施例中,为通道k(即,目前观察到的子带通道)的单一子带输出信号。图11示出的处理对各分析子带或对某一组分析子带施行,如图10的例示说明,已变换子带信号在由块103处理后被输入合成滤波器组105,来最后在块105的输出端获得图10所示的变换器输出信号。
在实施例中,第一变换器分支110a的块抽取器120a抽取10个子带样本,随后执行将这10个QMF样本变换成极性坐标。然后定义输出信号,如图13中处理块143所讨论的,容后详述。然后,由相角调整器124a所产生的此输出信号被转发至开窗器126a,其对该块的第一值及最末值扩展输出信号达零,此处此项操作相当于具有长度10的矩形窗的(合成)开窗。分支110a的块抽取器120a不执行降采样功能。因此由该块抽取器所抽取的样本以其被抽取的相同样本间隔而被映射至被抽取的块。
但此点对分支110b及110c不同。块抽取器120b优选抽取8个子带样本的块,并将这8个子带样本以不同子带样本间隔而分配在所抽取的块中。对所抽取块的非整数子带样本项目通过内插法获得,如此所得QMF样本连同经内插的样本被变换成极性坐标,且由角调整器124b处理以便获得与图13的块143表示型态类似的表示型态。然后,再度进行在开窗器126b的开窗来对头两个样本及末两个样本扩展由相角调整器124b所输出的块达零,该项操作相当于具有长度8的矩形窗的(合成)开窗。
块抽取器120c被配置为以6个子带样本的时间长度抽取块,执行降采样因子2的降采样功能,执行QMF样本变换成极性坐标,在相角调整器124b再度执行操作以便获得类似含括于图13的块143的表示型态,及输出信号再度扩展达零,但现在对头三个子带样本及末三个子带样本。该项操作相当于具有长度6的矩形窗的(合成)开窗。
然后各分支的转位输出信号由加法器128相加形成组合QMF输出信号,该组合QMF输出信号最后在块130使用重迭-加法而迭置,此处如前文讨论,重迭-加法先行值或跨幅值为块抽取器120a、120b及120c的跨幅值的两倍。
随后,在图12的上下文讨论用以确定优选相角校正的不同实施例。在151所指示的实施例中,存在有分析/合成滤波器组对的对称性情况,相角校正Δθn具有取决于变换因子T的第一项151a和取决于通道号n或图11中的标号k的第二项151b。
此实施例中,相角调整器被配置为使用数值Δθn(其在图11中指示为Ω(k))施加相角校正,其不仅根据项151b而取决于滤波器组通道,同时也取决于项151a所指示的变换因子T。但要紧地,相角校正并非取决于实际子带信号。这种依赖性通过相角计算器对声码器变换而考虑,如在块122a、122b、122b的上下文所讨论的,但相角校正或“复合输出信号增益值Ω(k)”与子带信号独立无关。
在又一实施例中,在图12中的152指示,出现相角转动的非对称性分布。相角转动用来沿时间轴而移位分析滤波器组输入信号样本的块,也沿时间轴而移位合成滤波器组的输出信号值。相角转动值以Ψn指示。在相角转动的非对称性分布的情况下,对Δθn指示实际使用的相角校正,及再度存在取决于变换因子的项152a及取决于子带通道的项152b。
153指示的本发明的又一优选实施例具有优于实施例151及152的优点在于相角校正项Δθn或图11示出的Ω(k)只取决于子带通道,但不再取决于变换因子。通过施加相角转动的具体应用至分析滤波器组来抵消相角校正的取决于变换的项,可获得此有利情况。在特定滤波器组实施的某个实施例中,此值等于图12所示的Δθn。但用于其它滤波器组设计,Δθn值可改变。图12示出385/128的常数因子,但视情况而定,此因子可从2变化至4。此外,摘述可使用385/128以外的其它数值及偏离用于特定滤波器组设计的此一数值(对该设计此值为最佳),将只导致对变换因子的略微相依性,至某个程度该相依性可被忽略。
图13示出由各个变换器分支110a、110b及110c执行的一连串步骤。在步骤140,抽取块的样本m通过如块120a中的纯粹样本抽取或如块120b、120c中的降采样,而且还可能通过如在块120b的上下文指示的内插法而测定。然后在步骤141,计算各样本的幅值r及相角Φ。在块142,图11中的相角计算器122a、122b及122c计算该块的某个幅值及某个相角。在优选实施例中,经由抽取且可能经降采样和内插的块中间的数值的幅值和相角被计算为块的相角值和块的幅值。但可取样块的其它样本来测定各块的相角及幅值。另外,甚至经由加和块全部样本的幅值及相角并经由将所得的值除以块内的样本数确定的各块的平均幅值或平均相角可被用作该块的相角及幅值。但在图13的实施例中,优选使用在指数零的该块中间样本的幅值和相角作为该块的幅值的相角。然后,经调整样本由相角调整器124a、124b及124c使用下列计算而得:使用本发明的相角校正Ω(为复数)作为第一项;使用幅值修改作为第二项(但也可免除);使用块122a、122b及122c计算得到的取决于信号的相角值对应(T-1)·Φ(0)作为第三项;及使用实际上考虑样本的实际相角Φ(m)作为第四项,如块143指示。
图14a及图14b指示对于图12中的实施例用于分析滤波器组的两项不同的调制功能。图14a示出要求取决于变换因子的相角校正的分析滤波器组的调制。这种滤波器组的调制对应图12的实施例153。
另一实施例系在图14b示出,对应于实施例152,其中,由于相角转动的非对称性分布而施加取决于变换因子的相角校正。具体地,图14b示出在ISO/IEC14496-3章节4.6.18.4.2(通过引用结合于此),匹配复合SBR滤波器组的特定分析滤波器组调制。
比较图14a和图14b,显然在图14b末二项和图14a的末项,用以计算余弦值及正弦值的相角转动量不同。
一个实施例包括一种用于由输入音频信号产生带宽扩展的音频信号的装置,包括:补丁产生器,用于由输入音频信号产生一个或多个补丁信号,其中补丁信号具有与不同补丁的补丁中心频率不同的或与输入音频信号的中心频率不同的补丁中心频率,其中该补丁产生器被配置用于产生该一个或多个补丁信号,使得该输入音频信号与该一个或多个补丁信号间的时间未对准或不同补丁信号间的时间未对准减少或消除;或其中该补丁产生器被配置用于在时间延伸功能内执行取决于滤波器组-通道的相角校正。
在又一实施例中,该补丁产生器包括多个补丁器,各个补丁器具有降采样功能、时间延伸功能;以及补丁校正器,用以对补丁信号施加时间校正来减少或消除时间未对准。
在又一实施例中,该补丁产生器被配置为存储时间延迟并以以下方式选择时间延迟:当脉冲状信号经处理时,通过该处理所获得的补丁信号的重心在时间上彼此对准。
在又一实施例中,由该补丁产生器施加的用以减少或消除时间未对准的时间延迟被固定地储存且与处理信号独立无关。
在又一实施例中,时间延伸器包括使用抽取先行值的块抽取器,开窗器/相角调整器,及具有与该抽取先行值不同的重迭-加法先行值的重迭-加法器。
在又一实施例中,施用用于减少或消除时间未对准的时间延迟取决于该抽取先行值、重迭-加法先行值或两值。
在又一实施例中,该时间延伸器包括用于具有分析滤波器组的不同通道号(number)的至少两个不同通道的块抽取器、开窗器/相角调整器,以及重迭-加法器,其中用于至少二通道的各通道的开窗器/相角调整器被配置用于施加各通道的相角调整,该相角调整取决于通道号。
在又一实施例中,其中该相角调整器被配置用于对取样值块的取样值施加相角调整,该相角调整为取决于时间延伸量及取决于该块的实际相角的相角值和取决于通道号的不取决于信号的相角值的组合。
虽然已经就装置的上下文描述若干方面,但显然这些方面也表示相应方法的描述,此处块或装置对应于方法步骤或方法步骤的特征。同理,在方法步骤的上下文所描述的方面也表示对应的装置的对应块或项目或特征的描述。
本发明的编码音频信号可储存在数字储存媒体或可在诸如无线传输媒体或有线传输媒体诸如因特网的传输媒体上传输。
根据某些实现要求,本发明的实施例可在硬件或软件实现。该项实现可使用数字储存媒体执行,这些媒体例如为软盘、DVD、CD、ROM、PROM、EPROM、EEPROM、或FLASH内存,其上储存有可电子式读取控制信号,这些信号与可程序规划计算机系统协力合作(或可协力合作)来执行个体方法。
根据本发明的若干实施例包括一种具有可电子式读取控制信号的数据载体,其可与可程序规划计算机系统协力合作因而执行此处所述方法中的一个。
一般而言,本发明的实施例可实现为具有程序代码的一种计算机程序产品,该程序代码可操作来当该计算机程序产品在一计算机上运行时执行这些方法中的一个。该程序代码例如可储存在机器可读取载体上。
其它实施例包括储存在机器可读取载体上用以执行此处所述方法中的一个的该计算机程序。
换言之,因此本发明方法的实施例为一种具有程序代码的计算机程序,当该计算机程序在计算机上运行时该程序代码用以执行此处所述方法中的一个。
因此本发明方法的实施例为一种数据载体(或数字储存媒体,或计算机可读取媒体)包含记录于其上的用以执行此处所述方法中的一个的计算机程序。
因此本发明方法的又一实施例为一种表现用以执行此处所述方法中的一个的计算机程序的数据串流或串行信号。该数据串流或串行信号例如可被配置为通过例如因特网的数据通信连接传输。
又一实施例包括一种被配置为或适用于执行此处所述方法中的一个的处理装置,例如计算机或可程序规划逻辑装置。
又一实施例包括一种计算机,其上安装有用以执行此处所述方法中的一个的计算机程序。
在若干实施例中,可使用可程序规划逻辑装置(例如,场可程序规划门阵列)来执行此处所述方法中的部分或全部功能。在若干实施例中,场可程序规划门阵列可与微处理器协力合作来执行此处所述方法中的一个。一般而言,这些方法优选任一种硬件装置执行。
前述实施例仅供举例说明本发明的原理。须了解此处所述配置及细节的修改及变异为本领域技术人员显然易见的。因此,本发明意图仅受随附的权利要求书的范围所限,而非受此处通过实施例的描述及解说所呈现的特定细节所限。
参考文献:
[1]J.L.Flanagan and R.M.Golden,Phase Vocoder,The Bell SystemTechnical Journal,November1966,pp1394-1509
[2]United States Patent6549884Laroche,J.&Dolson,M.:Phase-vocoder pitch-shifting
[3]J.Laroche and M.Dolson,New Phase-Vocoder Techniques forPitch-Shifting,Harmonizing and Other Exotic Effects,Proc.IEEE Workshopon App.of Signal Proc.to Signal Proc.to Audio and Acous.,New Paltz,NY1999.
[4]Frederik Nagel,Sascha Disch,A harmonic bandwidth extensionmethod for audio codecs,ICASSP,Taipei,Taiwan,April2009
[5]Frederik Nagel.,Sascha Disch and Nikolaus Rettelbach,A phasevocoder driven bandwidth extension method with novel transient handling foraudio codecs,126th AES Convention,Munich,Germany,May7-10,2009
Claims (19)
1.一种用于由输入信号产生带宽扩展的音频信号的装置,包括:
补丁产生器(82,102a,102b),用于由所述输入信号产生一个或多个补丁信号,其中补丁信号具有与不同补丁的补丁中心频率不同的或与输入音频信号的中心频率不同的补丁中心频率,
其中,所述补丁产生器(82,102a,102b)被配置用于对来自分析滤波器组(101)的子带信号执行时间延伸(90a,90b,90c;1808;130),以及
其中,所述补丁产生器(82,102a,102b)包括用于使用取决于滤波器组-通道的相角校正(151,152,153)调整所述子带信号的相角的相角调整器(1806,124a,124b,124c)。
2.根据权利要求1所述的装置,其中,所述相角调整器(124a,124b,124c,1806)被配置为选择所述相角校正(151,152,153),使得由滤波器组设计所导入的信号的幅值变化减少或消除。
3.根据权利要求1所述的装置,其中,所述相角调整器(124a,124b,124c,1806)被配置为施加所述相角校正(151,152,153),所述相角校正与所述子带信号独立无关。
4.根据权利要求1所述的装置,其中,所述相角调整器(124a,124b,124c,1806)被配置为根据所施加的变换因子(143)而额外地施加取决于信号的相角校正。
5.根据权利要求1所述的装置,其中,所述补丁产生器(82,102a,102b)被配置为用于执行针对块的处理,包括:
块抽取器(1800,120a,120b,120c),用于使用块先行值从所述子带信号提取随后的数值块;
所述相角调整器(124a,124b,124c,1806);以及
重迭-加法处理器(1808,130),其中,所述重迭-加法处理器被配置用于施加比所述块先行值大的另一块先行值来获得所述时间延伸。
6.根据权利要求5所述的装置,其中,所述块抽取器(120b,120c)被配置为额外地根据变换因子T执行降采样运算,并且在非整数降采样运算的情况下执行内插。
7.根据权利要求1所述的装置,其中,所述相角调整器(124a,124b,124c,1806)被配置为施加相角校正(153),所述相角校正包括:
πC(k+1/2)
其中,k指示滤波器组通道,C为2至4之间的实数。
8.根据权利要求5所述的装置,其中,所述补丁产生器(82,102a,102b)进一步包括用于使用窗函数对块开窗的开窗器(126a,126b,126c,1802)。
9.根据权利要求1所述的装置,所述装置被配置用于使用至少两个变换因子T执行频宽扩展,其中,所述补丁产生器被配置为:
对第一变换因子,
使用块先行值且使用不含或运用第一降采样因子的第一降采样来抽取(120a,120b);
对子带样本块的所述样本进行相角调整;
零填充相角调整块至一定长度以获得第一变换信号;对第二变换因子,
当已经执行第一降采样时,使用块先行值且使用运用比所述第一降采样因子大的第二降采样因子的降采样进行抽取;
对子带样本块的所述样本进行相角调整;以及
零填充所述相角调整块至一定长度以获得第二变换信号;
将所述第一变换信号和所述第二变换信号以逐样本的方式添加以获得变换块;以及
使用比所述块先行值大的先行值来重迭-加法(130)随后的变换因子以获得变换子带信号。
10.根据权利要求1所述的装置,进一步包括:
高频重建处理器(103),用于在对所述子带信号施加相角校正而获得经调整的子带信号后,施加高频重建参数(104)给所述子带信号。
11.根据权利要求1所述的装置,进一步包括合成滤波器组(105),所述合成滤波器组(105)具有比所述分析滤波器组(101)的子带间隔大的子带间隔。
12.根据权利要求1所述的装置,其中,所述补丁产生器(82,102a,102b)包括用于由低频带信号产生所述子带信号的分析滤波器组(101),其中,所述分析滤波器组(101)为具有相角转动的正交镜像滤波器组,其中,所述相角校正取决于所述变换因子。
13.根据权利要求1所述的装置,其中,所述分析滤波器组(101)为QMF滤波器组,且被配置为施加相角转动,使得相角校正(153)与用于产生所述一个或多个补丁信号所使用的变换因子独立无关。
14.根据权利要求1所述的装置,其中,所述补丁产生器包括时间延伸器(92a),其中所述时间延伸器(92a)包括运用抽取先行值的块抽取器。
15.根据权利要求1所述的装置,其中,所述补丁产生器(82,102a,102b)包括时间延伸器(92a),其中,所述时间延伸器(92a)包括用于具有分析滤波器组的不同通道号的至少两个不同通道的块抽取器、开窗器或相角调整器,以及重迭-加法器,
其中,用于该至少两个通道的各通道的开窗器或相角调整器被配置用于为各通道施加相角调整,所述相角调整取决于所述通道号。
16.根据权利要求1所述的装置,其中,所述相角调整器被配置用于对取样值块的取样值施加相角调整,所述相角调整为取决于时间延伸量和取决于所述块的实际相角的相角值与作为相角校正的取决于所述通道号的不取决于信号的相角值的组合。
17.根据权利要求1所述的装置,其中,所述补丁产生器(82,102a,102b)被配置为产生所述一个或多个补丁信号,使得所述输入音频信号与所述一个或多个补丁信号之间的时间未对准或不同补丁信号间的时间未对准减少或消除。
18.根据权利要求1所述的装置,其中,所述补丁产生器(82,102a,102b)包括多个补丁器(87a,87b,87c,110a,110b,110c),至少一个补丁器,具有降采样功能、时间延伸功能;以及补丁校正器,用于将时间校正施加至所述补丁信号,以减少或消除时间未对准。
19.一种用于由输入信号产生带宽扩展的音频信号的方法,所述方法包括下列步骤:
由所述输入信号产生一个或多个补丁信号,其中,所述补丁信号具有与不同补丁的补丁中心频率或输入音频信号的中心频率不同的补丁中心频率,
其中,对来自分析滤波器组(101)的子带信号执行时间延伸(90a,90b,90c,1808;130),以及
其中,使用取决于滤波器组-通道的相角校正(151,152,153)调整(1806,124a,124b,124c)所述子带信号的相角。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31211810P | 2010-03-09 | 2010-03-09 | |
US61/312,118 | 2010-03-09 | ||
PCT/EP2011/053298 WO2011110494A1 (en) | 2010-03-09 | 2011-03-04 | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102985970A CN102985970A (zh) | 2013-03-20 |
CN102985970B true CN102985970B (zh) | 2014-11-05 |
Family
ID=43829366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180023451.1A Active CN102985970B (zh) | 2010-03-09 | 2011-03-04 | 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准 |
Country Status (17)
Country | Link |
---|---|
US (2) | US9318127B2 (zh) |
EP (1) | EP2545551B1 (zh) |
JP (1) | JP5854520B2 (zh) |
KR (1) | KR101483157B1 (zh) |
CN (1) | CN102985970B (zh) |
AR (1) | AR080475A1 (zh) |
BR (1) | BR112012022745B1 (zh) |
CA (1) | CA2792449C (zh) |
ES (1) | ES2655085T3 (zh) |
MX (1) | MX2012010314A (zh) |
MY (1) | MY152376A (zh) |
PL (1) | PL2545551T3 (zh) |
PT (1) | PT2545551T (zh) |
RU (1) | RU2596033C2 (zh) |
SG (1) | SG183966A1 (zh) |
TW (1) | TWI425501B (zh) |
WO (1) | WO2011110494A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112204659A (zh) * | 2018-04-25 | 2021-01-08 | 杜比国际公司 | 具有减少后处理延迟的高频重建技术的集成 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL2545551T3 (pl) * | 2010-03-09 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio |
ES2522171T3 (es) | 2010-03-09 | 2014-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
EP2631906A1 (en) | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
EP2709106A1 (en) * | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
KR20160087827A (ko) * | 2013-11-22 | 2016-07-22 | 퀄컴 인코포레이티드 | 고대역 코딩에서의 선택적 위상 보상 |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
CA2985019C (en) | 2016-02-17 | 2022-05-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
TWI807562B (zh) | 2017-03-23 | 2023-07-01 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
IL278223B2 (en) | 2018-04-25 | 2023-12-01 | Dolby Int Ab | Combining high-frequency audio reconstruction techniques |
CN110881157B (zh) * | 2018-09-06 | 2021-08-10 | 宏碁股份有限公司 | 正交基底修正的音效控制方法及音效输出装置 |
GB2579348A (en) * | 2018-11-16 | 2020-06-24 | Nokia Technologies Oy | Audio processing |
JP7270836B2 (ja) * | 2019-08-08 | 2023-05-10 | ブームクラウド 360 インコーポレイテッド | 音響心理学的周波数範囲拡張のための非線形適応フィルタバンク |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005509928A (ja) * | 2001-11-23 | 2005-04-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号帯域幅拡張 |
CN100338649C (zh) * | 2002-03-28 | 2007-09-19 | 杜比实验室特许公司 | 处理音频信号、生成重建的音频信号的方法、设备及媒体 |
TW200939211A (en) * | 2008-01-31 | 2009-09-16 | Fraunhofer Ges Forschung | Device and method for a bandwidth extension of an audio signal |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55107313A (en) | 1979-02-08 | 1980-08-18 | Pioneer Electronic Corp | Adjuster for audio quality |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US6766300B1 (en) | 1996-11-07 | 2004-07-20 | Creative Technology Ltd. | Method and apparatus for transient detection and non-distortion time scaling |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6549884B1 (en) | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
EP1377967B1 (en) | 2001-04-13 | 2013-04-10 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
EP1351401B1 (en) | 2001-07-13 | 2009-01-14 | Panasonic Corporation | Audio signal decoding device and audio signal encoding device |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
JP4313993B2 (ja) | 2002-07-19 | 2009-08-12 | パナソニック株式会社 | オーディオ復号化装置およびオーディオ復号化方法 |
JP4227772B2 (ja) | 2002-07-19 | 2009-02-18 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
KR100524065B1 (ko) | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
US7337108B2 (en) | 2003-09-10 | 2008-02-26 | Microsoft Corporation | System and method for providing high-quality stretching and compression of a digital audio signal |
CN100507485C (zh) | 2003-10-23 | 2009-07-01 | 松下电器产业株式会社 | 频谱编码装置和频谱解码装置 |
JP4254479B2 (ja) | 2003-10-27 | 2009-04-15 | ヤマハ株式会社 | オーディオ帯域拡張再生装置 |
DE102004046746B4 (de) * | 2004-09-27 | 2007-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten |
JP4939424B2 (ja) | 2004-11-02 | 2012-05-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
EP1814106B1 (en) * | 2005-01-14 | 2009-09-16 | Panasonic Corporation | Audio switching device and audio switching method |
CN101138274B (zh) * | 2005-04-15 | 2011-07-06 | 杜比国际公司 | 用于处理去相干信号或组合信号的设备和方法 |
JP2007017628A (ja) | 2005-07-06 | 2007-01-25 | Matsushita Electric Ind Co Ltd | 復号化装置 |
US7565289B2 (en) | 2005-09-30 | 2009-07-21 | Apple Inc. | Echo avoidance in audio time stretching |
JP4760278B2 (ja) | 2005-10-04 | 2011-08-31 | 株式会社ケンウッド | 補間装置、オーディオ再生装置、補間方法および補間プログラム |
DE602006012370D1 (de) | 2005-12-13 | 2010-04-01 | Nxp Bv | Einrichtung und verfahren zum verarbeiten eines audio-datenstroms |
FR2910743B1 (fr) | 2006-12-22 | 2009-02-20 | Thales Sa | Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade. |
CA2708861C (en) | 2007-12-18 | 2016-06-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN101471072B (zh) | 2007-12-27 | 2012-01-25 | 华为技术有限公司 | 高频重建方法、编码装置和解码装置 |
KR101230479B1 (ko) | 2008-03-10 | 2013-02-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법 |
US9147902B2 (en) * | 2008-07-04 | 2015-09-29 | Guangdong Institute of Eco-Environmental and Soil Sciences | Microbial fuel cell stack |
JP5010743B2 (ja) * | 2008-07-11 | 2012-08-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 |
EP2301028B1 (en) | 2008-07-11 | 2012-12-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for calculating a number of spectral envelopes |
KR101239812B1 (ko) | 2008-07-11 | 2013-03-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장 신호를 생성하기 위한 장치 및 방법 |
US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
EP2169665B1 (en) * | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
PL4231290T3 (pl) | 2008-12-15 | 2024-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
RU2493618C2 (ru) * | 2009-01-28 | 2013-09-20 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
JP5433022B2 (ja) * | 2009-09-18 | 2014-03-05 | ドルビー インターナショナル アーベー | 高調波転換 |
CN102257567B (zh) * | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
ES2805349T3 (es) * | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
US8321216B2 (en) | 2010-02-23 | 2012-11-27 | Broadcom Corporation | Time-warping of audio signals for packet loss concealment avoiding audible artifacts |
PL2545551T3 (pl) * | 2010-03-09 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio |
-
2011
- 2011-03-04 PL PL11707156T patent/PL2545551T3/pl unknown
- 2011-03-04 BR BR112012022745-9A patent/BR112012022745B1/pt active IP Right Grant
- 2011-03-04 SG SG2012066536A patent/SG183966A1/en unknown
- 2011-03-04 CN CN201180023451.1A patent/CN102985970B/zh active Active
- 2011-03-04 KR KR1020127026336A patent/KR101483157B1/ko active IP Right Grant
- 2011-03-04 JP JP2012556460A patent/JP5854520B2/ja active Active
- 2011-03-04 WO PCT/EP2011/053298 patent/WO2011110494A1/en active Application Filing
- 2011-03-04 PT PT117071563T patent/PT2545551T/pt unknown
- 2011-03-04 ES ES11707156.3T patent/ES2655085T3/es active Active
- 2011-03-04 CA CA2792449A patent/CA2792449C/en active Active
- 2011-03-04 MY MYPI2012004004 patent/MY152376A/en unknown
- 2011-03-04 EP EP11707156.3A patent/EP2545551B1/en active Active
- 2011-03-04 RU RU2012142246/28A patent/RU2596033C2/ru not_active Application Discontinuation
- 2011-03-04 MX MX2012010314A patent/MX2012010314A/es active IP Right Grant
- 2011-03-08 TW TW100107717A patent/TWI425501B/zh active
- 2011-03-09 AR ARP110100722A patent/AR080475A1/es active IP Right Grant
-
2012
- 2012-09-05 US US13/604,313 patent/US9318127B2/en active Active
-
2016
- 2016-03-16 US US15/071,569 patent/US9905235B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005509928A (ja) * | 2001-11-23 | 2005-04-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号帯域幅拡張 |
CN100338649C (zh) * | 2002-03-28 | 2007-09-19 | 杜比实验室特许公司 | 处理音频信号、生成重建的音频信号的方法、设备及媒体 |
TW200939211A (en) * | 2008-01-31 | 2009-09-16 | Fraunhofer Ges Forschung | Device and method for a bandwidth extension of an audio signal |
Non-Patent Citations (4)
Title |
---|
"A harmonic bandwidth extension method for audio codecs;FREDERIK NAGEL ET AL;《ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2009. ICASSP 2009. IEEE INTERNATIONAL CONFERENCE ON, IEEE, PISCATAWAY, NJ, USA, 19 April 2009》;20090419;145-148 * |
"Improved Phase Vocoder Time-Scale Modification of Audio;JEAN LAROCHE ET AL;《 IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, IEEE SERVICE CENTER, NEW YORK, NY, US》;19990501;第7卷(第3期);323-332 * |
FREDERIK NAGEL ET AL."A harmonic bandwidth extension method for audio codecs.《ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2009. ICASSP 2009. IEEE INTERNATIONAL CONFERENCE ON, IEEE, PISCATAWAY, NJ, USA, 19 April 2009》.2009,145-148. * |
JEAN LAROCHE ET AL."Improved Phase Vocoder Time-Scale Modification of Audio.《 IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, IEEE SERVICE CENTER, NEW YORK, NY, US》.1999,第7卷(第3期),323-332. * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112204659A (zh) * | 2018-04-25 | 2021-01-08 | 杜比国际公司 | 具有减少后处理延迟的高频重建技术的集成 |
CN112204659B (zh) * | 2018-04-25 | 2021-12-17 | 杜比国际公司 | 具有减少后处理延迟的高频重建技术的集成 |
Also Published As
Publication number | Publication date |
---|---|
JP5854520B2 (ja) | 2016-02-09 |
CA2792449A1 (en) | 2011-09-15 |
EP2545551B1 (en) | 2017-10-04 |
US20130058498A1 (en) | 2013-03-07 |
BR112012022745B1 (pt) | 2020-11-10 |
CA2792449C (en) | 2017-12-05 |
RU2596033C2 (ru) | 2016-08-27 |
PL2545551T3 (pl) | 2018-03-30 |
CN102985970A (zh) | 2013-03-20 |
RU2012142246A (ru) | 2014-04-20 |
WO2011110494A1 (en) | 2011-09-15 |
KR101483157B1 (ko) | 2015-01-15 |
MY152376A (en) | 2014-09-15 |
ES2655085T3 (es) | 2018-02-16 |
US9318127B2 (en) | 2016-04-19 |
KR20130007598A (ko) | 2013-01-18 |
EP2545551A1 (en) | 2013-01-16 |
MX2012010314A (es) | 2012-09-28 |
AR080475A1 (es) | 2012-04-11 |
US20160267917A1 (en) | 2016-09-15 |
BR112012022745A2 (pt) | 2018-06-05 |
AU2011226206A1 (en) | 2012-10-18 |
US9905235B2 (en) | 2018-02-27 |
JP2013521536A (ja) | 2013-06-10 |
AU2011226206B2 (en) | 2013-12-19 |
PT2545551T (pt) | 2018-01-03 |
SG183966A1 (en) | 2012-10-30 |
TWI425501B (zh) | 2014-02-01 |
TW201207844A (en) | 2012-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102985970B (zh) | 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准 | |
RU2758466C2 (ru) | Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов | |
TWI444991B (zh) | 用以利用補丁邊界對齊處理音訊信號之裝置與方法 | |
RU2547220C2 (ru) | Устройство и способ для генерирования высокочастотного аудиосигнала с применением адаптивной избыточной дискретизации | |
Goodwin | The STFT, sinusoidal models, and speech modification | |
Beltrán et al. | Estimation of the instantaneous amplitude and the instantaneous frequency of audio signals using complex wavelets | |
Roebel et al. | Real time signal transposition with envelope preservation in the phase vocoder | |
RU2782168C1 (ru) | Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов | |
AU2024200328B2 (en) | : Efficient combined harmonic transposition | |
AU2011226206B9 (en) | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals | |
CN105556601B (zh) | 用于使用交叠范围中的组合来处理音频信号的装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Munich, Germany Patentee after: Fraunhofer Application and Research Promotion Association Patentee after: Dolby Int AB Address before: Munich, Germany Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Patentee before: Dolby Int AB |