CN102144258B - 促进确定信号边界频率的方法和装置 - Google Patents
促进确定信号边界频率的方法和装置 Download PDFInfo
- Publication number
- CN102144258B CN102144258B CN2009801326212A CN200980132621A CN102144258B CN 102144258 B CN102144258 B CN 102144258B CN 2009801326212 A CN2009801326212 A CN 2009801326212A CN 200980132621 A CN200980132621 A CN 200980132621A CN 102144258 B CN102144258 B CN 102144258B
- Authority
- CN
- China
- Prior art keywords
- signal
- amplitude spectrum
- frequency
- audio content
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 42
- 238000001228 spectrum Methods 0.000 claims abstract description 47
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000009825 accumulation Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 description 17
- 238000001514 detection method Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mobile Radio Communication Systems (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Telephone Function (AREA)
Abstract
信号处理平台(300)呈现要处理的信号(101)以及识别具有特定特性的信号部分(102),所述信号部分用于自动地确定至少一个边界频率(103),所述至少一个边界频率可以用于促进信号的带宽扩展。识别这些信号部分可以包括识别至少展现预定能量水平的信号部分。确定边界频率的步骤可以包括:计算识别的信号部分中的每个的幅度频谱,根据对应的归一化信号部分可以使用幅度频谱来确定通带内对应平坦度测量,从而提供核实的信号部分。然后,确定边界频率可以包括:积累这些核实的信号部分的幅度频谱;以及使用所得到的积累来估计对应的信号包络。然后,此信号包络可以用于确定至少一个边界频率。
Description
技术领域
本发明通常涉及信号处理,更具体地,涉及音频信号处理。
背景技术
各种设置至少部分地用于处理通过给定带宽一侧或另一侧限界的信号。在许多情况下,这样做是保证信号适合与处理平台和/或应用设置相对应的某些有限的处理能力。例如,一些处理平台(诸如蜂窝电话)通常将待处理的音频信号限制到某个预定带宽,诸如300至3400Hz,即使原始语音内容可以包括此范围之外的频率。
在认识到此类约束可能限制声音质量这一事实时,一些平台使用人工带宽扩展进一步处理此类信号。通常而言,人工带宽扩展通常包括将上述预定带宽外的人工生成的内容添加到已处理的信号,以便有希望改善得到的声音质量。
然而,此类方法的成功本身就可以很随意且不可预测。在一些情况下,对应结果可以是自然声音且相对取悦听众。然而,在其他情况下,带宽扩展结果可能相当不自然且令人讨厌。最坏地,此人工生成的内容的引入可能使得更难以辨别原始音频内容的实质性内容。
附图说明
上述需求至少部分是特别当结合附图研究时通过提供下面的具体实施方式中描述的促进确定信号边界频率的方法和装置来满足,在附图中:
图1包括根据本发明的各种实施例配置的流程图;
图2包括根据本发明的各种实施例配置的流程图;以及
图3包括根据本发明的各种实施例配置的框图。
本领域的技术人员将理解,附图中的元素是为了简明和清楚而图示的并且不一定按照比例绘制。例如,附图中一些元素的尺寸和/或相对定位可以相对其他元件被放大,以提高对本发明的各种实施例的理解。而且,往往不描绘在商业上可行的实施例中有用或必要的常见但公知的元件,以促进对本发明的各种实施例的较少的晦涩理解。进一步将理解,可以按照特定发生顺序来描述或描绘特定动作和/或步骤,同时本领域的技术人员将理解,实际上不需要对于顺序的此类指定。还将理解,在此使用的术语和表达具有上面阐述的本技术领域的技术人员赋予此类术语和表达的普通技术含义,除非在此已经另外阐述了不同的特定含义。
具体实施方式
通常而言,根据这些各种实施例,信号处理平台呈现要处理的信号(诸如数字化的音频信号),并且然后识别具有特定特性的信号部分,以提供对应识别的信号部分。然后,后者用于自动地确定信号的至少一个边界频率。然后,这个(或这些)(一个或多个)边界频率可以用于促进信号的带宽扩展。通过一种方法,识别具有特定特性的信号部分的步骤可以包括:识别至少展现特定能量水平的信号部分。在此类情况下,确定边界频率的步骤可以包括:至少部分地计算每个识别的信号部分的幅度频谱。
通过一种方法,如果期望,则上述幅度频谱可以用于根据对应的归一化的信号部分来确定通带内的对应平坦度测量,从而提供对应的核实信号部分。在此类情况下,且如果再次期望,则确定(一个或多个)边界频率的步骤可以包括积累这些核实信号部分的幅度频谱,从而提供积累的幅度频谱,并且然后使用后者来估计对应信号包络。然后,该信号包络可以用于确定(一个或多个)边界频率。
通过一种方法,例如,这些教导然后将适应通过至少部分自动地执行下述步骤来使用信号的高频带边缘检测执行所述信号的带宽扩展:通过使用高频带边缘的最低期望值;然后使用达到检测的高频带边缘的可用窄带信号;以及,然后使用检测的高频带边缘之上的带宽扩展的信号来表示所述信号。
作为这些方面的另一示例,这些教导将适应:通过检测在低频带边缘的最高期望值之下的低频带边缘来执行信号的带宽扩展,以提供对应的检测到的低频带边缘。然后,可以基于此检测到的低频带边缘来调整低频带提升特性,以提供对应的已调整的低频带提升特性。然后,此已调整的低频带提升特性可以应用于信号,以获得所得到的提升的低频带信号。
本领域的技术人员将认识和理解到,这些教导提供给定信号的频带边缘的检测。然后,这些教导考虑并容易适应使用此信息影响带宽扩展。与多种现有技术方法相比较,对于音频质量,带宽扩展结果本身相当优秀。此结果至少部分地由于更好的适应和原始信号中的现有内容的使用。这在许多情况下进而减小了在所得到的带宽扩展信号中包括的制造内容的量。
进一步将理解,通过利用可用处理平台容易地且经济地促进了这些教导。对应的计算要求相对适度,从而致使这些教导适合于具有有限本地处理资源(诸如,可用功率储备、计算能力等)的处理平台(诸如但不限于,蜂窝电话等)。进一步将理解,这些教导是高度可扩展的,并且可以与各种信号、带宽要求和/或机会等一起有效地使用。
在全面审查和研究下面的详细描述之后,这些和其他益处可能变得更加清楚。现参照附图,并且特别参照图1,现将呈现与这些教导中的很多都兼容的说明性处理。可以通过选择的信号处理平台来实现此处理100。这方面中的示例包括但不一定限于蜂窝电话、一键通无线设备(诸如所谓的对讲机)、陆线电话、所谓的互联网电话等。
此处理100包括呈现要处理的信号的步骤101。对于许多感兴趣的应用设置,此信号将包括音频内容。在许多情况下,呈现此信号的步骤将包括呈现音频内容的多个顺序样本(诸如数字样本)。例如,此步骤可以包括:呈现包括使用8KHz采样率获得的1024个顺序样本的此类信息的帧。例如,此步骤还可以包括:呈现包括多个此类帧的内容的窗口。例如,在涉及音频信号(包括人类语言)的各种各样的常见应用设置中,具有持续时间大约1至3秒的窗口可能很有用。
然后,此处理100呈现步骤102,步骤102识别信号中具有特定特性的信号部分,从而提供对应的识别的信号部分。通过一种方法,例如,此信号部分可以包括预定时间或数据量,诸如,上述帧。在此类情况下,此步骤可以包括识别展现感兴趣的特定特性的特定帧。
通过一种方法,此特定特性可以包括预定能量水平。在此类情况下,识别信号中具有感兴趣的特定特性的信号部分的步骤可以包括识别至少展现例如此预定能量水平的信号部分。
然后,此处理100呈现步骤103,步骤103使用这些识别的信号部分自动地确定信号的至少一个边界频率。例如,这可以包括根据需要确定信号的下边界频率、上边界频率或者上边界频率和下边界频率两者。通过一种方法,由于可以包括信号,此步骤可以包括根据音频内容的顺序样本组的至少一些顺序序列中的每一个来自动地确定信号的至少一个边界频率。例如,正如上文提到,可能有用的是,在许多应用设置中对顺序音频内容样本组的确定,其中,每组表示大约1秒至大约3秒的音频内容。
在这方面中,本领域的技术人员可以注意到且理解,根据倾向于表征给定应用设置的需要和/或机会,上述组和上述信号部分可以彼此紧密相关或不紧密相关。通过一种方法,例如,上述识别的信号部分可以落入上述组。然而,将理解,为了确定边界频率而选择的组不一定必须从顺序序列组选择。例如,选择的组可以在时间上彼此重叠。
如果需要,则此处理100将按照各种方式的任何一种容易适应执行这些步骤。通过一种方法,例如,这些步骤可以包括:计算识别的信号部分中的每个的幅度频谱。然后,该幅度频谱可以用于根据对应的归一化的信号部分来确定带通内的对应的平坦度测量,从而提供核实的信号部分。例如,此类方法将支持进一步的步骤,该进一步的步骤积累核实的信号部分的幅度频谱,以提供对应的积累的幅度频谱,使用该积累的幅度频谱来估计与核实的信号部分相对应的信号包络,并且然后使用该信号包络来确定上述(一个或多个)边界频率。
作为这个方面中的另一示例,如果需要,则此处理100将容易地适应使用幅度频谱的转换版本以影响上述积累。此类转换可以基于幅度频谱本身,但是在此类情况下,将不积累幅度频谱本身。在这方面中有用的转换包括但不限于:将幅度频谱提升到除了1之外的功率(诸如但不限于,大于1的功率),对幅度频谱执行log运算,然后是乘法步骤(例如,将结果转换为分贝)等等。
为了说明起见,在这些方面中现将提供根据特定示例的附加细节。本领域的技术人员将认识和理解,此示例的详情仅用于说明目的,而不提供这些详情包括在这方面中所有此类可能性的穷尽列表的任何建议或意图。
在不是非典型人工语音带宽扩展(BWE)系统中,通过基于从窄带语音本身提取的参数合成丢失信息来将(例如,300-3400Hz内包含的)输入窄带语音转换为对应的宽带语音(诸如,100-8000Hz)输出。首先,使用线性预测(LP)系数分析来分析此输入窄带(NB)语音,以提取频谱包络。根据NB系数,估计宽带LP系数(例如,使用现有技术中已知的码本映射)。还使用窄带LP系数对输入语音进行逆滤波,以获得(1∶2)上采样域中的NB激励信号。
根据此信号,(例如,使用诸如矫正的非线性操作)合成宽带(WB)激励信号。然后,使用LP滤波器(采用所估计的WB系数)对WB激励进行滤波并且合成宽带语音。所得到的合成宽带语音经过高通滤波并且被添加到输入NB语音(1∶2上采样的版本),以获得所估计的宽带输出语音。
此类BWE系统的典型应用情形是蜂窝电话,其中,此类系统可以用于扩展所接收到的音频的带宽,以增强用户体验。在设计用于此类应用的BWE系统中,通常假设输入NB信号具有特定带宽,诸如300-3400Hz。然而,在许多应用设置中,信道的带宽不固定,而是可以根据呼叫不同而变化(或者即使在单个呼叫体验中也能变化)。
当前教导允许检测所接收到的信号的频带边缘,使得在相当大地程度上保留原始信息(例如,从大约200到3600Hz),并且仅在要求的情况下或者在至少可能有帮助的情况下,才添加人工生成的信息(例如,从大约100至200Hz以及从大约3600至8000Hz)。
现参照图2,示出了符合这些教导的一种频带边缘检测算法的说明性示例。在第一步骤201中,输入NB语音由连续样本块组成,在此被称为帧。例如,第k帧可以被表示为:
Fk={s(nk+i),i=0,1,...,N-1}
其中,s(n)是通过[-1,1)限界的样本索引n处的语言样本,与帧Fk的第一样本相对应的样本索引是nk,并且N是帧长。
相继的帧可以彼此重叠,并且Fk+1相对于Fk中的新样本的数目被称为增量。为了说明性示例的目的,N被选择为1024(以8kHz采样128ms),并且增量被选择为120(以8kHz采样15ms)。然后,语音的每个帧点乘适当的窗口W,以获得加窗的语音帧Fk,w。适当的窗口是Hamming、Hann等。在此示例中,使用通过下式定义的升余弦窗:
W(i)=0.5*(1-cos(2·πi/N),i=0,1,...,N-1.
加窗的语音帧可以被表示为
Fk,w={s(nk+i)·W(i),i=0,1,...,N-1}.
在如上所述构成加窗的语音帧之后,在第二步骤202中,计算其能量如下
并且,当能量超过特定阈值时,进一步处理帧。否则,流程返回到第一步骤201,以构成下一帧。在此说明性示例中,在额定信号电平-26dBov,使用的能量阈值是-50dB。此步骤202确保在检测频带边缘中仅使用具有充足能量的帧。
当帧具有充足的能量时,此处理提供第三步骤203,以通过将其样本的每一个除以其能量的平方根来对帧进行归一化。归一化确保在检测频带边缘中使用的每个帧被给予相同的权重。本领域的技术人员将认识到,替代加权方案是能的。简化该表示法,归一化的帧可以表示为
然后通过快速傅里叶变换来获得归一化的帧的幅度频谱M(l)
M(l)=|X(l)|
其中,l是频率索引,并且对于N=1024,每个频率索引是步长8000/1024=7.8125Hz的倍数。
在第四步骤204中,检查幅度频谱的平坦度。例如,这可以通过估计通带(例如,300-3400Hz)内的频谱平坦度测量(sfm)来完成。在此示例中,频谱平坦度测量被定义为频谱值的几何平均与算数平均之比。sfm范围从峰值频谱(即,非平坦)0到完全平坦的频谱1。
在此说明性示例中,使用通带(300-3400Hz)内的12个等宽频带来计算sfm,如下。
当sfm大于阈值时,帧的幅度频谱用于进一步处理。否则,流程返回到第一步骤201。在此说明性示例中,sfm阈值被选择为0.5。此步骤确保用于频带边缘检测的帧在通带中具有适度平坦的频谱。本领域的技术人员还将理解,存在用于实现此的替代方式。例如,可以使用LP建模来计算帧的预测增益,并且仅当预测增益低于阈值时,才选择用于频带边缘检测中使用的帧。
当帧具有适度平坦的频谱时,在第五步骤205中,积累帧的幅度频谱,并且递增在积累中使用的帧的计数。如果需要,则还可以积累能量频谱(例如,通过将幅度频谱增加到第二功率,或者将幅度频谱提高到某个其他功率)。
在第六步骤206中,检查对于所积累的幅度频谱的帧计数,以弄清楚其是否至少等于指定阈值(诸如,在此说明性示例中,100)。当不是这种情况时,流程返回到第一步骤。
当已经积累了足够数目的幅度频谱时,在第七步骤207中进一步处理所积累的频谱。首先,通过对log频谱进行IFFT(逆快速傅里叶变换)来计算线性频率倒谱系数(LFCC)为:
通过将除了由{C(m),m=-M1,-(M1-1),...,0,1,...,M1-1,M1}表示的集合之外的所有LFCC设置为0并且如下进行FFT,可以获得log频谱包络:
其中,可以通过加N来将m的负值转换为正值。在此说明性示例中,M1被选择为14。
根据log频谱包络LS(l),可以估计较低或较高的频带边缘。例如,通带内log频谱的均值可以被估计为:
其中,lp1和lp2表示通带内较低和较高索引。在此说明性示例中,lp1=51并且lp2=422。
较低频带边缘可以被估计为索引l1,在索引l1,log谱包络是在LSmean之下的TL dB。这通过在适当的范围内(诸如115-265Hz)搜索并且选择log频谱包络值LS(l1)最接近于(LSmean-TL)的索引很容易实现。替代地,可以找到包括期望包络值的两个索引,并且使用线性内插来获得较低频带边缘的分数索引值。
通过在适当的范围内(诸如3450-3750Hz)搜索来类似地找到较高频带边缘lh,以找到LS(lh)是(LSmean-TH)dB的索引。对于阈值TL和TH,适当的值是大约10dB。注意到,用于检测较低频带边缘和较高频带缘边的搜索范围以及阈值TL和TH的选择取决于输入NB语音,也就是说,语音是干净的还是编码的、使用了什么类型的编码器、信噪比以及、可以唯一地用在给定应用设置中的其他因素。在期望的应用中,这些可以按照经验来选择用于最佳性能。还可能有用的是,使用一对陷波滤波器(分别在大约0Hz和4000Hz的凹陷)来处理输入NB语音,以确保log频谱包络在两个边缘衰减。
然后,在预先设计的校准带宽的情况下,使用所检测到的信号的频带边缘,将所检测到的频带边缘(即,l1和lh)分别转换成对应的频率值F1和Fh Hz。
一旦检测到频带边缘,则将他们合并到BWE中以增强其性能是相当直接的。例如,出于示例起见而假设,BWE系统已经被设计用于带宽300-3400Hz,但是通过频带边缘检测算法检测到的实际信号带宽是200-3600Hz。为了包括高端的附加信号带宽,可以仅将HPF的截止频率从3400Hz移动到3600Hz。替代地,还可以将原始信号与在3400-3600Hz频带内人工生成的信号逐步结合。类似地,在低端,可以将低频带提升特性降低100Hz(从300Hz到200Hz)。
本领域的技术人员将理解,可以使用各种各样的可用和/或容易配置的平台来容易地启用上述处理,包括本领域已知的部分或全部可编程平台或者某些应用可能期望的专用平台。现参照图3,现将提供对此类平台的说明性方法。
在此示例中,装置300包括处理器301,处理器301可操作地耦合到存储器302,在存储器302中存储了要处理的上述信号。本领域的技术人员将认识和理解,此类处理器可以包括固定目的硬连线平台或者可以包括部分或全部可编程平台。这些架构选项都是本领域可以公知和理解的,并且在此不需要进一步描述。
处理器301可以被配置成(例如,经由本领域的技术人员将公知的对应编程)实现在此阐述的一个或多个步骤、动作和/或功能。通过一种方法,例如,这可以包括配置处理器301:通过至少部分地使用高频带边缘的最低期望值,使用达到检测到的高频带边缘的可用窄带信号,并且使用所检测到的高频带边缘之上的带宽扩展信号以表示信号自动执行带宽扩展,使用高频带检测执行信号的带宽扩展(如在此教导,通过根据信号的顺序样本组的至少一些顺序序列的每一个来确定信号的对应边界频率)。
当然,也可以进行很多同样的操作以适应低频带内容。例如,通过一种方法,处理器301可以被编程为检测在低频带边缘的最高期望值之下的低频带边缘以提供对应的检测到的低频带边缘,基于所检测到的低频带边缘来调整低频带提升特性以提供已调整的低频带提升特性,并且将已调整的低频带提升特性应用于信号以获得已提升的低频带信号。
本领域的技术人员将认识和理解,此类装置300可以包括由图3所示的说明建议的多个物理上不同的元件。然而,也可以将此说明视为包括逻辑视图,在这种情况下,可以经由共享平台来启用和实现这些元件中的一个或多个。还将理解,此类共享平台可以包括如本领域已知的全部或至少部分可编程平台。
如此配置,这些教导将容易地结合带宽扩展方法应用,以更好地促进此类处理。这些教导也是高度可缩放的,并且可以与各种此类方法一起使用且结合要处理的各种各样的信号来使用。
本领域的技术人员将认识到,在不脱离本发明的精神和范围的情况下,可以对上述实施例进行各种修改、更改和组合,并且此类修改、更改和组合将被认为在本发明概念的范围内。
Claims (6)
1.一种用于信号处理的方法,包括:
在信号处理平台处;
呈现要处理的信号;
识别至少展现预定能量水平的信号部分,以提供识别的信号部分;
通过计算所述识别的信号部分中每个的幅度频谱,来使用所述识别的信号部分自动地确定所述信号的至少一个边界频率,以及根据对应的归一化信号部分,使用所述幅度频谱来确定通带内的对应平坦度测量,从而提供核实的信号部分。
2.如权利要求1所述的方法,其中,呈现要处理的信号的步骤包括:呈现音频内容。
3.如权利要求2所述的方法,其中,呈现信号的步骤进一步包括:呈现所述音频内容的多个顺序样本。
4.如权利要求3所述的方法,其中,自动地确定所述信号的至少一个边界频率的步骤包括:根据所述音频内容的顺序样本组中至少一些顺序序列中的每一个,自动地确定所述信号的所述至少一个边界频率。
5.如权利要求4所述的方法,其中,所述音频内容的每个所述顺序样本组表示从大约1秒到大约3秒的所述音频内容。
6.如权利要求1所述的方法,其中,自动地确定所述信号的至少一个边界频率的步骤进一步包括:
积累所述核实的信号部分的所述幅度频谱,以提供积累的幅度频谱;
使用所述积累的幅度频谱来估计与所述核实的信号部分相对应的信号包络;
使用所述信号包络来确定所述至少一个边界频率。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/195,837 | 2008-08-21 | ||
US12/195,837 US8463412B2 (en) | 2008-08-21 | 2008-08-21 | Method and apparatus to facilitate determining signal bounding frequencies |
PCT/US2009/051331 WO2010021804A1 (en) | 2008-08-21 | 2009-07-22 | Method and apparatus to facilitate determining signal bounding frequencies |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102144258A CN102144258A (zh) | 2011-08-03 |
CN102144258B true CN102144258B (zh) | 2013-05-01 |
Family
ID=41055250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801326212A Active CN102144258B (zh) | 2008-08-21 | 2009-07-22 | 促进确定信号边界频率的方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8463412B2 (zh) |
EP (1) | EP2316118B1 (zh) |
KR (1) | KR101250596B1 (zh) |
CN (1) | CN102144258B (zh) |
WO (1) | WO2010021804A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
ES2400661T3 (es) * | 2009-06-29 | 2013-04-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificación y decodificación de extensión de ancho de banda |
CN102208188B (zh) | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
JP6010539B2 (ja) | 2011-09-09 | 2016-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法および復号方法 |
JP5945626B2 (ja) * | 2012-03-29 | 2016-07-05 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | ハーモニックオーディオ信号の帯域幅拡張 |
KR20180040716A (ko) | 2015-09-04 | 2018-04-20 | 삼성전자주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
CN115765898B (zh) * | 2022-11-18 | 2024-04-12 | 中国舰船研究设计中心 | 一种基于最大值双边单调的频谱包络提取方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539355B1 (en) * | 1998-10-15 | 2003-03-25 | Sony Corporation | Signal band expanding method and apparatus and signal synthesis method and apparatus |
CN1441403A (zh) * | 1997-04-30 | 2003-09-10 | 日本放送协会 | 话速变换方法及其装置 |
CN1750124A (zh) * | 2004-09-17 | 2006-03-22 | 哈曼贝克自动系统股份有限公司 | 带限音频信号的带宽扩展 |
EP1892703A1 (en) * | 2006-08-22 | 2008-02-27 | Harman Becker Automotive Systems GmbH | Method and system for providing an acoustic signal with extended bandwidth |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
JPH02166198A (ja) | 1988-12-20 | 1990-06-26 | Asahi Glass Co Ltd | ドライクリーニング用洗浄剤 |
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
US5245589A (en) * | 1992-03-20 | 1993-09-14 | Abel Jonathan S | Method and apparatus for processing signals to extract narrow bandwidth features |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JPH07160299A (ja) * | 1993-12-06 | 1995-06-23 | Hitachi Denshi Ltd | 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式 |
DE69619284T3 (de) * | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
JP3522954B2 (ja) * | 1996-03-15 | 2004-04-26 | 株式会社東芝 | マイクロホンアレイ入力型音声認識装置及び方法 |
US5794185A (en) * | 1996-06-14 | 1998-08-11 | Motorola, Inc. | Method and apparatus for speech coding using ensemble statistics |
US5949878A (en) * | 1996-06-28 | 1999-09-07 | Transcrypt International, Inc. | Method and apparatus for providing voice privacy in electronic communication systems |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6453287B1 (en) * | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
JP2000305599A (ja) * | 1999-04-22 | 2000-11-02 | Sony Corp | 音声合成装置及び方法、電話装置並びにプログラム提供媒体 |
US7330814B2 (en) * | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
DE10041512B4 (de) * | 2000-08-24 | 2005-05-04 | Infineon Technologies Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
WO2002029782A1 (en) * | 2000-10-02 | 2002-04-11 | The Regents Of The University Of California | Perceptual harmonic cepstral coefficients as the front-end for speech recognition |
US6990446B1 (en) * | 2000-10-10 | 2006-01-24 | Microsoft Corporation | Method and apparatus using spectral addition for speaker recognition |
US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
DE60117471T2 (de) * | 2001-01-19 | 2006-09-21 | Koninklijke Philips Electronics N.V. | Breitband-signalübertragungssystem |
SE522553C2 (sv) | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP3579047B2 (ja) * | 2002-07-19 | 2004-10-20 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR100917464B1 (ko) * | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US20050065784A1 (en) * | 2003-07-31 | 2005-03-24 | Mcaulay Robert J. | Modification of acoustic signals using sinusoidal analysis and synthesis |
US7461003B1 (en) * | 2003-10-22 | 2008-12-02 | Tellabs Operations, Inc. | Methods and apparatus for improving the quality of speech signals |
JP2005136647A (ja) * | 2003-10-30 | 2005-05-26 | New Japan Radio Co Ltd | 低音ブースト回路 |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US7295607B2 (en) | 2004-05-07 | 2007-11-13 | Broadcom Corporation | Method and system for receiving pulse width keyed signals |
KR100708121B1 (ko) | 2005-01-22 | 2007-04-16 | 삼성전자주식회사 | 음성 신호의 대역 확장 방법 및 장치 |
NZ562182A (en) * | 2005-04-01 | 2010-03-26 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
US20060224381A1 (en) * | 2005-04-04 | 2006-10-05 | Nokia Corporation | Detecting speech frames belonging to a low energy sequence |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
DK1875463T3 (en) * | 2005-04-22 | 2019-01-28 | Qualcomm Inc | SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY |
US8311840B2 (en) * | 2005-06-28 | 2012-11-13 | Qnx Software Systems Limited | Frequency extension of harmonic signals |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
EP1772855B1 (en) * | 2005-10-07 | 2013-09-18 | Nuance Communications, Inc. | Method for extending the spectral bandwidth of a speech signal |
US7490036B2 (en) * | 2005-10-20 | 2009-02-10 | Motorola, Inc. | Adaptive equalizer for a coded speech signal |
US20070109977A1 (en) * | 2005-11-14 | 2007-05-17 | Udar Mittal | Method and apparatus for improving listener differentiation of talkers during a conference call |
US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
US7835904B2 (en) * | 2006-03-03 | 2010-11-16 | Microsoft Corp. | Perceptual, scalable audio compression |
US7844453B2 (en) * | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US20080004866A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Artificial Bandwidth Expansion Method For A Multichannel Signal |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
US8229106B2 (en) * | 2007-01-22 | 2012-07-24 | D.S.P. Group, Ltd. | Apparatus and methods for enhancement of speech |
US8688441B2 (en) | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8433582B2 (en) | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
-
2008
- 2008-08-21 US US12/195,837 patent/US8463412B2/en not_active Expired - Fee Related
-
2009
- 2009-07-22 EP EP09790695.2A patent/EP2316118B1/en active Active
- 2009-07-22 WO PCT/US2009/051331 patent/WO2010021804A1/en active Application Filing
- 2009-07-22 CN CN2009801326212A patent/CN102144258B/zh active Active
- 2009-07-22 KR KR1020117003805A patent/KR101250596B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1441403A (zh) * | 1997-04-30 | 2003-09-10 | 日本放送协会 | 话速变换方法及其装置 |
US6539355B1 (en) * | 1998-10-15 | 2003-03-25 | Sony Corporation | Signal band expanding method and apparatus and signal synthesis method and apparatus |
CN1750124A (zh) * | 2004-09-17 | 2006-03-22 | 哈曼贝克自动系统股份有限公司 | 带限音频信号的带宽扩展 |
EP1892703A1 (en) * | 2006-08-22 | 2008-02-27 | Harman Becker Automotive Systems GmbH | Method and system for providing an acoustic signal with extended bandwidth |
Non-Patent Citations (2)
Title |
---|
ANNADANA ET AL.A Novel Audio Post-Processing Toolkit for the Enhancement of Audio.《PROCEEDINGS AES 123RD CONVENTION》.2007, * |
ARORA ET AL.High Quality Blind Bandwidth Extension of Audio for Portable Player Applications.《PROCEEDINGS AEC 120TH CONVENTION》.2006, * |
Also Published As
Publication number | Publication date |
---|---|
KR20110043695A (ko) | 2011-04-27 |
CN102144258A (zh) | 2011-08-03 |
EP2316118A1 (en) | 2011-05-04 |
RU2011110493A (ru) | 2012-09-27 |
WO2010021804A1 (en) | 2010-02-25 |
KR101250596B1 (ko) | 2013-04-03 |
US20100049342A1 (en) | 2010-02-25 |
EP2316118B1 (en) | 2016-07-13 |
US8463412B2 (en) | 2013-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102144258B (zh) | 促进确定信号边界频率的方法和装置 | |
CN101976566B (zh) | 语音增强方法及应用该方法的装置 | |
RU2507608C2 (ru) | Устройства и способы для обработки аудио сигнала с целью повышения разборчивости речи, используя функцию выделения нужных характеристик | |
WO2021114733A1 (zh) | 一种分频段进行处理的噪声抑制方法及其系统 | |
EP1744305B1 (en) | Method and apparatus for noise reduction in sound signals | |
CN101894563B (zh) | 语音增强的方法 | |
CN109378013B (zh) | 一种语音降噪方法 | |
CN103021420B (zh) | 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法 | |
EP3040991A1 (en) | Voice activation detection method and device | |
EP2629294A2 (en) | System and method for dynamic residual noise shaping | |
JP4660578B2 (ja) | 信号補正装置 | |
EP2416315A1 (en) | Noise suppression device | |
CN1679083A (zh) | 不利环境中的多信道语音检测 | |
CN101878416A (zh) | 音频信号的带宽扩展的方法和设备 | |
CN101154382A (zh) | 检测风噪声的方法及其系统 | |
CN103544961A (zh) | 语音信号处理方法及装置 | |
JP6439682B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
CN103886865A (zh) | 声音处理装置、声音处理方法和程序 | |
CN102314883B (zh) | 一种判断音乐噪声的方法以及语音消噪方法 | |
CN103578466A (zh) | 基于分数阶傅里叶变换的语音非语音检测方法 | |
TW201606753A (zh) | 用以估計音訊信號中雜訊之方法、雜訊估計器、音訊編碼器、音訊解碼器、及用以傳送音訊信號之系統 | |
EP2689418B1 (en) | Method and arrangement for damping of dominant frequencies in an audio signal | |
Amehraye et al. | Perceptual improvement of Wiener filtering | |
CN111968651A (zh) | 一种基于wt的声纹识别方法及系统 | |
CN1991980A (zh) | 去除语音信号中背景噪声的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: Illinois State Patentee after: MOTOROLA MOBILITY LLC Address before: Illinois State Patentee before: MOTOROLA MOBILITY, Inc. |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20181212 Address after: California, USA Patentee after: Google Technology Holdings LLC Address before: Illinois State Patentee before: MOTOROLA MOBILITY LLC |