CN1520590A - 宽带信号传输系统 - Google Patents
宽带信号传输系统 Download PDFInfo
- Publication number
- CN1520590A CN1520590A CNA028127382A CN02812738A CN1520590A CN 1520590 A CN1520590 A CN 1520590A CN A028127382 A CNA028127382 A CN A028127382A CN 02812738 A CN02812738 A CN 02812738A CN 1520590 A CN1520590 A CN 1520590A
- Authority
- CN
- China
- Prior art keywords
- amplitude
- frequency
- bandwidth
- audio signal
- marking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008054 signal transmission Effects 0.000 title description 2
- 238000001228 spectrum Methods 0.000 claims abstract description 80
- 230000005540 biological transmission Effects 0.000 claims abstract description 43
- 230000005236 sound signal Effects 0.000 claims abstract description 35
- 239000004606 Fillers/Extenders Substances 0.000 claims abstract description 28
- 238000013507 mapping Methods 0.000 claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Transmitters (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
描述了一种传输系统(10),它包括通过传输信道(16)向接收机(14)发送窄带音频信号的发射机(12)。接收机(14)包括频域带宽扩展器(18),它利用接收到的窄带音频信号的高频带扩展对该信号作补充,从而扩展接收到的窄带音频信号的带宽。带宽扩展器(18)包括振幅扩展器(24),用于将窄带振幅映射到高频带振幅从而扩展接收到的窄带音频信号的振幅频谱带宽,带宽扩展器(18)还包括:相位扩展器(26),用于扩展接收到的窄带信号的相位频谱带宽;和组合器(28),用于将扩展振幅频谱和扩展相位频谱组合成带宽扩展音频信号,传输系统的特征在于振幅扩展器(24)包括振幅映射器(42)以及第一和第二频标变换器(40,44),第一频标变换器(40)配置用于将所述振幅频谱的线性频标变换成对数频标,例如Bark刻度。振幅映射器(42)配置用于根据对数频标将窄带振幅映射到高频带振幅。第二频标变换器(44)配置用于将扩展振幅频谱的对数频标变换成线性频标。
Description
本发明涉及传输系统,它包括通过传输信道向接收机传送窄带音频信号的发射机,该接收机包括频域带宽扩展器,频域带宽扩展器通过用接收到的窄带音频信号的高频扩展对该信号进行补充,从而扩展接收到的窄带音频信号的带宽。带宽扩展器包括振幅扩展器,用于通过将窄带振幅映射到高频带振幅,从而扩展接收到的窄带音频信号的振幅频谱带宽;带宽扩展器还包括:相位扩展器,用于扩展接收到的窄带信号的相位频谱带宽;以及组合器,用于将扩展振幅频谱和扩展相位频谱组合成带宽扩展音频信号。
本发明还涉及一种接收机,用于通过传输信道接收来自发射机的窄带音频信号;本发明还涉及一种通过传输信道接收窄带音频信号的方法。
根据前序部分的传输系统从Hynek Hermansky等人的论文“基于时间处理的语音增强”(proceedings of the 1995 IEEE InternationalConference on Acoustics,Speech,and Signal Processing,pp.405-408)中得知。
这种传输系统可用于,例如通过诸如无线信道、同轴电缆或者光纤的传输媒体传输音频信号,例如语音信号或者音乐信号。这种传输系统还可以用于在诸如磁带或者磁盘的记录媒体上记录这种音频信号。可能的应用有自动应答机、录音机、(移动)电话或者MP3播放机。
现有电话网中所用的窄带语音带宽为3100Hz(300-3400Hz)。如果带宽提高到约7kHz(50-7000Hz),则语音听起来会更自然。具有这种带宽的语音叫做宽带语音,它具有附加的低频带(50-300Hz)和高频带(3400-7000Hz)。从窄带语音信号有可能通过外插法产生高频带和低频带。所得的语音信号称之为伪宽带语音信号。例如,从论文″编码窄带语音的宽带增强新技术″(IEEE Speech CodingWorkshop 1999,June 20-23,1999,Porvoo,Finland)中,已经知道几种用于扩展窄带信号带宽的技术。这些技术用于改善诸如电话网的窄带网络中的语音质量,而不改变所述网络。在接收侧(例如移动电话或者电话应答机),可以将窄带语音扩展为伪宽带语音。
已知传输系统的接收机包括频域带宽扩展器,用于扩展接收到的窄带语音信号的带宽。这种带宽扩展器包括长度为128的FFT,用于将接收到的时域窄带语音信号变换成频域窄带语音信号。接着,分别扩展这种频域信号的振幅频谱和相位频谱的带宽,随后将得到的宽带振幅频谱和宽带相位频谱组合成频域宽带语音信号。通过将128点窄带振幅频谱映射到128点高频带振幅频谱来执行振幅频谱的带宽扩展。
已知传输系统中接收到的窄带信号的振幅频谱的带宽扩展相对复杂,因为它需要执行相当大量的计算,并因为它要求较大的存储器存储(中间)数据。
本发明的目的是提供开头段落中描述的传输系统,这种传输系统相对简单,所要求的计算较少,存储器较小。此目的于根据本发明的传输系统中实现,该传输系统的特征在于,所述振幅扩展器包括振幅映射器以及第一和第二频标变换器,第一频标变换器经配置,用于将振幅频谱的线性频标变换成对数频标,振幅映射器经配置,用于根据对数频标将窄带振幅映射到高频带振幅上,第二频标变换器经配置,用于将扩展振幅频谱的对数频标转换为线性频标。通过将振幅频谱的线性频标(它被划分成相对精细的大小相等的单位)转换成对数频标(它被划分成相对较粗的大小递增的单元),振幅频谱包括比原来的线性频标振幅频谱少得多的数据,结果窄带振幅到高频带振幅的映射要求的计算较少,且要求的存储器较小。最好选择所谓的Bark刻度的对数频标。或者,可以利用ERB对数频标。
图5显示宽带语音信号的Bark刻度频谱和线性频标频谱的例示。虚线表示线性频率频谱,实线表示根据Bark刻度的频率区。一个频率区中的各频率具有相同的振幅(即为所有振幅频标频谱的平均值)。当采用Bark刻度时,语音信号的窄带部分(即低于4000Hz)可以只用18个振幅表示,而语音信号的高频带部分(即高于4000Hz)可以用4个振幅表示。现在,不用将128点窄带振幅频谱映射到128点高频带振幅频谱上(如同已知传输系统中的做法),将18个窄带振幅映射到4个高频带振幅上就足够了,显然这样的计算效率高得多,而且要求的存储器较少。还发现,当把数量较大的窄带振幅映射到数量较小的高频带振幅上时,计算得到的高频带振幅非常精确。
根据本发明的传输系统的一个实施例的特征在于,所述振幅映射器还包括从多个映射矩阵中选择映射矩阵的矩阵选择器和用于将窄带振幅与选中的映射矩阵相乘以获得高频带振幅的矩阵乘法器。已经证明,使用映射矩阵是将窄带振幅映射到高频带振幅的有效途径。用于扩展振幅频谱的映射矩阵仅需要少量的数据ROM(只读存储器)。前面段落里描述的示例中的矩阵为18×4。常用的扩展方法是使用编码本,为了取得可比性能,它消耗较多的数据ROM。而且这种编码本方法的计算复杂度较高,因为必须搜索编码本各条目以得到最佳匹配。国际专利申请WO 01/35395(PCT/EP00/10761,PHF99607)中更详细地描述了用于宽带语音合成目的的映射矩阵应用。
根据本发明的另一传输系统实施例的特征在于,所述振幅映射器还包括用于将窄带振幅归一化的归一化装置和根据接收到的窄带信号的音量对高频带振幅定标的缩放装置。以这种方式,对不依赖于实际窄带语音信号音量的归一化窄带振幅执行实际的映射操作。在映射操作完成之后,通过对高频带振幅定标,从而再包含原来的音量信息。
根据本发明的传输系统的另一实施例的特征在于,振幅映射器还包括用于平滑高频带振幅的平滑装置。当前的高频带振幅最好使用之前帧的高频带振幅进行平滑处理,从而避免振幅的突变。
根据以下参照附图对最佳实施例的描述,本发明的以上目的和特性将变得显而易见,附图中:
图1显示根据本发明的传输系统10的实施例的框图,
图2显示根据本发明的传输系统10中所用的带宽扩展器18的
实施例的框图,
图3显示根据本发明的传输系统10中所用的振幅扩展器24的
实施例的框图,
图4显示根据本发明的传输系统10中所用的振幅映射器42的实施例的框图,
图5显示宽带语音信号的Bark刻度频谱和线性频标频谱的示例,它将用于解释根据本发明的传输系统的操作。
在这些图中,相同的部分用相同的标号指示。
图1显示根据本发明的传输系统10的实施例的框图。传输系统10包括发射机12,用于通过传输信道16向接收机14传送窄带音频信号,例如窄带语音信号或者窄带音乐信号。传输系统10可以是电话通信系统,其中,发射机可以是(移动)电话,而接收机可以是(移动)电话或者应答机。接收机14包括频域带宽扩展器18,它利用接收到的窄带音频信号的高频带扩展对该信号进行补充,从而扩展接收到的窄带音频信号的带宽。
图2显示根据本发明的传输系统10所用的带宽扩展器18的实施例的框图。首先将接收到的窄带音频信号分段成10ms的帧(或采样频率为8000Hz的80个样本),这样每帧与其相邻帧有5ms的重叠。接着,每帧使用汉明窗20进行开窗处理。随后,对开窗处理过的信号应用长度为128的FFT 22(快速傅立叶变换),得到长度为128的复频谱S。将复频谱S变换为它的振幅频谱|S|和相位频谱,如下所示:
以及
其中,Sr表示S的实数部分,而Sl表示S的虚数部分。修改振幅频谱|S|和相位频谱,以便实现带宽扩展。
带宽扩展器18包括振幅扩展器24,用于通过将窄带振幅映射到高频带振幅,从而扩展接收到的窄带音频信号的振幅频谱|S|的带宽。带宽扩展器18还包括用于扩展接收到的窄带信号的相位频谱带宽的相位扩展器26和将扩展的振幅频谱|Se|和扩展的相位频谱e组合成带宽扩展音频信号的组合器28。振幅频谱|Se|和相位频谱e通过下式转换成频谱Se:
通过对Se应用长度为256的反FFT 30并取起始的160个样本获得时间信号Se。由于采样频率为16kHz,因此这对应10ms,这样。应用具有与前一帧和后一帧有5ms重叠的重叠相加(OLA)过程32。因为这些帧已经用汉明窗作了开窗处理,因此无需再作开窗处理。
相位频谱e可以通过对窄带频谱上采样而加以扩展。结果是4与8kHz之间的相位频谱为0到4kHz频带中的相位频谱的镜像型式。有可能这样简单地实现这种过程:通过将128点相位频谱的镜像并取反的型式与原来的相位频谱合并,从而获得256点的用c表示的伪宽带频谱。此外,在无声语音情况下,随机序列可以在镜像之前加到高频带相位频谱中。对于这种目的,有声/无声检测器可能有用。
图3显示根据本发明的传输系统10所用的振幅扩展器24的实施例的框图。振幅扩展器24包括振幅映射器42以及第一和第二频标变换器40和44。第一频标变换器40经配置,用于将振幅频谱的线性频标变换成对数频标。振幅映射器42经配置,用于根据对数频标,将窄带振幅映射到高频带振幅上。第二频标变换器44经配置,用于将扩展的振幅频谱的对数频标变换成线性频标。
振幅频谱|S|的频率和振幅都是线性的。两种刻度上都采用非均匀变换。线性频标在第一频标变换器40中变换到属于所谓的Bark刻度的临界带宽,Bark刻度是具有临界带宽的对数刻度。频率f的相应临界带宽由下式给出:
针对每个临界频带中的一个频率对振幅频谱|S|采样。低于4kHz的频带中有18个采样点,而在高频带中有4个点。然后,采样频谱|Sw|的振幅通过下式变换到对数域:
An=20log10|Sw| (5)
在振幅映射器42中用映射矩阵执行振幅扩展(即根据Bark频标将窄带振幅映射到高频带振幅上)。多映射矩阵的应用在国际专利申请WO 01/35395(PCT/EP00/10761,PHF99607)中描述,其中,对LPC参数应用多映射矩阵。在这种方法中,对18个窄带振幅An执行扩展将会得到4个高频带振幅Ah。
然后,在第二频标变换器44中,高频带振幅从对数Bark刻度转换到线性频标。这可用两种方式完成。一种方式是使全部临界频带的振幅恒定。也可能对振幅点作多项式拟合(即所谓的样条拟合)。这种更为复杂的方法导致更好的语音质量。同样将振幅变换到线性域。通过把该高频带振幅频谱和窄带振幅频谱合并,获得长度为256的伪宽带振幅频谱|Sc|。
图4显示根据本发明的传输系统10所用的振幅映射器42的实施例的框图。如前所述,对18个窄带振幅An执行映射或者扩展,将会得到4个高频带振幅Ah。这是根据如下步骤完成的:首先,在归一化装置50中,通过从窄带振幅中减去平均值将窄带振幅归一化:
接着,在矩阵选择器52中,基于窄带振幅频谱|S|,从多个映射矩阵中选出一个映射矩阵。例如,多个映射矩阵可能包括10个矩阵:5个用于有声语音,5个用于无声语音。有声/无声检测器可用于将频带0到1kHz中的能量与频带0到4kHz中的能量相比较。如果能量差高于某个门限,则该帧可分为有声类,否则分为无声类。为了从5个(有声或者无声)矩阵中选出一个,可以使用频带0到1kHz中的能量与频带1到2kHz之间的能量差。矩阵和用于选择矩阵的门限可以通过训练获得。
之后,在矩阵乘法器54中,将归一化窄带振幅A与选中的映射矩阵相乘,以获得高频带振幅A′:
A′=M·A, (7)
其中,M是18×4的映射矩阵:
接下来,将计算得到的高频带振幅通过缩放装置56缩放到适当水平(即根据接收到的窄带信号量)。这种定标是通过加入窄带振幅的平均值而完成的:
最后,扩展了的频带振幅通过在当前振幅Ah中内插之前帧的振幅而加以平滑。
用于将窄带振幅映射到高频带振幅的矩阵数量可以改变。实验表明,在依然获得可接受语音质量的同时,有可能将矩阵数减少为4(而不是上述的10)。可以通过数字硬件或者由数字信号处理器执行的软件或者通过通用微处理器实现带宽扩展器18。
本发明的范围不限于这些明确公开的实施例。本发明实施在每个新特征和特征的每个组合中。任何标号并不限制所述权利要求的范围。单词“包括”不排除存在权利要求中所列举的以外的其它单元或步骤。在单元之前使用单词“一个”并不排除存在多个这样的单元。
Claims (11)
1.一种传输系统(10),包括:发射机(12),它通过传输信道(16)向接收机(14)传送窄带音频信号;接收机(14),它包括频域带宽扩展器(18),用于利用接收到的窄带音频信号的高频带扩展对该信号作补充从而扩展所述接收到的窄带音频信号的带宽,所述带宽扩展器(18)包括振幅扩展器(24),用于将窄带振幅映射到高频带振幅从而扩展所述接收到的窄带音频信号的振幅频谱带宽,所述带宽扩展器(18)还包括:相位扩展器(26),用于扩展所述接收到的窄带信号的相位频谱的带宽;以及组合器(28),用于将所述扩展振幅频谱和所述扩展相位频谱组合成带宽扩展音频信号,其特征在于:所述振幅扩展器(24)包括振幅映射器(42)以及第一和第二频标变换器(40,44),所述第一频标变换器(40)经配置,用于将所述振幅频谱的线性频标变换成对数频标,所述振幅映射器(42)经配置,用于根据所述对数频标将所述窄带振幅映射到所述高频带振幅,所述第二频标变换器(44)经配置,用于将所述扩展振幅频谱的对数频标变换成所述线性频标。
2.如权利要求1所述的传输系统(10),其特征在于所述对数频标是Bark刻度。
3.如权利要求1或2所述的传输系统(10),其特征在于所述振幅映射器(42)还包括:矩阵选择器(52),用于从多个映射矩阵中选择映射矩阵,以及矩阵乘法器(54),用于通过将所述窄带振幅与所述选中的映射矩阵相乘,从而获得所述高频带振幅。
4.如权利要求1至3中任何一项所述的传输系统(10),其特征在于所述振幅映射器(42)还包括归一化装置(50),用于将所述窄带振幅归一化,以及缩放装置(56),用于根据所述接收到的窄带信号的音量对所述高频带振幅进行缩放。
5.如权利要求1至4中任何一项所述的传输系统(10),其特征在于所述振幅扬声器(42)还包括平滑装置(58),用于平滑所述高频带振幅。
6.一种接收机(14),用于通过传输信道(16)从发射机(12)接收窄带音频信号,所述接收机(14)包括频域带宽扩展器(18),用于利用接收到的窄带音频信号的高频带扩展对该信号作补充从而扩展所述接收到的窄带音频信号的带宽,所述带宽扩展器(18)包括振幅扩展器(24),用于将窄带振幅映射到高频带振幅从而扩展所述接收到的窄带音频信号的振幅频谱带宽,所述带宽扩展器(18)还包括:相位扩展器(26),用于扩展所述接收到的窄带信号的相位频谱的带宽;以及组合器(28),用于将所述扩展振幅频谱和所述扩展相位频谱组合成带宽扩展音频信号,其特征在于:所述振幅扩展器(24)包括振幅映射器(42)以及第一和第二频标变换器(40,44),所述第一频标变换器(40)经配置,用于将所述振幅频谱的线性频标变换成对数频标,所述振幅映射器(42)经配置,用于根据所述对数频标将所述窄带振幅映射到所述高频带振幅,所述第二频标变换器(44)经配置,用于将所述扩展振幅频谱的对数频标变换成所述线性频标。
7.如权利要求6所述的接收机(14),其特征在于所述对数频标是Bark刻度。
8.如权利要求6或7所述的接收机(14),其特征在于所述振幅映射器(42)还包括:矩阵选择器(52),用于从多个映射矩阵中选择映射矩阵,以及矩阵乘法器(54),用于通过将所述窄带振幅与所述选中的映射矩阵相乘,从而获得所述高频带振幅。
9.一种通过传输信道(16)接收窄带音频信号的方法,所述方法包括:
-将窄带振幅映射到高频带振幅,从而扩展所述接收到的窄带音频信号的振幅频谱的带宽,
-扩展所述接收到的窄带信号的相位频谱的带宽,
-将所述扩展的振幅频谱和扩展的相位频谱组合成带宽扩展音频信号,其特征在于所述方法还包括:
-将所述振幅频谱的线性频标变换成对数频标,
-根据所述对数频标将所述窄带振幅映射到所述高频带振幅,
-将所述扩展振幅频谱的对数频标变换成所述线性频标。
10.如权利要求9所述的通过所述传输信道(16)接收所述窄带音频信号的方法,其特征在于所述对数频标是Bark刻度。
11.如权利要求9或10所述的通过所述传输信道(16)接收所述窄带音频信号的方法,其特征在于所述方法还包括:
-从多个映射矩阵中选择映射矩阵,
-将所述窄带振幅与所述选中的映射矩阵相乘,从而获得所述高频带振幅。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01202504.5 | 2001-06-28 | ||
EP01202504 | 2001-06-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1520590A true CN1520590A (zh) | 2004-08-11 |
CN1235192C CN1235192C (zh) | 2006-01-04 |
Family
ID=8180561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN02812738.2A Expired - Fee Related CN1235192C (zh) | 2001-06-28 | 2002-06-20 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7174135B2 (zh) |
EP (1) | EP1405303A1 (zh) |
JP (1) | JP2004521394A (zh) |
CN (1) | CN1235192C (zh) |
WO (1) | WO2003003350A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102339607A (zh) * | 2010-07-16 | 2012-02-01 | 华为技术有限公司 | 一种频带扩展的方法和装置 |
CN103684487A (zh) * | 2012-09-13 | 2014-03-26 | Nxp股份有限公司 | 减少多径干扰 |
CN103827967A (zh) * | 2011-12-27 | 2014-05-28 | 三菱电机株式会社 | 语音信号复原装置以及语音信号复原方法 |
CN104981871A (zh) * | 2013-02-15 | 2015-10-14 | 高通股份有限公司 | 个人化带宽扩展 |
CN107705801A (zh) * | 2016-08-05 | 2018-02-16 | 中国科学院自动化研究所 | 语音带宽扩展模型的训练方法及语音带宽扩展方法 |
CN110556123A (zh) * | 2019-09-18 | 2019-12-10 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7330814B2 (en) * | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
WO2003036623A1 (de) * | 2001-09-28 | 2003-05-01 | Siemens Aktiengesellschaft | Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
CN101656077B (zh) * | 2004-05-14 | 2012-08-29 | 松下电器产业株式会社 | 音频编码装置、音频编码方法以及通信终端和基站装置 |
WO2005111568A1 (ja) | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
CN101048649A (zh) * | 2004-11-05 | 2007-10-03 | 松下电器产业株式会社 | 可扩展解码装置及可扩展编码装置 |
ATE429011T1 (de) * | 2005-01-31 | 2009-05-15 | Harman Becker Automotive Sys | Bandbreitenerweiterung eines schmalbandigen akustischen signals |
DE602005001048T2 (de) | 2005-01-31 | 2008-01-03 | Harman Becker Automotive Systems Gmbh | Erweiterung der Bandbreite eines schmalbandigen Sprachsignals |
CA2603255C (en) * | 2005-04-01 | 2015-06-23 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
US8086451B2 (en) * | 2005-04-20 | 2011-12-27 | Qnx Software Systems Co. | System for improving speech intelligibility through high frequency compression |
US7813931B2 (en) * | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
EP1875464B9 (en) * | 2005-04-22 | 2020-10-28 | Qualcomm Incorporated | Method, storage medium and apparatus for gain factor attenuation |
US8311840B2 (en) * | 2005-06-28 | 2012-11-13 | Qnx Software Systems Limited | Frequency extension of harmonic signals |
US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
JP4766559B2 (ja) * | 2006-06-09 | 2011-09-07 | Kddi株式会社 | 音楽信号の帯域拡張方式 |
US7912729B2 (en) * | 2007-02-23 | 2011-03-22 | Qnx Software Systems Co. | High-frequency bandwidth extension in the time domain |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
EP2360687A4 (en) * | 2008-12-19 | 2012-07-11 | Fujitsu Ltd | VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD |
JP5223786B2 (ja) * | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
JP5928539B2 (ja) * | 2009-10-07 | 2016-06-01 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
MX2012004564A (es) | 2009-10-20 | 2012-06-08 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodo para codificar informacion de audio y programa de computacion que utiliza una reduccion de tamaño de intervalo interactiva. |
SG182464A1 (en) | 2010-01-12 | 2012-08-30 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, method for encoding and decoding an audio information, and computer program obtaining a context sub-region value on the basis of a norm of previously decoded spectral values |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
WO2012131438A1 (en) * | 2011-03-31 | 2012-10-04 | Nokia Corporation | A low band bandwidth extender |
JP5949379B2 (ja) * | 2012-09-21 | 2016-07-06 | 沖電気工業株式会社 | 帯域拡張装置及び方法 |
US20140142928A1 (en) * | 2012-11-21 | 2014-05-22 | Harman International Industries Canada Ltd. | System to selectively modify audio effect parameters of vocal signals |
CN103165135B (zh) * | 2013-03-04 | 2015-03-25 | 深圳广晟信源技术有限公司 | 一种数字音频粗分层编码方法和装置 |
CN104301064B (zh) | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
KR20230042410A (ko) | 2013-12-27 | 2023-03-28 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
JP6220701B2 (ja) * | 2014-02-27 | 2017-10-25 | 日本電信電話株式会社 | サンプル列生成方法、符号化方法、復号方法、これらの装置及びプログラム |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
US10332543B1 (en) * | 2018-03-12 | 2019-06-25 | Cypress Semiconductor Corporation | Systems and methods for capturing noise for pattern recognition processing |
US11266976B2 (en) | 2018-04-16 | 2022-03-08 | Chevron Phillips Chemical Company Lp | Methods of preparing a catalyst with low HRVOC emissions |
CN112133319A (zh) * | 2020-08-31 | 2020-12-25 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频生成的方法、装置、设备及存储介质 |
CN112086102B (zh) * | 2020-08-31 | 2024-04-16 | 腾讯音乐娱乐科技(深圳)有限公司 | 扩展音频频带的方法、装置、设备以及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5710863A (en) * | 1995-09-19 | 1998-01-20 | Chen; Juin-Hwey | Speech signal quantization using human auditory models in predictive coding systems |
CN1335980A (zh) | 1999-11-10 | 2002-02-13 | 皇家菲利浦电子有限公司 | 借助于映射矩阵的宽频带语音合成 |
US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
-
2002
- 2002-06-20 US US10/480,660 patent/US7174135B2/en not_active Expired - Lifetime
- 2002-06-20 CN CN02812738.2A patent/CN1235192C/zh not_active Expired - Fee Related
- 2002-06-20 WO PCT/IB2002/002366 patent/WO2003003350A1/en not_active Application Discontinuation
- 2002-06-20 EP EP02738469A patent/EP1405303A1/en not_active Withdrawn
- 2002-06-20 JP JP2003509440A patent/JP2004521394A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102339607A (zh) * | 2010-07-16 | 2012-02-01 | 华为技术有限公司 | 一种频带扩展的方法和装置 |
CN103827967A (zh) * | 2011-12-27 | 2014-05-28 | 三菱电机株式会社 | 语音信号复原装置以及语音信号复原方法 |
CN103684487A (zh) * | 2012-09-13 | 2014-03-26 | Nxp股份有限公司 | 减少多径干扰 |
US9380389B2 (en) | 2012-09-13 | 2016-06-28 | Nxp B.V. | Multipath interference reduction |
CN104981871A (zh) * | 2013-02-15 | 2015-10-14 | 高通股份有限公司 | 个人化带宽扩展 |
CN104981871B (zh) * | 2013-02-15 | 2018-01-02 | 高通股份有限公司 | 个人化带宽扩展 |
CN107705801A (zh) * | 2016-08-05 | 2018-02-16 | 中国科学院自动化研究所 | 语音带宽扩展模型的训练方法及语音带宽扩展方法 |
CN107705801B (zh) * | 2016-08-05 | 2020-10-02 | 中国科学院自动化研究所 | 语音带宽扩展模型的训练方法及语音带宽扩展方法 |
CN110556123A (zh) * | 2019-09-18 | 2019-12-10 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
CN110556123B (zh) * | 2019-09-18 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20040166820A1 (en) | 2004-08-26 |
EP1405303A1 (en) | 2004-04-07 |
WO2003003350A1 (en) | 2003-01-09 |
US7174135B2 (en) | 2007-02-06 |
CN1235192C (zh) | 2006-01-04 |
JP2004521394A (ja) | 2004-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1235192C (zh) | 传输系统以及用于接收窄带音频信号的接收机和方法 | |
EP2221808B1 (en) | Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof | |
US6073100A (en) | Method and apparatus for synthesizing signals using transform-domain match-output extension | |
US7610205B2 (en) | High quality time-scaling and pitch-scaling of audio signals | |
EP1489599B1 (en) | Coding device and decoding device | |
RU2471253C2 (ru) | Способ и устройство для оценивания энергии полосы высоких частот в системе расширения полосы частот | |
EP1440300B1 (en) | Encoding device, decoding device and audio data distribution system | |
US6799164B1 (en) | Method, apparatus, and medium of digital acoustic signal coding long/short blocks judgement by frame difference of perceptual entropy | |
EP2991075B1 (en) | Speech coding method and speech coding apparatus | |
JP4805540B2 (ja) | ステレオ信号の符号化 | |
US8738372B2 (en) | Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band | |
US9653088B2 (en) | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding | |
EP3852104B1 (en) | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation | |
EP1515310A1 (en) | A system and method for providing high-quality stretching and compression of a digital audio signal | |
US20040181403A1 (en) | Coding apparatus and method thereof for detecting audio signal transient | |
WO2002060070A2 (en) | System and method for error concealment in transmission of digital audio | |
EP1657710B1 (en) | Coding apparatus and decoding apparatus | |
EP1688917A1 (en) | Voice/musical sound encoding device and voice/musical sound encoding method | |
EP1239458B1 (en) | Voice recognition system, standard pattern preparation system and corresponding methods | |
KR100474969B1 (ko) | 음성신호 부호화를 위한 선 스펙트럼 계수의 벡터 양자화방법과 이를 위한 마스킹 임계치 산출 방법 | |
JP4287840B2 (ja) | 符号化装置 | |
Pollak et al. | Audio Compression using Wavelet Techniques | |
Trinkaus | Perceptual coding of audio and diverse speech signals | |
HUE035162T2 (en) | Systems, procedures, equipment and computer-readable media for decoding harmonic signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |