CN104781879A - 用于对音频信号进行编码的方法和装置 - Google Patents
用于对音频信号进行编码的方法和装置 Download PDFInfo
- Publication number
- CN104781879A CN104781879A CN201380059616.XA CN201380059616A CN104781879A CN 104781879 A CN104781879 A CN 104781879A CN 201380059616 A CN201380059616 A CN 201380059616A CN 104781879 A CN104781879 A CN 104781879A
- Authority
- CN
- China
- Prior art keywords
- signal
- scrambler
- time
- gap
- copied
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims description 30
- 238000000034 method Methods 0.000 title claims description 22
- 238000012545 processing Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 31
- 238000005070 sampling Methods 0.000 description 17
- 238000001228 spectrum Methods 0.000 description 17
- 230000005284 excitation Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 238000007493 shaping process Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000000465 moulding Methods 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
混合语音编码器(200)检测从类音乐的声音到类语音的声音的改变。当编码器(200)检测到类音乐的声音(例如,音乐)时,它以第一模式操作,在该第一模式中它运用频域编码器(300A)。当编码器(200)检测到类语音的声音(例如,人类语音)时,它以第二模式操作,并且运用时域或者波形编码器(300B)。在切换出现时,编码器(200)使用信号的在间隙(416)之后出现的部分来回填信号中的间隙(416)。
Description
技术领域
本公开内容一般性地涉及音频处理,并且更具体地,涉及切换音频编码器模式。
背景技术
可听见的频率范围(对人耳可听见的周期性振动的频率)是从大约50Hz到大约22kHz,但是听力随着年龄而退化并且多数成年人发现难以听见大约14-15kHz以上的频率。人类语音信号的多数能量一般被限于从250Hz到3.4kHz的范围。因此,传统语音传输系统限于常称为“窄带”的该频率范围。然而,为了允许更好的声音质量、为了使听者更容易识别语音以及为了使得听者能够区分需要迫使空气经过窄信道的被称为“摩擦音”(‘s’和‘f’为示例)的那些语音元素,更新的系统已经将该范围延伸到50Hz到7kHz。该更大的频率范围通常被称为“宽带”(WB)或者有时被称为HD(高清晰度)语音。
高于WB范围的频率——从大约7kHz到大约15kHz——在此被称为带宽延伸(BWE)区域。从大约50Hz到大约15kHz的声音频率的全范围被称为“超宽带(SWB)”。在BWE区域中,人耳对声音信号的相位并不特别地敏感。然而,它对声音谐波的规律性以及对能量的存在和分布是敏感的。因此,处理BWE声音有助于语音听上去更自然并且也提供了“存在”的感知。
附图说明
图1描绘其中可以实现本发明的各种实施例的通信系统的示例。
图2示出描绘了根据本发明的实施例的通信设备的框图。
图3示出描绘了在本发明的实施例中的编码器的框图。
图4和5描绘根据本发明的各种实施例的间隙填充的示例。
具体实施方式
本发明的一个实施例涉及一种混合编码器。当由编码器接收到的音频输入从类音乐的声音(例如,音乐)改变成类语音的声音(例如,人类语音)时,编码器从第一模式(例如,音乐模式)切换成第二模式(例如,语音模式)。在本发明的一个实施例中,当编码器以第一模式操作时,它运用第一编码器(例如,频域编码器,诸如基于谐波的正弦型编码器)。当编码器切换到第二模式时,它运用第二编码器(例如,时域或者波形编码器,诸如CELP编码器)。从第一编码器向第二编码器的该切换可能引起在编码过程中的延迟,从而产生编码的信号中的间隙。为了补偿,编码器使用音频信号的在间隙之后出现的部分回填间隙。
在本发明的一个有关实施例中,第二编码器包括BWE编码部分和核心编码部分。核心编码部分可以根据编码器操作的比特速率以不同采样速率来操作。例如,使用较低采样速率(例如,当编码器以较低比特速率操作时)可以是有利的,以及使用较高采样速率(例如,在编码器以较高比特速率操作时)可以是有利的。核心部分的采样速率确定BWE编码部分的最低频率。然而,当从第一编码器到第二编码器的切换出现时,可能存在关于核心编码部分应当操作在的采样速率的不确定性。直到核心采样速率已知,BWE编码部分的处理链可能不能够被配置,从而引起在BWE编码部分的处理链中的延迟。作为该延迟的结果,在处理期间在信号的BWE区域(被称为“BWE目标信号”)中产生了间隙。为了补偿,编码器使用音频信号的在间隙之后出现的部分来回填BWE目标信号间隙。
在本发明的另一实施例中,音频信号从由第一编码器(诸如,频域编码器)编码的第一类型的信号(诸如,音乐或者类音乐的信号)切换成由第二编码器(诸如,时域或者波形编码器)处理的第二类型的信号(诸如,语音或者类语音的信号)。切换在第一时间处出现。在处理的音频信号中的间隙具有在第一时间处或者之后开始并且在第二时间处结束的时间跨度。处理的音频信号的在第二时间处或者之后出现的部分被复制并且可能在对复制的部分执行功能(诸如,时间反转、正弦加窗和/或余弦加窗)之后被插入到间隙中。
先前描述的实施例可以由一种通信设备执行,在该通信设备中输入接口(例如,麦克风)接收音频信号,语音-音乐检测器确定了从类音乐的音频到类语音的音频的切换已经出现,并且缺失信号发生器回填BWE目标信号中的间隙。各种操作可以由处理器(例如,数字信号处理器或者DSP)与存储器(例如,包括,先行缓冲器)组合来执行。
在以下描述中,将要注意,附图中所示的部件以及标注的路径旨在于指示在各种实施例中信号一般如何流动以及被处理。线连接不一定对应于离散的物理路径,而块不一定对应于离散的物理部件。部件可以被实现为硬件或者为软件。此外,术语“被耦合”的使用不一定意味着在部件之间的物理连接,而可以描述部件之间的其中存在中间部件的关系。它仅描述部件的用以物理地或者经由软件结构(例如,数据结构、对象等)相互通信的能力。
转向附图,现在将描述本发明的一个实施例在其中操作的网络的示例。图1图示包括网络102的通信系统100。网络102可以包括许多部件,诸如无线接入点、蜂窝基站、有线网络(光纤、同轴线缆等)。任何数目的通信设备和通信设备的许多种类可以经由网络102交换数据(语音、视频、网页等)。第一通信设备104和第二通信设备106在图1中被描绘为经由网络102通信。尽管第一通信设备104和第二通信设备106被示为智能电话,但是它们可以是任何类型的通信设备,包括膝上型计算机、具有无线局域网能力的设备、具有无线广域网能力的设备或者用户设备(UE)。除非另有指明,第一通信设备104被视为发射设备而第二通信设备106被视为接收设备。
图2图示根据本发明的实施例的通信设备104(来自图1)的框图。通信设备104可以能够访问在网络102中存储的信息或者数据并且经由网络102与第二通信设备106通信。在一些实施例中,通信设备104支持一个或者多个通信应用。也可以在第二通信设备106上执行在此描述的各种实施例。
通信设备104可以包括收发器240,该收发器240能够通过网络102发送和接收数据。通信设备可以包括控制器/处理器210,该控制器/处理器210执行存储的程序,诸如编码器222。本发明的各种实施例由编码器222执行。通信设备也可以包括由控制器/处理器210使用的存储器220。存储器220存储编码器222并且可以进一步包括先行缓冲器221,该先行缓冲器221的目的将在被更详细地描述。通信设备可以包括用户输入/输出接口250,该用户输入/输出接口250可以包括诸如键盘、显示器、触摸屏、麦克风、耳机和扬声器之类的单元。通信设备也可以包括附加单元可以附着到的网络接口260,例如,通用串行总线(USB)接口。最后,通信设备可以包括数据库接口230,该数据库接口230允许通信设备访问与通信设备的配置有关的各种存储的数据结构。
根据本发明的一个实施例,输入/输出接口250(例如,其麦克风)检测音频信号。编码器222对音频信号进行编码。在这样做时,编码器运用称为“先行(look-ahead)”的技术以对语音信号进行编码。使用先行,编码器222检查在其正在编码的当前语音帧的将来的少量语音,以便于确定在该帧之后什么将到来。编码器将将来语音信号的一部分存储在先行缓冲器221中。
参照图3的框图,现在将描述编码器222(来自图2)的操作。编码器222包括语音/音乐检测器300和耦合到语音/音乐检测器300的开关320。在如图2中描绘的那些部件的右侧,存在第一编码器300a和第二编码器300b。在本发明的一个实施例中,第一编码器300a是频域编码器(其可以被实现为基于谐波的正弦编码器),并且第二部件集合构成时域或者波形编码器,诸如CELP编码器300b。第一和第二编码器300a和300b被耦合到开关320。
第二编码器300b的特征可以在于具有高频带部分和低频带部分,该高频带部分通过路径O和P输出BWE激励信号(从大约7kHz到大约16kHz),该低频带部分通过路径N输出WB激励信号(从大约50Hz到大约7kHz)。将会理解,该分组仅为了方便引用。如将讨论的那样,高频带部分和低频带部分相互交互。
高频带部分包括带通滤波器301、耦合到带通滤波器301的频谱翻转和降频混合器307、耦合到频谱翻转和降频混合器307的抽取器311、耦合到抽取器311的缺失信号发生器311a以及耦合到缺失信号发生器311a的线性预测编码(LPC)分析器314。高频带部分300a进一步包括耦合到LPC分析器314的第一量化器318。例如,LPC分析器可以是10阶LPC分析器。
仍然参照图3,第二编码器300b的高频带部分也包括高频带自适应码书(ACB)302(或者备选地,长期预测器)、加法器303和方波整型电路306。高频带ACB 302被耦合到加法器303和方波整型电路306。高频带部分进一步包括高斯发生器308、加法器309和带通滤波器312。高斯发生器308和带通滤波器312均被耦合到加法器309。高频带部分也包括频谱翻转和降频混合器313、抽取器315、1/A(z)全极点滤波器316(其将被称为“全极点滤波器”)、增益计算器317以及第二量化器319。频谱翻转和降频混合器313被耦合到带通滤波器312,抽取器315被耦合到频谱翻转和降频混合器313,全极点滤波器316被耦合到抽取器315,并且增益计算器317被耦合到全极点滤波器316和量化器两者。附加地,全极点滤波器316被耦合到LPC分析器314。
低频带部分包括插值器304、抽取器305和代码激励线性预测(CELP)核心编码解码器310。插值器304和抽取器305均被耦合到CELP核心编码解码器310。
现在将描述根据本发明的一个实施例的编码器222的操作。语音/音乐检测器300接收音频输入(诸如从图2的输入/输出接口250的麦克风)。如果检测器300确定音频输入是音乐型音频,则检测器控制开关320切换以允许音频输入向第一编码器300a传递。在另一方面,如果检测器300确定音频输入是语音型音频,则检测器控制开关320以允许音频输入向第二编码器300b传递。例如,如果使用第一通信设备104的人在具有背景音乐的位置,则检测器300将使得开关320切换编码器222以在该人不说话(即,背景音乐为主)的时段期间使用第一编码器300a。一旦该人开始说话(即,语音为主),检测器300将使得开关320切换编码器222以使用第二编码器300b。
现在将参照图3来描述第二编码器300b的高频带部分的操作。带通滤波器301经由路径A接收32kHz输入信号。在该示例中,输入信号是在32KHz采样的超宽带(SWB)信号。带通滤波器301具有6.4kHz或者8kHz的较低频率截止并且具有8kHz的带宽。带通滤波器301的较低频率截止被匹配到CELP核心编码解码器310的高频率截止(例如,6.4KHz或者8KHz)。带通滤波器301对SWB信号进行滤波,从而产生在32kHz采样的并且具有8kHz带宽的通过路径C的频带有限的信号。频谱翻转和降频混合器307在频谱上翻转通过路径C接收到的频带有限的输入信号,并且在频率上对信号进行向下的频谱变换,使得所需频带占用从0Hz-8kHz的区域。向抽取器311提供了翻转的和降频混合的输入信号,该抽取器311在频带上将翻转的和降频混合的信号限于8kHz、将翻转的和降频混合的信号的采样速率从32kHz减少到16kHz并且经由路径J输出输入信号的频谱翻转的和频带有限的版本的临界采样的版本,即BWE目标信号。在路径J上的信号的采样速率是16kHz。向缺失信号发生器311a提供了该BWE目标信号。
缺失信号发生器311a填充BWE目标信号中的间隙,该间隙从编码器222在第一编码器300a与CELP型编码器300b之间的切换而产生。将关于图4更详细地描述该间隙填充过程。向LPC分析器314和经由路径L向增益计算器317提供了间隙填充的BWE目标信号。LPC分析器314确定间隙填充的BWE目标信号的频谱并且通过路径M输出LPC滤波器系数(未量化)。通过路径M的信号由量化器318接收,该量化器318量化包括LPC参数的LPC系数。量化器318的输出构成量化的LPC参数。
仍然参照图3,抽取器305经由路径A接收32kHz SWB输入信号。抽取器305对输入信号进行频带限制和重新采样。作为结果的输出是12.8kHz或者16kHz采样的信号。向CELP核心编码解码器310提供了频带有限和重新采样的信号。CELP核心编码解码器310对频带有限和重新采样的信号的较低6.4或者8kHz进行编码,并且通过路径N和F输出CELP核心随机激励信号分量(“随机码书分量”)。插值器304经由路径F接收随机码书分量并且对其上采样用于在高频带路径中使用。换言之,随机码书分量用作高频带随机码书分量。上采样因子被匹配到CELP核心编码解码器的高频率截止,使得输出采样速率是32kHz。加法器303经由路径B接收上采样的随机码书分量、经由路径E接收自适应码书分量并且将两个分量相加。随机和自适应码书分量的总计被用来更新ACB 302的状态用于经由路径D的将来节距周期。
再次参照图3,高频带ACB 302以较高采样速率操作并且重新创建CELP核心310的激励的插值的和延伸的版本,并且可以被视为镜像CELP核心310的功能。较高采样速率处理创建了由于更高采样速率而创建在频率上比CELP核心的谐波延伸更高的谐波。为了实现这一点,高频带ACB 302使用来自CELP核心310的ACB参数并且对CELP核心随机激励分量的插值版本操作。ACB 302的输出与上采样的随机码书分量相加以创建自适应码书分量。ACB 302通过路径D接收高频带激励信号的随机和自适应码书分量的总计作为输入。如先前指出的那样,该总计是从加法模块303的输出提供的。
也向方波整型电路306提供了随机和自适应分量的总计(路径D)。方波整型电路306生成CELP核心信号的强谐波以形成向混合器309提供的带宽延伸的高频带激励信号。高斯发生器308生成整形的高速噪声信号,该整形的高速噪声信号的能量包络与从方波整型电路306输出的带宽延伸的高频带激励信号的能量包络匹配。混合器309从高斯发生器308接收噪声信号和从方波整型电路306接收带宽延伸的高频带激励信号并且用整形的高斯噪声信号替换带宽延伸的高频带激励信号的一部分。替换的部分依赖于估计的发音程度,该发音程度是来自CELP核心的输出并且基于随机分量和活跃码书分量中的相对能量的测量。向带通滤波器312提供了从混合功能产生的混合信号。带通滤波器312具有与带通滤波器301的特性相同的特性,并且提取高频带激励信号的对应分量。
向频谱翻转和降频混合器313提供了带通滤波的高频带激励信号,该带通滤波的高频带激励信号由带通滤波器312输出。频谱翻转和降频混合器313翻转带通滤波的高频带激励信号并且在频率上执行向下的频谱变换,使得作为结果的信号占用从0Hz到8kHz的频率区域。该操作匹配频谱翻转和降频混合器307的操作。向抽取器315提供了作为结果的信号,该抽取器315对翻转的和降频混合的高频带激励信号进行频带限制和将其采样速率从32kHz降低到16kHz。该操作匹配抽取器311的操作。作为结果的信号具有大体上平坦或者白的频谱,但是缺乏任何共振峰信息。全极点滤波器316从抽取器314接收抽取的、翻转的和降频混合的信号以及从LPC分析器314接收未量化的LPC滤波系数。该全极点滤波器316对抽取的、翻转的和降频混合的高频带信号重新塑形,使得它匹配BWE目标信号的形状。向增益计算器317提供了重新塑形的信号,该增益计算器317也从缺失信号发生器311a接收间隙填充的BWE目标信号(经由路径L)。增益计算器317使用间隙填充的BWE目标信号以确定应当被用于频谱整形的、抽取的、翻转的和降频混合的高频带激励信号的理想增益。向第二量化器319提供了频谱整形的、抽取的、翻转的和降频混合的高频带激励信号(具有理想增益),该第二量化器量化用于高频带的增益。第二量化器319的输出是经量化的增益。经量化的LPC参数和经量化的增益受到附加的处理、变换等,从而产生例如经由网络102向第二通信设备106发射的射频信号。
如先前指出的那样,缺失信号发生器311a填充从编码器222从音乐模式改变成语音模式而产生的信号中的间隙。现在将关于图4更详细地描述根据本发明的一个实施例的由缺失信号发生器311a执行的操作。图4描绘信号400、402、404和408的图形。图形的垂直轴代表信号的量值而水平轴代表时间。第一信号400是编码器222尝试处理的原始声音信号。第二信号402是从缺乏任何修改地处理第一信号400而产生的信号(即,未修改的信号)。第一时间410是编码器222从第一模式(例如,使用频域编码器,诸如基于谐波的正弦型编码器的音乐模式)切换成第二模式(例如,使用时域或者波形编码器,诸如CELP编码器的语音模式)的时间点。因此,直到第一时间410,编码器222以第一模式来处理音频信号。在第一时间410处或者之后不久,编码器222尝试以第二模式来处理音频信号,但是直至编码器222能够在模式切换(该模式切换在第二时间412出现)之后刷出滤波存储器和缓冲器并且填充先行缓冲器221才能够有效地这样做。正如可见,在第一时间410与第二时间412之间存在时间间隔,在该时间间隔中,在处理的音频信号中存在间隙416(例如,该间隔416可以大约为5毫秒)。在该间隙416期间,在BWE区域中几乎没有声音可用于编码。为了补偿该间隙,缺失信号发生器311a复制信号402的部分406。复制的信号部分406是缺失信号部分(即,应当已经在间隙中的信号部分)的估计。复制的信号部分406占用从第二时间412到第三时间414跨越的时间间隔418。将要注意,可以存在第二时间412后的信号的可以被复制的多个部分,但是该示例涉及单个复制的部分。
编码器222将复制的信号部分406叠加到重新生成的信号估计408上,使得复制的信号部分406的一部分被插入到间隙416中。在一些实施例中,如图4中所示,缺失信号发生器311a在将复制的信号部分406叠加到重新生成的信号估计402上之前对复制的信号部分406进行时间反转。
在一个实施例中,复制的部分406跨越比间隙416的时间段更长的时间段。因此,除了复制的部分406填充间隙416之外,复制的部分的一部分与超出间隙416之外的信号组合。在其它实施例中,复制的部分跨越与间隙416相同的时间段。
图5示出另一实施例。在该实施例中,存在已知目标信号500,该已知目标信号500是从由编码器222执行的初始处理产生的信号。在第一时间512之前,编码器222以第一模式(其中,例如,它使用频率编码器,诸如基于谐波的正弦型编码器)来操作。在第一时间512处,编码器222从第一模式切换成第二模式(其中,例如,它使用CELP编码器)。例如,该切换基于从音乐或者类音乐的声音改变成语音或者类语音的声音的向通信设备输入的音频。编码器222直至第二时间514才能够从第一模式向第二模式的切换中恢复。在第二时间514之后,编码器222能够以第二模式对语音输入进行编码。间隙503存在于第一时间与第二时间之间。为了补偿间隙503,缺失信号发生器311a(图3)复制已知目标信号500的与间隙503相同时间长度518的部分504。缺失信号发生器组合复制的部分504的余弦窗口部分502与复制的部分504的时间反转的正弦窗口部分506。余弦窗口部分502和时间反转的正弦窗口部分506二者均可以取自复制的部分504的相同分段516。时间反转的正弦和余弦部分可以相互异相,并且可以不一定在分段516的相同时间点处开始和结束。余弦窗口和时间反转的正弦窗口的组合将被称为重叠-相加信号510。重叠-相加信号510替换目标信号500的复制的部分504的一部分。复制的信号504的尚未被替换的部分将被称为未替换的信号520。编码器将重叠-相加信号510附加到未替换的信号516,并且使用组合的信号510和516来填充间隙503。
尽管已经以如下方式描述了本公开内容及其最佳模式,该方式建立了由发明人的占有并且使得本领域普通技术人员能够实现和使用本公开内容,但是将会理解,存在在此公开的示例实施例的等价形式并且可以对其进行修改和变化而不偏离本公开内容的精神和范围,本公开内容的精神和范围将不由示例实施例限制而由所附权利要求限制。
Claims (9)
1.一种对音频信号进行编码的方法,所述方法包括:
以第一编码器模式(300A)处理所述音频信号;
在第一时间(410)从所述第一编码器模式(300A)切换到第二编码器模式(300B);
以所述第二编码器模式(300B)处理所述音频信号,其中所述第二编码器模式(300B)的处理延迟造成了所述音频信号中的间隙(416),所述间隙(416)具有在所述第一时间(410)处或者之后开始并且在第二时间(412)处结束的时间跨度;
复制经处理的所述音频信号的部分(406),其中复制的所述部分(406)在所述第二时间(412)处或者之后出现;以及
将信号插入到所述间隙(416)中,其中插入的所述信号基于复制的所述部分(406)。
2.根据权利要求1所述的方法,其中插入的所述信号是复制的所述部分的时间反转的版本。
3.根据权利要求1所述的方法,
其中复制的所述部分的所述时间跨度比所述间隙的所述时间跨度长;
所述方法进一步包括组合复制的所述部分的重叠部分与经处理的所述音频信号的出现在所述第二时间之后的至少一部分。
4.根据权利要求1所述的方法,
其中复制的所述部分包括正弦窗口部分和余弦窗口部分;并且
其中插入复制的所述部分包括组合所述正弦窗口部分与所述余弦窗口部分并且将组合的所述正弦窗口部分和所述余弦窗口部分的至少一部分插入到所述间隙部分中。
5.根据权利要求1所述的方法,其中将所述编码器从第一模式切换到第二模式包括将所述编码器从音乐模式切换到语音模式。
6.根据权利要求1所述的方法,进一步包括:
如果所述音频信号被确定为音乐信号,则以所述第一模式对所述音频信号进行编码;
确定所述音频信号已经从所述音乐信号切换到语音信号;以及
如果确定了所述音频信号已经切换成语音信号,则以所述第二模式对所述音频信号进行编码。
7.根据权利要求6所述的方法,其中所述第一模式是音乐编码模式并且所述第二模式是语音编码模式。
8.根据权利要求1所述的方法,进一步包括在所述第一模式中使用频域编码器并且在所述第二模式中使用CELP编码器。
9.一种用于对音频信号进行编码的装置(200),所述装置(200)包括:
第一编码器(300A);
第二编码器(300B);
语音-音乐检测器(300);
其中当所述语音-音乐检测器(300)确定音频信号已经从音乐改变成语音时,所述音频信号停止由所述第一编码器(300A)处理而由所述第二编码器(300B)处理;
其中所述第二编码器(300B)的处理延迟造成了所述音频信号中的间隙(416),所述间隙(416)具有在第一时间(410)处或者之后开始并且在第二时间(412)处结束的时间跨度;以及
缺失信号发生器(311A),所述缺失信号发生器(311A)复制经处理的所述音频信号的部分(406),其中复制的所述部分(406)在所述第二时间(412)处或者之后出现,并且所述缺失信号发生器(311A)将信号插入到所述间隙(416)中,其中插入的所述信号基于复制的所述部分(406)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/626,923 | 2012-09-26 | ||
US13/626,923 US9129600B2 (en) | 2012-09-26 | 2012-09-26 | Method and apparatus for encoding an audio signal |
PCT/US2013/058436 WO2014051965A1 (en) | 2012-09-26 | 2013-09-06 | Method and apparatus for encoding an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104781879A true CN104781879A (zh) | 2015-07-15 |
CN104781879B CN104781879B (zh) | 2019-01-15 |
Family
ID=49182533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380059616.XA Active CN104781879B (zh) | 2012-09-26 | 2013-09-06 | 用于对音频信号进行编码的方法和装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9129600B2 (zh) |
EP (1) | EP2901450B1 (zh) |
JP (1) | JP6110498B2 (zh) |
KR (1) | KR101668401B1 (zh) |
CN (1) | CN104781879B (zh) |
WO (1) | WO2014051965A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022062942A1 (zh) * | 2020-09-22 | 2022-03-31 | 华为技术有限公司 | 音频编解码方法和装置 |
WO2023051367A1 (zh) * | 2021-09-29 | 2023-04-06 | 华为技术有限公司 | 解码方法、装置、设备、存储介质及计算机程序产品 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9601125B2 (en) | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US9514761B2 (en) * | 2013-04-05 | 2016-12-06 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
BR112016004299B1 (pt) * | 2013-08-28 | 2022-05-17 | Dolby Laboratories Licensing Corporation | Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida |
US9437236B2 (en) * | 2013-11-04 | 2016-09-06 | Michael Hugh Harrington | Encoding data |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
US10121488B1 (en) * | 2015-02-23 | 2018-11-06 | Sprint Communications Company L.P. | Optimizing call quality using vocal frequency fingerprints to filter voice calls |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
WO2020249380A1 (en) * | 2019-06-13 | 2020-12-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Time reversed audio subframe error concealment |
CN110430104B (zh) * | 2019-09-18 | 2021-12-03 | 北京云中融信网络科技有限公司 | 音频传输延迟的测试方法、装置、存储介质和电子设备 |
US11562761B2 (en) * | 2020-07-31 | 2023-01-24 | Zoom Video Communications, Inc. | Methods and apparatus for enhancing musical sound during a networked conference |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0932141A2 (en) * | 1998-01-22 | 1999-07-28 | Deutsche Telekom AG | Method for signal controlled switching between different audio coding schemes |
CN101231849A (zh) * | 2007-09-15 | 2008-07-30 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US20100305953A1 (en) * | 2007-05-14 | 2010-12-02 | Freescale Semiconductor, Inc. | Generating a frame of audio data |
US20110218797A1 (en) * | 2010-03-05 | 2011-09-08 | Motorola, Inc. | Encoder for audio signal including generic audio and speech frames |
CN102682782A (zh) * | 2011-03-17 | 2012-09-19 | 索尼公司 | 语音处理装置、方法和程序 |
Family Cites Families (99)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4560977A (en) | 1982-06-11 | 1985-12-24 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
US4670851A (en) | 1984-01-09 | 1987-06-02 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
US4727354A (en) | 1987-01-07 | 1988-02-23 | Unisys Corporation | System for selecting best fit vector code in vector quantization encoding |
JP2527351B2 (ja) | 1987-02-25 | 1996-08-21 | 富士写真フイルム株式会社 | 画像デ―タの圧縮方法 |
US5067152A (en) | 1989-01-30 | 1991-11-19 | Information Technologies Research, Inc. | Method and apparatus for vector quantization |
DE68922610T2 (de) | 1989-09-25 | 1996-02-22 | Rai Radiotelevisione Italiana | Umfassendes System zur Codierung und Übertragung von Videosignalen mit Bewegungsvektoren. |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
WO1993018505A1 (en) | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
IT1281001B1 (it) | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6263312B1 (en) | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
US6253185B1 (en) | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
US6904174B1 (en) | 1998-12-11 | 2005-06-07 | Intel Corporation | Simplified predictive video encoder |
US6480822B2 (en) | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
CA2246532A1 (en) | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
US6453287B1 (en) | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
US6493664B1 (en) | 1999-04-05 | 2002-12-10 | Hughes Electronics Corporation | Spectral magnitude modeling and quantization in a frequency domain interpolative speech codec system |
US6691092B1 (en) | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US6504877B1 (en) | 1999-12-14 | 2003-01-07 | Agere Systems Inc. | Successively refinable Trellis-Based Scalar Vector quantizers |
JP4149637B2 (ja) | 2000-05-25 | 2008-09-10 | 株式会社東芝 | 半導体装置 |
US6304196B1 (en) | 2000-10-19 | 2001-10-16 | Integrated Device Technology, Inc. | Disparity and transition density control system and method |
AUPR105000A0 (en) | 2000-10-27 | 2000-11-23 | Canon Kabushiki Kaisha | Method for generating and detecting marks |
JP3404024B2 (ja) | 2001-02-27 | 2003-05-06 | 三菱電機株式会社 | 音声符号化方法および音声符号化装置 |
JP3636094B2 (ja) | 2001-05-07 | 2005-04-06 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6662154B2 (en) | 2001-12-12 | 2003-12-09 | Motorola, Inc. | Method and system for information signal coding using combinatorial and huffman codes |
US6947886B2 (en) | 2002-02-21 | 2005-09-20 | The Regents Of The University Of California | Scalable compression of audio and other signals |
EP1483759B1 (en) | 2002-03-12 | 2006-09-06 | Nokia Corporation | Scalable audio coding |
JP3881943B2 (ja) | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
AU2003208517A1 (en) * | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
WO2004097796A1 (ja) | 2003-04-30 | 2004-11-11 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号化装置及びこれらの方法 |
JP2005005844A (ja) | 2003-06-10 | 2005-01-06 | Hitachi Ltd | 計算装置及び符号化処理プログラム |
JP4123109B2 (ja) | 2003-08-29 | 2008-07-23 | 日本ビクター株式会社 | 変調装置及び変調方法並びに復調装置及び復調方法 |
SE527670C2 (sv) | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
BRPI0509108B1 (pt) | 2004-04-05 | 2019-11-19 | Koninklijke Philips Nv | método para codificar uma pluralidade de sinais de entrada, codificador para codificar uma pluralidade de sinais de entrada, método de decodificar dados, e decodificador |
US20060022374A1 (en) | 2004-07-28 | 2006-02-02 | Sun Turn Industrial Co., Ltd. | Processing method for making column-shaped foam |
US6975253B1 (en) | 2004-08-06 | 2005-12-13 | Analog Devices, Inc. | System and method for static Huffman decoding |
US7161507B2 (en) | 2004-08-20 | 2007-01-09 | 1St Works Corporation | Fast, practically optimal entropy coding |
US20060047522A1 (en) | 2004-08-26 | 2006-03-02 | Nokia Corporation | Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system |
JP4771674B2 (ja) | 2004-09-02 | 2011-09-14 | パナソニック株式会社 | 音声符号化装置、音声復号化装置及びこれらの方法 |
JP5046652B2 (ja) | 2004-12-27 | 2012-10-10 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
BRPI0607246B1 (pt) * | 2005-01-31 | 2019-12-03 | Skype | método para gerar uma seqüência de amostras de encobrimento com relação à transmissão de um sinal de áudio digitalizado, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado |
US20060190246A1 (en) | 2005-02-23 | 2006-08-24 | Via Telecom Co., Ltd. | Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC |
EP1866913B1 (en) | 2005-03-30 | 2008-08-27 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
US7885809B2 (en) | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
FR2888699A1 (fr) | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
ATE490454T1 (de) | 2005-07-22 | 2010-12-15 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
JP5171256B2 (ja) | 2005-08-31 | 2013-03-27 | パナソニック株式会社 | ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 |
CN101273403B (zh) | 2005-10-14 | 2012-01-18 | 松下电器产业株式会社 | 可扩展编码装置、可扩展解码装置以及其方法 |
JP4969454B2 (ja) | 2005-11-30 | 2012-07-04 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
US8260620B2 (en) | 2006-02-14 | 2012-09-04 | France Telecom | Device for perceptual weighting in audio encoding/decoding |
US20070239294A1 (en) | 2006-03-29 | 2007-10-11 | Andrea Brueckner | Hearing instrument having audio feedback capability |
US7230550B1 (en) | 2006-05-16 | 2007-06-12 | Motorola, Inc. | Low-complexity bit-robust method and system for combining codewords to form a single codeword |
US7414549B1 (en) | 2006-08-04 | 2008-08-19 | The Texas A&M University System | Wyner-Ziv coding based on TCQ and LDPC codes |
US7461106B2 (en) | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
WO2008062990A1 (en) | 2006-11-21 | 2008-05-29 | Samsung Electronics Co., Ltd. | Method, medium, and system scalably encoding/decoding audio/speech |
CN101325631B (zh) * | 2007-06-14 | 2010-10-20 | 华为技术有限公司 | 一种估计基音周期的方法和装置 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8521540B2 (en) * | 2007-08-17 | 2013-08-27 | Qualcomm Incorporated | Encoding and/or decoding digital signals using a permutation value |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
US7889103B2 (en) | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
US20090234642A1 (en) | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US8639519B2 (en) * | 2008-04-09 | 2014-01-28 | Motorola Mobility Llc | Method and apparatus for selective signal coding based on core encoder performance |
BRPI0910784B1 (pt) | 2008-07-11 | 2022-02-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador e decodificador de áudio para estruturas de codificação de sinais de áudio amostrados |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2304723B1 (en) | 2008-07-11 | 2012-10-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for decoding an encoded audio signal |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
WO2010028297A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
KR20080091305A (ko) * | 2008-09-26 | 2008-10-09 | 노키아 코포레이션 | 서로 다른 코딩 모델들을 통한 오디오 인코딩 |
US20100088090A1 (en) | 2008-10-08 | 2010-04-08 | Motorola, Inc. | Arithmetic encoding for celp speech encoders |
US8725500B2 (en) * | 2008-11-19 | 2014-05-13 | Motorola Mobility Llc | Apparatus and method for encoding at least one parameter associated with a signal source |
US8200496B2 (en) | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8140342B2 (en) | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8175888B2 (en) | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
US8219408B2 (en) | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
EP2237269B1 (en) * | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
PL2473995T3 (pl) * | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
CN102714041B (zh) * | 2009-11-19 | 2014-04-16 | 瑞典爱立信有限公司 | 改进的激励信号带宽扩展 |
US8442837B2 (en) * | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
US8868432B2 (en) * | 2010-10-15 | 2014-10-21 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
MX351750B (es) * | 2010-10-25 | 2017-09-29 | Voiceage Corp | Codificación de señales de audio genéricas a baja tasa de bits y a retardo bajo. |
WO2012108680A2 (ko) * | 2011-02-08 | 2012-08-16 | 엘지전자 주식회사 | 대역 확장 방법 및 장치 |
SG192721A1 (en) * | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
CN103035248B (zh) * | 2011-10-08 | 2015-01-21 | 华为技术有限公司 | 音频信号编码方法和装置 |
EP2721610A1 (en) * | 2011-11-25 | 2014-04-23 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
US9053699B2 (en) * | 2012-07-10 | 2015-06-09 | Google Technology Holdings LLC | Apparatus and method for audio frame loss recovery |
-
2012
- 2012-09-26 US US13/626,923 patent/US9129600B2/en active Active
-
2013
- 2013-09-06 EP EP13762972.1A patent/EP2901450B1/en active Active
- 2013-09-06 WO PCT/US2013/058436 patent/WO2014051965A1/en active Application Filing
- 2013-09-06 KR KR1020157010638A patent/KR101668401B1/ko active IP Right Grant
- 2013-09-06 JP JP2015534516A patent/JP6110498B2/ja active Active
- 2013-09-06 CN CN201380059616.XA patent/CN104781879B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0932141A2 (en) * | 1998-01-22 | 1999-07-28 | Deutsche Telekom AG | Method for signal controlled switching between different audio coding schemes |
US20100305953A1 (en) * | 2007-05-14 | 2010-12-02 | Freescale Semiconductor, Inc. | Generating a frame of audio data |
CN101231849A (zh) * | 2007-09-15 | 2008-07-30 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US20110218797A1 (en) * | 2010-03-05 | 2011-09-08 | Motorola, Inc. | Encoder for audio signal including generic audio and speech frames |
CN102682782A (zh) * | 2011-03-17 | 2012-09-19 | 索尼公司 | 语音处理装置、方法和程序 |
Non-Patent Citations (1)
Title |
---|
BALÁZS KÖVESI ET AL: "Integration of a CELP Coder in the ARDOR Universal Sound Codec", 《INTERSPEECH 2006 - ICSLP》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022062942A1 (zh) * | 2020-09-22 | 2022-03-31 | 华为技术有限公司 | 音频编解码方法和装置 |
WO2023051367A1 (zh) * | 2021-09-29 | 2023-04-06 | 华为技术有限公司 | 解码方法、装置、设备、存储介质及计算机程序产品 |
Also Published As
Publication number | Publication date |
---|---|
EP2901450B1 (en) | 2018-12-26 |
JP6110498B2 (ja) | 2017-04-05 |
KR20150060897A (ko) | 2015-06-03 |
WO2014051965A1 (en) | 2014-04-03 |
JP2015530622A (ja) | 2015-10-15 |
US9129600B2 (en) | 2015-09-08 |
CN104781879B (zh) | 2019-01-15 |
KR101668401B1 (ko) | 2016-10-21 |
EP2901450A1 (en) | 2015-08-05 |
US20140088973A1 (en) | 2014-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104781879A (zh) | 用于对音频信号进行编码的方法和装置 | |
CN103187066B (zh) | 处理音频帧以在不同编解码器之间转变的方法和装置 | |
CN101681627B (zh) | 使用音调规则化及非音调规则化译码的信号编码方法及设备 | |
RU2667382C2 (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
RU2418323C2 (ru) | Системы и способы для изменения окна с кадром, ассоциированным с аудио сигналом | |
JPH10187197A (ja) | 音声符号化方法及び該方法を実施する装置 | |
CN113223540B (zh) | 在声音信号编码器和解码器中使用的方法、设备和存储器 | |
CN101006495A (zh) | 语音编码装置、语音解码装置、通信装置以及语音编码方法 | |
KR20030046510A (ko) | 광대역 음성 코덱에서 고주파 확장층 부호화 | |
WO2001059757A2 (en) | Method and apparatus for compression of speech encoded parameters | |
JP2009069856A (ja) | 音声コーデックにおける擬似高帯域信号の推定方法 | |
CN1983909A (zh) | 一种丢帧隐藏装置和方法 | |
CN104995678B (zh) | 用于控制平均编码率的系统和方法 | |
JP2003533902A5 (zh) | ||
EP1020848A2 (en) | Method for transmitting auxiliary information in a vocoder stream | |
TW202215417A (zh) | 多聲道信號產生器、音頻編碼器及依賴混合噪音信號的相關方法 | |
JP4437011B2 (ja) | 音声符号化装置 | |
CN114863942A (zh) | 音质转换的模型训练方法、提升语音音质的方法及装置 | |
Bhatt et al. | Overall performance evaluation of adaptive multi rate 06.90 speech codec based on code excited linear prediction algorithm using MATLAB | |
Sun et al. | Speech compression | |
KR960015861B1 (ko) | 선 스펙트럼 주파수 벡터의 양자화 방법 및 양자화기 | |
JPH08160996A (ja) | 音声符号化装置 | |
Sahab et al. | SPEECH CODING ALGORITHMS: LPC10, ADPCM, CELP AND VSELP | |
Woodard | Digital coding of speech using code excited linear prediction | |
Ding | Backward compatible wideband voice over narrowband low-resolution media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20171115 Address after: American California Applicant after: Technology Holdings Co., Ltd of Google Address before: Illinois Applicant before: Motorola Mobility, Inc. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |