CN101661749A - 一种语音和音乐双模切换编/解码的方法 - Google Patents

一种语音和音乐双模切换编/解码的方法 Download PDF

Info

Publication number
CN101661749A
CN101661749A CN200910093060A CN200910093060A CN101661749A CN 101661749 A CN101661749 A CN 101661749A CN 200910093060 A CN200910093060 A CN 200910093060A CN 200910093060 A CN200910093060 A CN 200910093060A CN 101661749 A CN101661749 A CN 101661749A
Authority
CN
China
Prior art keywords
signal
music
voice
coding
coded message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910093060A
Other languages
English (en)
Inventor
卢敏
张树华
窦维蓓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN200910093060A priority Critical patent/CN101661749A/zh
Publication of CN101661749A publication Critical patent/CN101661749A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明实施例提供了一种语音和音乐双模切换编/解码的方法,其特征在于,所述编码方法包括:判断输入的音频信号的类型是否发生了切换;当从音乐信号切换为语音信号时,则获取切换前的音乐信号的尾部信号,采用语音编码模式进行预编码,将切换后的语音信号采用语音编码模式进行编码;当输入的音频信号从语音信号切换为音乐信号时,则获取切换前的所述语音信号的尾部信号,采用音乐编码模式进行预编码,将切换后的音乐信号采用音乐编码模式进行编码。本发明实施例在音频信号发生切换时,通过采用预编码和预解码的方式,使得音乐信号与语音信号切换时,编码能够较平稳地过渡;在解码时也能保证音乐信号与语音信号的无失真切换。

Description

一种语音和音乐双模切换编/解码的方法
技术领域
本发明涉及音频编码技术领域,特别涉及一种语音和音乐双模切换编/解码的方法。
背景技术
在音频编码技术中,根据音频信号的类型,将音频信号简单分为语音信号和音乐信号两类。
语音信号由于具有短时平稳性,可以采用基于人体发声模型的时域预测编码技术,目前应用较广泛的有CELP(Coded-Excited Linear Predication,码激励线性预测)编码技术,该编码技术在较低码率(一般指单声道<24KBps,立体声<32KBps)下也可以得到高品质的语音信号。
音乐信号无论是频谱范围还是动态特性,都远超过语音信号,因此不适用于时域预测编码技术。通常,音乐信号一般利用人耳对声音的听觉掩蔽效应,采用变换编码技术进行编码。
随着编码技术的不断发展,对音频编码技术也有了更高的需求。由于语音信号和音乐信号采用的编码技术的原理不同,单一的语音编码器或音乐编码器对与之类型不匹配的音频信号无法进行高质量的编码,尤其在低码率时该问题会更加明显。针对此问题,一种解决方法就是采用选择性编码,即对音频信号逐帧进行类型识别,识别出为语音信号或音乐信号后,再选择相应类型的最优编码方式进行编码,这种选择性编码方式称之为语音和音乐双模切换编码。
现有技术中,有以下几种语音和音乐双模切换编码的方法:现有技术1提出了一种AMR-WB+(Enhanced Adaptive Multi-Rate Wideband codec,增强自适应多速率宽带编码)变换编码方法,该方法设置一个ACELP(Algebraic CodeExcited Linear Prediction,代数码本激励线性预测)与TCX(Transform CodedExcitation,变换码激励)混合编码器对音频信号低频部分进行编码,输入的音频信号先经LP(Linear Prediction,线性预测)滤波器,生成滤波器系数和激励信号源,然后对该激励信号逐帧进行选择,用闭环或开环的方式选择出最优的编码模式,对其中的语音信号采用ACELP编码,对其中的音乐信号采用TCX编码,每帧音频信号可有26种ACELP和TCX的编码组合。
现有技术2提出了一种基于AMR-WB+和HE-AAC(High EfficiencyAdvanced Audio Coding,高效率高级音频编码)的语音/音乐联合编码的方案,该方法对低频单声道的音频信号进行选择编码。若输入的低频部分的音频信号为语音信号,则先进行LP滤波,对得到的激励信号采用ACELP编码或基于MDCT(Modified Discrete Cosine Transform,修正离散余弦变换)的频域编码;若输入为音乐信号,那么直接对输入信号采用基于MDCT的频域编码。在音频信号的类型发生改变时,利用对音乐帧添加新的MDCT窗型来保证编码切换时信号的平滑过渡。
在对现有技术进行研究后,发明人发现,现有技术1中,该变换编码的方式在一定程度上增强了对音乐信号的编码能力,但在进行编码模式的选择时,闭环方法计算量较大大,开环方法能节省计算量,但降低了切换精确度,且由于该变换编码技术是对LP滤波后的激励信号进行编码的,所以对音乐信号的编码效率仍有局限性。
现有技术2的方案中,在核心编码模块中对切换的平滑过渡处理略显不足。当从语音切换到音乐时,对切换后的音乐首帧采用的新MDCT窗型长度并不适用,而且还会使该音乐首帧与切换前的语音尾帧有部分的时域重叠;而从音乐切换到语音时,切换前的音乐尾帧采用的新MDCT窗型也没有考虑到和后续的语音首帧衔接的问题,致使CELP编码无法立即建立记忆而引起信号切换处无法平稳过渡,造成信号失真。
发明内容
本发明实施例提供了一种语音和音乐双模切换编/解码的方法,所述编码方法包括:
判断输入的音频信号的类型是否发生了切换;
当输入的音频信号从音乐信号切换为语音信号时,则获取切换前的所述音乐信号的尾部信号,将切换前的所述音乐信号的尾部信号采用语音编码模式进行预编码,将切换后的语音信号采用语音编码模式进行编码;
当输入的音频信号从语音信号切换为音乐信号时,则获取切换前的所述语音信号的尾部信号,将切换前的所述语音信号的尾部信号采用音乐编码模式进行预编码,将切换后的音乐信号采用音乐编码模式进行编码。
所述解码方法包括:
判断输入的编码信息的类型是否发生了切换;
当输入的编码信息从音乐信号的编码信息切换为语音信号的编码信息时,则获取切换前的所述音乐信号的尾部信号的编码信息,将切换前的所述音乐信号的尾部信号的编码信息采用语音解码模式进行预解码,将切换后的语音信号的编码信息采用语音解码模式进行解码;
当输入的编码信息从语音信号的编码信息切换为音乐信号的编码信息时,则获取切换前的所述语音信号的尾部信号的编码信息,将切换前的所述语音信号的尾部信号的编码信息采用音乐解码模式进行预解码,将切换后的音乐信号的编码信息采用音乐解码模式进行解码。
本发明实施例还提供了一种语音和音乐双模切换编/解码的方法,所述编码方法包括:
判断输入的音频信号的类型是否发生了切换;
当输入的音频信号从音乐信号切换为语音信号时,则从切换前的所述音乐信号中,获取编码延迟前的音乐信号的尾部信号,将所述编码延迟前的音乐信号的尾部信号采用语音编码模式进行预编码,将编码延迟的音乐信号以及切换后的语音信号采用语音编码模式进行编码;
当输入的音频信号从语音信号切换为音乐信号时,则从切换前的所述语音信号中,获取编码延迟前的语音信号的尾部信号,将所述编码延迟前的语音信号的尾部信号采用音乐编码模式进行预编码,将编码延迟的语音信号以及切换后的音乐信号采用音乐编码模式进行编码。
所述解码方法,包括:
判断输入的编码信息的类型是否发生了切换;
当输入的编码信息从音乐信号的编码信息切换为语音信号的编码信息时,则对切换后的语音信号的编码信息采用语音解码模式进行解码;
当输入的编码信息从语音信号的编码信息切换为音乐信号的编码信息时,则对切换后的音乐信号的编码信息采用音乐解码模式进行解码。
本发明实施例在音频信号发生切换时,通过采用预编码和预解码的方式,使得音乐信号与语音信号切换时,编码能够较平稳地过渡;在解码时也能保证音乐信号与语音信号的无失真切换。在提高了音频编码效果的同时,也不会对编码效率造成影响。
附图说明
图1是本发明实施例1中提供语音和音乐双模切编码的方法流程图;
图2是本发明实施例1中提供语音和音乐双模切解码的方法流程图;
图3是本发明实施例2中提供语音和音乐双模切编码的方法流程图;
图4是本发明实施例2中提供的音频信号在编码端和解码端的时序关系和对应处理示意图;
图5是本发明实施例2中提供语音和音乐双模切解码的方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
本发明实施例提供了一种语音和音乐双模切换编/解码的方法,在输入的音频信号发生了切换时,通过将切换前的音频信号进行预编码,使得音频信号切换时能够平稳的过度,提高音频编码的质量。
本发明实施例的方法包括编码方法和解码方法,优选的,语音编码可采用AMR-WB(Adaptive Multi-Rate Wideband codec,自适应多速率宽带编码)的方式,音乐编码可采用AAC(Advanced Audio Coding,高级音频编码)的方式。当音频信号未发生切换时,则按照通常的编/解码方法进行处理,此处不再赘述。当音频信号发生了切换时,本发明实施例提供了如下的编/解码方法以进行处理,具体地,参见图1,编码方法包括:
101:判断输入的音频信号的类型是否发生了切换,当判断出输入的音频信号从音乐信号切换为语音信号时,则执行102;当判断出输入的音频信号从语音信号切换为音频信号时,则执行103。
具体的,判断的方法为:获取输入的音频信号的帧的类型;若当前帧的类型为语音信号,前一帧的类型为音乐信号,则判断输入的音频信号的类型由音乐信号切换为语音信号;若当前帧的类型为音乐信号,前一帧的类型为语音信号,则判断输入的语音信号的类型由音乐信号切换为音乐信号。
102:当输入的音频信号从音乐信号切换为语音信号时,则获取切换前的该音乐信号的尾部信号,将切换前的该音乐信号的尾部信号采用语音编码模式进行预编码,将切换后的语音信号采用语音编码模式进行编码。
具体的,在本发明实施例中,当从音乐信号切换到语音信号时,获取切换前的该音乐信号的尾部信号,可采用如下方法:在采用音乐编码模式对该音乐信号进行编码生成了音乐信号的编码信息后,获取该音乐信号的尾部信号的编码信息,即获取音乐信号的编码信息末尾部分的帧,获取的帧的数量可以根据具体要求限定,可以为一帧或多帧;对该音乐信号的尾部信号的编码信息进行解码,就得到了该音乐信号的尾部信号。优选的,可以在编码端建立一个和解码端完全一致的音乐解码模块,用于解码音乐信号的尾部信号的编码信息,解码得到的音乐信号的尾部信号与解码端完全一致,由此可以提高音乐信号编码与解码时的一致性。
具体的,将切换前的该音乐信号的尾部信号采用语音编码模式进行预编码,即对切换前的该音乐信号的尾部信号采用语音编码模式进行编码,并舍弃编码得到的该音乐信号的尾部信号的编码信息,不计入传输码流。
103:当输入的音频信号从语音信号切换为音乐信号时,则获取切换前的该语音信号的尾部信号,将切换前的该语音信号的尾部信号采用音乐编码模式进行预编码,将切换后的音乐信号采用音乐编码模式进行编码。
具体的,在本步骤中获取切换前的该语音信号的尾部信号时,考虑到音乐信号编码对先前信息的弱依赖性和编码复杂度,优选的方法为直接从输入的语音信号中提取该语音信号的尾部信号进行预编码,以此降低编码复杂度。
具体的,将切换前的该音乐信号的尾部信号采用语音编码模式进行预编码,即对切换前的该音乐信号的尾部信号采用语音编码模式进行编码,并舍弃编码得到的该音乐信号的尾部信号的编码信息,不计入传输码流。
本实施例的编码方法中,在发生音频信号的切换时采用了预编码的方式,通过对切换前的音频信号进行预编码,可以使得后续的音频信号在进行编码时,能够与切换前的音频信号保持连续性,由此使得音乐信号与语音信号切换时能够较平滑的过渡。
通过上述步骤就实现了对音频信号的编码。相应的,参见图2,解码方法包括:
201:判断输入的编码信息的类型是否发生了切换;当判断出输入的编码信息从音乐信号的编码信息切换为语音信号的编码信息时,则执行202;当判断出输入的编码信息从语音信号的编码信息切换为音乐信号的编码信息时,则执行203。
具体的,判断的方法为:获取输入的编码信息的帧的类型;若当前帧的类型为语音信号的编码信息,前一帧的类型为音乐信号的编码信息,则判断输入的编码信息的类型由音乐信号的编码信息切换为语音信号的编码信息;若当前帧的类型为音乐信号的编码信息,前一帧的类型为语音信号的编码信息,则判断输入的编码信息的类型由语音信号的编码信息切换为音乐信号的编码信息。
202:当输入的编码信息从音乐信号的编码信息切换为语音信号的编码信息时,则获取切换前的该音乐信号的尾部信号的编码信息,将切换前的该音乐信号的尾部信号的编码信息采用语音解码模式进行预解码,将切换后的语音信号的编码信息采用语音解码模式进行解码。
具体的,与编码方法相对应,在本步骤中,当从音乐信号的编码信息切换为语音信号的编码信息时,获取切换前的该音乐信号的尾部信号的编码信息,可采用如下方法:在对音乐信号的编码信息进行解码得到音乐信号后,获取该音乐信号的尾部信号,即获取音乐信号的末尾部分的帧,获取的帧的数量可以根据具体要求限定,可以为一帧或多帧;对该音乐信号的尾部信号采用语音编码模式进行编码,得到该音乐信号的尾部信号的编码信息。优选的,可以在解码端建立一个和编码端完全一致的语音编码模块,用于对音乐信号的尾部信号进行编码,由此可以提高音乐信号编码与解码时的一致性。
具体的,在本实施例中,将切换前的该音乐信号的尾部信号的编码信息采用语音解码模式进行预解码,即对切换前的该音乐信号的尾部信号的编码信息采用语音解码模式进行解码,并舍弃解码重构的该音乐信号的尾部信号,不计入解码信号。
203:当输入的编码信息从语音信号的编码信息切换为音乐信号的编码信息时,则获取切换前的该语音信号的尾部信号的编码信息,将切换前的该语音信号的尾部信号的编码信息采用音乐解码模式进行预解码,将切换后的音乐信号的编码信息采用音乐解码模式进行解码。
具体的,在本步骤中,当从语音信号的编码信息切换为音乐信号的编码信息时,获取切换前的该语音信号的尾部信号的编码信息,可采用如下方法:在对语音信号的编码信息进行解码得到语音信号后,获取该语音信号的尾部信号,即获取语音信号的末尾部分的帧,获取的帧的数量可以根据具体要求限定,可以为一帧或多帧;对该语音信号的尾部信号采用音乐编码模式进行编码,得到该语音信号的尾部信号的编码信息。优选的,可以在解码端建立一个和编码端完全一致的音乐编码模块,用于对语音信号的尾部信号进行编码。
具体的,在本步骤中,将切换前的该语音信号的尾部信号的编码信息采用音乐解码模式进行预解码,即对切换前的该语音信号的尾部信号的编码信息采用音乐解码模式进行解码,并舍弃该语音信号的尾部信号,不计入解码信号。
由上述方法可以看出,本实施例提供的音频信号编/解码的方法中,在发生音频信号的切换时,在编码时采用预编码的方式,在解码时采用预解码的方式,使得音乐信号与语音信号切换时能够较平稳地进行编码;在解码时也能保证音乐信号与语音信号的无失真切换。此外,本发明实施例未采用对滤波激励信号进行编码,因此,在提高了音频编码效果的同时,也不会对编码效率造成影响。
本发明实施例在音频信号发生切换时,通过采用预编码和预解码的方式,使得音乐信号与语音信号切换时,编码能够较平稳地过渡;在解码时也能保证音乐信号与语音信号的无失真切换。在提高了音频编码效果的同时,也不会对编码效率造成影响。
实施例2
本发明实施例提供了一种语音和音乐双模切换编/解码的方法,与实施例1类似,在输入的音频信号发生了切换时,通过将切换前的音频信号进行预编码,使得音频信号切换时能够平稳的过度,本发明实施例在实施例1的基础上,进一步考虑编/解码在有延迟的情况下,进行语音和音乐双模切换的编/解码。
本发明实施例的方法包括编码方法和解码方法,考虑到编码和解码时存在一定的延时,因此在编码或解码时,要相应的提前进行预编码和编码,提前编码的信号长度为编/解码延时的信号长度。具体地,参见图3,编码方法包括:
301:判断输入的音频信号的类型是否发生了切换,当判断出输入的音频信号从音乐信号切换为语音信号时,则执行302;当判断出输入的音频信号从语音信号切换为音频信号时,则执行303。
具体的,判断的方法与实施例1中的方法相同,此处不再赘述。
302:当输入的音频信号从音乐信号切换为语音信号时,则从切换前的该音乐信号中,获取编码延迟前的音乐信号的尾部信号,将该编码延迟前的音乐信号的尾部信号采用语音编码模式进行预编码,将编码延迟的音乐信号以及切换后的语音信号采用语音编码模式进行编码。
具体的,假设采用语音编码方式进行预编码的音乐信号的尾部信号的长度为L1,L1可以为一个语音帧的长度,语音编码时的总延时的信号长度为M;采用音乐编码方式进行预编码的语音信号的尾部信号的长度为L2,L2可以为一个音乐帧的长度,音乐编码时的总延时的信号长度为N,优选的,可以采用MDCT编码方式对音乐信号进行编码,通常,编码和解码的延时长度都大于帧长,即M>2*L1,N>2*L2。参见图4是音频信号在编码端和解码端的时序关系和对应处理示意图,其中包括了音乐信号切换为语音信号,以及语音信号切换为音乐信号两种情况,在图4中,编码端的音乐片段即音乐信号,语音片段即语音信号;解码端的音乐片段即解码重构的音乐信号,语音片段即解码重构的语音信号。音乐片段的类型为音乐信号,语音片段的类型为语音信号。
如图4所示,当从音乐信号A切换到语音信号B时,在进行预编码时,考虑到编码的延时,需要提前进行预编码,将该编码延迟前的音乐信号的尾部信号采用语音编码模式进行预编码,即在切换前的音乐信号的N+L1长度处进行语音编码方式的预编码。
对音乐信号进行预编码结束后,开始进行正常的语音编码,将编码延迟的音乐信号以及切换后的语音信号采用语音编码模式进行正常编码;即在切换前的音乐信号的N长度处进行语音编码方式的正常编码。
具体的,与实施例1相同,进行预编码的信号在编码后会被舍弃,不计入传输码流,此处不再赘述。
303:当输入的音频信号从语音信号切换为音乐信号时,则从切换前的该语音信号中,获取编码延迟前的语音信号的尾部信号,将该编码延迟前的语音信号的尾部信号采用音乐编码模式进行预编码,将编码延迟的语音信号以及切换后的音乐信号采用音乐编码模式进行编码。
如图4所示,当从语音信号B切换到音乐信号C时,在进行预编码时,考虑到编码延时,需要提前进行预编码,将该编码延迟前的语音信号的尾部信号采用音乐编码模式进行预编码,即在切换前的语音信号的M+L2长度处进行语音编码方式的预编码。
对语音信号进行预编码结束后,开始进行正常的音乐编码,将编码延迟的语音信号以及切换后的音乐信号采用音乐编码模式进行正常编码;即在切换前的语音信号的M长度处进行音乐编码方式的正常编码。
通过上述步骤就实现了对音频信号的编码,下面叙述本实施例的解码过程。在本实施例中由于编/解码具有延时,因此本实施例的解码过程与实施例1有所不同,不需要进行预解码,直接按照延时解码的方法进行解码即可。
具体的,参见图4的解码端,在考虑编/解码延时的情况下,当音乐片段A’结束音乐解码后,其解码的中止点应该比原始音乐片段A进行音乐编码的中止点提前N的长度。此时检测到下一帧是语音帧,就直接进入语音解码模式,由于语音解码的延时,解码的语音信号为图中的语音片段模块B’,语音片段模块B’中的前M长度的语音信号是不计入解码信号的。在这M长度的语音信号中,其中前M-L1长度的语音信号是原语音编/解码器中的残留点(图4中模块0’),后L1长度的语音信号对应预编码的部分(图4中模块3’),从语音片段B’第M+1处解码得到的才是有效语音信号。因为在语音片段B’中,有效语音信号的编码信息前已经包括了进行了预编码的语音信号,所以解码时就不需要增加预解码过程。
同理,当语音片段B’结束语音解码后,其解码的中止点也会比原始语音片段的中止点提前M长度。在音乐片段C’中,有效音乐信号的编码信息前已经包括了进行了预编码的音乐信号,所以解码时也不需要增加预解码过程。
参见图5,本实施例的解码方法包括:
501:判断输入的编码信息的类型是否发生了切换;当判断出输入的编码信息从音乐信号的编码信息切换为语音信号的编码信息时,则执行502;当判断出输入的编码信息从语音信号的编码信息切换为音乐信号的编码信息时,则执行503。
具体的,判断的方法与实施例1中的方法相同,此处不再赘述。
502:当输入的编码信息从音乐信号的编码信息切换为语音信号的编码信息时,则对切换后的语音信号的编码信息采用语音解码模式进行解码。
具体的,在解码时,由于具有延时,采用语音解码方式进行解码时,应提前进行解码,提前解码重构的信号的长度,即为语音编码的总延时长度M;采用音乐解码方式进行解码时,应提前解码重构的信号长度,即为音乐编码时的总延时长度N。
在对切换后的语音信号的编码信息采用语音解码模式进行解码时,由于具有延时,在解码时应根据语音解码的总延时长度进行解码,从对应于编码端的音乐信号的编码延迟的信号处,开始将解码得到的信号计入最终的解码信号。
参照图4中进行说明,在音乐解码中止前的M长度出开始进行语音编码,但解码得到的前M长度的信号是不计入最终的解码信号的,从音乐解码中止处开始,解码得到的信号才计入最终的解码信号。即图中模块0’及模块3’处的解码重构的信号不计入最终解码信号,模块3’处之后的解码重构的信号才计入最终解码信号。
503:当输入的编码信息从语音信号的编码信息切换为音乐信号的编码信息时,则对切换后的音乐信号的编码信息采用音乐解码模式进行解码。
在对切换后的音乐信号的编码信息采用音乐解码模式进行解码时,由于具有延时,在解码时应根据音乐解码的总延时长度进行解码,从对应于编码端的语音信号的编码延迟的信号处,开始将解码得到的信号计入最终的解码信号。
参照图4中进行说明,在音乐解码中止前的N长度处开始进行语音编码,但解码得到的前N长度的信号是不计入最终的解码信号的,从语音解码中止处开始,解码得到的信号才计入最终的解码信号。即图中模块2’及模块7’处的解码重构信号不计入最终解码信号,模块7’处之后的解码重构信号才计入最终解码信号。
由上述方法可以看出,本实施例提供的音频信号编/解码的方法,能够使音乐信号与语音信号切换时能够较平稳地进行编码;在解码时也能保证音乐信号与语音信号的无失真切换。此外,本发明实施例未采用对LP滤波激励信号进行编码,因此,在提高了音频编码效果的同时,也不会对编码效率造成影响。
本发明实施例在音频信号发生切换时,通过采用预编码和预解码的方式,使得音乐信号与语音信号切换时,编码能够较平稳地过渡;在解码时也能保证音乐信号与语音信号的无失真切换。在提高了音频编码效果的同时,也不会对编码效率造成影响。
本发明实施例可以利用软件实现,相应的软件程序可以存储在可读取的存储介质中,例如,路由器的硬盘、缓存或光盘中。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1、一种语音和音乐双模切换编/解码的方法,其特征在于,所述编码方法包括:
判断输入的音频信号的类型是否发生了切换;
当输入的音频信号从音乐信号切换为语音信号时,则获取切换前的所述音乐信号的尾部信号,将切换前的所述音乐信号的尾部信号采用语音编码模式进行预编码,将切换后的语音信号采用语音编码模式进行编码;
当输入的音频信号从语音信号切换为音乐信号时,则获取切换前的所述语音信号的尾部信号,将切换前的所述语音信号的尾部信号采用音乐编码模式进行预编码,将切换后的音乐信号采用音乐编码模式进行编码。
2、根据权利要求1所述的语音和音乐双模切换编/解码的方法,其特征在于,所述将切换前的所述音乐信号的尾部信号采用语音编码模式进行预编码,包括:
对切换前的所述音乐信号的尾部信号采用语音编码模式进行编码,并舍弃编码得到的音乐信号的尾部信号的编码信息,不计入传输码流;
所述将切换前的所述语音信号的尾部信号采用音乐编码模式进行预编码,包括:
对切换前的所述语音信号的尾部信号采用音乐编码模式进行编码,并舍弃编码得到的语音信号尾部信号的编码信息,不计入传输码流。
3、根据权利要求1所述的语音和音乐双模切换编/解码的方法,其特征在于,所述获取切换前的所述音乐信号的尾部信号,包括:
获取所述音乐信号的尾部信号的编码信息,所述编码信息采用了音乐编码模式进行编码;
对所述音乐信号的尾部信号的编码信息进行解码,得到所述音乐信号的尾部信号。
4、根据权利要求1所述的语音和音乐双模切换编/解码的方法,其特征在于,所述解码方法包括:
判断输入的编码信息的类型是否发生了切换;
当输入的编码信息从音乐信号的编码信息切换为语音信号的编码信息时,则获取切换前的所述音乐信号的尾部信号的编码信息,将切换前的所述音乐信号的尾部信号的编码信息采用语音解码模式进行预解码,将切换后的语音信号的编码信息采用语音解码模式进行解码;
当输入的编码信息从语音信号的编码信息切换为音乐信号的编码信息时,则获取切换前的所述语音信号的尾部信号的编码信息,将切换前的所述语音信号的尾部信号的编码信息采用音乐解码模式进行预解码,将切换后的音乐信号的编码信息采用音乐解码模式进行解码。
5、根据权利要求4所述的语音和音乐双模切换编/解码的方法,其特征在于,所述将切换前的所述音乐信号的尾部信号的编码信息采用语音解码模式进行预解码,包括:
对切换前的所述音乐信号的尾部信号的编码信息采用语音编码模式进行解码,并舍弃解码得到的所述音乐信号的尾部信号,不计入解码信号;
所述将切换前的所述语音信号的尾部信号的编码信息采用音乐解码模式进行预解码,包括:
对切换前的所述语音信号的尾部信号的编码信息采用音乐编码模式进行解码,并舍弃解码得到的所述语音信号的尾部信号,不计入解码信号。
6、根据权利要求4所述的语音和音乐双模切换编/解码的方法,其特征在于,所述获取切换前的所述音乐信号的尾部信号的编码信息,包括:
获取所述音乐信号的尾部信号,所述音乐信号的尾部信号采用音乐解码模式对相应的编码信息进行解码后得到;
对所述音乐信号的尾部信号采用语音编码模式进行编码,得到所述音乐信号的尾部信号的编码信息。
7、根据权利要求4所述的语音和音乐双模切换编/解码的方法,其特征在于,所述获取切换前的所述语音信号的尾部信号的编码信息,包括:
获取所述语音信号的尾部信号,所述语音信号的尾部信号采用语音解码模式对相应的编码信息进行解码后得到;
对所述语音信号的尾部信号采用音乐编码模式进行编码,得到所述语音信号的尾部信号的编码信息。
8、一种语音和音乐双模切换编/解码的方法,其特征在于,所述编码方法包括:
判断输入的音频信号的类型是否发生了切换;
当输入的音频信号从音乐信号切换为语音信号时,则从切换前的所述音乐信号中,获取编码延迟前的音乐信号的尾部信号,将所述编码延迟前的音乐信号的尾部信号采用语音编码模式进行预编码,将编码延迟的音乐信号以及切换后的语音信号采用语音编码模式进行编码;
当输入的音频信号从语音信号切换为音乐信号时,则从切换前的所述语音信号中,获取编码延迟前的语音信号的尾部信号,将所述编码延迟前的语音信号的尾部信号采用音乐编码模式进行预编码,将编码延迟的语音信号以及切换后的音乐信号采用音乐编码模式进行编码。
9、根据权利要求8所述的语音和音乐双模切换编/解码的方法,其特征在于,所述将所述编码延迟前的音乐信号的尾部信号采用语音编码模式进行预编码,包括:
对所述编码延迟前的音乐信号的尾部信号采用语音编码模式进行编码,并舍弃编码得到的所述编码延迟前的音乐信号的尾部信号的编码信息,不计入传输码流;
所述将所述编码延迟前的语音信号的尾部信号采用音乐编码模式进行预编码,包括:
对所述编码延迟前的语音信号的尾部信号采用音乐编码模式进行编码,并舍弃编码得到的所述编码延迟前的语音信号的尾部信号的编码信息,不计入传输码流。
10、根据权利要求8所述的语音和音乐双模切换编/解码的方法,其特征在于,所述获取编码延迟前的音乐信号的尾部信号,包括:
获取编码延迟前的音乐信号的尾部信号的编码信息,所述编码信息采用了音乐编码模式进行编码;
对所述编码延迟前的音乐信号的尾部信号的编码信息进行解码,得到编码延迟前的音乐信号的尾部信号。
11、根据权利要求8所述的语音和音乐双模切换编/解码的方法,其特征在于,所述解码方法,包括:
判断输入的编码信息的类型是否发生了切换;
当输入的编码信息从音乐信号的编码信息切换为语音信号的编码信息时,则对切换后的语音信号的编码信息采用语音解码模式进行解码;
当输入的编码信息从语音信号的编码信息切换为音乐信号的编码信息时,则对切换后的音乐信号的编码信息采用音乐解码模式进行解码。
CN200910093060A 2009-09-23 2009-09-23 一种语音和音乐双模切换编/解码的方法 Pending CN101661749A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910093060A CN101661749A (zh) 2009-09-23 2009-09-23 一种语音和音乐双模切换编/解码的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910093060A CN101661749A (zh) 2009-09-23 2009-09-23 一种语音和音乐双模切换编/解码的方法

Publications (1)

Publication Number Publication Date
CN101661749A true CN101661749A (zh) 2010-03-03

Family

ID=41789723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910093060A Pending CN101661749A (zh) 2009-09-23 2009-09-23 一种语音和音乐双模切换编/解码的方法

Country Status (1)

Country Link
CN (1) CN101661749A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2581902A4 (en) * 2010-06-14 2015-04-08 Panasonic Corp HYBRID AUDIO ENCODING DEVICE AND HYBRID AUDIO DECODING DEVICE
CN106415717A (zh) * 2014-05-15 2017-02-15 瑞典爱立信有限公司 音频信号分类和编码
CN106453818A (zh) * 2015-08-11 2017-02-22 三星电子株式会社 声音数据的自适应处理
WO2018058379A1 (zh) * 2016-09-28 2018-04-05 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
CN110636370A (zh) * 2018-06-25 2019-12-31 阿里巴巴集团控股有限公司 一种视频处理方法、装置、电子设备和可读介质
WO2022062942A1 (zh) * 2020-09-22 2022-03-31 华为技术有限公司 音频编解码方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2581902A4 (en) * 2010-06-14 2015-04-08 Panasonic Corp HYBRID AUDIO ENCODING DEVICE AND HYBRID AUDIO DECODING DEVICE
US9275650B2 (en) 2010-06-14 2016-03-01 Panasonic Corporation Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs
CN106415717A (zh) * 2014-05-15 2017-02-15 瑞典爱立信有限公司 音频信号分类和编码
CN106415717B (zh) * 2014-05-15 2020-03-13 瑞典爱立信有限公司 音频信号分类和编码
CN106453818A (zh) * 2015-08-11 2017-02-22 三星电子株式会社 声音数据的自适应处理
WO2018058379A1 (zh) * 2016-09-28 2018-04-05 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
US10593339B2 (en) 2016-09-28 2020-03-17 Huawei Technologies Co., Ltd. Multichannel audio signal processing method, apparatus, and system
US10984807B2 (en) 2016-09-28 2021-04-20 Huawei Technologies Co., Ltd. Multichannel audio signal processing method, apparatus, and system
US11922954B2 (en) 2016-09-28 2024-03-05 Huawei Technologies Co., Ltd. Multichannel audio signal processing method, apparatus, and system
CN110636370A (zh) * 2018-06-25 2019-12-31 阿里巴巴集团控股有限公司 一种视频处理方法、装置、电子设备和可读介质
CN110636370B (zh) * 2018-06-25 2022-02-01 斑马智行网络(香港)有限公司 一种视频处理方法、装置、电子设备和可读介质
WO2022062942A1 (zh) * 2020-09-22 2022-03-31 华为技术有限公司 音频编解码方法和装置

Similar Documents

Publication Publication Date Title
US11705137B2 (en) Apparatus for encoding and decoding of integrated speech and audio
EP1278184B1 (en) Method for coding speech and music signals
US10290308B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
EP2255358B1 (en) Scalable speech and audio encoding using combinatorial encoding of mdct spectrum
US10373621B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
AU2005246538B2 (en) Supporting a switch between audio coder modes
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
AU2003281378B2 (en) Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for CDMA wireless systems
KR101869395B1 (ko) 예측 인코딩 및 변환 인코딩 사이에서 교번하는 낮은―지연 사운드―인코딩
KR101698905B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
CN101661749A (zh) 一种语音和音乐双模切换编/解码的方法
CN106575505A (zh) Fd/lpd转换环境中的帧丢失管理
Vaillancourt et al. ITU-T EV-VBR: A robust 8-32 kbit/s scalable coder for error prone telecommunications channels
Jelínek et al. Itu-t G. EV-VBR baseline codec
CA2491623C (en) Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20100303