CN104269174B - 一种音频信号的处理方法及装置 - Google Patents

一种音频信号的处理方法及装置 Download PDF

Info

Publication number
CN104269174B
CN104269174B CN201410575199.0A CN201410575199A CN104269174B CN 104269174 B CN104269174 B CN 104269174B CN 201410575199 A CN201410575199 A CN 201410575199A CN 104269174 B CN104269174 B CN 104269174B
Authority
CN
China
Prior art keywords
audio signal
accompaniment
signal
placing
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410575199.0A
Other languages
English (en)
Other versions
CN104269174A (zh
Inventor
田彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Taile Culture Technology Co ltd
Original Assignee
Beijing Yinzhibang Culture Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yinzhibang Culture Technology Co Ltd filed Critical Beijing Yinzhibang Culture Technology Co Ltd
Priority to CN201410575199.0A priority Critical patent/CN104269174B/zh
Publication of CN104269174A publication Critical patent/CN104269174A/zh
Application granted granted Critical
Publication of CN104269174B publication Critical patent/CN104269174B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本发明实施例提供了一种音频信号的处理方法及装置。一方面,本发明实施例通过对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号;从而利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;进而对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。因此,本发明实施例提供的技术方案能够自动提取伴奏音频信号,以及自动生成待播放的音频信号,能够提高音频信号的处理效率。

Description

一种音频信号的处理方法及装置
【技术领域】
本发明涉及信号处理技术领域,尤其涉及一种音频信号的处理方法及装置。
【背景技术】
随着多媒体技术和智能设备的不断发展,利用终端收听音乐、广播等多媒体信息已经是一项基本功能。
目前,终端上安装的客户端能够向用户提供各种与音频相关的功能,如音频信号的播放功能、检索功能或者推荐功能等。现有技术中,客户端播放的音频信号主要包括原始的音频信号以及该音频信号相应的伴奏音频信号。
然而,现有技术中播放的伴奏音频信号是有依据原始的音频信号,由人工手动制作而成,并人工利用伴奏音频信号和原始的音频信号制作用于播放的音频信号,这样才能够在播放音频信号时只播放其中的伴奏音频信号。这种人工手动对伴奏音频信号进行处理的方式,使得音频信号的处理效率比较低。
【发明内容】
有鉴于此,本发明实施例提供了一种音频信号的处理方法及装置,可以实现自动提取伴奏音频信号,以及自动生成待播放的音频信号,能够提高音频信号的处理效率。
本发明实施例的一方面,提供一种音频信号的处理方法,包括:
对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号;
利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;
对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号,包括:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
依据所述第一音频信号,获得分离矩阵;
利用所述分离矩阵,对所述第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号,包括:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
对所述第一音频信号进行解码处理,以获得所述第一音频信号的左声道和右声道;
对所述左声道和所述右声道进行相关处理,以获得所述第一音频信号中伴奏音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述利用不同声道分别放置所述第一音频信号和所述伴奏音频信号,包括:
利用左声道放置所述第一音频信号,利用右声道放置所述伴奏音频信号;或者,
利用右声道放置所述第一音频信号,利用左声道放置所述伴奏音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述利用不同声道分别放置所述第一音频信号和所述伴奏音频信号,包括:
利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理;
利用左声道放置所述加密处理后的所述第一音频信号,利用右声道放置加密处理后的所述伴奏音频信号;或者,利用右声道放置所述加密处理后的所述第一音频信号,利用左声道放置加密处理后的所述伴奏音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号,包括:
依据目标音频格式,确定编码方式;
利用所述编码方式,对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号;
其中,所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式;相应的,所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
获得所述第一音频信号中演唱音频信号;
接收用户输入的演唱音频信号;
获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度;
依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
本发明实施例的一方面,提供一种音频信号的处理装置,包括:
信号分离单元,用于对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号;
信号处理单元,用于利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;
信号编码单元,用于对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信号分离单元,具体用于:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
依据所述第一音频信号,获得分离矩阵;
利用所述分离矩阵,对所述第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信号分离单元,具体用于:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
对所述第一音频信号进行解码处理,以获得所述第一音频信号的左声道和右声道;
对所述左声道和所述右声道进行相关处理,以获得所述第一音频信号中伴奏音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信号处理单元,具体用于:
利用左声道放置所述第一音频信号,利用右声道放置所述伴奏音频信号;或者,
利用右声道放置所述第一音频信号,利用左声道放置所述伴奏音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信号处理单元,具体用于:
利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理;
利用左声道放置所述加密处理后的所述第一音频信号,利用右声道放置加密处理后的所述伴奏音频信号;或者,利用右声道放置所述加密处理后的所述第一音频信号,利用左声道放置加密处理后的所述伴奏音频信号。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信号编码单元,具体用于:
依据目标音频格式,确定编码方式;
利用所述编码方式,对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号;
其中,所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式;相应的,所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述信号分离单元,还用于获得所述第一音频信号中演唱音频信号;
所述装置还包括:分数获取单元,用于接收用户输入的演唱音频信号;获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度;依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
由以上技术方案可以看出,本发明实施例具有以下有益效果:
本发明实施例通过对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号;从而利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;进而对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。本发明实施例提供的技术方案能够自动提取伴奏音频信号,以及自动生成待播放的音频信号,与现有技术相比,能够提高音频信号的处理效率,提高获得伴奏音频信号的效率,减少人力成本。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例所提供的音频信号的处理方法的流程示意图;
图2是本发明实施例所提供的音频信号的处理方法的实施例一的流程示意图;
图3是本发明实施例中对第一音频信号进行信号分离处理的示例图;
图4是本发明实施例所提供的音频信号的处理装置的功能方块图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二来描述音频信号,但这些关键词不应限于这些术语。这些术语仅用来将关键词彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一音频信号也可以被称为第二音频信号,类似地,第二音频信号也可以被称为第一音频信号。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
本发明实施例给出一种音频信号的处理方法,请参考图1,其为本发明实施例所提供的音频信号的处理方法的流程示意图,如图所示,该方法包括以下步骤:
S101,对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号。
具体的,对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号的方法可以包括但不限于以下两种:
第一种:首先,获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号。然后,依据所述第一音频信号,获得分离矩阵。最后,利用所述分离矩阵,对所述第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号。
第二种:首先,获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号。然后,对所述第一音频信号进行解码处理,以获得所述第一音频信号的左声道和右声道。最后,对所述左声道和所述右声道进行相关处理,以获得所述第一音频信号中伴奏音频信号。
请参考图2,其为本发明实施例所提供的音频信号的处理方法的实施例一的流程示意图,如图所示,获得第一音频信号的方法可以包括但不限于:可以利用爬虫工具,从互联网上爬取第一音频信号,然后将爬取到的第一音频信号存储在音频数据库中。或者,也可以接收音频提供者上传的第一音频信号,然后该第一音频信号将存储在音频数据库中。这样,就可以从音频数据库中获得需要进行处理的第一音频信号。
可以理解的是,该第一音频信号中可以包含伴奏音频信号和演唱音频信号,即该第一音频信号是伴奏音频信号和演唱音频信号的混合音频信号,因此,才需要从第一音频信号中分离出伴奏音频信号。
其中,该第一音频信号的音频格式可以包括但不限于动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer 3,MP3)格式、动态图像专家组(Moving Pictures Experts Group 4,MP4)格式或者微软媒体编码(Windows MediaAudio,WMA)格式等。
优选的,上述第一种方法中,依据所述第一音频信号,获得分离矩阵,然后利用所述分离矩阵,对所述第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号的方法可以包括但不限于:
请参考图3,其为本发明实施例中对第一音频信号进行信号分离处理的示例图,如图所示,包含伴奏音频信号和演唱音频信号的源音频信号S(t)经过一个2×2维线性的混合矩阵A后,可以得到第一音频信号X(t),即X(t)=S(t)×A,基于该原理,本发明实施例中,可以将第一音频信号X(t)经过一个2×2维线性的分离矩阵W后,就可以得到源音频信号S(t)中伴奏音频信号的估计和演唱音频信号的估计U(t)=[u1(t),u2(t)]T,即U(t)=X(t)×W。其中,分离矩阵W其实质为混合矩阵A的逆矩阵,因此能够实现第一音频信号的信号分离处理。在获得U(t)后,可以获得音频信号u1(t)和音频信号u2(t)的能量,并比较这两个能量,两个能量中能量较大的音频信号就是第一音频信号中的伴奏音频信号,能量较小的音频信号就是第一音频信号中的演唱音频信号。
需要说明的是,u1(t)和u2(t)分别表示伴奏音频信号的估计和演唱音频信号的估计,或者分别表示演唱音频信号的估计和伴奏音频信号的估计。其中,T表示转置。这里,由于经过分离矩阵处理后,会存在信号还原的误差,因此只能得到伴奏音频信号的最优近似值和演唱音频信号的最优近似值,即奏音频信号的估计和演唱音频信号的估计。
需要说明的是,U(t)中的两个分量与S(t)中的两个分量的排序可以不相同,也可以相同,上述方案中通过分离矩阵W的信号分离处理,使得第一音频信号中的演唱音频信号和伴奏音频信号之间的独立性最强。
例如,依据所述第一音频信号X(t),获得分离矩阵W的方法可以包括但不限于:利用对称快速独立成分分析(Fast-Independent Component Analysis,FastICA)算法对第一音频信号X(t)进行处理,以获得第一音频信号X(t)中每个分量的估计,然后对于每个分量的估计自适应地选择对应的对比函数,接着先利用一单元FastICA算法对每个分量的估计进行第一次修正,以及利用对比函数对每个分量进行第二次修正,最后使用优化参数对分量的估计进行第三次修正,依据经过三次修正后获得每个分量的估计生成分离矩阵W,分离矩阵W实际上是混合矩阵A的逆矩阵,因此,利用混合矩阵A的逆矩阵对第一音频信号X(t)进行处理,就可以得到源音频信号S(t)。
上述第二种方法是利用相关性技术实现的,相关性技术指的是利用左声道和右声道的相关性,消除两个声道中共同的演唱音频信号,由于两个声道中的伴奏音频信号是不相关的,因此,对两个声道经过相关处理后就可以剩下伴奏音频信号。
基于该原理,该第二种方法中,对所述第一音频信号进行解码处理,以获得所述第一音频信号的左声道和右声道。然后对所述左声道和所述右声道进行相关处理,以获得所述第一音频信号中伴奏音频信号的方法可以包括但不限于:
对所述第一音频信号进行解码处理,以获得所述第一音频信号的左声道X1[k]和右声道Xr[k]。
利用如下公式对所述左声道X1[k]和所述右声道Xr[k]进行相关处理:
D[k]=X1[k]-sin(γb)S[k]
其中,S[k]表示利用相关处理获得的演唱音频信号。
其中,D[k]表示利用相关处理获得的伴奏音频信号。
其中,X1[k]表示第一音频信号的左声道。
其中,Xr[k]表示第一音频信号的右声道。
其中,γb为预设的中间参数。
另外,在对第一音频信号进行信号分离处理后,除了可以获得所述第一音频信号中的伴奏音频信号,还可以获得第一音频信号中的演唱音频信号;然后接收用户输入的演唱音频信号,以及依据第一音频信号中演唱音频信号和用户输入的演唱音频信号,计算第一音频信号中演唱音频信号与用户输入的演唱音频信号的相似度,从而可以依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
需要说明的是,现有技术中,获得演唱分数时,都是直接计算第一音频信号与用户输入的演唱音频信号的相似度,依据该相似度获得演唱分数。由于第一音频信号中不仅含有演唱音频信号,也包括伴奏音频信号,所以获得的演唱分数的准确性较低,不能准确评价用户的演唱水平。本发明实施例中,还可以获得第一音频信号中的演唱音频信号,利用该演唱音频信号获得演唱分数可以提高演唱分数的准确性。
S102,利用不同声道分别放置所述第一音频信号和所述伴奏音频信号。
具体的,如图2所示,在从第一音频信号中分离出伴奏音频信号后,可以利用不同声道分别放置所述第一音频信号和所述伴奏音频信号。
本发明实施例中,利用不同声道分别放置所述第一音频信号和所述伴奏音频信号的方法可以包括但不限于以下几种:
第一种:利用左声道放置所述第一音频信号,利用右声道放置所述伴奏音频信号。
第二种:利用右声道放置所述第一音频信号,利用左声道放置所述伴奏音频信号。
第三种:首先,利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理。然后,利用左声道放置所述加密处理后的所述第一音频信号,利用右声道放置加密处理后的所述伴奏音频信号。
第四种:首先,利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理。然后,利用右声道放置所述加密处理后的所述第一音频信号,利用左声道放置加密处理后的所述伴奏音频信号。
例如,利用左声道放置所述第一音频信号,利用右声道放置所述伴奏音频信号的方法可以包括但不限于:左声道和右声道分别占用若干位的存储空间,如左声道占用1~10位中的第1、3、5、7、9位,右声道占用1~10位中的第2、4、6、8、10位,将第一音频信号放置在第1、3、5、7、9位,就可以实现利用左声道放置第一音频信号,即存储空间的奇数位放置第一音频信号。将伴奏音频信号放置在第2、4、6、8、10位,就可以实现利用右声道放置所述伴奏音频信号,即存储空间的偶数位放置伴奏音频信号。
再例如,左声道占用1~10位中的第1、2、3、4、5位,右声道占用1~10位中的第6、7、8、9、10位,将第一音频信号放置在第1、2、3、4、5位,就可以实现利用左声道放置第一音频信号;将伴奏音频信号放置在第6、7、8、9、10位,就可以实现利用右声道放置所述伴奏音频信号。
另外,利用右声道放置所述第一音频信号,利用左声道放置所述伴奏音频信号的方法与上述利用左声道放置所述第一音频信号,利用右声道放置所述伴奏音频信号的方法原理相同,这里不再赘述。
例如,所述加密算法可以包括但不限于消息摘要算法第五版(Message DigestAlgorithm V,MD5)、数据加密算法(Data Encryption Standard,DES)、3DES或者高级加密标准(Advanced Encryption Standard,AES)等。
需要说明的是,对所述第一音频信号进行加密处理所使用的加密算法与对所述伴奏音频信号进行加密处理所使用的加密算法可以相同也可以不同。
另外,利用不同声道放置第一音频信号和伴奏音频信号时,还可以将第一音频信号分为两部分,将伴奏音频信号也分为两部分,然后利用左声道放置第一音频信号的前一部分,利用右声道放置伴奏音频信号的前一部分,然后利用左声道放置伴奏音频信号的后一部分,利用右声道放置第一音频信号的后一部分,从而实现依据时间,并利用不同声道放置第一音频信号和伴奏音频信号。
S103,对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。
具体的,在如图3所示,利用不同声道分别放置所述第一音频信号和所述伴奏音频信号后,可以对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号,其方法可以包括但不限于:
首先,依据目标音频格式,确定编码方式。然后,利用所述编码方式,对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。
另外,如果在服务器侧获得第二音频信号,则服务器可以对该第二音频信号进行存储。服务器可以在收到客户端的音频下载请求时,将存储的第二音频信号提供给客户端。如果在客户端侧获得第二音频信号,则客户端可以在本地终端中存储该第二音频信号,在需要进行播放时,可以直接播放所存储的第二音频信号。
其中,对放置第一音频信号的声道和放置伴奏音频信号的声道一起进行编码处理,以获得第二音频信号,该第二音频信号在播放时,先对第二音频信号进行解码处理,从而获得第一音频信号和伴奏音频信号,并利用两个声道分别播放第一音频信号和伴奏音频信号,以实现利用不同声道播放第一音频信号和伴奏音频信号。这样,就可以通过设置声道,选择只播放左声道或者只播放右声道或者两个声道同时播放,进而能够实现在客户端中只播放伴奏音频信号,以实现客户端的K歌功能。
可以理解的是,放置第一音频信号的声道可以包括放置第一音频信号本身的声道,还可以包括放置加密处理后的第一音频信号的声道。同理,放置伴奏音频信号的声道可以包括放置伴奏音频信号本身的声道,还可以包括放置加密处理后的伴奏音频信号的声道。
需要说明的是,本发明实施例中所述声道,指的是音频在录制或者播放时,在不同空间位置采集或回放的相互独立的音频信号。
本发明实施例中,所述目标音频格式包括MP3格式、MPEG-4格式、WMA格式或者高级音频编码(Advanced Audio Coding,AAC)格式。相应的,所述编码方式包括MP3编码、MPEG-4编码、WMA编码或者AAC编码。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer,PC)、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
需要说明的是,S101~S103的执行主体可以为音频信号的处理装置,该装置可以位于本地终端的应用,或者还可以为位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,该装置也可以位于服务器,本发明实施例对此不进行特别限定。
另外,若该装置位于服务器时,可以是服务器预先生成并存储获得的第二音频信号,然后在客户端从服务器下载时直接提供给客户端。或者,也可以在接收到客户端的下载请求后,依据下载请求,即时获得第二音频信号,然后再将该第二音频信号提供给客户端。
可以理解的是,所述应用可以是安装在终端上的应用程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本发明实施例对此不进行限定。
本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
请参考图4,其为本发明实施例所提供的音频信号的处理装置的功能方块图。如图所示,该装置包括:
信号分离单元40,用于对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号;
信号处理单元41,用于利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;
信号编码单元42,用于对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。
优选的,所述信号分离单元40,具体用于:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
依据所述第一音频信号,获得分离矩阵;
利用所述分离矩阵,对所述第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号。
优选的,所述信号分离单元40,具体用于:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
对所述第一音频信号进行解码处理,以获得所述第一音频信号的左声道和右声道;
对所述左声道和所述右声道进行相关处理,以获得所述第一音频信号中伴奏音频信号。
优选的,所述信号处理单元41,具体用于:
利用左声道放置所述第一音频信号,利用右声道放置所述伴奏音频信号;或者,
利用右声道放置所述第一音频信号,利用左声道放置所述伴奏音频信号。
优选的,所述信号处理单元41,具体用于:
利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理;
利用左声道放置所述加密处理后的所述第一音频信号,利用右声道放置加密处理后的所述伴奏音频信号;或者,利用右声道放置所述加密处理后的所述第一音频信号,利用左声道放置加密处理后的所述伴奏音频信号。
优选的,所述信号编码单元42,具体用于:
依据目标音频格式,确定编码方式;
利用所述编码方式,对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号;
其中,所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式;相应的,所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
所述信号分离单元40,还用于获得所述第一音频信号中演唱音频信号;
所述装置还包括:分数获取单元43,用于接收用户输入的演唱音频信号;获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度;依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
由于本实施例中的各单元能够执行图1所示的方法,本实施例未详细描述的部分,可参考对图1的相关说明。
本发明实施例的技术方案具有以下有益效果:
本发明实施例通过对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号;从而利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;进而对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。
本发明实施例提供的技术方案能够自动提取伴奏音频信号,以及自动生成待播放的音频信号,与现有技术相比,能够提高音频信号的处理效率,提高获得伴奏音频信号的效率,减少人力成本。
另外,本发明实施例能够自动提取伴奏音频信号,从而实现可以只播放伴奏音频信号,使得客户端能够实现K歌功能,使得客户端可以输出更加丰富的音频信号,带来良好的用户体验。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种音频信号的处理方法,其特征在于,所述方法包括:
对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号;
利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;
对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号;
所述利用不同声道分别放置所述第一音频信号和所述伴奏音频信号,包括:
利用左声道放置所述第一音频信号,利用右声道放置所述伴奏音频信号;或者,
利用右声道放置所述第一音频信号,利用左声道放置所述伴奏音频信号;
所述对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号,包括:
依据目标音频格式,确定编码方式;
利用所述编码方式,对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。
2.根据权利要求1所述的方法,其特征在于,所述对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号,包括:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
依据所述第一音频信号,获得分离矩阵;
利用所述分离矩阵,对所述第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号。
3.根据权利要求1所述的方法,其特征在于,所述对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号,包括:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
对所述第一音频信号进行解码处理,以获得所述第一音频信号的左声道和右声道;
对所述左声道和所述右声道进行相关处理,以获得所述第一音频信号中伴奏音频信号。
4.根据权利要求1所述的方法,其特征在于,所述利用不同声道分别放置所述第一音频信号和所述伴奏音频信号,包括:
利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理;
利用左声道放置所述加密处理后的所述第一音频信号,利用右声道放置加密处理后的所述伴奏音频信号;或者,利用右声道放置所述加密处理后的所述第一音频信号,利用左声道放置加密处理后的所述伴奏音频信号。
5.根据权利要求1或4所述的方法,其特征在于,所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式;相应的,所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
6.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
获得所述第一音频信号中演唱音频信号;
接收用户输入的演唱音频信号;
获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度;
依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
7.一种音频信号的处理装置,其特征在于,所述装置包括:
信号分离单元,用于对第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号;
信号处理单元,用于利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;
信号编码单元,用于对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号;
所述信号处理单元,具体用于:
利用左声道放置所述第一音频信号,利用右声道放置所述伴奏音频信号;或者,
利用右声道放置所述第一音频信号,利用左声道放置所述伴奏音频信号;
所述信号编码单元,具体用于:
依据目标音频格式,确定编码方式;
利用所述编码方式,对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理,以获得第二音频信号。
8.根据权利要求7所述的装置,其特征在于,所述信号分离单元,具体用于:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
依据所述第一音频信号,获得分离矩阵;
利用所述分离矩阵,对所述第一音频信号进行信号分离处理,以获得所述第一音频信号中伴奏音频信号。
9.根据权利要求7所述的装置,其特征在于,所述信号分离单元,具体用于:
获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号;
对所述第一音频信号进行解码处理,以获得所述第一音频信号的左声道和右声道;
对所述左声道和所述右声道进行相关处理,以获得所述第一音频信号中伴奏音频信号。
10.根据权利要求7所述的装置,其特征在于,所述信号处理单元,具体用于:
利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理;
利用左声道放置所述加密处理后的所述第一音频信号,利用右声道放置加密处理后的所述伴奏音频信号;或者,利用右声道放置所述加密处理后的所述第一音频信号,利用左声道放置加密处理后的所述伴奏音频信号。
11.根据权利要求7或10所述的装置,其特征在于,所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式;相应的,所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
12.根据权利要求8或9所述的装置,其特征在于,所述信号分离单元,还用于获得所述第一音频信号中演唱音频信号;
所述装置还包括:分数获取单元,用于接收用户输入的演唱音频信号;获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度;依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
CN201410575199.0A 2014-10-24 2014-10-24 一种音频信号的处理方法及装置 Active CN104269174B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410575199.0A CN104269174B (zh) 2014-10-24 2014-10-24 一种音频信号的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410575199.0A CN104269174B (zh) 2014-10-24 2014-10-24 一种音频信号的处理方法及装置

Publications (2)

Publication Number Publication Date
CN104269174A CN104269174A (zh) 2015-01-07
CN104269174B true CN104269174B (zh) 2018-02-09

Family

ID=52160689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410575199.0A Active CN104269174B (zh) 2014-10-24 2014-10-24 一种音频信号的处理方法及装置

Country Status (1)

Country Link
CN (1) CN104269174B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106486128B (zh) * 2016-09-27 2021-10-22 腾讯科技(深圳)有限公司 一种双音源音频数据的处理方法及装置
CN110232931B (zh) * 2019-06-18 2022-03-22 广州酷狗计算机科技有限公司 音频信号的处理方法、装置、计算设备及存储介质

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2655806B2 (ja) * 1993-02-26 1997-09-24 三星電子株式会社 オーディオ信号を記録するオーディオ信号記録方法及びオーディオ信号の再生方法及び装置
CN1573920A (zh) * 2003-06-02 2005-02-02 三星电子株式会社 使用独立分量分析算法分离音乐与语音的装置与方法
CN1808571A (zh) * 2005-01-19 2006-07-26 松下电器产业株式会社 声音信号分离系统及方法
CN2802648Y (zh) * 2005-10-24 2006-08-02 彭灏 媒体播放器的辅助娱乐装置
CN1924992A (zh) * 2006-09-12 2007-03-07 东莞市步步高视听电子有限公司 一种卡拉ok人声播放方法
CN1937488A (zh) * 2006-08-28 2007-03-28 珠海金山软件股份有限公司 一种音频信号在网络中安全迅速传输和即时播放的方法
CN1945689A (zh) * 2006-10-24 2007-04-11 北京中星微电子有限公司 一种从歌曲中提取伴奏乐的方法及其装置
CN101707679A (zh) * 2009-10-30 2010-05-12 深圳创维-Rgb电子有限公司 一种电视机及其卡拉ok评分系统和方法
CN101819765A (zh) * 2009-02-27 2010-09-01 沈阳晨讯希姆通科技有限公司 一种手机卡拉ok打分方法
CN101902322A (zh) * 2009-05-26 2010-12-01 瑞昱半导体股份有限公司 音频数据传输方法及其音频处理系统
CN102264014A (zh) * 2010-05-26 2011-11-30 陈柚仁 音源分离式无线耳机模块及音源分离方法
CN102592607A (zh) * 2012-03-30 2012-07-18 北京交通大学 一种使用盲语音分离的语音转换系统和方法
CN102664018A (zh) * 2012-04-26 2012-09-12 杭州来同科技有限公司 基于径向基函数统计模型的演唱评分方法
CN102664016A (zh) * 2012-04-23 2012-09-12 安徽科大讯飞信息科技股份有限公司 唱歌评测方法及系统
CN102890936A (zh) * 2011-07-19 2013-01-23 联想(北京)有限公司 一种音频处理方法、终端设备及系统
CN202871289U (zh) * 2012-09-07 2013-04-10 深圳市爱码芯科技有限公司 一种基于mp3格式的便携式卡拉ok装置
CN103812646A (zh) * 2014-02-18 2014-05-21 立德高科(北京)数码科技有限责任公司 对音频数据进行加密输出的方法以其装置
CN103943113A (zh) * 2014-04-15 2014-07-23 福建星网视易信息系统有限公司 一种歌曲去伴奏的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5265860B2 (ja) * 2006-09-05 2013-08-14 ソニー株式会社 受信装置
JP5135205B2 (ja) * 2008-12-26 2013-02-06 日本放送協会 多チャンネル音響信号の音響圧縮符号化装置及び復号装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2655806B2 (ja) * 1993-02-26 1997-09-24 三星電子株式会社 オーディオ信号を記録するオーディオ信号記録方法及びオーディオ信号の再生方法及び装置
CN1573920A (zh) * 2003-06-02 2005-02-02 三星电子株式会社 使用独立分量分析算法分离音乐与语音的装置与方法
CN1808571A (zh) * 2005-01-19 2006-07-26 松下电器产业株式会社 声音信号分离系统及方法
CN2802648Y (zh) * 2005-10-24 2006-08-02 彭灏 媒体播放器的辅助娱乐装置
CN1937488A (zh) * 2006-08-28 2007-03-28 珠海金山软件股份有限公司 一种音频信号在网络中安全迅速传输和即时播放的方法
CN1924992A (zh) * 2006-09-12 2007-03-07 东莞市步步高视听电子有限公司 一种卡拉ok人声播放方法
CN1945689A (zh) * 2006-10-24 2007-04-11 北京中星微电子有限公司 一种从歌曲中提取伴奏乐的方法及其装置
CN101819765A (zh) * 2009-02-27 2010-09-01 沈阳晨讯希姆通科技有限公司 一种手机卡拉ok打分方法
CN101902322A (zh) * 2009-05-26 2010-12-01 瑞昱半导体股份有限公司 音频数据传输方法及其音频处理系统
CN101707679A (zh) * 2009-10-30 2010-05-12 深圳创维-Rgb电子有限公司 一种电视机及其卡拉ok评分系统和方法
CN102264014A (zh) * 2010-05-26 2011-11-30 陈柚仁 音源分离式无线耳机模块及音源分离方法
CN102890936A (zh) * 2011-07-19 2013-01-23 联想(北京)有限公司 一种音频处理方法、终端设备及系统
CN102592607A (zh) * 2012-03-30 2012-07-18 北京交通大学 一种使用盲语音分离的语音转换系统和方法
CN102664016A (zh) * 2012-04-23 2012-09-12 安徽科大讯飞信息科技股份有限公司 唱歌评测方法及系统
CN102664018A (zh) * 2012-04-26 2012-09-12 杭州来同科技有限公司 基于径向基函数统计模型的演唱评分方法
CN202871289U (zh) * 2012-09-07 2013-04-10 深圳市爱码芯科技有限公司 一种基于mp3格式的便携式卡拉ok装置
CN103812646A (zh) * 2014-02-18 2014-05-21 立德高科(北京)数码科技有限责任公司 对音频数据进行加密输出的方法以其装置
CN103943113A (zh) * 2014-04-15 2014-07-23 福建星网视易信息系统有限公司 一种歌曲去伴奏的方法和装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
《DES与AES数据加密算法探讨》;隋涛;《湖北第二师范学院学报》;20130831;第30卷(第8期);第66-68页 *
《MD5加密算法的研究及应用》;魏晓玲;《信息技术》;20100731(第7期);第145-151页 *
《基于内容分析的新浪新闻平台研究》;刘晓东;《情报杂志》;20090630;第28卷;第1-4页 *
《基于特征参数在歌唱比赛评分方法中的研究》;黄仁 等;《Silicon Valley》;20101231(第24期);第52-52页 *
《基于高斯混合模型流行音乐中歌唱部分的智能检测》;李丽娟 等;《小型微型计算机系统》;20090531;第30卷(第5期);第1017-1020页 *

Also Published As

Publication number Publication date
CN104269174A (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
US11477156B2 (en) Watermarking and signal recognition for managing and sharing captured content, metadata discovery and related arrangements
US9437201B2 (en) Advanced watermarking system and method
KR102043609B1 (ko) 다수의 미디어 처리 노드들을 갖는 적응적 처리
JP6060155B2 (ja) 受信データの比較を実行しその比較に基づいて後続サービスを提供する方法及びシステム
CN105144723B (zh) 使曲集的音频轨道与视频内容相关联
US20120197648A1 (en) Audio annotation
WO2015017428A1 (en) Associating audio tracks with video content by matching audio content of the video with audio tracks
CN105144752A (zh) 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置
CN105556598A (zh) 多通道音频的通道的选择性加水印
CN110149529B (zh) 媒体信息的处理方法、服务器及存储介质
US9183837B2 (en) Apparatus and method for determining bit rate for audio content
CN104269174B (zh) 一种音频信号的处理方法及装置
US20160313970A1 (en) Gapless media generation
RU2682026C1 (ru) Способ и устройство для определения параметра межканальной разности времени
WO2016110156A1 (zh) 语音搜索方法、装置、终端和计算机存储介质
US20240203431A1 (en) Robust authentication of digital audio
CN117837173A (zh) 用于音频渲染的信号处理方法、装置和电子设备
KR20150112351A (ko) 음원 추천 장치 및 방법
CN104023278A (zh) 流媒体数据处理方法和电子设备
Zmudzinski et al. Watermark embedding using audio fingerprinting
Yin et al. Advertising system based on cloud computing and audio watermarking
Kalker et al. Robust Identification of Audio Using Watermarking and Fingerprinting
Hollosi et al. Complexity Scalable Perceptual Tempo Estimation from HE-AAC Encoded Music
Healy Digital audio watermarking for broadcast monitoring and content identification
Yu et al. Detecting fake-quality MP3 based on Huffman table index.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160321

Address after: 100027 Haidian District, Qinghe Qinghe East Road, No. 23, building two, floor 2108, No., No. 18

Applicant after: BEIJING YINZHIBANG CULTURE TECHNOLOGY Co.,Ltd.

Address before: 100085 Beijing, Haidian District, No. ten on the street Baidu building, No. 10

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220414

Address after: 518057 3305, floor 3, building 1, aerospace building, No. 51, Gaoxin South ninth Road, high tech Zone community, Yuehai street, Nanshan District, Shenzhen, Guangdong

Patentee after: Shenzhen Taile Culture Technology Co.,Ltd.

Address before: 2108, floor 2, building 23, No. 18, anningzhuang East Road, Qinghe, Haidian District, Beijing 100027

Patentee before: BEIJING YINZHIBANG CULTURE TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right