CN108074557A - 音调调整方法、装置及存储介质 - Google Patents
音调调整方法、装置及存储介质 Download PDFInfo
- Publication number
- CN108074557A CN108074557A CN201711312180.7A CN201711312180A CN108074557A CN 108074557 A CN108074557 A CN 108074557A CN 201711312180 A CN201711312180 A CN 201711312180A CN 108074557 A CN108074557 A CN 108074557A
- Authority
- CN
- China
- Prior art keywords
- tone
- song
- information
- adjustment
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000001105 regulatory effect Effects 0.000 title claims abstract description 30
- 238000001228 spectrum Methods 0.000 claims abstract description 174
- 230000005236 sound signal Effects 0.000 claims abstract description 75
- 230000001755 vocal effect Effects 0.000 claims description 93
- 241001342895 Chorus Species 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明公开了一种音调调整方法,接收到歌曲播放信号时,获取音频输入设备采集的音频信号,获取所述音频信号对应的用户频谱信息,识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息,根据所述原唱频谱信息与所述用户频谱信息调整歌曲播放的音调。本发明还公开了一种音调调整装置及存储介质。实现唱歌系统中音调调整智能化,避免了应演唱者对音调的误判而调整音调不恰当而导致演唱者的发出的声音与歌曲音乐不协调的现象发生。
Description
技术领域
本发明涉及音乐播放领域,尤其涉及音调调整方法、装置及存储介质。
背景技术
唱歌逐渐成为人们日常休闲的娱乐活动,K歌系统为唱歌提供伴奏和歌词等服务,但由于每个人的声音能够发出的音频不同,很多歌曲的音调与演唱者声音的音调不符,所以很多演唱者不能够唱出歌曲原本的音调,导致演唱者无法演唱所有喜欢的歌曲。
目前对于与自身音调不符的歌曲,可以通过升降调手动调节歌曲的音调,演唱者使用遥控按键依据自身唱歌的音调升降歌曲的音调。但是大多数演唱者不是专业的歌手,不能够准确判断自身的音频特征,也无法及时知晓每首歌的原唱的音频特征,所以难以自行调整出较为协调的音调以适应自身发出的声音。
发明内容
本发明的主要目的在于提供一种音调调整方法,旨在解决演唱者难以通过手动调节歌曲的音调,调整出较为协调的歌曲音调以适应自身发出的声音的技术问题。
为实现上述目的,本发明提供一种音调调整方法,所述音调调整方法包括以下步骤:
接收到歌曲播放信号时,获取音频输入设备采集的音频信号;
获取所述音频信号对应的用户频谱信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述用户频谱信息调整播放歌曲的音调。
优选地,获取所述音频信号的声纹特征,判断历史记录中是否存在所述声纹特征;
若不存在,则在执行所述根据所述原唱频谱与所述用户频谱信息调整歌曲播放的音调之后,记录所述声纹特征与所述声纹特征对应的音调调整信息;
若存在,则获取历史记录中所述声纹特征对应的音调调整信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述音调调整信息调整播放所述歌曲的音调。
优选地,所述获取音频输入设备采集的音频信号的步骤之后,还包括:
获取所述音频信号的声纹特征;
当获取到的声纹特征为一个时,执行所述获取所述音频信号对应的用户频谱信息的步骤;
当获取到的声纹特征为多个时,获取各个声纹特征对应的频谱,根据各个频谱生成所述音频信号的频谱信息。
优选地,所述获取各个声纹特征对应的频谱,根据各个频谱生成所述音频信号的频谱信息的步骤包括:
当获取到的声纹特征为多个时,获取各个声纹特征对应的频谱的总幅值差,判断所述总幅值差是否大于第一预设幅值差;
当所述总幅值差大于第一预设幅值差时,将组成各个频谱的频率取平均值后生成所述音频信号的用户频谱信息;
当所述总幅值差小于或等于第一预设幅值差时,将最先获取到的声纹特征对应的频谱作为所述音频信号的用户频谱信息。
优选地,所述获取音频输入设备采集的音频信号的步骤之前,还包括:
检测到系统启动操作后,获取用户登录信息,判断历史记录中是否存在所述声纹特征;
若不存在,则执行所述根据所述原唱频谱与所述频谱信息调整歌曲播放的音调后,并记录所述登录信息以及所述登录信息对应的音调调整信息;
若存在,则获取历史记录中所述登录信息对应的音调调整信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述音调调整信息调整播放所述歌曲的音调。
优选地,所述根据所述原唱频谱信息与所述用户频谱信息调整播放歌曲的音调的步骤包括:
根据所述用户频谱信息获取所述音频信号对应的用户音调;
根据所述原唱频谱信息获取所述歌曲原唱对应的原唱音调;
当所述用户音调与所述原唱音调的差值大于第一预设阈值时,将所述调整歌曲的音调调节至所述用户音调。
优选地,所述根据所述用户频谱信息获取所述音频信号对应的用户音调的步骤之前,还包括:
获取所述用户频谱信息与所述原唱频谱信息中的总幅值差;
当所述用户频谱信息与所述原唱频谱信息中的总幅值差大于第二预设幅值差时,执行所述根据所述用户频谱信息获取所述音频信号对应的用户音调。
优选地,所述调整播放歌曲的音调的步骤包括:
识别当前音乐播放模式;
在当前音乐播放模式为伴奏模式时,调整播放歌曲的伴奏的音调;
在当前音乐播放模式为伴唱模式时,调整播放歌曲的伴奏和原唱的音调。
此外,为实现上述目的,本发明还提供一种音调调整装置,其特征在于,所述音调调整装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音调调整程序,所述音调调整程序被所述处理器执行时实现如上所述的音调调整方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有音调调整程序,所述音调调整程序被处理器执行时实现如上所述的音调调整方法的步骤。
本发明实施例提出的一种音调调整方法,歌曲开始播放时,获取一段时间内的音频输入设备采集到的一段音频信号,从这段音频信号中解析出对应的频谱信息,同时获取当前播放歌曲的歌曲信息,根据歌曲信息获取歌曲原唱的原唱频谱。根据声音的频谱能够判断声音频率范围,通过调节音调能够调整发出的声音进而调整了声音的频率。所以根据获取的音频信号对应的频谱信息以及原唱频谱能够将歌曲播放的音调调整到合适的档位,使得歌曲播放的音调与演唱者的声音音调相符,满足演唱者的唱歌需求,实现唱歌系统中音调调整智能化,避免了应演唱者对音调的误判而调整音调不恰当而导致演唱者的发出的声音与歌曲音乐不协调的现象发生。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本发明音调调整方法第一实施例的流程示意图;
图3为本发明音调调整方法第二实施例的流程示意图;
图4为本发明音调调整方法第三实施例的流程示意图;
图5为本发明音调调整方法第四实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:
接收到歌曲播放信号时,获取音频输入设备采集的音频信号;
获取所述音频信号对应的用户频谱信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述用户频谱信息调整播放歌曲的音调。
由于现有技术通过手动调整歌曲的音调,使得歌曲的音调与演唱者发出的声音的音调相协调,但是大多数演唱者不是专业的歌手,不能够准确判断自身的音频特征,也无法及时知晓每首歌的原唱的音频特征,导致歌曲的音调调整效果低下。
本发明提供一种解决方案,歌曲开始播放时,获取一段时间内的音频输入设备采集到的一段音频信号,从这段音频信号中解析出对应的频谱信息,同时获取当前播放歌曲的歌曲信息,根据歌曲信息获取歌曲原唱的原唱频谱。根据声音的频谱能够判断声音频率范围,通过调节音调能够调整发出的声音进而调整了声音的频率。所以根据获取的音频信号对应的频谱信息以及原唱频谱能够将歌曲播放的音调调整到合适的档位,使得歌曲播放的音调与演唱者的声音音调相符,满足演唱者的唱歌需求,实现唱歌系统中音调调整智能化,避免了应演唱者对音调的误判而调整音调不恰当而导致演唱者的发出的声音与歌曲音乐不协调的现象发生。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端可以是智能手机,也可以是电视机、平板电脑、PC、便携计算机等具有歌曲播放功能的终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、音箱、输入单元比如键盘(Keyboard)、话筒,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及音调调整程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的音调调整程序,并执行以下操作:
接收到歌曲播放信号时,获取音频输入设备采集的音频信号;
获取所述音频信号对应的用户频谱信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述用户频谱信息调整播放歌曲的音调。
进一步地,处理器1001可以调用存储器1005中存储的音调调整程序,还执行以下操作:
获取所述音频信号的声纹特征,判断历史记录中是否存在所述声纹特征;
若不存在,则在执行所述根据所述原唱频谱与所述用户频谱信息调整歌曲播放的音调之后,记录所述声纹特征与所述声纹特征对应的音调调整信息;
若存在,则获取历史记录中所述声纹特征对应的音调调整信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述音调调整信息调整播放所述歌曲的音调。
进一步地,处理器1001可以调用存储器1005中存储的音调调整程序,还执行以下操作:
获取所述音频信号的声纹特征;
当获取到的声纹特征为一个时,执行所述获取所述音频信号对应的用户频谱信息的步骤;
当获取到的声纹特征为多个时,获取各个声纹特征对应的频谱,根据各个频谱生成所述音频信号的频谱信息。
进一步地,处理器1001可以调用存储器1005中存储的音调调整程序,还执行以下操作:
当获取到的声纹特征为多个时,获取各个声纹特征对应的频谱的总幅值差,判断所述总幅值差是否大于第一预设幅值差;
当所述总幅值差大于第一预设幅值差时,将组成各个频谱的频率取平均值后生成所述音频信号的用户频谱信息;
当所述总幅值差小于或等于第一预设幅值差时,将最先获取到的声纹特征对应的频谱作为所述音频信号的用户频谱信息。
进一步地,处理器1001可以调用存储器1005中存储的音调调整程序,还执行以下操作:
检测到系统启动操作后,获取用户登录信息,判断历史记录中是否存在所述声纹特征;
若不存在,则执行所述根据所述原唱频谱与所述频谱信息调整歌曲播放的音调后,并记录所述登录信息以及所述登录信息对应的音调调整信息;
若存在,则获取历史记录中所述登录信息对应的音调调整信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述音调调整信息调整播放所述歌曲的音调。
进一步地,处理器1001可以调用存储器1005中存储的音调调整程序,还执行以下操作:
根据所述用户频谱信息获取所述音频信号对应的用户音调;
根据所述原唱频谱信息获取所述歌曲原唱对应的原唱音调;
当所述用户音调与所述原唱音调的差值大于第一预设阈值时,将所述调整歌曲的音调调节至所述用户音调。
进一步地,处理器1001可以调用存储器1005中存储的音调调整程序,还执行以下操作:
获取所述用户频谱信息与所述原唱频谱信息中的总幅值差;
当所述用户频谱信息与所述原唱频谱信息中的总幅值差大于第二预设幅值差时,执行所述根据所述用户频谱信息获取所述音频信号对应的用户音调。
进一步地,处理器1001可以调用存储器1005中存储的音调调整程序,还执行以下操作:
识别当前音乐播放模式;
在当前音乐播放模式为伴奏模式时,调整播放歌曲的伴奏的音调;
在当前音乐播放模式为伴唱模式时,调整播放歌曲的伴奏和原唱的音调。
参照图2,提出本发明音调调整方法第一实施例,所述音调调整方法包括:
步骤S10,接收到歌曲播放信号时,获取音频输入设备采集的音频信号。
声音的三种特征分别是音调(也称频率)、响度和音色,常用的音频输入设备有麦克风,在麦克风采集到的音频信号中能够获得被采集的声音的三种特征,以及根据这三种声音特征而唯一确定的声纹。每个人的声纹与指纹一样是独一无二的,同样声纹的声音可以判断是同一个人发出的,所以可以根据声纹来辨别声音发出者的身份。
在K歌设备歌曲播放后,演唱者跟随音乐开始唱歌,通过麦克风等音频输入设备采集演唱者一段时间间隔内的声音信号,从这段声音信号中可以获取演唱者声音的音调。
步骤S20,获取所述音频信号对应的频谱信息。
频谱是频率谱密度的简称,是频率的分布曲线。根据音频信号可以得到声音的频率特征,将所有频率组合起来即可得到声音的频谱,通过对频谱的分析可以知道该声音能够产生的频率范围,即可得到该声音对应的音调区间。所以将采集到的演唱者的声音信号进行解析后能够得到该演唱者能够发出哪些音调的声音,即可知道该演唱者唱歌时哪些调能够唱出哪些调无法唱出。
步骤S30,识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息。
歌曲信息包括歌名、演唱者、作曲、作词、歌词、伴奏等。根据歌曲信息从服务器中提取出歌曲的原唱声音,根据原唱声音得到原唱的频谱特征,进而可以通过原唱的频谱特征分析得到当前播放歌曲符合的音调区间。
步骤S40,根据所述原唱频谱信息与所述用户频谱信息调整播放歌曲的音调。
根据频谱信息可以分析得到音频输入装置采集到的演唱者的音调,根据原唱频谱可以分析得到原唱者的音调,其中,原唱频谱得到的音调代表着与当前播放的歌曲相匹配的音调。所以将采集到的演唱者的声音信息中分析出的音调与原唱频谱中分析得到的音调进行比对,当两者差值大于一定值时,按照演唱者的音调升高或降低当前歌曲播放的音调,使得音调调整后的歌曲播放能够与演唱者的声音相匹配,音调调整更加恰当、智能。
此外,还可以直接将先前获取的原唱频谱和采集到的演唱者声音的频谱信息进行对比,对比两者中频谱的每个频率幅值的差异,统计总幅值差。当总幅值差大于一定幅值差时,再对上述两个频谱分析得到对应的音调,进而比较音调的差值来调整当前播放歌曲的音调;而当总幅值小于这一定幅值差时,说明演唱者的声调与原唱的声调较为相似,无需调整当前播放歌曲的音调,此时已无需分析频谱以获取音调,简化了音调调整程序,节约程序运行时间。
其中,调整当前播放歌曲的音调前,先判断当前的音乐播放模式,如果当前音乐播放模式是伴奏模式时,直接将歌曲的伴奏音调进行调整;如果当前音乐播放模式是伴唱模式时,则接将歌曲的伴奏以及原唱的音调同时进行调整。
在本实施例中在歌曲开始播放时,获取一段时间内的音频输入设备采集到的一段音频信号,从这段音频信号中解析出对应的频谱信息,同时获取当前播放歌曲的歌曲信息,根据歌曲信息获取歌曲原唱的原唱频谱。根据声音的频谱能够判断声音频率范围,通过调节音调能够调整发出的声音进而调整了声音的频率。所以根据获取的音频信号对应的频谱信息以及原唱频谱能够将歌曲播放的音调调整到合适的档位,使得歌曲播放的音调与演唱者的声音音调相符,满足演唱者的唱歌需求,实现唱歌系统中音调调整智能化,避免了应演唱者对音调的误判而调整音调不恰当而导致演唱者的发出的声音与歌曲音乐不协调的现象发生。
参照图3,提出本发明音乐的音调调整方法第二实施例的流程示意图,基于上述第一实施例,所述步骤S10之后,还包括步骤:
步骤S50,获取所述音频信号的声纹特征。
步骤S60,判断历史记录中是否存在所述音频信号的声纹特征。
根据音频信号可以获取音频信号中声音的音调、响声和音色三种基本特征,根据这三种特征可以唯一确定声纹特征,而同一个人唯一对应一种声纹,所以通过声纹特征可以确定声音发出者的身份。在K歌系统中将接收到的所有声音的声纹特征进行存储,当接收到演唱者发出的音频信号时,获取音频信号的声纹特征,并搜索系统历史记录中该声纹特征的记录,以判断该声纹特征是否存储在历史记录中,即可知道该演唱者是否先前通过该K歌系统演唱过。
步骤S20,当历史记录中不存在所述声纹特征时,获取所述音频信号对应的频谱信息。
如果在系统历史记录中未搜索到该声纹特征,则说明历史记录中不存在该声纹特征,即该演唱者未使用过该K歌系统,则开始执行步骤S20根据所述音频信号获取所述音频信号对应的频谱信息,并在执行在步骤S40根据所述原唱频谱信息与所述用户频谱信息调整歌曲播放的音调之后,将该声纹特征以及该声纹特征涉及到的对应的音调调整信息存储在历史记录中,以供后期检测到该声纹特征后,直接调取历史记录终端调整信息进行当前播放歌曲的音调调整。
步骤S30,当历史记录中存在所述声纹特征时,识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息。
步骤S70,获取历史记录中所述声纹特征对应的音调调整信息,根据所述原唱频谱信息与所述音调调整信息调整播放所述歌曲的音调。
如果在系统历史记录中搜索到该声纹特征,则说明历史记录中存在该声纹特征,即该演唱者在演唱当前播放的歌曲之前已经使用过该K歌系统,则直接调取历史记录中该声纹信息对应的调整信息,根据该音调调整信息以及当前播放歌曲的原唱频谱信息调整当前播放歌曲的音调。简化了音调调整步骤,使得音调调整更加快速。例如,甲在演唱歌曲A时,系统采集甲的一段音频信号,该音频信号对应的声纹在历史记录中不存在,则获取该音频信号对应的频谱以及歌曲A的原唱频谱,根据该音频信号对应的频谱以及歌曲A的原唱频谱对歌曲A进行音调调整,并将甲的声纹特征以及音调调整信息记录到服务器中。之后,甲继续演唱歌曲B,系统再次采集甲的一段音频信号,在历史记录搜索到该音频信号对应的声纹特征,则直接根据历史记录中该声纹特征对应的音调调整信息以及歌曲B的原唱频谱将歌曲B的音调进行调整。
在本实施例中,在音频信号获取后,先对音频信号的声纹特征进行提取,判断历史记录中是否存在该声纹特征,当不存在时,则按照第一实施例中的步骤进行歌曲播放音调的调整,并在音调调整之后将该声纹特征以及对应的音调调整信息记录到服务器,以供再次检测到该声纹特征后直接调取记录中的音调调整信息,根据该音调调整信息进行歌曲播放的音调调整。所以当历史记录中存在该声纹特征时,直接根据历史记录中该声纹特征对应的音调调整信息以及当前播放歌曲的原唱频谱信息进行调整当前播放歌曲的音调,使得调整后的音调更加匹配演唱者的声音,使得演唱者的声音与歌曲音乐的融合更加协调。本方案通过识别与记录声纹特征简化了音调调整的程序,使得音调调整更加快速,实现音调调整的智能化。
参照图4,提出本发明音调调整方法第三实施例的流程示意图,基于上述第一或第二实施例,所述步骤S50之后,还包括:
步骤S80,判断获取到的声纹特征是否为一个。
当多人合唱时,此时获取到的音频信号中就有多个人的声音,此时获取到的声纹特征自然也是多个,所以在调整歌曲音调之间可以事先判断当前演唱者是一个还是多个,根据演唱者的个数调整当前播放的歌曲的音调。
步骤S90,当获取到的声纹特征为多个时,获取各个声纹特征对应的频谱,根据各个频谱生成所述音频信号的频谱信息。
当获取到的声纹特征为多个时,说明当前是多人合唱情形,由于每个人的声音音调不同,如果按照某个人的音调进行调整歌曲音调的话,合唱的其他人的声音将与音乐播放的音调格格不入。所以,在多人合唱时,分别获取各个声纹对应的频谱,当各个声纹对应的多个频谱中两两幅值差有一个大于第一预设幅值差时,将各个频谱中对应频率取平均值后组成新的频谱,以该频谱为参考的频谱信息,执行步骤S30,将其与原唱频谱进行比对后调整当前歌曲播放的音调,以满足多人合唱的音调需求。如果各个声纹对应的多个频谱中两两幅值差均小于或等于该第一预设幅值差时,说明合唱的多人的声音音调差异较小,则直接将最先获取到的声纹特征对应的频谱作为参考的频谱信息,执行步骤S30,将其与原唱频谱进行比对后调整当前歌曲播放的音调,以简化频谱生成操作,降低声调调整难度,加快调整速度。
步骤S20,当获取到的声纹特征为一个时,获取所述音频信号对应的用户频谱信息。
当声纹特征为一个时则按第一或第二实施例,执行步骤S20根据所述音频信号获取所述音频信号对应的频谱信息。
在本实施例中,获取到音频信号的声纹特征后,先判断该声纹特征是一个还是多个,以判断当前K歌系统的使用情况,当获取到的声纹特征为多个时,说明当前是多人合唱,则将各个声纹特征对应的频谱综合后生成供后期音调调整参考的频谱信息,以使调整后的歌曲音调能够满足多人合唱的音调需求;当获取到的声纹特征为一个时,说明当前是多单人演唱,则按照上述第一或第二实施例中的步骤进行当前播放歌曲的音调调整。实现了多人合唱下歌曲音调调整的智能化和普遍适用性。
参照图5,提出本发明音调调整方法第四实施例的流程示意图,基于上述第一至三任意实施例,所述步骤S10之前,还包括:
步骤S100,检测到系统启动操作后,获取用户登录信息。
步骤S110,判断历史记录中是否存在所述登录信息。
当用户打开K歌系统时,K歌系统弹出用户登录界面,识别用户输入的登录信息,并在系统历史记录搜索该登录信息对应的记录,以判断该登录信息是否存储在历史记录中,即该演唱者先前是否使用过该K歌系统。
步骤S30,当记录中存在所述登录信息时,识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息。
步骤S120,获取历史记录中所述登录信息对应的音调调整信息,根据所述原唱频谱信息与所述音调调整信息调整播放所述歌曲的音调。
如果在系统历史记录中搜索到该登录信息,则说明历史记录中存在该登录新,即该演唱者先前使用过该K歌系统,则直接调取历史记录中该登录信息对应的音调调整信息,根据该音调调整信息以及当前播放歌曲的原唱频谱信息调整当前播放歌曲的音调。简化了音调调整步骤,使得音调调整更加快速。
步骤S10,当记录中不存在所述登录信息时,接收到歌曲播放信号时,获取音频输入设备采集的音频信号。
如果在系统历史记录中未搜索到该登录信息,则说明历史记录中不存在该登录信息,即该用户未使用过该K歌系统,则开始执行步骤S10接收到歌曲播放信号时,获取音频输入设备采集的音频信号,并在执行在步骤S40根据所述原唱频谱信息与所述用户频谱信息调整歌曲播放的音调之后,将该登录信息以及该登录信息涉及到的对应的音调调整信息存储在历史记录中,以供后期检测到该登录信息后,直接调取历史记录终端调整信息进行当前播放歌曲的音调调整。
在本实施例中,在检测到K歌系统被启动后,K歌系统弹出用户登录界面,识别用户输入的登录信息,并在系统历史记录搜索该登录信息对应的记录,以判断该登录信息是否存储在历史记录中,即该演唱者先前是否使用过该K歌系统。当历史记录中存在该登录信息时,直接根据历史记录中的登录信息对应的音调调整信息以及当前播放歌曲的原唱频谱信息进行歌曲的音调调整,使得调整后的音调匹配演唱者的声音,使得演唱者的声音与歌曲音乐的融合更加协调。当历史记录中不存在该登录信息时,则按照上述第一至第三实施例中的步骤进行歌曲播放音调的调整,并在音调调整之后将该登录信息以及其对应的音调调整信息记录到服务器,以供再次检测到该登录信息后直接调取记录中的音调调整信息,根据该音调调整信息进行歌曲播放的音调调整。本方案通过识别用户登录信息,通过对用户的登录信息以及其音调调整信息的存储,简化了音调调整的程序,使得音调调整更加快速,实现音调调整的智能化。
此外,本发明实施例还提出一种音调调整装置,所述音调调整装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音调调整程序,所述音调调整程序被所述处理器执行时实现如上各个实施例所述的音乐的音调调整方法的步骤。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有音调调整程序,所述音调调整程序被处理器执行时实现如上各个实施例所述的音调调整方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种音调调整方法,其特征在于,所述音调调整方法包括以下步骤:
接收到歌曲播放信号时,获取音频输入设备采集的音频信号;
获取所述音频信号对应的用户频谱信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述用户频谱信息调整播放歌曲的音调。
2.如权利要求1所述的音调调整方法,其特征在于,所述获取音频输入设备采集的音频信号的步骤之后,还包括:
获取所述音频信号的声纹特征,判断历史记录中是否存在所述声纹特征;
若不存在,则在执行所述根据所述原唱频谱与所述用户频谱信息调整歌曲播放的音调之后,记录所述声纹特征与所述声纹特征对应的音调调整信息;
若存在,则获取历史记录中所述声纹特征对应的音调调整信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述音调调整信息调整播放所述歌曲的音调。
3.如权利要求1所述的音调调整方法,其特征在于,所述获取音频输入设备采集的音频信号的步骤之后,还包括:
获取所述音频信号的声纹特征;
当获取到的声纹特征为一个时,执行所述获取所述音频信号对应的用户频谱信息的步骤;
当获取到的声纹特征为多个时,获取各个声纹特征对应的频谱,根据各个频谱生成所述音频信号的频谱信息。
4.如权利要求3所述的音调调整方法,其特征在于,所述获取各个声纹特征对应的频谱,根据各个频谱生成所述音频信号的频谱信息的步骤包括:
当获取到的声纹特征为多个时,获取各个声纹特征对应的频谱的总幅值差,判断所述总幅值差是否大于第一预设幅值差;
当所述总幅值差大于第一预设幅值差时,将组成各个频谱的频率取平均值后生成所述音频信号的用户频谱信息;
当所述总幅值差小于或等于第一预设幅值差时,将最先获取到的声纹特征对应的频谱作为所述音频信号的用户频谱信息。
5.如权利要求1所述的音调调整方法,其特征在于,所述获取音频输入设备采集的音频信号的步骤之前,还包括:
检测到系统启动操作后,获取用户登录信息,判断历史记录中是否存在所述登录信息;
若不存在,则执行所述根据所述原唱频谱与所述频谱信息调整歌曲播放的音调后,并记录所述登录信息以及所述登录信息对应的音调调整信息;
若存在,则获取历史记录中所述登录信息对应的音调调整信息;
识别当前播放歌曲的歌曲信息,根据所述歌曲信息获取所述歌曲的原唱频谱信息;
根据所述原唱频谱信息与所述音调调整信息调整播放所述歌曲的音调。
6.如权利要求1所述的音调调整方法,其特征在于,所述根据所述原唱频谱信息与所述用户频谱信息调整播放歌曲的音调的步骤包括:
根据所述用户频谱信息获取所述音频信号对应的用户音调;
根据所述原唱频谱信息获取所述歌曲原唱对应的原唱音调;
当所述用户音调与所述原唱音调的差值大于第一预设阈值时,将所述调整歌曲的音调调节至所述用户音调。
7.如权利要求6所述的音调调整方法,其特征在于,所述根据所述用户频谱信息获取所述音频信号对应的用户音调的步骤之前,还包括:
获取所述用户频谱信息与所述原唱频谱信息中的总幅值差;
当所述用户频谱信息与所述原唱频谱信息中的总幅值差大于第二预设幅值差时,执行所述根据所述用户频谱信息获取所述音频信号对应的用户音调。
8.如权利要求1-7任一项所述的音调调整方法,其特征在于,所述调整播放歌曲的音调的步骤包括:
识别当前音乐播放模式;
在当前音乐播放模式为伴奏模式时,调整播放歌曲的伴奏的音调;
在当前音乐播放模式为伴唱模式时,调整播放歌曲的伴奏和原唱的音调。
9.一种音调调整装置,其特征在于,所述音调调整装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音调调整程序,所述音调调整程序被所述处理器执行时实现如权利要求1至8中任一项所述的音调调整方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有音调调整程序,所述音调调整程序被处理器执行时实现如权利要求1至8中任一项所述的音调调整方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711312180.7A CN108074557B (zh) | 2017-12-11 | 2017-12-11 | 音调调整方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711312180.7A CN108074557B (zh) | 2017-12-11 | 2017-12-11 | 音调调整方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108074557A true CN108074557A (zh) | 2018-05-25 |
CN108074557B CN108074557B (zh) | 2021-11-23 |
Family
ID=62158195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711312180.7A Active CN108074557B (zh) | 2017-12-11 | 2017-12-11 | 音调调整方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108074557B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109003627A (zh) * | 2018-09-07 | 2018-12-14 | 广州酷狗计算机科技有限公司 | 确定音频得分的方法、装置、终端及存储介质 |
CN109272975A (zh) * | 2018-08-14 | 2019-01-25 | 无锡冰河计算机科技发展有限公司 | 演唱伴奏自动调整方法、装置及ktv点唱机 |
CN109712635A (zh) * | 2018-12-28 | 2019-05-03 | 深圳创维-Rgb电子有限公司 | 一种声音数据处理方法、智能终端及存储介质 |
CN110035296A (zh) * | 2019-04-23 | 2019-07-19 | 广州酷狗计算机科技有限公司 | 直播间歌曲信息的显示方法、设备及可读存储介质 |
CN110634462A (zh) * | 2019-09-30 | 2019-12-31 | 深圳市通世海精密机械有限公司 | 一种声音调整系统及调整方法 |
CN111046226A (zh) * | 2018-10-15 | 2020-04-21 | 阿里巴巴集团控股有限公司 | 一种音乐的调音方法及装置 |
CN111048058A (zh) * | 2019-11-25 | 2020-04-21 | 福建星网视易信息系统有限公司 | 一种实时调整歌曲曲谱的演唱或演奏方法及终端 |
CN111370024A (zh) * | 2020-02-21 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 一种音频调整方法、设备及计算机可读存储介质 |
CN112201263A (zh) * | 2020-10-16 | 2021-01-08 | 广州资云科技有限公司 | 一种基于歌曲识别的电音基调调整系统 |
CN112397043A (zh) * | 2020-11-03 | 2021-02-23 | 北京中科深智科技有限公司 | 一种语音转化成歌曲的方法和系统 |
CN108074557B (zh) * | 2017-12-11 | 2021-11-23 | 深圳Tcl新技术有限公司 | 音调调整方法、装置及存储介质 |
CN113707113A (zh) * | 2021-08-24 | 2021-11-26 | 北京达佳互联信息技术有限公司 | 用户歌声的修音方法、装置及电子设备 |
CN118312123A (zh) * | 2024-04-17 | 2024-07-09 | 广州资云科技有限公司 | 歌曲播放进度识别方法、装置、计算机设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5447438A (en) * | 1992-10-14 | 1995-09-05 | Matsushita Electric Industrial Co., Ltd. | Music training apparatus |
WO2006106466A1 (en) * | 2005-04-07 | 2006-10-12 | Koninklijke Philips Electronics N.V. | Method and signal processor for modification of audio signals |
CN101154376A (zh) * | 2006-09-26 | 2008-04-02 | 久久音乐科技有限公司 | 音乐伴奏装置的自动跟调方法暨系统 |
CN101183858A (zh) * | 2007-11-26 | 2008-05-21 | 无敌科技(西安)有限公司 | 一种歌曲音调自动调整方法及其系统 |
US20100043626A1 (en) * | 2006-09-26 | 2010-02-25 | Wen-Hsin Lin | Automatic tone-following method and system for music accompanying devices |
CN101667422A (zh) * | 2009-09-22 | 2010-03-10 | 北京中星微电子有限公司 | 一种调节歌曲伴奏的调式的方法及装置 |
CN104538011A (zh) * | 2014-10-30 | 2015-04-22 | 华为技术有限公司 | 一种音调调节方法、装置及终端设备 |
CN105575400A (zh) * | 2015-12-24 | 2016-05-11 | 广东欧珀移动通信有限公司 | 一种获取歌曲信息的方法、终端、服务器和系统 |
CN106971704A (zh) * | 2017-04-27 | 2017-07-21 | 维沃移动通信有限公司 | 一种音频处理方法及移动终端 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108074557B (zh) * | 2017-12-11 | 2021-11-23 | 深圳Tcl新技术有限公司 | 音调调整方法、装置及存储介质 |
-
2017
- 2017-12-11 CN CN201711312180.7A patent/CN108074557B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5447438A (en) * | 1992-10-14 | 1995-09-05 | Matsushita Electric Industrial Co., Ltd. | Music training apparatus |
WO2006106466A1 (en) * | 2005-04-07 | 2006-10-12 | Koninklijke Philips Electronics N.V. | Method and signal processor for modification of audio signals |
CN101154376A (zh) * | 2006-09-26 | 2008-04-02 | 久久音乐科技有限公司 | 音乐伴奏装置的自动跟调方法暨系统 |
US20100043626A1 (en) * | 2006-09-26 | 2010-02-25 | Wen-Hsin Lin | Automatic tone-following method and system for music accompanying devices |
CN101183858A (zh) * | 2007-11-26 | 2008-05-21 | 无敌科技(西安)有限公司 | 一种歌曲音调自动调整方法及其系统 |
CN101667422A (zh) * | 2009-09-22 | 2010-03-10 | 北京中星微电子有限公司 | 一种调节歌曲伴奏的调式的方法及装置 |
CN104538011A (zh) * | 2014-10-30 | 2015-04-22 | 华为技术有限公司 | 一种音调调节方法、装置及终端设备 |
CN105575400A (zh) * | 2015-12-24 | 2016-05-11 | 广东欧珀移动通信有限公司 | 一种获取歌曲信息的方法、终端、服务器和系统 |
CN106971704A (zh) * | 2017-04-27 | 2017-07-21 | 维沃移动通信有限公司 | 一种音频处理方法及移动终端 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108074557B (zh) * | 2017-12-11 | 2021-11-23 | 深圳Tcl新技术有限公司 | 音调调整方法、装置及存储介质 |
CN109272975A (zh) * | 2018-08-14 | 2019-01-25 | 无锡冰河计算机科技发展有限公司 | 演唱伴奏自动调整方法、装置及ktv点唱机 |
CN109272975B (zh) * | 2018-08-14 | 2023-06-27 | 无锡冰河计算机科技发展有限公司 | 演唱伴奏自动调整方法、装置及ktv点唱机 |
CN109003627A (zh) * | 2018-09-07 | 2018-12-14 | 广州酷狗计算机科技有限公司 | 确定音频得分的方法、装置、终端及存储介质 |
CN111046226A (zh) * | 2018-10-15 | 2020-04-21 | 阿里巴巴集团控股有限公司 | 一种音乐的调音方法及装置 |
CN111046226B (zh) * | 2018-10-15 | 2023-05-05 | 阿里巴巴集团控股有限公司 | 一种音乐的调音方法及装置 |
CN109712635A (zh) * | 2018-12-28 | 2019-05-03 | 深圳创维-Rgb电子有限公司 | 一种声音数据处理方法、智能终端及存储介质 |
CN109712635B (zh) * | 2018-12-28 | 2020-10-09 | 深圳创维-Rgb电子有限公司 | 一种声音数据处理方法、智能终端及存储介质 |
CN110035296A (zh) * | 2019-04-23 | 2019-07-19 | 广州酷狗计算机科技有限公司 | 直播间歌曲信息的显示方法、设备及可读存储介质 |
CN110634462A (zh) * | 2019-09-30 | 2019-12-31 | 深圳市通世海精密机械有限公司 | 一种声音调整系统及调整方法 |
CN111048058A (zh) * | 2019-11-25 | 2020-04-21 | 福建星网视易信息系统有限公司 | 一种实时调整歌曲曲谱的演唱或演奏方法及终端 |
CN111370024A (zh) * | 2020-02-21 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 一种音频调整方法、设备及计算机可读存储介质 |
CN112201263A (zh) * | 2020-10-16 | 2021-01-08 | 广州资云科技有限公司 | 一种基于歌曲识别的电音基调调整系统 |
CN112397043A (zh) * | 2020-11-03 | 2021-02-23 | 北京中科深智科技有限公司 | 一种语音转化成歌曲的方法和系统 |
CN113707113A (zh) * | 2021-08-24 | 2021-11-26 | 北京达佳互联信息技术有限公司 | 用户歌声的修音方法、装置及电子设备 |
CN113707113B (zh) * | 2021-08-24 | 2024-02-23 | 北京达佳互联信息技术有限公司 | 用户歌声的修音方法、装置及电子设备 |
CN118312123A (zh) * | 2024-04-17 | 2024-07-09 | 广州资云科技有限公司 | 歌曲播放进度识别方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108074557B (zh) | 2021-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108074557A (zh) | 音调调整方法、装置及存储介质 | |
CN101098334B (zh) | 信息处理设备和信息处理方法 | |
CN101667422B (zh) | 一种调节歌曲伴奏的调式的方法及装置 | |
KR20170100007A (ko) | 청취 로그 및 음악 라이브러리를 생성하기 위한 시스템 및 방법 | |
JP2012018412A (ja) | 会話の話題を決定して関連するコンテンツを取得して提示する方法及びシステム | |
CN105390144B (zh) | 一种音频处理方法和音频处理装置 | |
CN105808710A (zh) | 一种远程 k 歌终端、远程k 歌系统及远程k 歌方法 | |
CN106302997A (zh) | 一种输出控制方法、电子设备及系统 | |
CN107609034A (zh) | 一种智能音箱的音频播放方法、音频播放装置及存储介质 | |
CN101739437A (zh) | 一种网络搜音机的实现方法及其专用设备 | |
CN105872619A (zh) | 一种视频播放记录的匹配方法及匹配装置 | |
CN110083738A (zh) | 一种基于声纹和情境感知的音乐推荐方法和终端设备 | |
CN106293599A (zh) | 一种输出控制方法、电子设备及输出系统 | |
CN109618116A (zh) | 多媒体信息的处理方法、电子设备及计算机存储介质 | |
CN106708741B (zh) | 语音应用的测试方法及系统 | |
CN106548792A (zh) | 智能音箱装置、移动终端及音乐播放处理方法 | |
JP2000268047A (ja) | 情報提供システム、クライアント、情報提供サーバ及び情報提供方法 | |
CN102883063A (zh) | 移动终端和铃声设置方法 | |
CN110347864A (zh) | 一种智能调节音频参数的方法及系统 | |
CN104426915B (zh) | 实现在线音乐分段下载的方法、服务器和系统 | |
JP2010078926A (ja) | デュエット相手抽出システム | |
JP2000250574A (ja) | コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法 | |
CN113470670A (zh) | 电音基调快速切换方法及系统 | |
WO2001097123A1 (en) | Method and system for group-composition in internet, and business method therefor | |
CN114792522A (zh) | 音频信号处理、会议记录与呈现方法、设备、系统及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |