CN107248406B - 一种自动生成鬼畜类歌曲的方法 - Google Patents

一种自动生成鬼畜类歌曲的方法 Download PDF

Info

Publication number
CN107248406B
CN107248406B CN201710515267.8A CN201710515267A CN107248406B CN 107248406 B CN107248406 B CN 107248406B CN 201710515267 A CN201710515267 A CN 201710515267A CN 107248406 B CN107248406 B CN 107248406B
Authority
CN
China
Prior art keywords
syllable
midi
sentence block
sentence
syllables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710515267.8A
Other languages
English (en)
Other versions
CN107248406A (zh
Inventor
刘莙怡
李经纬
陈慧婷
陈健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Jinguo Intellectual Property Co., Ltd
Original Assignee
Yiwu Mei Jie Packing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yiwu Mei Jie Packing Co ltd filed Critical Yiwu Mei Jie Packing Co ltd
Priority to CN201710515267.8A priority Critical patent/CN107248406B/zh
Publication of CN107248406A publication Critical patent/CN107248406A/zh
Application granted granted Critical
Publication of CN107248406B publication Critical patent/CN107248406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • G10H1/0025Automatic or semi-automatic music composition, e.g. producing random music, applying rules from music theory or modifying a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/101Music Composition or musical creation; Tools or processes therefor
    • G10H2210/111Automatic composing, i.e. using predefined musical rules

Abstract

本申请提供了一种自动生成鬼畜类歌曲的方法及装置。该方法包括:获取第一语音文件;建立所述第一语音文件中发声的音节与MIDI格式音频文件中MIDI音符的对应填充关系;根据所述对应填充关系,将所述第一语音文件中发声的音节的音长做拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,得到第二语音文件;将所述第二语音文件中每P个句块作为一个变声单位进行随机变声处理;根据所述对应填充关系,将随机变声处理后的第二语音文件与所述预设的背景音乐进行混音,得到鬼畜类歌曲。

Description

一种自动生成鬼畜类歌曲的方法
技术领域
本申请涉及音乐制作领域,尤其涉及一种自动生成鬼畜类歌曲的方法。
背景技术
现在网络上有很多鬼畜类型的歌曲及视频广受欢迎,鬼畜类的歌曲及视频以高度同步、快速重复的素材配合背景音乐的节奏、鬼一样的抽搐来达到洗脑或喜感效果,或通过音、视频剪辑,用频率极高的重复画面或声音组合而成的一段节奏配合音画同步率极高的一类歌曲及视频。但是,通常这种鬼畜类型的音频需要专业人员来制作,而且制作过程复杂,周期较长。目前并没有一种装置或设备能够自动生成鬼畜类型的歌曲。
发明内容
本申请提供了一种自动生成鬼畜类歌曲的方法及装置。为了实现上述目的,本申请提供了以下技术方案:
一种自动生成鬼畜类歌曲的方法,包括:
获取第一语音文件;
建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系,所述发声的音节为汉字的读音,所述MIDI格式音频文件由预设的背景音乐生成,所述MIDI格式音频文件包含MIDI音符和所述MIDI音符的音长;
根据所述对应填充关系,将所述第一语音文件中发声的音节的音长做拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,得到第二语音文件;
将所述第二语音文件中每P个句块作为一个变声单位进行随机变声处理,其中P为正整数;
根据所述对应填充关系,将随机变声处理后的第二语音文件与所述预设的背景音乐进行混音,得到鬼畜类歌曲。
优选的,在所述获取第一语音文件之后,且在所述建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系之前,还包括:
检测所述第一语音文件中发声的音节和未发声的音节,将所述未发声的音节之前的连续的发声的音节作为一个句块,并记录每个句块中发声的音节个数N,其中,未发生的音节为汉字组成的句子之间的停顿,连续的发声的音节组成句块,未发声的音节划分出不同的句块,N为正整数;
读取由预设的背景音乐生成的MIDI格式音频文件,所述MIDI格式音频文件包含MIDI音符和所述MIDI音符的音长;
检测所述MIDI格式音频文件中每个小节所包含的MIDI音符,并记录每个小节所包含的MIDI音符个数M,M为正整数。
优选的,在检测所述第一语音文件中发声的音节和未发声的音节,将所述未发声的音节之前的连续的发声的音节作为一个句块之后,且在建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系之前,还包括:
若一个句块满足预设的条件,将该句块与前面相邻的一个句块或者与后面相邻的一个句块合并为一个句块,合并后的句块中的发声的音节个数为合并前两个句块中发声的音节的数量之和,若合并后的句块满足所述预设的条件,则将合并后的句块与该合并后的句块前面相邻的一个句块或者与后面相邻的一个句块合并为一个句块,直到合并后的句块不满足所述预设的条件,其中,所述预设的条件为句块中发声的音节的个数N小于或者等于预设的数值。
优选的,所述建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系,具体包括:
比较所述第一语音文件中第i个句块中发声的音节个数N和所述MIDI格式音频文件中第i个小节的MIDI音符个数M,其中i为正整数,将N大于2M的句块平均划分为F个句块,使得满足N/F小于或者等于2M,其中F为大于1的正整数,每个句块中发声的音节个数为N/F,如果N不能被F整除,则将N/F向下或者向上取整;
若N小于M,则对应填充关系为,第i个句块中N个发声的音节一一对应第i个小节中前N个MIDI音符,第i个句块中从倒数第M-N个发声的音节开始一一对应在第i个小节剩余的M-N的音符;
若N等于M,则对应填充关系为,第i个句块中第K个发声的音节对应第i个小节中第K个MIDI音符,其中K为正整数;
若N大于M且小于或者等于2M,则对应填充关系为,第i个句块中倒数第2*(N-M)个发声的音节之前的发声的音节一一对应第i个小节中的音符,从第i个句块中倒数第2*(N-M)个发声的音节开始,第i个句块中两个连续的发声的音节对应一个MIDI音符。
一种自动生成鬼畜类歌曲的装置,包括:
语音获取模块,用于获取第一语音文件;
对应关系建立模块,用于建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系,所述发声的音节为汉字的读音,所述MIDI格式音频文件由预设的背景音乐生成,所述MIDI格式音频文件包含MIDI音符和所述MIDI音符的音长;
音长处理模块,用于根据所述对应填充关系,将所述第一语音文件中发声的音节的音长做拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,得到第二语音文件;
变声处理模块,用于将所述第二语音文件中每P个句块作为一个变声单位进行随机变声处理,其中P为正整数;
混音模块,用于根据所述对应填充关系,将随机变声处理后的第二语音文件与所述预设的背景音乐进行混音,得到鬼畜类歌曲。
优选的,还包括:
音节检测模块,用于在所述语音获取模块获取第一语音文件之后,且在所述对应关系建立模块建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系之前,检测所述第一语音文件中发声的音节和未发声的音节,将所述未发声的音节之前的连续的发声的音节作为一个句块,并记录每个句块中发声的音节个数N,其中,未发生的音节为汉字组成的句子之间的停顿,连续的发声的音节组成句块,未发声的音节划分出不同的句块,N为正整数;
读取模块,用于在所述对应关系建立模块建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系之前,读取由预设的背景音乐生成的MIDI格式音频文件,所述MIDI格式音频文件包含MIDI音符和所述MIDI音符的音长;
音符检测模块,用于在所述读取模块读取由预设的背景音乐生成的MIDI格式音频文件之后,检测所述MIDI格式音频文件中每个小节所包含的MIDI音符,并记录每个小节所包含的MIDI音符个数M,M为正整数。
优选的,还包括:
句块合并模块,用于在所述音节检测模块用于检测所述第一语音文件中发声的音节和未发声的音节,将所述未发声的音节之前的连续的发声的音节作为一个句块之后,且在所述对应关系建立模块用于建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系之前,若一个句块满足预设的条件,将该句块与前面相邻的一个句块或者与后面相邻的一个句块合并为一个句块,合并后的句块中的发声的音节个数为合并前两个句块中发声的音节的数量之和,若合并后的句块满足所述预设的条件,则将合并后的句块与该合并后的句块前面相邻的一个句块或者与后面相邻的一个句块合并为一个句块,直到合并后的句块不满足所述预设的条件,其中,所述预设的条件为句块中发声的音节的个数N小于或者等于预设的数值。
优选的,所述对应关系建立模块用于建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系包括:
对应关系建立模块具体用于,比较所述第一语音文件中第i个句块中发声的音节个数N和所述MIDI格式音频文件中第i个小节的MIDI音符个数M,其中i为正整数,将N大于2M的句块平均划分为F个句块,使得满足N/F小于或者等于2M,其中F为大于1的正整数,每个句块中发声的音节个数为N/F,如果N不能被F整除,则将N/F向下或者向上取整;
若N小于M,则对应填充关系为,第i个句块中N个发声的音节一一对应第i个小节中前N个MIDI音符,第i个句块中从倒数第M-N个发声的音节开始一一对应在第i个小节剩余的M-N的音符;
若N等于M,则对应填充关系为,第i个句块中第K个发声的音节对应第i个小节中第K个MIDI音符,其中K为正整数;
若N大于M且小于或者等于2M,则对应填充关系为,第i个句块中倒数第2*(N-M)个发声的音节之前的发声的音节一一对应第i个小节中的音符,从第i个句块中倒数第2*(N-M)个发声的音节开始,第i个句块中两个连续的发声的音节对应一个MIDI音符。
由上述方案可知,本申请提供了一种自动生成鬼畜类歌曲的方法及装置,首先获取第一语音文件,建立所述第一语音文件中发声的音节与MIDI格式音频文件中MIDI音符的对应填充关系;根据所述对应填充关系,将所述第一语音文件中发声的音节的音长做拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,得到第二语音文件;将所述第二语音文件中每P个句块作为一个变声单位进行随机变声处理;根据所述对应填充关系,将随机变声处理后的第二语音文件与所述预设的背景音乐进行混音,得到鬼畜类歌曲。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种自动生成鬼畜类歌曲的方法的流程图;
图2为又一种自动生成鬼畜类歌曲的方法的流程图;
图3为一种自动生成鬼畜类歌曲的装置的流程图。
具体实施方式
本申请提供了一种自动生成鬼畜类歌曲的方法和装置,该装置可以应用在各种电子设备中,如计算机、或者平板电脑、或者手机。当该装置应用在手机中时,该装置可以为手机应用(Application,APP)。
下面详细介绍实现该装置自动生成鬼畜类歌曲的过程。
图1为一种自动生成鬼畜类歌曲的方法的流程图,该方法的具体流程如下:
S101:获取第一语音文件。
其中,获取第一语音文件可以由两种方法实现,第一种方法为,接收第一语音文件,例如第一语音文件可以是用户提前录制的;第二种方法为,接收用户的语音,生成第一语音文件。例如,手机上的APP采集用户的语音,并将语音生成第一语音文件。
其中,在语音文件中,发声的音节为汉字的读音。未发声的音节为,汉字之间的停顿。
基于上述获取方法,第一语音文件中音节(包括发声的音节和未发声的音节)的排列顺序与用户录制语音的过程中用户发出语音的顺序一致。
S102:检测第一语音文件中发声的音节和未发声的音节,将未发声的音节之前的连续的发声的音节作为一个句块,并记录每个句块中发声的音节个数N,N为正整数。
连续的发声的音节组成句块,未发声的音节划分出不同的句块。句块的排列顺序与用户录制语音的过程中用户发出语音的顺序一致。
例如,检测第一语音文件中发声的音节和未发声的音节,从开始检测到第一个发声的音节直到检测到第一个未发声的音节,第一个未发声的音节之前的连续的发声的音节即为一个句块,并记录该句块中发声的音节个数N,然后,进行下一个句块的检测,直到完成对第一语音文件的检测。
例如,手机APP接收用户的语音,生成的语音文件中包括以下内容“问世间情为何物直教人生死相许”,空格为用户输入语音时的停顿,即未发声的音节。检测该语音文件中发声的音节和未发声的音节,检测到的第一个音节为发声的音节,即汉字“问”,第二个音节为发声的音节,即汉字“世”,继续对后面的音节进行检测,直到检测到第八个音节,即空格处,第八个音节为一个未发声的音节,而且是检测到的第一个未发声的音节,将该未发声的音节之前的连续的发声的音节作为一个句块,即将“问世间情为何物”这句话作为一个句块,并记录该句块中发声的音节的个数为7。在检测完一个句块后,将重新对检测的发声的音节进行计数。然后,继续对后续音节进行检测,检测到的第一个音节为发声的音节,即汉字“直”,继续对后面的音节进行检测,直到检测到第八个音节,即空格处,第八个音节为一个未发声的音节,而且是检测到的第一个未发声的音节,将该未发声的音节之前的连续的发声的音节作为一个句块,即“直教人生死相许”这句话作为一个句块,并记录该句块中发声的音节的个数为7。
S103:读取由预设的背景音乐生成的乐器数字接口(Musical InstrumentDigital Interface,MIDI)格式音频文件,所述MIDI格式音频文件包含MIDI音符和所述MIDI音符的音长,检测所述MIDI格式音频文件中每个小节所包含的MIDI音符,并记录每个小节所包含的MIDI音符个数M,M为正整数。
其中,预设的背景音乐可以由用户根据自己的喜好提前设置,从而满足用户的个性化需求。预设的背景音乐也可以由程序开发者提前设置。或者,程序开发者提前设置背景音乐,用户可以从其中选择自己喜欢的背景音乐,如果没有用户喜欢的背景音乐,用户可以根据自己的喜好提前设置背景音乐。为了达到鬼畜类型音乐更好的效果,一般选择节奏感较强的音乐作为背景音乐。MIDI格式的音频文件由背景音乐生成。
例如,|12345|即为一个小节,“|”是小节线,每个小节之间是由小节线来划分,该小节所包含的MIDI音符个数为5。
需要说明的是,步骤S103可以在步骤S101之前执行,也可以在步骤S102之前执行,只要在步骤S104之前完成即可,本申请对步骤S101、S102、S103的执行顺序并不做限定。
S104:建立第一语音文件中发声的音节与MIDI格式音频文件中MIDI音符的对应填充关系。
其中,建立第一语音文件中发声的音节与MIDI格式音频文件中MIDI音符的对应填充关系的具体实现方式为:
比较第一语音文件中第i个句块中发声的音节个数N和MIDI格式音频文件中第i个小节的MIDI音符个数M,将N大于2M的句块平均分划分为F个句块,使得满足N/F小于或者等于2M,其中F为大于1的正整数,每个句块中发声的音节个数为N/F,如果N不能被F整除,则将N/F向下或者向上取整。
需要说明的是F的取值,将F预先设置一个数值,当不满足N/F小于或者等于2M,可以将F逐一递增,或者逐一递减,直到满足N/F小于或者等于2M。
例如,第i个句块中发声的音节个数13大于第i个小节中MIDI音符个数5的两倍,F预先设置为2,将第i个句块平均划分为2个句块,每个句块中发声的音节个数为13/2,而13/2结果并不为整数,需要对13/2结果进行取整处理,其中一个句块中发声的音节个数为7,另一个句块中发声的音节个数为6。
例如,第i个句块中发声的音节个数24大于第i个小节中MIDI音符个数5的两倍,F预先设置为2,将第i个句块平均划分为2个句块,每个句块中发声的音节个数为24/2,而24/2并不小于或者等于10,将F加1,将第i个句块平均划分为3个句块,24/3满足小于或者等于10的条件,每个句块中发声的音节个数为8。
若N小于M,则对应填充关系为,第i个句块中N个发声的音节一一对应第i个小节中前N个MIDI音符,第i个句块中从倒数第M-N个发声的音节开始一一对应在第i个小节剩余的M-N的音符。即在音符多于音节的情况下,在多余的音符中重复最后M-N个发声的音节。
例如,第i个句块为“直教人生死相许”,该句块中发声的音节个数N=7,第i个小节中MIDI音符个数M=9,在此用数字代表音符,那么9个音符分别是1,2,3,4,5,6,7,8,9。则第i个句块中发声的音节与第i个小节中MIDI音符对应填充关系为:“直”对应音符“1”,“教”对应音符“2”,“人”对应音符“3”,“生”对应音符“4”,“死”对应音符“5”,“相”对应音符“6”,“许”对应音符“7”,“相”对应音符“8”,“许”对应音符“9”。
又例如,第i个句块为“我爱你”,该句块中发声的音节个数N=3,第i个小节中MIDI音符个数M=7,在此用数字代表音符,那么7个音符分别是1,2,3,4,5,6,7。则第i个句块中发声的音节与第i个小节中MIDI音符对应填充关系为:“我”对应音符“1”,“爱”对应音符“2”,“你”对应音符“3”,“我”对应音符“4”,“爱”对应音符“5”,“你”对应音符“6”,“你”对应音符“7”。
若N等于M,则对应填充关系为,第i个句块中第K个发声的音节对应第i个小节中第K个MIDI音符。
例如,第i个句块为“直教人生死相许”,该句块中发声的音节个数N=7,第i个小节中MIDI音符个数M=7,在此用数字代表音符,那么7个音符分别是1,2,3,4,5,6,7。则第i个句块中发声的音节与第i个小节中MIDI音符对应填充关系为:“直”对应音符“1”,“教”对应音符“2”,“人”对应音符“3”,“生”对应音符“4”,“死”对应音符“5”,“相”对应音符“6”,“许”对应音符“7”。
若N大于M且小于或者等于2M,则对应填充关系为,第i个句块中倒数第2*(N-M)个发声的音节之前,第i个句块中发声的音节一一对应第i个小节中的音符,从第i个句块中倒数第2*(N-M)个发声的音节开始,第i个句块中两个连续的发声的音节对应一个MIDI音符。
例如,第i个句块为“直教人生死相许”,该句块中发声的音节个数N=7,第i个小节中MIDI音符个数M=5,在此用数字代表音符,那么5个音符分别是1,2,3,4,5。则第i个句块中发声的音节与第i个小节中MIDI音符对应填充关系为:“直”对应音符“1”,“教”对应音符“2”,“人”对应音符“3”,“生死”对应音符“4”,“相许”对应音符“5”。
综上,本申请实施例将语音文件中一个句块对应MIDI格式音频文件中一个小节,发声的音节对应MIDI音符的位置这样做出来的音乐更具有连贯性。而且,在一个句块中发声的音节数量等于一个小节中MIDI音符的数量的情况下,把一个发声的音节对应一个MIDI音符,这样使处理后的第二语音文件更契合背景音乐的节奏点,整体效果更有节奏感。并且,在一个句块中发声的音节数量少于一个小节中MIDI音符数量时,设定了一定的重复规则,使做出来的效果更符合鬼畜的感觉。在一个句块中发声的音节数量多于一个小节中MIDI音符数量时,将多个发声的音节对应一个音符,使得语速更快,更符合鬼畜的感觉。
S105:根据所述对应填充关系,将第一语音文件中发声的音节的音长做拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,得到第二语音文件。
其中,因为发声的音节的音长和MIDI音符的音长有可能是不一样的,所以需要根据对应填充的MIDI音符的音长,将发声的音节的时长进行拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,这样处理后的第二语音文件更契合背景音乐的节奏点,使得整体效果更有节奏感。
例如,“直”对应音符“1”,“直”的音长为1秒,而“1”的音长为2秒,则将“直”的音长拉伸为2秒,使得“直”的音长和“1”的音长相同。
又例如,“人”对应音符“3”,“人”的音长为2秒,而“3”的音长为1秒,则将“人”的音长压缩为1秒,使得“人”的音长和“3”的音长相同。
S106:将第二语音文件中每P个句块作为一个变声单位进行随机变声处理,其中P为正整数。
其中,在随机变声处理过程中,可以对每个变声单位随机添加多种不同的变声效果,相邻两个变声单位所添加的变声效果可以相同,也可以不相同,并设置每个变声效果出现的概率。例如,对某个变声单位随机添加小黄人、电视机喇叭、操场喇叭、原声(即不做变声处理)四种变声效果,相应地每个变声效果出现的概率为2/9,2/9,2/9,1/3。
可见,本申请实施例设定了随机的变声效果,即使用户提供同一语音文件,但是每次处理后的效果都是不同的,使最终效果具有多样性和趣味性。并且,当相邻两个变声单位所添加的变声效果不相同时,得到的鬼畜效果更好。
S107:根据所述对应填充关系,将随机变声处理后的第二语音文件与预设的背景音乐进行混音,得到鬼畜类歌曲。
综上,本申请实施例将语音文件中一个句块对应MIDI格式音频文件中一个小节,这样做出来的音乐更具有连贯性。并且,根据对应MIDI音符的音长,将第一语音文件中相应的发声的音节做拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,这样处理后得到的第二语音文件更契合背景音乐的节奏点,使得整体效果更有节奏感。而且,将第二语音文件以P个句块作为一个变声单位进行随机变声处理,使得变声处理后的第二语音文件更具有鬼畜效果。并且,因为变声处理是随机的,所以即使用户提供同一语音文件,每次处理后的效果是不同的,使最终效果具有多样性和趣味性。
进一步的,如果第一语音文件中存在多个短句,而一个短句中的汉字个数太少,例如一个短句中只有两个汉字,那么将这样一个短句对应在一个小节中,则汉字重复的次数太多,最终得到的鬼畜类歌曲效果不好。为了达到更好的效果,可以将多个短句合并为一个长句,这样做出来的鬼畜类歌曲效果更好。
为了减少第一语音文件中短句重复的次数,本申请提供了如图2所示的又一个实施例,即在图1所示的S102之后S104之前,还包括:
S1021:若一个句块满足预设的条件,将该句块与前面相邻的一个句或者与后面相邻的一个句块合并为一个句块,合并后的句块中的发声的音节个数为合并前两个句块中发声的音节的数量之和,若合并后的句块满足预设的条件,则将合并后的句块与该合并后的句块前面相邻的一个句块或者与后面相邻的一个句块合并为一个句块,直到合并后的句块不满足预设的条件,其中,预设的条件为句块中发声的音节的个数N小于或者等于预设的数值。
需要说明的是,步骤S1021和步骤S103的执行顺序可以为:先执行S1021,再执行S103,还可以为:先执行S103,再执行S1021。
可选的,还可以将第一语音文件中的一些满足预设条件的句块与前面相邻的一个句块合并为一个句块,而将第一语音文件中的另外一些满足预设条件的句块与后面相邻的一个句块合并为一个句块。
其中,句块的排列顺序如前所述。
例如,预设的数值为4,第一语音文件为“两只老虎两只老虎跑得快跑得快”,第一个句块和第二个句块中的发声的音节个数为4,第三个和第四个句块中发声的音节个数为3,将第三个句块和第二个句块合并为一个句块,或者将第三个句块和第四个句块合并为一个句块。这样做的目的是将多个短句合并为一个长句,将合并后的一个长句对应到一个小节中,汉字重复的次数就不会太多,最终得到的鬼畜类歌曲效果就比较好。
在将全部满足预设条件的句块均与前面相邻的一个句块进行合并的情况下,若第一个句块满足预设的条件,将第一个句块与后面相邻的一个句块合并为一个句块。
在将全部满足预设条件的句块均与后面相邻的一个句块进行合并的情况下,若最后一个句块满足预设的条件,将最后一个句块与前面相邻的一个句块合并为一个句块,或者,无论最后一个句块是否满足预设条件,均不与其它句块合并。
图3为本申请实施例公开的一种自动生成鬼畜类歌曲的装置,包括:语音获取模块、对应关系建立模块、音长处理模块、变声处理模块和混音模块,
其中,语音获取模块,用于获取第一语音文件。
对应关系建立模块,用于建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系,所述发声的音节为汉字的读音,所述MIDI格式音频文件由预设的背景音乐生成,所述MIDI格式音频文件包含MIDI音符和所述MIDI音符的音长。
音长处理模块,用于根据所述对应填充关系,将所述第一语音文件中发声的音节的音长做拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,得到第二语音文件。
变声处理模块,用于将所述第二语音文件中每P个句块作为一个变声单位进行随机变声处理,其中P为正整数。
混音模块,用于根据所述对应填充关系,将随机变声处理后的第二语音文件与所述预设的背景音乐进行混音,得到鬼畜类歌曲。
可选的,还包括音节检测模块,读取模块,音符检测模块,句块合并模块。
上述模块的功能的具体实现过程,以及附加功能,均可以参见上述方法实施例,这里不再赘述。

Claims (3)

1.一种自动生成鬼畜类歌曲的方法,其特征在于,包括:
获取第一语音文件;
建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系,所述发声的音节为汉字的读音,所述MIDI格式音频文件由预设的背景音乐生成,所述MIDI格式音频文件包含MIDI音符和所述MIDI音符的音长;
根据所述对应填充关系,将所述第一语音文件中发声的音节的音长做拉伸或者压缩处理,使得发声的音节的音长与对应填充的MIDI音符的音长相同,得到第二语音文件;
将所述第二语音文件中每P个句块作为一个变声单位进行随机变声处理,其中P为正整数;
根据所述对应填充关系,将随机变声处理后的第二语音文件与所述预设的背景音乐进行混音,得到鬼畜类歌曲;
所述建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系,具体包括:
比较所述第一语音文件中第i个句块中发声的音节个数N和所述MIDI格式音频文件中第i个小节的MIDI音符个数M,其中i为正整数,将N大于2M的句块平均划分为F个句块,使得满足N/F小于或者等于2M,其中F为大于1的正整数,每个句块中发声的音节个数为N/F,如果N不能被F整除,则将N/F向下或者向上取整;
若N小于M,则对应填充关系为,第i个句块中N个发声的音节一一对应第i个小节中前N个MIDI音符,第i个句块中从倒数第M-N个发声的音节开始一一对应在第i个小节剩余的M-N的音符;
若N等于M,则对应填充关系为,第i个句块中第K个发声的音节对应第i个小节中第K个MIDI音符,其中K为正整数;
若N大于M且小于或者等于2M,则对应填充关系为,第i个句块中倒数第2*(N-M)个发声的音节之前的发声的音节一一对应第i个小节中的音符,从第i个句块中倒数第2*(N-M)个发声的音节开始,第i个句块中两个连续的发声的音节对应一个MIDI音符。
2.根据权利要求1所述的方法,其特征在于,在所述获取第一语音文件之后,且在所述建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系之前,还包括:
检测所述第一语音文件中发声的音节和未发声的音节,将所述未发声的音节之前的连续的发声的音节作为一个句块,并记录每个句块中发声的音节个数N,其中,未发生的音节为汉字组成的句子之间的停顿,连续的发声的音节组成句块,未发声的音节划分出不同的句块,N为正整数;
读取由预设的背景音乐生成的MIDI格式音频文件,所述MIDI格式音频文件包含MIDI音符和所述MIDI音符的音长;
检测所述MIDI格式音频文件中每个小节所包含的MIDI音符,并记录每个小节所包含的MIDI音符个数M,M为正整数。
3.根据权利要求2所述的方法,其特征在于,在检测所述第一语音文件中发声的音节和未发声的音节,将所述未发声的音节之前的连续的发声的音节作为一个句块之后,且在建立所述第一语音文件中发声的音节与乐器数字接口MIDI格式音频文件中MIDI音符的对应填充关系之前,还包括:
若一个句块满足预设的条件,将该句块与前面相邻的一个句块或者与后面相邻的一个句块合并为一个句块,合并后的句块中的发声的音节个数为合并前两个句块中发声的音节的数量之和,若合并后的句块满足所述预设的条件,则将合并后的句块与该合并后的句块前面相邻的一个句块或者与后面相邻的一个句块合并为一个句块,直到合并后的句块不满足所述预设的条件,其中,所述预设的条件为句块中发声的音节的个数N小于或者等于预设的数值。
CN201710515267.8A 2017-06-29 2017-06-29 一种自动生成鬼畜类歌曲的方法 Active CN107248406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710515267.8A CN107248406B (zh) 2017-06-29 2017-06-29 一种自动生成鬼畜类歌曲的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710515267.8A CN107248406B (zh) 2017-06-29 2017-06-29 一种自动生成鬼畜类歌曲的方法

Publications (2)

Publication Number Publication Date
CN107248406A CN107248406A (zh) 2017-10-13
CN107248406B true CN107248406B (zh) 2020-11-13

Family

ID=60015018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710515267.8A Active CN107248406B (zh) 2017-06-29 2017-06-29 一种自动生成鬼畜类歌曲的方法

Country Status (1)

Country Link
CN (1) CN107248406B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110858924B (zh) * 2018-08-22 2021-11-26 阿里巴巴(中国)有限公司 视频背景音乐的生成方法、装置及存储介质
CN113676772B (zh) * 2021-08-16 2023-08-08 上海哔哩哔哩科技有限公司 视频生成方法及装置
CN116504206B (zh) * 2023-03-18 2024-02-20 深圳市狼视天下科技有限公司 一种识别环境并生成音乐的摄像头

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761992A (zh) * 2003-03-20 2006-04-19 索尼株式会社 歌声合成方法和设备、程序、记录介质以及机器人设备
CN103915093A (zh) * 2012-12-31 2014-07-09 安徽科大讯飞信息科技股份有限公司 一种实现语音歌唱化的方法和装置
EP3023977A1 (en) * 2014-11-20 2016-05-25 Casio Computer Co., Ltd. Automatic composition apparatus and automatic composition method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4415573B2 (ja) * 2003-06-13 2010-02-17 ソニー株式会社 歌声合成方法、歌声合成装置、プログラム及び記録媒体並びにロボット装置
JP4298612B2 (ja) * 2004-09-01 2009-07-22 株式会社フュートレック 音楽データ加工方法、音楽データ加工装置、音楽データ加工システム及びコンピュータプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761992A (zh) * 2003-03-20 2006-04-19 索尼株式会社 歌声合成方法和设备、程序、记录介质以及机器人设备
CN103915093A (zh) * 2012-12-31 2014-07-09 安徽科大讯飞信息科技股份有限公司 一种实现语音歌唱化的方法和装置
EP3023977A1 (en) * 2014-11-20 2016-05-25 Casio Computer Co., Ltd. Automatic composition apparatus and automatic composition method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Music Synthesis with Reconstructive Phrase Modeling;Eric Lindemann;《IEEE Signal Processing Magazine》;20071231;第24卷(第2期);第80-91页 *
歌词到歌曲转换系统的实现;李锦珑,杨鸿武,梁青青;《计算机工程与应用》;20101231;第46卷(第16期);第124-126页 *

Also Published As

Publication number Publication date
CN107248406A (zh) 2017-10-13

Similar Documents

Publication Publication Date Title
US10789290B2 (en) Audio data processing method and apparatus, and computer storage medium
CN111667812B (zh) 一种语音合成方法、装置、设备及存储介质
CN109949783B (zh) 歌曲合成方法及系统
US10490181B2 (en) Technology for responding to remarks using speech synthesis
CN108492817B (zh) 一种基于虚拟偶像的歌曲数据处理方法及演唱交互系统
CN106898340B (zh) 一种歌曲的合成方法及终端
CN107248406B (zh) 一种自动生成鬼畜类歌曲的方法
CN109215629B (zh) 语音处理方法、装置及终端
CN110675886A (zh) 音频信号处理方法、装置、电子设备及存储介质
CN112184859B (zh) 端到端的虚拟对象动画生成方法及装置、存储介质、终端
WO2021232876A1 (zh) 实时驱动虚拟人的方法、装置、电子设备及介质
CN111508469A (zh) 一种文语转换方法及装置
CN114121006A (zh) 虚拟角色的形象输出方法、装置、设备以及存储介质
Xu Transmitting tone and intonation simultaneously-the parallel encoding and target approximation (PENTA) model
CN113112575B (zh) 一种口型生成方法、装置、计算机设备及存储介质
CN117275485B (zh) 一种音视频的生成方法、装置、设备及存储介质
CN113823323A (zh) 一种基于卷积神经网络的音频处理方法、装置及相关设备
CN108922505B (zh) 信息处理方法及装置
CN109036373A (zh) 一种语音处理方法及电子设备
CN114363531A (zh) 基于h5的文案解说视频生成方法、装置、设备以及介质
CN112634861A (zh) 数据处理方法、装置、电子设备和可读存储介质
CN113223513A (zh) 语音转换方法、装置、设备和存储介质
JP2005242231A (ja) 音声合成装置、音声合成方法、及び音声合成プログラム
CN113838445B (zh) 歌曲创作方法及相关设备
JP4678672B2 (ja) 発音学習装置及び発音学習プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190215

Address after: 310023 Room 901-2, 8 Building, Saiyin International Business Center, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou Qiwei Network Technology Co., Ltd.

Address before: Room 006, Block H, 319 Minlei Road, Pudong New Area, Shanghai, 20109

Applicant before: Shanghai youth voice network technology Co. Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200727

Address after: 430000 No. 14 South Central Road, Wuchang District, Hubei, Wuhan

Applicant after: Xu Faxi

Address before: 310023 Room 901-2, 8 Building, Saiyin International Business Center, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant before: HANGZHOU KIBEY NETOWRK TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201020

Address after: 322000 3rd floor, no.2828 Xicheng Road, Chengxi street, Yiwu City, Jinhua City, Zhejiang Province

Applicant after: Yiwu Mei Jie Packing Co.,Ltd.

Address before: 430000 No. 14 South Central Road, Wuchang District, Hubei, Wuhan

Applicant before: Xu Faxi

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210302

Address after: 322015 2a, science and technology building, 968 Xuefeng West Road, Beiyuan street, Yiwu City, Jinhua City, Zhejiang Province (self declaration)

Patentee after: Zhejiang Jinguo Intellectual Property Co., Ltd

Address before: 322000 3rd floor, 2828 Xicheng Road, Chengxi street, Yiwu City, Jinhua City, Zhejiang Province

Patentee before: Yiwu Mei Jie Packing Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210305

Address after: 322015 2a, science and technology building, 968 Xuefeng West Road, Beiyuan street, Yiwu City, Jinhua City, Zhejiang Province (self declaration)

Patentee after: Zhejiang Jinguo Intellectual Property Co., Ltd

Address before: 322015 3rd floor, 2828 Xicheng Road, Chengxi street, Yiwu City, Jinhua City, Zhejiang Province

Patentee before: Yiwu Mei Jie Packing Co.,Ltd.