CN106686431B - 一种音频文件的合成方法和设备 - Google Patents

一种音频文件的合成方法和设备 Download PDF

Info

Publication number
CN106686431B
CN106686431B CN201611124036.6A CN201611124036A CN106686431B CN 106686431 B CN106686431 B CN 106686431B CN 201611124036 A CN201611124036 A CN 201611124036A CN 106686431 B CN106686431 B CN 106686431B
Authority
CN
China
Prior art keywords
accompaniment
file
user
audio data
clips
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611124036.6A
Other languages
English (en)
Other versions
CN106686431A (zh
Inventor
任轶
于康康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Netease Cloud Music Technology Co Ltd
Original Assignee
Hangzhou Netease Cloud Music Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Netease Cloud Music Technology Co Ltd filed Critical Hangzhou Netease Cloud Music Technology Co Ltd
Priority to CN201611124036.6A priority Critical patent/CN106686431B/zh
Publication of CN106686431A publication Critical patent/CN106686431A/zh
Application granted granted Critical
Publication of CN106686431B publication Critical patent/CN106686431B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本发明的实施方式提供了一种音频文件的合成方法。预先将第一伴奏文件处理为由多个连续的播放时间段分别标记的多个伴奏片段构成,根据用户的第一指示确定第一伴奏文件,再根据用户的第二指示,确定该作为发起方的用户选择的第一伴奏文件中的第一伴奏片段;为确定的第一伴奏片段进行音频数据采集;将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户。在合成第一伴奏文件的过程中,多个感兴趣用户都参与了合成,增加了社交性和趣味性,丰富了现有技术中唱歌类软件的功能,为用户带来了更好的体验。此外,本发明的实施方式提供了一种音频文件的合成设备。

Description

一种音频文件的合成方法和设备
技术领域
本发明的实施方式涉及多媒体技术领域,更具体地,本发明的实施方式涉及一种音频文件的合成方法和设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
音乐作为反映人类现实生活情感的一种艺术早已成为我们生活中不可缺少的休闲娱乐方式。除了听音乐,唱歌也是一种为大众所热爱的方式,相关的音乐软件也层出不穷。
现有技术中,常用的唱歌类应用软件如唱吧、全民K歌等,但是这些应用软件基本采用如下方式实现:通过用户搜索或者直接选择,确定用户选择的歌曲,进入该歌曲的演唱主页,边播放伴奏音频边获取用户输入的声音音频,将用户输入的声音音频与伴奏音频合成,生成如KTV里人声加伴奏的音乐形式的音频文件。但是在整个合成过程中,仅仅是单个用户独立完成一首歌曲,功能单一。
发明内容
出于现有技术的唱歌类软件的实现方式均是使单个用户独立完成一首歌曲的原因,现有技术中唱歌类软件功能单一。
因此在现有技术中,唱歌类软件仅实现了单人独立完成一首歌曲这是非常令人烦恼的过程。
为此,非常需要一种改进的音频文件的合成方法,以丰富唱歌类软件的功能。
在本上下文中,本发明的实施方式期望提供一种音频文件的合成方法和设备。
在本发明实施方式的第一方面中,提供了一种音频文件的合成方法之一,包括:
根据用户的第一指示,确定第一伴奏文件,其中,所述第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成;
根据用户的第二指示,确定用户选择的所述第一伴奏文件中的第一伴奏片段;
为所述第一伴奏片段进行音频数据采集;
将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由所述多个伴奏片段和对应音频数据合成的音频文件。
在一种实施方式中,为所述第一伴奏片段进行音频数据采集,包括:
向用户提供所述第一伴奏片段;
接收用户针对所述第一伴奏片段采集的第一音频数据;将所述第一伴奏片段和所述第一音频数据合成或者关联保存;或者
接收用户将所述第一伴奏片段与针对所述第一伴奏片段采集的第一音频数据合成后的第一伴奏片段。
在一种实施方式中,在确定第一伴奏文件之后,还包括:
按照所述多个伴奏片段分别对应的播放时间段的先后顺序,将所述多个伴奏片段以及所述多个伴奏片段分别对应的歌词呈现;
为所述第一伴奏片段进行音频数据采集,包括:
在播放所述第一伴奏片段的同时采集所述用户发送的第一音频数据,并将所述第一伴奏片段和所述第一音频数据合成或者关联保存。
在一种实施方式中,将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,包括:
根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户;
向确定出的其他用户发送携带有预设接口的音频数据采集请求,其中,所述预设接口为提供所述其他用户访问所述第一伴奏文件的接口;
接收任一其他用户发送的选择指示;
将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户。
在一种实施方式中,在将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,还包括:
获取该任一其他用户针对所选择的伴奏片段进行合成后得到的完成合成的伴奏片段;
使用获取的完成合成的伴奏片段替换所述第一伴奏文件中对应播放时间段的未完成音频数据合成的伴奏片段。
在一种实施方式中,在将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,还包括:
获取该任一其他用户针对所选择的伴奏片段采集的音频数据;
将获取的音频数据和该任一其他用户选择的伴奏片段合成。
在一种实施方式中,在将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,还包括:
获取该任一其他用户针对选择的伴奏片段采集的音频数据;
将获取的音频数据与该任一其他用户选择的伴奏片段关联保存;
所述方法,还包括:
当接收到播放所述第一伴奏文件的指示时,在按照播放时间段的先后顺序播放各伴奏片段的同时,针对每个完成音频数据采集的伴奏片段,将关联保存的音频数据与该伴奏片段播放时间点对齐提供播放。
在一种实施方式中,在向确定出的其他用户发送音频数据采集请求之后,还包括:
启动第一计时器开始计时;
在第一预设计时时间到达时,若所述第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
在一种实施方式中,在接收到任一其他用户发送的选择指示之后,还包括:
为所述选择指示所指示选择的未完成音频数据采集的伴奏片段设置已完成标识;其中,设置有已完成标识的伴奏片段不能被任何用户再次选择;
启动第二计时器开始计时;
若在第二预设时间段内未获取到该任一其他用户的音频数据,则取消对该选择指示所指示选择的伴奏片段的已完成标识的设置。
在一种实施方式中,将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,包括:
根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户;
向确定出的其他用户发送携带有预设接口的音频数据采集请求;
接收任一其他用户通过所述预设接口发送的获取所述第一伴奏文件的请求;
将所述第一伴奏文件发送给该任一其他用户。
在一种实施方式中,在将所述第一伴奏文件发送给该任一其他用户之后,还包括:
获取该任一其他用户针对选择的伴奏片段执行合成操作之后得到的第一伴奏文件;
按照接收到其他用户反馈的第一伴奏文件的先后顺序,确定每个反馈的第一伴奏文件中对应其他用户完成合成的伴奏片段;以及
若该完成合成的伴奏片段在当前第一伴奏文件中未完成合成,则使用该完成合成的伴奏片段替换当前第一伴奏文件中播放时间段对应的未完成合成的伴奏片段,得到合并的第一伴奏文件。
在一种实施方式中,在向确定出的其他用户发送音频数据采集请求之后,还包括:
启动第三计时器开始计时;
在第三预设计时时间到达时,若第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
在一种实施方式中,根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户,包括:
根据预先统计的用户兴趣数据,以及当前所述第一伴奏文件中伴奏片段的音频数据采集完成进度,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户,
其中,所述第一伴奏文件中未完成音频数据采集的伴奏片段越多,确定出的其他用户越多。
在一种实施方式中,采用如下方法统计用户兴趣数据:
监测用户播放音频文件时产生的播放行为;
根据监测到的播放行为,统计符合如下指标的音频文件:播放达到预设时长、和/或播放达到预设频次;
确定统计出的音频文件所属的类型,和/或对应的表演者,作为所述用户的兴趣数据。
在一种实施方式中,根据用户的第一指示,确定第一伴奏文件,包括:
在音频文件的播放界面,接收用户的用于指示针对所播放音频文件生成合成音频文件的第一指示;
确定所播放音频文件对应的第一伴奏文件。
在一种实施方式中,根据用户的第一指示,确定第一伴奏文件,包括:
接收用户的用于对任意音频文件进行合成的第一指示;
根据预先统计的用户兴趣数据,确定用户感兴趣的音频文件;
确定用户感兴趣的所述音频文件对应的第一伴奏文件。
在一种实施方式中,上述方法还包括:
为所述用户设置第一访问界面,
其中,所述第一访问界面用于提供所述第一伴奏文件的访问接口、以及所述第一伴奏文件的相关统计数据;
所述相关统计数据包括:所述第一伴奏文件的当前完成进度、和/或参与所述第一伴奏文件合成的用户数。
在一种实施方式中,采用如下方法生成所述第一伴奏文件中的伴奏片段:
获取所述第一伴奏文件对应的原声音频文件中除伴奏之外的音频数据;
对获取的音频数据进行语法分析,将获取的音频数据以整句为单位进行划分;
将划分得到的每个整句在所述第一伴奏文件中对应播放时间段的伴奏作为一个伴奏片段进行标记,得到由多个连续的播放时间段分别标记的多个伴奏片段。
在本发明实施方式的第二方面中,提供了一种音频文件的合成方法之二,包括:
接收音频数据采集请求;
从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段;
其中,所述第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集;
在播放所述第二伴奏片段的同时采集用户发送的第二音频数据;
将采集的结果反馈。
在一种实施方式中,从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段,包括:
根据用户的第三指示,通过所述音频数据采集请求中携带的预设接口访问第二伴奏文件;
根据用户的第四指示,发送用于表征用户选择的所述第二伴奏文件中的第二伴奏片段的选择指示;
接收所述第二伴奏片段;
将采集的结果反馈,包括:反馈所述第二音频数据;
或者将所述第二伴奏片段和所述第二音频数据合成,并反馈完成合成的第二伴奏片段。
在一种实施方式中,从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段,包括:
根据用户的第五指示,通过所述音频数据采集请求中携带的预设接口获取第二伴奏文件;
根据用户的第六指示,确定用户选择的所述第二伴奏文件中的第二伴奏片段;
将采集的结果反馈,包括:
反馈完成本次合成的第二伴奏文件。
在一种实施方式中,上述方法还包括:
为所述用户设置第二访问界面,
其中,所述第二访问界面用于提供所述第二伴奏文件的访问接口、以及所述第二伴奏文件的相关统计数据;
所述相关统计数据包括:所述第二伴奏文件的当前完成进度、和/或参与所述第二伴奏文件合成的用户数。
在本发明实施方式的第三方面中,提供了一种音频文件的合成方法之三,包括:
步骤一:响应于第一用户的指示,选择伴奏文件并呈现伴奏文件包含的多个伴奏片段所对应的多句歌词;
步骤二:响应于第一用户对任一句歌词的选择,播放对应的伴奏片段,并录制音频数据;
步骤三:将音频文件合成请求发送给其他用户;
步骤四:响应于所述其他用户的指示,呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择;
步骤五:响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据;
步骤六:若有剩余歌词未被选择时,重复步骤三至步骤五;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
在一种实施方式中,上述方法进一步包括:将音频文件发送给参与录制音频数据的第一用户和其他用户。
在本发明实施方式的第四方面中,提供了一种音频文件的合成设备之一,包括:
伴奏文件确定模块,用于根据用户的第一指示,确定第一伴奏文件,其中,所述第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成;
伴奏片段确定模块,用于根据用户的第二指示,确定用户选择的所述第一伴奏文件中的第一伴奏片段;
音频数据采集模块,用于为所述第一伴奏片段进行音频数据采集;
伴奏文件提供模块,用于将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由所述多个伴奏片段和对应音频数据合成的音频文件。
在一种实施方式中,所述音频数据采集模块,具体用于向用户提供所述第一伴奏片段;接收用户针对所述第一伴奏片段采集的第一音频数据;将所述第一伴奏片段和所述第一音频数据合成或者关联保存;或者接收用户将所述第一伴奏片段与针对所述第一伴奏片段采集的第一音频数据合成后的第一伴奏片段。
在一种实施方式中,上述设备还包括:呈现模块;
所述呈现模块,用于在所述伴奏文件确定模块确定第一伴奏文件之后,按照所述多个伴奏片段分别对应的播放时间段的先后顺序,将所述多个伴奏片段以及所述多个伴奏片段分别对应的歌词呈现;
所述音频数据采集模块,具体用于在播放所述第一伴奏片段的同时采集所述用户发送的第一音频数据,并将所述第一伴奏片段和所述第一音频数据合成或者关联保存。
在一种实施方式中,所述伴奏文件提供模块,具体用于根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户;向确定出的其他用户发送携带有预设接口的音频数据采集请求,其中,所述预设接口为提供所述其他用户访问所述第一伴奏文件的接口;接收任一其他用户发送的选择指示;将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户。
在一种实施方式中,上述设备还包括:获取模块和替换模块;
所述获取模块,用于在所述伴奏文件提供模块将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对所选择的伴奏片段进行合成后得到的完成合成的伴奏片段;
所述替换模块,用于使用获取的完成合成的伴奏片段替换所述第一伴奏文件中对应播放时间段的未完成音频数据合成的伴奏片段。
在一种实施方式中,上述设备还包括:获取模块和合成模块;
所述获取模块,用于在所述伴奏文件提供模块将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对所选择的伴奏片段采集的音频数据;
所述合成模块,用于将获取的音频数据和该任一其他用户选择的伴奏片段合成。
在一种实施方式中,上述设备还包括:获取模块、存储模块和播放模块;
所述获取模块,用于在所述伴奏文件提供模块将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对选择的伴奏片段采集的音频数据;
所述存储模块,用于将获取的音频数据与该任一其他用户选择的伴奏片段关联保存;
所述播放模块,用于当接收到播放所述第一伴奏文件的指示时,在按照播放时间段的先后顺序播放各伴奏片段的同时,针对每个完成音频数据采集的伴奏片段,将关联保存的音频数据与该伴奏片段播放时间点对齐提供播放。
在一种实施方式中,上述设备还包括:计时模块;
所述计时模块,用于在所述伴奏文件提供模块向确定出的其他用户发送音频数据采集请求之后,启动第一计时器开始计时;以及在第一预设计时时间到达时,若所述第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
在一种实施方式中,上述设备还包括:标识设置模块和计时模块;
所述标识设置模块,用于在所述伴奏文件提供模块接收到任一其他用户发送的选择指示之后,为所述选择指示所指示选择的未完成音频数据采集的伴奏片段设置已完成标识;其中,设置有已完成标识的伴奏片段不能被任何用户再次选择;
所述计时模块,用于启动第二计时器开始计时;以及若在第二预设时间段内未获取到该任一其他用户的音频数据,则取消对该选择指示所指示选择的伴奏片段的已完成标识的设置。
在一种实施方式中,所述音频数据采集模块,具体用于根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户;向确定出的其他用户发送携带有预设接口的音频数据采集请求;接收任一其他用户通过所述预设接口发送的获取所述第一伴奏文件的请求;将所述第一伴奏文件发送给该任一其他用户。
在一种实施方式中,上述设备还包括:获取模块、完成伴奏确定模块和替换模块;
所述获取模块,用于在所述音频数据采集模块将所述第一伴奏文件发送给该任一其他用户之后,获取该任一其他用户针对选择的伴奏片段执行合成操作之后得到的第一伴奏文件;
所述完成伴奏确定模块,用于按照接收到其他用户反馈的第一伴奏文件的先后顺序,确定每个反馈的第一伴奏文件中对应其他用户完成合成的伴奏片段;
所述替换模块,用于若该完成合成的伴奏片段在当前第一伴奏文件中未完成合成,则使用该完成合成的伴奏片段替换当前第一伴奏文件中播放时间段对应的未完成合成的伴奏片段,得到合并的第一伴奏文件。
在一种实施方式中,上述设备还包括:计时模块;
所述计时模块,用于在所述音频数据采集模块向确定出的其他用户发送音频数据采集请求之后,启动第三计时器开始计时;以及在第三预设计时时间到达时,若第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
在一种实施方式中,所述音频数据采集模块,具体用于根据预先统计的用户兴趣数据,以及当前所述第一伴奏文件中伴奏片段的音频数据采集完成进度,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户,其中,所述第一伴奏文件中未完成音频数据采集的伴奏片段越多,确定出的其他用户越多。
在一种实施方式中,所述音频数据采集模块,具体用于采用如下方法统计用户兴趣数据:监测用户播放音频文件时产生的播放行为;根据监测到的播放行为,统计符合如下指标的音频文件:播放达到预设时长、和/或播放达到预设频次;确定统计出的音频文件所属的类型,和/或对应的表演者,作为所述用户的兴趣数据。
在一种实施方式中,所述伴奏文件确定模块,具体用于在音频文件的播放界面,接收用户的用于指示针对所播放音频文件生成合成音频文件的第一指示;确定所播放音频文件对应的第一伴奏文件。
在一种实施方式中,所述伴奏文件确定模块,具体用于接收用户的用于对任意音频文件进行合成的第一指示;根据预先统计的用户兴趣数据,确定用户感兴趣的音频文件;确定用户感兴趣的所述音频文件对应的第一伴奏文件。
在一种实施方式中,上述设备还包括:界面设置模块;
所述界面设置模块,用于为所述用户设置第一访问界面,其中,所述第一访问界面用于提供所述第一伴奏文件的访问接口、以及所述第一伴奏文件的相关统计数据;所述相关统计数据包括:所述第一伴奏文件的当前完成进度、和/或参与所述第一伴奏文件合成的用户数。
在一种实施方式中,所述伴奏片段确定模块,还用于采用如下方法生成所述第一伴奏文件中的伴奏片段:获取所述第一伴奏文件对应的原声音频文件中除伴奏之外的音频数据;对获取的音频数据进行语法分析,将获取的音频数据以整句为单位进行划分;将划分得到的每个整句在所述第一伴奏文件中对应播放时间段的伴奏作为一个伴奏片段进行标记,得到由多个连续的播放时间段分别标记的多个伴奏片段。
在本发明实施方式的第五方面中,提供了一种音频文件的合成设备之二,包括:
接收模块,用于接收音频数据采集请求;
伴奏片段确定模块,用于从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段;其中,所述第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集;
音频数据采集模块,用于在播放所述第二伴奏片段的同时采集用户发送的第二音频数据;
发送模块,用于将采集的结果反馈。
在一种实施方式中,所述伴奏片段确定模块,具体用于根据用户的第三指示,通过所述音频数据采集请求中携带的预设接口访问第二伴奏文件;根据用户的第四指示,发送用于表征用户选择的所述第二伴奏文件中的第二伴奏片段的选择指示;接收所述第二伴奏片段;
所述发送模块,具体用于反馈所述第二音频数据;或者将所述第二伴奏片段和所述第二音频数据合成,并反馈完成合成的第二伴奏片段。
在一种实施方式中,所述伴奏片段确定模块,具体用于根据用户的第五指示,通过所述音频数据采集请求中携带的预设接口获取第二伴奏文件;根据用户的第六指示,确定用户选择的所述第二伴奏文件中的第二伴奏片段;
所述发送模块,具体用于反馈完成本次合成的第二伴奏文件。
在一种实施方式中,上述设备还包括:界面设置模块;
所述界面设置模块,用于为所述用户设置第二访问界面,其中,所述第二访问界面用于提供所述第二伴奏文件的访问接口、以及所述第二伴奏文件的相关统计数据;所述相关统计数据包括:所述第二伴奏文件的当前完成进度、和/或参与所述第二伴奏文件合成的用户数。
在本发明实施方式的第六方面中,提供了一种音频文件的合成系统之一,包括:发起方终端和参与者终端;
所述发起方终端,用于响应于第一用户的指示,选择伴奏文件并呈现伴奏文件包含的多个伴奏片段所对应的多句歌词;响应于第一用户对任一句歌词的选择,播放对应的伴奏片段,并录制音频数据;将音频文件合成请求发送给其他用户;
所述参与者终端,用于响应于所述其他用户的指示,呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择;响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据;
所述发起方终端,还用于若有剩余歌词未被选择时,重复将音频文件合成请求发送给其他用户;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
在本发明实施方式的第七方面中,提供了一种音频文件的合成系统之二,包括:服务器、发起方终端和参与者终端;
所述服务器,用于响应于第一用户的指示,选择伴奏文件,并将所述伴奏文件提供所述发起方终端;
所述发起方终端,用于呈现伴奏文件包含的多个伴奏片段所对应的多句歌词;
所述服务器,还用于响应于第一用户对任一句歌词的选择,将所述歌词对应的伴奏片段提供所述发起方终端;
所述发起方终端,还用于播放对应的伴奏片段,并录制音频数据,并上传所述服务器;
所述服务器,还用于将音频文件合成请求发送给其他用户;响应于所述其他用户的指示,将所述伴奏文件提供所述其他用户;
所述参与者终端,用于呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择;响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据;并上传所述服务器;
所述服务器,还用于若有剩余歌词未被选择时,重复将音频文件合成请求发送给其他用户;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
根据本发明实施方式的一种音频文件的合成方法和设备,预先将第一伴奏文件处理为由多个连续的播放时间段分别标记的多个伴奏片段构成,根据用户的第一指示确定第一伴奏文件,再根据用户的第二指示,确定该作为发起方的用户选择的第一伴奏文件中的第一伴奏片段;为确定的第一伴奏片段进行音频数据采集;将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户。可见,作为发起方的用户完成了一个伴奏片段的对应音频数据采集之后,将部分伴奏片段完成的第一伴奏文件提供给对该第一伴奏文件感兴趣的其他用户,使得不同其他用户分别针对不同未完成合成的伴奏片段进行音频数据采集,得到由多个伴奏片段和对应音频数据合成的音频文件,在合成第一伴奏文件的过程中,多个感兴趣用户都参与了合成,与现有技术中,单个用户独立合成一个音频文件相比,增加了社交性和趣味性,丰富了现有技术中唱歌类软件的功能,为用户带来了更好的体验。
根据本发明实施方式的另一种音频文件的合成方法和设备,接收音频数据采集请求;从音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段;其中,第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集;在播放第二伴奏片段的同时采集用户发送的第二音频数据;将采集的结果反馈。本发明实施例中,用户可以作为参与者来参与发起方用户发起的音频文件合成,这样,由发起方用户和多个参与者用户都参与第二伴奏文件的音频数据采集,最终完成音频文件的合成,与现有技术中,单个用户独立合成一个音频文件相比,增加了社交性和趣味性,丰富了现有技术中唱歌类软件的功能,为用户带来了更好的体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明实施方式的应用场景示意图;
图2示意性地示出了根据本发明一实施例的一种音频文件的合成方法的流程示意图;
图3a~图3b示意性地示出了根据本发明另一实施例的一种音频文件的合成方法的流程示意图;
图4示意性地示出了根据本发明又一实施例的一种音频文件的合成方法的流程示意图;
图5a~图5c示意性地示出了根据本发明再一实施例的一种音频文件的合成方法的流程示意图;
图6示意性地示出了根据本发明还一实施例的一种音频文件的合成方法的流程示意图;
图7a~图7f示意性地示出了作为发起方的终端发起音频文件合成的操作流程示意图;
图8示意性地示出了根据本发明更一实施例的一种音频文件的合成方法的流程示意图;
图9示意性地示出了根据本发明进一实施例的一种音频文件的合成方法的流程示意图;
图10示意性地示出了根据本发明另又一实施例的一种音频文件的合成方法的流程示意图;
图11a~图11f示意性地示出了作为参与者的终端参与音频文件合成的操作流程示意图;
图12a~图12b示意性地示出了作为发起者或者参与者的终端管理自身发起的或参与的音频文件界面示意图;
图13示意性地示出了根据本发明另再一实施例的一种音频文件的合成方法的流程示意图;
图14示意性地示出了根据本发明一实施例的一种音频文件的合成设备之一的结构示意图;
图15示意性地示出了根据本发明又一实施例的一种音频文件的合成设备之一的结构示意图;
图16示意性地示出了根据本发明一实施例的一种音频文件的合成设备之二的结构示意图;
图17示意性地示出了根据本发明又一实施例的一种音频文件的合成设备之二的结构示意图;
图18示意性地示出了根据本发明实施例的一种音频文件的合成设备之一的程序产品示意图;
图19示意性地示出了根据本发明实施例的一种音频文件的合成设备之二的程序产品示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种音频文件的合成方法和设备。
在本文中,需要理解的是,所涉及的术语第一伴奏文件表示由多个连续的播放时间段分别标记的多个伴奏片段构成的伴奏文件。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,现有技术中,常用的唱歌类应用软件均是使单个用户独立完成一首歌曲,功能单一。
为此,本发明提供了一种音频文件的合成方法和设备,该方法包括:根据用户的第一指示,确定第一伴奏文件,其中,第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成;根据用户的第二指示,确定用户选择的第一伴奏文件中的第一伴奏片段;为确定的第一伴奏片段进行音频数据采集;将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由多个伴奏片段和对应音频数据合成的音频文件。以及
另一种音频文件的合成方法和设备,该方法包括:接收音频数据采集请求;从音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段;其中,第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集;在播放第二伴奏片段的同时采集用户发送的第二音频数据;将采集的结果反馈。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
首先参考图1,终端102~终端n都安装有能够实现本发明实施例提供的音频文件合成方法的音频合成软件,或者都能够访问提供本发明实施例提供的音频文件合成方法的服务器。并且具有采集音频数据的功能,终端102~终端n能够通过网络进行通信。服务器101通过网络与终端102~终端n通信连接,服务器101可以根据实际需要被设置为提供伴奏文件,并且实施本发明实施例提供的音频文件合成方法。其中,网络可以为局域网、广域网、移动互联网等;终端102~终端n可以为便携设备(例如:手机、平板、笔记本电脑等),也可以为个人电脑(PC,Personal Computer)。
示例性方法
下面结合图1的应用场景,参考图2~图13来描述根据本发明示例性实施方式的用于合成音频文件的方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
图2为本发明提供的一种音频文件的合成方法的一实施例的流程示意图,执行主体为终端102~终端n中作为发起方的终端,也可以为服务器101。
如图2所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S201、根据用户的第一指示,确定第一伴奏文件。
其中,第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成。
S202、根据用户的第二指示,确定用户在S201中选择的第一伴奏文件中的第一伴奏片段。
S203、为S202中确定的第一伴奏片段进行音频数据采集。
本步骤中,执行主体可以为终端102~终端n中作为发起方的终端,也就是说,可以由发起方终端直接为第一伴奏片段进行音频数据采集;执行主体也可以为服务器101,也就是说,可以由服务器101将第一伴奏片段提供给发起方终端,由服务器101间接为第一伴奏片段进行音频数据采集。
S204、将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由多个伴奏片段和对应音频数据合成的音频文件。
本步骤中,得到的由多个伴奏片段和对应音频数据合成的音频文件,可以为将多个伴奏片段和对应音频数据合成为一个文件的音频文件,也可以为单独的伴奏文件和对应的音频数据分别合成为多个文件,在播放的时候再按照播放时间对齐进行合成播放。
图3a~图3b为本发明提供的一种音频文件的合成方法的另一实施例的流程示意图,执行主体为服务器101。如图3a所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S301、根据用户的第一指示,确定第一伴奏文件。
其中,第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成。
本步骤中,向用户提供第一伴奏片段之后,在用户终端侧可以按照多个伴奏片段分别对应的播放时间段的先后顺序,将多个伴奏片段以及该多个伴奏片段分别对应的歌词呈现,以便对用户进行提示。
S302、根据用户的第二指示,确定用户在S301中选择的第一伴奏文件中的第一伴奏片段。
S303、向用户提供S302中确定的第一伴奏片段。
本步骤中,向用户提供第一伴奏片段之后,在用户终端侧可以通过终端设备针对第一伴奏片段对音频数据进行采集。
S304、接收用户针对S303中提供的第一伴奏片段采集的第一音频数据。
S305、将S303中提供的第一伴奏片段和S304中采集的第一音频数据合成或者关联保存。
步骤S304~步骤S305中可以直接接收用户采集的第一音频数据,由服务器101将第一音频数据与对应的第一伴奏片段进行合成,或者关联保存,待播放时再按照播放时间对齐进行合成播放。也可以由用户终端进行合成,直接接收完成合成的第一音频数据和第一伴奏片段,即如图3b所示,步骤S304~步骤S305可以被替换为步骤S3041:
S3041、接收用户将S303中提供的第一伴奏片段与针对该第一伴奏片段采集的第一音频数据合成后的第一伴奏片段。
S306、将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由多个伴奏片段和对应音频数据合成的音频文件。
图4为本发明提供的一种音频文件的合成方法的又一实施例的流程示意图,执行主体为终端102~终端n中作为发起方的终端。如图4所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S401、根据用户的第一指示,确定第一伴奏文件。
其中,第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成。
本步骤中,第一伴奏片段可以保存在发起方终端,接收到用户的第一指示之后,从发起方终端本地获取该第一伴奏文件;也可以保存在服务器101,接收到用户的第一指示之后,从服务器101获取该第一伴奏文件。
S402、按照多个伴奏片段分别对应的播放时间段的先后顺序,将多个伴奏片段以及该多个伴奏片段分别对应的歌词呈现。
S403、根据用户的第二指示,确定用户在S401中选择的第一伴奏文件中的第一伴奏片段。
S404、在播放S403中确定的第一伴奏片段的同时采集用户发送的第一音频数据,并将该第一伴奏片段和第一音频数据合成或者关联保存。
本步骤中,将第一伴奏片段和该第一音频数据合成还是关联保存,可以根据具体实施方式来确定,若具体实施时需要得到将伴奏文件和音频数据合成后的单个文件,则本步骤执行合成操作;若具体实施时,需要得到伴奏文件和对应的音频数据多个文件,在播放时将伴奏文件和对应关联保存的音频数据文件播放时间对齐合成播放,则本步骤执行关联保存操作。
较佳地,在播放S302中选择的第一伴奏片段的同时还可以将第一伴奏片段对应的歌词与第一伴奏片段时间对齐进行显示。
S405、将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由多个伴奏片段和对应音频数据合成的音频文件。
图5a~图5c为本发明提供的一种音频文件的合成方法的再一实施例的流程示意图,执行主体为终端102~终端n中作为发起方的终端,也可以为服务器101。
如图5a所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S501、根据用户的第一指示,确定第一伴奏文件。
其中,第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成。
本步骤S501中,用户可以在音频文件的播放界面,发出对所播放音频文件生成合成音频文件的指示,即将步骤S501实施为如下步骤:
步骤一一、在音频文件的播放界面,接收用户的用于指示针对所播放音频文件生成合成音频文件的第一指示;
步骤一二、确定所播放音频文件对应的第一伴奏文件。
具体实施时,可以在音频播放界面设置选项,用户通过对该选项的操作发出该第一指示。步骤一一的执行主体可以为服务器101或者终端102~终端n中作为发起方的终端,当为发起方的终端时,在接收到第一指示之后,可以由发起方终端从本地确定第一伴奏文件,如果本地没有存储第一伴奏文件,则可以从服务器101获取该第一伴奏文件。
本步骤S501中,用户也可以预先不确定需要合成的音频文件,而是直接发出生成合成音频文件的指示,由执行主体为用户确定需要合成的音频文件,即将步骤S501实施为如下步骤:
步骤二一、接收用户的用于对任意音频文件进行合成的第一指示;
步骤二二、根据预先统计的用户兴趣数据,确定用户感兴趣的音频文件;
步骤二三、确定用户感兴趣的音频文件对应的第一伴奏文件。
进一步地,步骤二一~步骤二三的执行主体可以为服务器101或者终端102~终端n中作为发起方的终端。当为发起方的终端时,如果发起方终端本地没有存储第一伴奏文件,则可以从服务器101获取该第一伴奏文件。
本步骤中,为了对用户后续进行伴奏片段的选择进行提示,可以将构成第一伴奏文件的伴奏片段,以及各伴奏片段分别对应的歌词向用户呈现。
S502、根据用户的第二指示,确定用户在S501中选择的第一伴奏文件中的第一伴奏片段。
进一步地,第一伴奏文件可以由多个连续的播放时间段分别标记的多个伴奏片段构成,用户可以通过第二指示选择其中一个播放时间段标记的伴奏片段。第一伴奏文件可以由服务器101生成,或者由终端102~终端n中作为发起方的终端生成,较佳地,可以由服务器101预先生成并保存在对应的位置。
具体地,可以采用如下方法生成第一伴奏文件中的伴奏片段:
步骤一、获取第一伴奏文件对应的原声音频文件中除伴奏之外的音频数据;
步骤二、对获取的音频数据进行语法分析,将获取的音频数据以整句为单位进行划分;
步骤三、将划分得到的每个整句在第一伴奏文件中对应播放时间段的伴奏作为一个伴奏片段进行标记,得到由多个连续的播放时间段分别标记的多个伴奏片段。
S503、为S502中确定的第一伴奏片段进行音频数据采集。
本步骤中,执行主体可以为终端102~终端n中作为发起方的终端,即可以通过发起方终端直接播放第一伴奏片段采集第一音频数据;执行主体也可以为服务器101,即可以由服务器101将第一伴奏片段提供给发起方终端,由服务器101间接进行音频数据采集。
具体实施时,可以通过发起方终端的音频采集装置对用户发送的第一音频数据进行采集,用户发送的音频数据通常为用户配合第一伴奏片段进行演唱发出的声音数据。
S504、根据预先统计的用户兴趣数据,确定对第一伴奏文件对应的原声音频文件感兴趣的其他用户。
本步骤中,不但需要确定出哪些用户对该原声音频文件感兴趣,还需要从这些感兴趣用户中确定出需要数量的感兴趣用户作为其他用户。该数量可以根据当前第一伴奏文件中伴奏片段的音频数据采集完成进度来确定,确定的数量可以少于、等于、或多于当前第一伴奏文件中尚未完成音频数据采集的伴奏片段的数量,具体实施方式可以根据实际需要进行确定,这里并不限制。那么,步骤S504可以替换为如下步骤:
根据预先统计的用户兴趣数据,以及当前第一伴奏文件中伴奏片段的音频数据采集完成进度,确定对第一伴奏文件对应的原声音频文件感兴趣的其他用户,其中,第一伴奏文件中未完成音频数据采集的伴奏片段越多,确定出的其他用户越多。
进一步地,可以采用如下方法统计用户兴趣数据:
步骤一、监测用户播放音频文件时产生的播放行为;
步骤二、根据监测到的播放行为,统计符合如下指标的音频文件:播放达到预设时长、和/或播放达到预设频次;
步骤三、确定统计出的音频文件所属的类型,和/或对应的表演者,作为用户的兴趣数据。
S505、向S504中确定出的其他用户发送携带有预设接口的音频数据采集请求,其中,预设接口为提供该其他用户访问第一伴奏文件的接口。
具体实施时,可以向其他用户发送即时消息,该即时消息承载音频数据采集请求,并携带有预设接口,可以将第一伴奏文件预先存储在服务器101,其他用户通过访问该预设接口可以从服务器101获取到该第一伴奏文件。
S506、启动第一计时器开始计时。
进一步地,其他用户接收到音频数据采集请求之后,可能由于各种原因没有及时访问第一伴奏文件并进行音频数据采集,为了保证最终合成的音频文件的生成效率,在发送音频数据采集请求之后,还可以为其他用户对音频数据的采集设置时限,即可以执行本步骤。
S507、接收任一其他用户发送的选择指示。
由于可能向多个其他用户发送音频数据采集请求,并且多个其他用户可能选择同一个伴奏片段,那么,可以将已完成音频数据采集的伴奏片段进行标识,即在接收到任一其他用户发送的选择指示之后,执行如下步骤:
步骤一、为该选择指示所指示选择的未完成音频数据采集的伴奏片段设置已完成标识;其中,设置有已完成标识的伴奏片段不能被任何用户再次选择;
步骤二、启动第二计时器开始计时;
步骤三、若在第二预设时间段内未获取到该任一其他用户的音频数据,则取消对该选择指示所指示选择的伴奏片段的已完成标识的设置。
也就是说,当用户从接收到的第一伴奏文件中尚未完成音频数据采集的伴奏片段中选择一个伴奏片段,则会发送选择指示,接收到选择指示之后,可以认为该其他用户将会为该选择的伴奏片段生成音频数据,可以将该伴奏片段设置已完成标识,以免该任一其他用户之外的其他用户重复选择同一个伴奏片段发生冲突,具体实施时,可以将该任一用户选择的伴奏片段置灰,使得除该任一其他用户之外的其他用户无法对该伴奏片段进行选择。并且,为了避免该任一其他用户选择了伴奏片段之后又放弃采集音频数据,可以启动第二计时器进行计时,如果在第二预设时间段内该任一其他用户未完成音频数据的采集,可以认为该任一其他用户放弃为该伴奏片段采集音频数据,可以取消对该伴奏片段的已完成标识的设置,以使该伴奏片段恢复能够被除该任一其他用户之外的其他用户选择。
S508、将S507中选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户。
本步骤中,可以根据该任一其他用户的选择指示确定出其选择的伴奏片段,为了节省网络资源可以不将整个第一伴奏文件发送给该任一其他用户,而将该伴奏片段截取并发送给该任一其他用户。
S509、获取该任一其他用户针对所选择的伴奏片段进行合成后得到的完成合成的伴奏片段。
S510、使用S509中获取的完成合成的伴奏片段替换第一伴奏文件中对应播放时间段的未完成音频数据合成的伴奏片段。
步骤S509~步骤S510中,可以由其他用户通过其对应终端完成对所选择的伴奏片段和采集的音频数据的合成,将合成后的伴奏片段发送给服务器101或者发起方终端,使用该完成合成的伴奏片段替换第一伴奏文件中对应的尚未与音频数据进行合成的伴奏片段即可。
进一步地,该合成操作也可以不由该其他用户的终端执行,而由执行主体(服务器101或者发起方终端)执行,即如图5b所示,将步骤S509~步骤S510可以被替换为步骤S5091~步骤S5101:
S5091、获取该任一其他用户针对所选择的伴奏片段采集的音频数据。
S5101、将获取的音频数据和该任一其他用户选择的伴奏片段合成。
步骤S5091~步骤S5101中,执行主体接收音频数据,由执行主体将音频数据与对应伴奏片段进行合成。
进一步地,也可以不执行合成操作,而将音频数据和对应伴奏片段关联保存,当需要播放的时候再将关联保存的音频数据和伴奏片段播放时间对齐进行合成播放,即如图5c所示,步骤S509~步骤S510还可以被替换为步骤S5092~步骤S5112:
S5092、获取该任一其他用户针对选择的伴奏片段采集的音频数据。
S5102、将获取的音频数据与该任一其他用户选择的伴奏片段关联保存。
S5112、当接收到播放第一伴奏文件的指示时,在按照播放时间段的先后顺序播放各伴奏片段的同时,针对每个完成音频数据采集的伴奏片段,将关联保存的音频数据与该伴奏片段播放时间点对齐提供播放。
本步骤中,当执行主体为服务器101时,当接收到终端发送的播放指示时,可以将关联保存的音频数据与伴奏片段播放时间点对齐提供给该终端进行播放;当执行主体为终端102~终端n中作为发起方的终端时,可以将关联保存的音频数据与伴奏片段播放时间点对齐提供给该终端的播放器进行播放。
S511、在第一预设计时时间到达时,判断第一伴奏文件中当前是否存在未完成音频数据采集的伴奏片段;若是,则进入步骤S505,否则,本流程结束。
若第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
在预先设置的第一预设计时时间到达之后,若第一伴奏文件中当前仍存在未完成音频数据采集的伴奏片段,则可以重新执行步骤S504~步骤S505,重新确定其他用户,并向重新确定的其他用户发送音频数据采集请求,或者如果S504中确定出的其他用户数量足够,可以直接重新执行步骤S505,从上次已经确定出来的其他用户中重新确定本次的其他用户,并向重新确定的其他用户发送音频数据采集请求,本次确定的其他用户与上次确定出来的其他用户可以完全不同,也可以部分重叠,或者全部重叠,具体实施方式可以根据实际情况确定,这里并不限制。
并且,针对确定出的其他用户的数量少于第一伴奏文件中尚未完成音频采集的伴奏片段的数量的情况,也可以在每次接收到其他用户完成采集的音频数据之后,在第一伴奏文件中当前仍存在尚未完成音频采集的伴奏片段的前提下,重复执行步骤S504~步骤S505或者步骤S505,直到第一伴奏文件中的伴奏片段全部完成音频数据的采集。
进一步地,本步骤的执行与步骤S507~步骤S510的执行没有严格的先后顺序,可以在第一预设计时时间到达时即执行本步骤。
图6为本发明提供的一种音频文件的合成方法的还一实施例的流程示意图,执行主体为终端102~终端n中作为发起方的终端,也可以为服务器101。
如图6所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S601、根据用户的第一指示,确定第一伴奏文件。
其中,第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成。
S602、根据用户的第二指示,确定用户在S401中选择的第一伴奏文件中的第一伴奏片段。
S603、为S602中确定的第一伴奏片段进行音频数据采集。
S604、根据预先统计的用户兴趣数据,确定对第一伴奏文件对应的原声音频文件感兴趣的其他用户。
S605、向S604中确定出的其他用户发送携带有预设接口的音频数据采集请求。
S606、启动第三计时器开始计时。
步骤S601~步骤S606的具体实施方式可以参见图5a所示实施例的对应步骤,这里不再赘述。
S607、接收任一其他用户通过预设接口发送的获取第一伴奏文件的请求。
当任一其他用户接收到音频数据采集请求,可以通过预设接口作出响应,本实施例中,当用户响应时,可以不提供该任一其他用户选择的伴奏片段,而是将整个第一伴奏文件提供给该任一其他用户。用户接收到整个第一伴奏文件之后再选择伴奏片段,并针对该伴奏片段采集音频数据。
S608、将第一伴奏文件发送给该任一其他用户。
S609、获取该任一其他用户针对选择的伴奏片段执行合成操作之后得到的第一伴奏文件。
本实施例中,上述步骤中,执行主体并不知晓该任一其他用户选择的是哪个伴奏片段,该任一其他用户获取到整个第一伴奏文件,在本地选择伴奏片段、音频数据的采集、以及将采集的音频数据和对应选择的伴奏片段进行合成,再将对应伴奏片段完成合成的第一伴奏文件反馈给执行主体。
S610、按照接收到其他用户反馈的第一伴奏文件的先后顺序,确定每个反馈的第一伴奏文件中对应其他用户完成合成的伴奏片段。
本步骤中,由于执行主体没有通过用户的选择指示确定出用户所选择的伴奏片段,也就无法控制其他用户重复选择相同的伴奏片段进行音频数据的采集,而只能通过接收到其他用户反馈第一伴奏文件的先后顺序,确定其他用户是否成功选择了对应伴奏片段。也就是说,对于同一伴奏片段,先接收到的完成对该伴奏片段合成的其他用户为成功选择该伴奏片段的其他用户,后续接收到的第一伴奏文件中,若其他用户也是针对该伴奏片段进行合成,则为无效选择。
S611、若该完成合成的伴奏片段在当前第一伴奏文件中未完成合成,则使用该完成合成的伴奏片段替换当前第一伴奏文件中播放时间段对应的未完成合成的伴奏片段,得到合并的第一伴奏文件。
S612、在第三预设计时时间到达时,判断第一伴奏文件中当前是否存在未完成音频数据采集的伴奏片段;若是,则进入步骤S605,否则,本流程结束。
若第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
在预先设置的第三预设计时时间到达之后,若第一伴奏文件中当前仍存在未完成音频数据采集的伴奏片段,则可以重新执行步骤S604~步骤S605,重新确定其他用户,并向重新确定的其他用户发送音频数据采集请求,或者如果S604中确定出的其他用户数量足够,可以直接重新执行步骤S605,从上次已经确定出来的其他用户中重新确定本次的其他用户,并向重新确定的其他用户发送音频数据采集请求,本次确定的其他用户与上次确定出来的其他用户可以完全不同,也可以部分重叠,或者全部重叠,具体实施方式可以根据实际情况确定,这里并不限制。
进一步地,本步骤的执行与步骤S607~步骤S611的执行没有严格的先后顺序,可以在第三预设计时时间到达时即执行本步骤。
图7a~图7f为作为发起方的终端发起音频文件合成的操作流程示意图。如图7a~图7b所示,在音频文件的播放界面,用户通过设置的选项701发起音频文件合成(即发起音乐漂流瓶)的第一指示;如图7c所示,根据第一指示,将伴奏文件对应的各伴奏片段呈现给用户,每个伴奏片段都显示有歌词,以便用户进行伴奏片段的选择;如图7d所示,用户发出第二指示确定出第一伴奏片段,较佳地,可以将第一伴奏片段作为悬浮窗进行呈现;如图7e所示,在播放第一伴奏片段的同时,采集用户发送的第一音频数据,并且可以显示当前录制进度;如图7f所示,完成第一伴奏片段对应的音频文件的录制之后,生成待完成的音频文件(即音乐漂流瓶),此后,可以执行确定对原声音频文件感兴趣的其他用户,向该其他用户发送音频数据采集请求的步骤(即抛出音乐漂流瓶)。
图8为本发明提供的一种音频文件的合成方法的更一实施例的流程示意图。本实施例中,执行主体为终端102~终端n中作为参与者的终端。
如图8所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S801、接收音频数据采集请求。
本发明实施例中,终端102~终端n中的任一终端可以作为参与者接收来自发起方终端或者服务器101的数据采集请求。
S802、从S801中接收的音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段。
其中,第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集。
本步骤中,由于作为发起方的终端已经完成了第二伴奏文件中一个伴奏片段的合成,并且之前其他用户也可能完成了第二伴奏文件中的部分伴奏文件,因此,作为参与者的终端接收到的第二伴奏文件中存在至少一个伴奏片段已完成音频数据采集。
S803、在播放S802中确定的第二伴奏片段的同时采集用户发送的第二音频数据。
S804、将S803中采集的结果反馈。
本步骤中,反馈的对象可以是发送音频数据采集请求的主体,可以为发起方终端或者服务器101。
图9为本发明提供的一种音频文件的合成方法的进一实施例的流程示意图。本实施例中,执行主体为终端102~终端n中作为参与者的终端。
如图9所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S901、接收音频数据采集请求。
S902、根据用户的第三指示,通过音频数据采集请求中携带的预设接口访问第二伴奏文件。
其中,第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集。
通过预设接口访问的第二伴奏文件可以存储在作为发起方的终端上,也可以存储在服务器101上。用户通过发出第三指示能够使第二伴奏文件在本地显示。
本步骤中,为了对用户后续选择伴奏片段进行提示,可以将构成第二伴奏文件的伴奏片段,以及各伴奏片段分别对应的歌词向用户呈现,其中,已经完成音频数据采集的伴奏片段可以设置为不可选择的状态(例如:置灰)。
S903、根据用户的第四指示,发送用于表征用户选择的第二伴奏文件中的第二伴奏片段的选择指示。
本步骤中,用户可以通过发出第四指示,对第二伴奏文件中的第二伴奏片段进行选择。
S904、接收S903中选择的第二伴奏片段。
本步骤中,用户可以接收作为发起方的终端或者视频服务器101发送的第二伴奏片段。
S905、在播放第二伴奏片段的同时采集用户发送的第二音频数据。
较佳地,在播放选择的第二伴奏片段的同时还可以将第二伴奏片段对应的歌词与第二伴奏片段时间对齐进行显示,对用户进行提示。
S906、反馈第二音频数据;或者
将第二伴奏片段和第二音频数据合成,并反馈完成合成的第二伴奏片段。
本步骤中,可以只反馈第二音频数据,由作为发起方的终端或者服务器101执行合成操作,也可以在本地进行合成,将合成后的第二伴奏片段反馈。
图10为本发明提供的一种音频文件的合成方法的另又一实施例的流程示意图,本实施例中,执行主体为终端102~终端n中作为参与者的终端。
如图10所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S1001、接收音频数据采集请求。
S1002、根据用户的第五指示,通过音频数据采集请求中携带的预设接口获取第二伴奏文件。
其中,第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成合成。
通过预设接口访问的第二伴奏文件可以存储在作为发起方的终端上,也可以存储在服务器101上。用户通过发出第五指示能够将第二伴奏文件获取到本地。
S1003、根据用户的第六指示,确定用户选择的所述第二伴奏文件中的第二伴奏片段。
S1004、在播放第二伴奏片段的同时采集用户发送的第二音频数据,并将第二伴奏片段和所述第二音频数据合成。
S1005、反馈完成本次合成的第二伴奏文件。
图11a~图11f为作为参与者的终端参与音频文件合成的操作流程示意图。如图11a~图11b所示,通过即时消息接收到音频数据采集请求;如图11c所示,发出第三指示,访问第二伴奏文件,显示的第二伴奏文件中置灰的伴奏片段表征已经完成对应音频数据采集无法再次进行选择;如图11d所示,发出第四指示,从可选的伴奏片段中选择第二伴奏片段,将第二伴奏片段作为悬浮窗进行呈现;如图11e所示,在播放第一伴奏片段的同时,采集用户发送的第二音频数据,并且可以显示当前录制进度;如图11f所示,完成第二伴奏片段对应的音频文件的录制之后,若当前还存在尚未采集音频数据的伴奏片段,可以执行再次向对原声音频文件感兴趣的其他用户发送音频数据采集请求的步骤(抛出音乐漂流瓶)。
进一步地,为了便于对自身作为发起方的伴奏文件和自身作为参与者的伴奏文件进行管理,可以在本终端为用户设置相关界面,具体地:
可以为用户设置第一访问界面,
其中,第一访问界面用于提供第一伴奏文件的访问接口、以及第一伴奏文件的相关统计数据;相关统计数据包括:第一伴奏文件的当前完成进度、和/或参与第一伴奏文件合成的用户数。以及
可以为用户设置第二访问界面,
其中,第二访问界面用于提供第二伴奏文件的访问接口、以及第二伴奏文件的相关统计数据;相关统计数据包括:第二伴奏文件的当前完成进度、和/或参与第二伴奏文件合成的用户数。
图12a~图12b为作为发起者或者参与者的终端管理自身发起的或参与的音频文件界面示意图。如图12a所示,可以为音频文件的管理设置入口,例如:我的音乐漂流瓶,通过该入口进入管理界面;如图12b所示,在“我发布的漂流瓶”中包括作为发起者发起的音频文件合成,可以包括已完成合成的或者正在完成合成的音频文件,针对每个音频文件显示当前完成进度、和参与合成的用户数等;在“我参与的漂流瓶”中包括作为参与者参与的音频文件合成,可以包括已完成合成的或者正在完成合成的音频文件,针对每个音频文件显示当前完成进度、和参与合成的用户数等。
图13为本发明提供的一种音频文件的合成方法的另再一实施例的流程示意图。如图13所示,本发明实施例提供的一种音频文件的合成方法,包括如下步骤:
S1301、响应于第一用户的指示,选择伴奏文件并呈现伴奏文件包含的多个伴奏片段所对应的多句歌词。
S1302、响应于第一用户对任一句歌词的选择,播放对应的伴奏片段,并录制音频数据。
步骤S1301~步骤S1302的执行主体可以为终端102~终端n中作为发起方的终端。
S1303、将音频文件合成请求发送给其他用户。
本步骤的执行主体可以为终端102~终端n中作为发起方的终端,也可以为服务器101。
S1304、响应于所述其他用户的指示,呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择。
S1305、响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据。
步骤S1304~步骤S1305的执行主体可以为终端102~终端n中作为参与者的终端。
S1306、判断是否存在剩余歌词未被选择;若是,则进入步骤S1303,否则,进入步骤S1307。
S1307、将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
步骤S1306~步骤S1307中,若有剩余歌词未被选择时,重复步骤三至步骤五;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
步骤S1306~步骤S1307的执行主体可以为终端102~终端n中作为发起方的终端,也可以为服务器101。
进一步地,服务器101还可以用于将音频文件发送给参与录制音频数据的第一用户和其他用户。
示例性设备
在介绍了本发明示例性实施方式的方法之后,接下来,参考图14描述本发明示例性实施方式的、用于音频文件合成的设备之一。
图14为本发明实施例提供一种音频文件的合成设备之一的结构示意图,如图14所示,可以包括如下模块:
伴奏文件确定模块1401,用于根据用户的第一指示,确定第一伴奏文件,其中,所述第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成;
伴奏片段确定模块1402,用于根据用户的第二指示,确定用户选择的所述第一伴奏文件中的第一伴奏片段;
音频数据采集模块1403,用于为所述第一伴奏片段进行音频数据采集;
伴奏文件提供模块1404,用于将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由所述多个伴奏片段和对应音频数据合成的音频文件。
在本实施例的一些实施方式中,可选的,所述音频数据采集模块1403,具体用于向用户提供所述第一伴奏片段;接收用户针对所述第一伴奏片段采集的第一音频数据;将所述第一伴奏片段和所述第一音频数据合成或者关联保存;或者接收用户将所述第一伴奏片段与针对所述第一伴奏片段采集的第一音频数据合成后的第一伴奏片段。
在本实施例的另一些实施方式中,可选的,所述设备还包括:呈现模块1405;
所述呈现模块1405,用于在所述伴奏文件确定模块1401确定第一伴奏文件之后,按照所述多个伴奏片段分别对应的播放时间段的先后顺序,将所述多个伴奏片段以及所述多个伴奏片段分别对应的歌词呈现;
所述音频数据采集模块1403,具体用于在播放所述第一伴奏片段的同时采集所述用户发送的第一音频数据,并将所述第一伴奏片段和所述第一音频数据合成或者关联保存。
在本实施例的又一些实施方式中,可选的,所述伴奏文件提供模块1404,具体用于根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户;向确定出的其他用户发送携带有预设接口的音频数据采集请求,其中,所述预设接口为提供所述其他用户访问所述第一伴奏文件的接口;接收任一其他用户发送的选择指示;将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户。
在本实施例的再一些实施方式中,可选的,所述设备还包括:获取模块1406和替换模块1407;
所述获取模块1406,用于在所述伴奏文件提供模块1404将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对所选择的伴奏片段进行合成后得到的完成合成的伴奏片段;
所述替换模块1407,用于使用获取的完成合成的伴奏片段替换所述第一伴奏文件中对应播放时间段的未完成音频数据合成的伴奏片段。
在本实施例的还一些实施方式中,可选的,所述设备还包括:获取模块1406和合成模块1408;
所述获取模块1406,用于在所述伴奏文件提供模块1404将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对所选择的伴奏片段采集的音频数据;
所述合成模块1408,用于将获取的音频数据和该任一其他用户选择的伴奏片段合成。
在本实施例的更一些实施方式中,可选的,所述设备还包括:获取模块1406、存储模块1409和播放模块1410;
所述获取模块1406,用于在所述伴奏文件提供模块1404将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对选择的伴奏片段采集的音频数据;
所述存储模块1409,用于将获取的音频数据与该任一其他用户选择的伴奏片段关联保存;
所述播放模块1410,用于当接收到播放所述第一伴奏文件的指示时,在按照播放时间段的先后顺序播放各伴奏片段的同时,针对每个完成音频数据采集的伴奏片段,将关联保存的音频数据与该伴奏片段播放时间点对齐提供播放。
在本实施例的进一些实施方式中,可选的,所述设备还包括:计时模块1411;
所述计时模块1411,用于在所述伴奏文件提供模块1404向确定出的其他用户发送音频数据采集请求之后,启动第一计时器开始计时;以及在第一预设计时时间到达时,若所述第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
在本实施例的另又一些实施方式中,可选的,所述设备还包括:标识设置模块1412和计时模块1411;
所述标识设置模块1412,用于在所述伴奏文件提供模块1404接收到任一其他用户发送的选择指示之后,为所述选择指示所指示选择的未完成音频数据采集的伴奏片段设置已完成标识;其中,设置有已完成标识的伴奏片段不能被任何用户再次选择;
所述计时模块1411,用于启动第二计时器开始计时;以及若在第二预设时间段内未获取到该任一其他用户的音频数据,则取消对该选择指示所指示选择的伴奏片段的已完成标识的设置。
在本实施例的另再一些实施方式中,可选的,所述音频数据采集模块1403,具体用于根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户;向确定出的其他用户发送携带有预设接口的音频数据采集请求;接收任一其他用户通过所述预设接口发送的获取所述第一伴奏文件的请求;将所述第一伴奏文件发送给该任一其他用户。
在本实施例的另还一些实施方式中,可选的,所述设备还包括:获取模块1406、完成伴奏确定模块1413和替换模块1407;
所述获取模块1406,用于在所述音频数据采集模块1403将所述第一伴奏文件发送给该任一其他用户之后,获取该任一其他用户针对选择的伴奏片段执行合成操作之后得到的第一伴奏文件;
所述完成伴奏确定模块1413,用于按照接收到其他用户反馈的第一伴奏文件的先后顺序,确定每个反馈的第一伴奏文件中对应其他用户完成合成的伴奏片段;
所述替换模块1407,用于若该完成合成的伴奏片段在当前第一伴奏文件中未完成合成,则使用该完成合成的伴奏片段替换当前第一伴奏文件中播放时间段对应的未完成合成的伴奏片段,得到合并的第一伴奏文件。
在本实施例的另更一些实施方式中,可选的,所述设备还包括:计时模块1411;
所述计时模块1411,用于在所述音频数据采集模块1403向确定出的其他用户发送音频数据采集请求之后,启动第三计时器开始计时;以及在第三预设计时时间到达时,若第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
在本实施例的另进一些实施方式中,可选的,所述音频数据采集模块1403,具体用于根据预先统计的用户兴趣数据,以及当前所述第一伴奏文件中伴奏片段的音频数据采集完成进度,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户,其中,所述第一伴奏文件中未完成音频数据采集的伴奏片段越多,确定出的其他用户越多。
在本实施例的又另一些实施方式中,可选的,所述音频数据采集模块1403,具体用于采用如下方法统计用户兴趣数据:监测用户播放音频文件时产生的播放行为;根据监测到的播放行为,统计符合如下指标的音频文件:播放达到预设时长、和/或播放达到预设频次;确定统计出的音频文件所属的类型,和/或对应的表演者,作为所述用户的兴趣数据。
在本实施例的又再一些实施方式中,可选的,所述伴奏文件确定模块1401,具体用于在音频文件的播放界面,接收用户的用于指示针对所播放音频文件生成合成音频文件的第一指示;确定所播放音频文件对应的第一伴奏文件。
在本实施例的又还一些实施方式中,可选的,所述伴奏文件确定模块1401,具体用于接收用户的用于对任意音频文件进行合成的第一指示;根据预先统计的用户兴趣数据,确定用户感兴趣的音频文件;确定用户感兴趣的所述音频文件对应的第一伴奏文件。
在本实施例的又更一些实施方式中,可选的,所述设备还包括:界面设置模块1414;
所述界面设置模块1414,用于为所述用户设置第一访问界面,其中,所述第一访问界面用于提供所述第一伴奏文件的访问接口、以及所述第一伴奏文件的相关统计数据;所述相关统计数据包括:所述第一伴奏文件的当前完成进度、和/或参与所述第一伴奏文件合成的用户数。
在本实施例的又进一些实施方式中,可选的,所述伴奏片段确定模块1402,还用于采用如下方法生成所述第一伴奏文件中的伴奏片段:获取所述第一伴奏文件对应的原声音频文件中除伴奏之外的音频数据;对获取的音频数据进行语法分析,将获取的音频数据以整句为单位进行划分;将划分得到的每个整句在所述第一伴奏文件中对应播放时间段的伴奏作为一个伴奏片段进行标记,得到由多个连续的播放时间段分别标记的多个伴奏片段。
在介绍了本发明示例性实施方式的方法和设备之后,接下来,介绍根据本发明的又一示例性实施方式的用于音频文件合成的设备之一。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明的用于音频文件合成的设备之一可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的用于音频文件合成的方法中的步骤。例如,所述处理单元可以执行如图2中所示的步骤S201、根据用户的第一指示,确定第一伴奏文件,步骤S202、根据用户的第二指示,确定用户在S201中选择的第一伴奏文件中的第一伴奏片段,步骤S203、为所述第一伴奏片段进行音频数据采集,以及步骤S204、将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由多个伴奏片段和对应音频数据合成的音频文件。
下面参照图15来描述根据本发明的这种实施方式的用于音频文件合成的设备之一150。图15显示的用于音频文件合成的设备之一150仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图15所示,用于音频文件合成的设备之一150以通用计算设备的形式表现。用于音频文件合成的设备之一150的组件可以包括但不限于:上述至少一个处理单元1501、上述至少一个存储单元1502、连接不同系统组件(包括处理单元1501和存储单元1502)的总线1503。
总线1503表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元1502可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)15021和/或高速缓存存储器15022,还可以进一步只读存储器(ROM)15023。
存储单元1502还可以包括具有一组(至少一个)程序模块15024的程序/实用工具1500,这样的程序模块15024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
用于音频文件合成的设备之一150也可以与一个或多个外部设备1504(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该用于音频文件合成的设备之一150交互的设备通信,和/或与使得该用于音频文件合成的设备之一150能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1505进行。并且,用于音频文件合成的设备之一150还可以通过网络适配器1506与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1506通过总线1503与用于音频文件合成的设备之一150的其它模块通信。用于音频文件合成的设备之一150也可以通过显示单元1507将伴奏文件向用户显示。应当明白,尽管图中未示出,可以结合用于音频文件合成的设备之一150使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
图16为本发明实施例提供一种音频文件的合成设备之二的结构示意图,如图16所示,可以包括如下模块:
接收模块1601,用于接收音频数据采集请求;
伴奏片段确定模块1602,用于从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段;其中,所述第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集;
音频数据采集模块1603,用于在播放所述第二伴奏片段的同时采集用户发送的第二音频数据;
发送模块1604,用于将采集的结果反馈。
在本实施例的一些实施方式中,可选的,所述伴奏片段确定模块1602,具体用于根据用户的第三指示,通过所述音频数据采集请求中携带的预设接口访问第二伴奏文件;根据用户的第四指示,发送用于表征用户选择的所述第二伴奏文件中的第二伴奏片段的选择指示;接收所述第二伴奏片段;
所述发送模块1604,具体用于反馈所述第二音频数据;或者将所述第二伴奏片段和所述第二音频数据合成,并反馈完成合成的第二伴奏片段。
在本实施例的另一些实施方式中,可选的,所述伴奏片段确定模块1602,具体用于根据用户的第五指示,通过所述音频数据采集请求中携带的预设接口获取第二伴奏文件;根据用户的第六指示,确定用户选择的所述第二伴奏文件中的第二伴奏片段;
所述发送模块1604,具体用于反馈完成本次合成的第二伴奏文件。
在本实施例的又一些实施方式中,可选的,所述设备还包括:界面设置模块1605;
所述界面设置模块1605,用于为所述用户设置第二访问界面,其中,所述第二访问界面用于提供所述第二伴奏文件的访问接口、以及所述第二伴奏文件的相关统计数据;所述相关统计数据包括:所述第二伴奏文件的当前完成进度、和/或参与所述第二伴奏文件合成的用户数。
在介绍了本发明示例性实施方式的方法和设备之后,接下来,介绍根据本发明的又一示例性实施方式的用于音频文件合成的设备之二。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明的用于音频文件合成的设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的用于音频文件合成的方法中的步骤。例如,所述处理单元可以执行如图8中所示的步骤S801、接收音频数据采集请求,步骤S802、从S801中接收的音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段,步骤S803、在播放S802中确定的第二伴奏片段的同时采集用户发送的第二音频数据,以及步骤S804、将S803中采集的结果反馈。
下面参照图17来描述根据本发明的这种实施方式的用于音频文件合成的设备之二170。图17显示的用于音频文件合成的设备之二170仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图17所示,用于音频文件合成的设备之二170以通用计算设备的形式表现。用于音频文件合成的设备之二170的组件可以包括但不限于:上述至少一个处理单元1701、上述至少一个存储单元1702、连接不同系统组件(包括处理单元1701和存储单元1702)的总线1703。
总线1703表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元1702可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)17021和/或高速缓存存储器17022,还可以进一步只读存储器(ROM)17023。
存储单元1702还可以包括具有一组(至少一个)程序模块17024的程序/实用工具1700,这样的程序模块17024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
用于音频文件合成的设备之二170也可以与一个或多个外部设备1704(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该用于音频文件合成的设备之二170交互的设备通信,和/或与使得该用于音频文件合成的设备之二170能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1705进行。并且,用于音频文件合成的设备之二170还可以通过网络适配器1706与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1706通过总线1703与用于音频文件合成的设备之二170的其它模块通信。用于音频文件合成的设备之二170也可以通过显示单元1707将伴奏文件向用户显示。应当明白,尽管图中未示出,可以结合用于音频文件合成的设备之二170使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
本发明实施例还提供了一种音频文件的合成系统之一,包括:发起方终端和参与者终端;
所述发起方终端,用于响应于第一用户的指示,选择伴奏文件并呈现伴奏文件包含的多个伴奏片段所对应的多句歌词;响应于第一用户对任一句歌词的选择,播放对应的伴奏片段,并录制音频数据;将音频文件合成请求发送给其他用户;
所述参与者终端,用于响应于所述其他用户的指示,呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择;响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据;
所述发起方终端,还用于若有剩余歌词未被选择时,重复将音频文件合成请求发送给其他用户;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
进一步地,发起方终端可以相当于上述音频文件合成的设备之一,参与者终端可以相当于上述音频文件合成的设备之二。
本发明实施例还提供了一种音频文件的合成系统之二,包括:服务器、发起方终端和参与者终端;
所述服务器,用于响应于第一用户的指示,选择伴奏文件,并将所述伴奏文件提供所述发起方终端;
所述发起方终端,用于呈现伴奏文件包含的多个伴奏片段所对应的多句歌词;
所述服务器,还用于响应于第一用户对任一句歌词的选择,将所述歌词对应的伴奏片段提供所述发起方终端;
所述发起方终端,还用于播放对应的伴奏片段,并录制音频数据,并上传所述服务器;
所述服务器,还用于将音频文件合成请求发送给其他用户;响应于所述其他用户的指示,将所述伴奏文件提供所述其他用户;
所述参与者终端,用于呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择;响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据;并上传所述服务器;
所述服务器,还用于若有剩余歌词未被选择时,重复将音频文件合成请求发送给其他用户;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
进一步地,发起方终端可以相当于上述音频文件合成的设备之一,参与者终端可以相当于上述音频文件合成的设备之二。
示例性程序产品
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的用于音频文件合成的方法中的步骤,例如,所述音频文件合成设备之一可以执行如图2中所示的步骤S201、根据用户的第一指示,确定第一伴奏文件,步骤S202、根据用户的第二指示,确定用户在S201中选择的第一伴奏文件中的第一伴奏片段,步骤S203、为所述第一伴奏片段进行音频数据采集,以及步骤S204、将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由多个伴奏片段和对应音频数据合成的音频文件;所述音频文件合成设备之二可以执行如图8中所示的步骤S801、接收音频数据采集请求,步骤S802、从S801中接收的音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段,步骤S803、在播放S802中确定的第二伴奏片段的同时采集用户发送的第二音频数据,以及步骤S804、将S803中采集的结果反馈。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图18所示,描述了根据本发明的实施方式的用于音频文件合成的程序产品之一180,如图19所示,描述了根据本发明的实施方式的用于音频文件合成的程序产品之二190,其均可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了音频文件的合成设备之一和音频文件的合成设备之二的若干装置或子装置,但是这种划分仅仅并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (48)

1.一种音频文件的合成方法,包括:
根据用户的第一指示,确定第一伴奏文件,其中,所述第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成;
根据用户的第二指示,确定用户选择的所述第一伴奏文件中的第一伴奏片段;
为所述第一伴奏片段进行音频数据采集;
将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由所述多个伴奏片段和对应音频数据合成的音频文件;
其中,将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,包括:
根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户;
向确定出的其他用户发送携带有预设接口的音频数据采集请求,其中,所述预设接口为提供所述其他用户访问所述第一伴奏文件的接口;
接收任一其他用户发送的选择指示;
将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户。
2.根据权利要求1所述的方法,为所述第一伴奏片段进行音频数据采集,包括:
向用户提供所述第一伴奏片段;
接收用户针对所述第一伴奏片段采集的第一音频数据;将所述第一伴奏片段和所述第一音频数据合成或者关联保存;或者
接收用户将所述第一伴奏片段与针对所述第一伴奏片段采集的第一音频数据合成后的第一伴奏片段。
3.根据权利要求1所述的方法,在确定第一伴奏文件之后,还包括:
按照所述多个伴奏片段分别对应的播放时间段的先后顺序,将所述多个伴奏片段以及所述多个伴奏片段分别对应的歌词呈现;
为所述第一伴奏片段进行音频数据采集,包括:
在播放所述第一伴奏片段的同时采集所述用户发送的第一音频数据,并将所述第一伴奏片段和所述第一音频数据合成或者关联保存。
4.根据权利要求1所述的方法,在将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,还包括:
获取该任一其他用户针对所选择的伴奏片段进行合成后得到的完成合成的伴奏片段;
使用获取的完成合成的伴奏片段替换所述第一伴奏文件中对应播放时间段的未完成音频数据合成的伴奏片段。
5.根据权利要求1所述的方法,在将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,还包括:
获取该任一其他用户针对所选择的伴奏片段采集的音频数据;
将获取的音频数据和该任一其他用户选择的伴奏片段合成。
6.根据权利要求1所述的方法,在将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,还包括:
获取该任一其他用户针对选择的伴奏片段采集的音频数据;
将获取的音频数据与该任一其他用户选择的伴奏片段关联保存;
所述方法,还包括:
当接收到播放所述第一伴奏文件的指示时,在按照播放时间段的先后顺序播放各伴奏片段的同时,针对每个完成音频数据采集的伴奏片段,将关联保存的音频数据与该伴奏片段播放时间点对齐提供播放。
7.根据权利要求1或4-6任一项所述的方法,在向确定出的其他用户发送音频数据采集请求之后,还包括:
启动第一计时器开始计时;
在第一预设计时时间到达时,若所述第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
8.根据权利要求1或4-6任一项所述的方法,在接收到任一其他用户发送的选择指示之后,还包括:
为所述选择指示所指示选择的未完成音频数据采集的伴奏片段设置已完成标识;其中,设置有已完成标识的伴奏片段不能被任何用户再次选择;
启动第二计时器开始计时;
若在第二预设时间段内未获取到该任一其他用户的音频数据,则取消对该选择指示所指示选择的伴奏片段的已完成标识的设置。
9.根据权利要求1所述的方法,在将所述第一伴奏文件发送给该任一其他用户之后,还包括:
获取该任一其他用户针对选择的伴奏片段执行合成操作之后得到的第一伴奏文件;
按照接收到其他用户反馈的第一伴奏文件的先后顺序,确定每个反馈的第一伴奏文件中对应其他用户完成合成的伴奏片段;以及
若该完成合成的伴奏片段在当前第一伴奏文件中未完成合成,则使用该完成合成的伴奏片段替换当前第一伴奏文件中播放时间段对应的未完成合成的伴奏片段,得到合并的第一伴奏文件。
10.根据权利要求9所述的方法,在向确定出的其他用户发送音频数据采集请求之后,还包括:
启动第三计时器开始计时;
在第三预设计时时间到达时,若第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
11.根据权利要求1或4-6、9任一项所述的方法,根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户,包括:
根据预先统计的用户兴趣数据,以及当前所述第一伴奏文件中伴奏片段的音频数据采集完成进度,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户,
其中,所述第一伴奏文件中未完成音频数据采集的伴奏片段越多,确定出的其他用户越多。
12.根据权利要求1或4-6、9任一项所述的方法,采用如下方法统计用户兴趣数据:
监测用户播放音频文件时产生的播放行为;
根据监测到的播放行为,统计符合如下指标的音频文件:播放达到预设时长、和/或播放达到预设频次;
确定统计出的音频文件所属的类型,和/或对应的表演者,作为所述用户的兴趣数据。
13.根据权利要求1-6任一项所述的方法,根据用户的第一指示,确定第一伴奏文件,包括:
在音频文件的播放界面,接收用户的用于指示针对所播放音频文件生成合成音频文件的第一指示;
确定所播放音频文件对应的第一伴奏文件。
14.根据权利要求1-6任一项所述的方法,根据用户的第一指示,确定第一伴奏文件,包括:
接收用户的用于对任意音频文件进行合成的第一指示;
根据预先统计的用户兴趣数据,确定用户感兴趣的音频文件;
确定用户感兴趣的所述音频文件对应的第一伴奏文件。
15.根据权利要求1-6任一项所述的方法,还包括:
为所述用户设置第一访问界面,
其中,所述第一访问界面用于提供所述第一伴奏文件的访问接口、以及所述第一伴奏文件的相关统计数据;
所述相关统计数据包括:所述第一伴奏文件的当前完成进度、和/或参与所述第一伴奏文件合成的用户数。
16.根据权利要求1-6任一项所述的方法,采用如下方法生成所述第一伴奏文件中的伴奏片段:
获取所述第一伴奏文件对应的原声音频文件中除伴奏之外的音频数据;
对获取的音频数据进行语法分析,将获取的音频数据以整句为单位进行划分;
将划分得到的每个整句在所述第一伴奏文件中对应播放时间段的伴奏作为一个伴奏片段进行标记,得到由多个连续的播放时间段分别标记的多个伴奏片段。
17.一种音频文件的合成方法,包括:
接收音频数据采集请求;
从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段;
其中,所述第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集;
在播放所述第二伴奏片段的同时采集用户发送的第二音频数据;所述用户是根据预先统计的用户兴趣数据,确定对第二伴奏文件对应的原声音频文件感兴趣的用户;
将采集的结果反馈。
18.根据权利要求17所述的方法,从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段,包括:
根据用户的第三指示,通过所述音频数据采集请求中携带的预设接口访问第二伴奏文件;
根据用户的第四指示,发送用于表征用户选择的所述第二伴奏文件中的第二伴奏片段的选择指示;
接收所述第二伴奏片段;
将采集的结果反馈,包括:
反馈所述第二音频数据;或者
将所述第二伴奏片段和所述第二音频数据合成,并反馈完成合成的第二伴奏片段。
19.根据权利要求17所述的方法,从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段,包括:
根据用户的第五指示,通过所述音频数据采集请求中携带的预设接口获取第二伴奏文件;
根据用户的第六指示,确定用户选择的所述第二伴奏文件中的第二伴奏片段;
将采集的结果反馈,包括:
反馈完成本次合成的第二伴奏文件。
20.根据权利要求17-19任一项所述的方法,还包括:
为所述用户设置第二访问界面,
其中,所述第二访问界面用于提供所述第二伴奏文件的访问接口、以及所述第二伴奏文件的相关统计数据;
所述相关统计数据包括:所述第二伴奏文件的当前完成进度、和/或参与所述第二伴奏文件合成的用户数。
21.一种音频文件的合成方法,包括:
步骤一:响应于第一用户的指示,选择伴奏文件并呈现伴奏文件包含的多个伴奏片段所对应的多句歌词;
步骤二:响应于第一用户对任一句歌词的选择,播放对应的伴奏片段,并录制音频数据;
步骤三:将音频文件合成请求发送给其他用户;所述其他用户是根据预先统计的用户兴趣数据,确定对所述伴奏文件对应的原声音频文件感兴趣的其他用户;
步骤四:响应于所述其他用户的指示,呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择;
步骤五:响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据;
步骤六:若有剩余歌词未被选择时,重复步骤三至步骤五;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
22.根据权利要求21所述的方法,进一步包括:将音频文件发送给参与录制音频数据的第一用户和其他用户。
23.一种音频文件的合成设备,包括:
伴奏文件确定模块,用于根据用户的第一指示,确定第一伴奏文件,其中,所述第一伴奏文件由多个连续的播放时间段分别标记的多个伴奏片段构成;
伴奏片段确定模块,用于根据用户的第二指示,确定用户选择的所述第一伴奏文件中的第一伴奏片段;
音频数据采集模块,用于为所述第一伴奏片段进行音频数据采集;
伴奏文件提供模块,用于将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户,使不同用户分别针对不同伴奏片段进行音频数据采集,得到由所述多个伴奏片段和对应音频数据合成的音频文件;
所述伴奏文件提供模块,具体用于根据预先统计的用户兴趣数据,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户;向确定出的其他用户发送携带有预设接口的音频数据采集请求,其中,所述预设接口为提供所述其他用户访问所述第一伴奏文件的接口;接收任一其他用户发送的选择指示;将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户。
24.根据权利要求23所述的设备,所述音频数据采集模块,具体用于向用户提供所述第一伴奏片段;接收用户针对所述第一伴奏片段采集的第一音频数据;将所述第一伴奏片段和所述第一音频数据合成或者关联保存;或者接收用户将所述第一伴奏片段与针对所述第一伴奏片段采集的第一音频数据合成后的第一伴奏片段。
25.根据权利要求23所述的设备,还包括:呈现模块;
所述呈现模块,用于在所述伴奏文件确定模块确定第一伴奏文件之后,按照所述多个伴奏片段分别对应的播放时间段的先后顺序,将所述多个伴奏片段以及所述多个伴奏片段分别对应的歌词呈现;
所述音频数据采集模块,具体用于在播放所述第一伴奏片段的同时采集所述用户发送的第一音频数据,并将所述第一伴奏片段和所述第一音频数据合成或者关联保存。
26.根据权利要求23所述的设备,还包括:获取模块和替换模块;
所述获取模块,用于在所述伴奏文件提供模块将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对所选择的伴奏片段进行合成后得到的完成合成的伴奏片段;
所述替换模块,用于使用获取的完成合成的伴奏片段替换所述第一伴奏文件中对应播放时间段的未完成音频数据合成的伴奏片段。
27.根据权利要求23所述的设备,还包括:获取模块和合成模块;
所述获取模块,用于在所述伴奏文件提供模块将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对所选择的伴奏片段采集的音频数据;
所述合成模块,用于将获取的音频数据和该任一其他用户选择的伴奏片段合成。
28.根据权利要求23所述的设备,还包括:获取模块、存储模块和播放模块;
所述获取模块,用于在所述伴奏文件提供模块将所述选择指示所指示选择的未完成音频数据采集的伴奏片段发送给该任一其他用户之后,获取该任一其他用户针对选择的伴奏片段采集的音频数据;
所述存储模块,用于将获取的音频数据与该任一其他用户选择的伴奏片段关联保存;
所述播放模块,用于当接收到播放所述第一伴奏文件的指示时,在按照播放时间段的先后顺序播放各伴奏片段的同时,针对每个完成音频数据采集的伴奏片段,将关联保存的音频数据与该伴奏片段播放时间点对齐提供播放。
29.根据权利要求23、26-28任一项所述的设备,还包括:计时模块;
所述计时模块,用于在所述伴奏文件提供模块向确定出的其他用户发送音频数据采集请求之后,启动第一计时器开始计时;以及在第一预设计时时间到达时,若所述第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
30.根据权利要求23、26-28任一项所述的设备,还包括:标识设置模块和计时模块;
所述标识设置模块,用于在所述伴奏文件提供模块接收到任一其他用户发送的选择指示之后,为所述选择指示所指示选择的未完成音频数据采集的伴奏片段设置已完成标识;其中,设置有已完成标识的伴奏片段不能被任何用户再次选择;
所述计时模块,用于启动第二计时器开始计时;以及若在第二预设时间段内未获取到该任一其他用户的音频数据,则取消对该选择指示所指示选择的伴奏片段的已完成标识的设置。
31.根据权利要求23所述的设备,还包括:获取模块、完成伴奏确定模块和替换模块;
所述获取模块,用于在所述音频数据采集模块将所述第一伴奏文件发送给该任一其他用户之后,获取该任一其他用户针对选择的伴奏片段执行合成操作之后得到的第一伴奏文件;
所述完成伴奏确定模块,用于按照接收到其他用户反馈的第一伴奏文件的先后顺序,确定每个反馈的第一伴奏文件中对应其他用户完成合成的伴奏片段;
所述替换模块,用于若该完成合成的伴奏片段在当前第一伴奏文件中未完成合成,则使用该完成合成的伴奏片段替换当前第一伴奏文件中播放时间段对应的未完成合成的伴奏片段,得到合并的第一伴奏文件。
32.根据权利要求31所述的设备,还包括:计时模块;
所述计时模块,用于在所述音频数据采集模块向确定出的其他用户发送音频数据采集请求之后,启动第三计时器开始计时;以及在第三预设计时时间到达时,若第一伴奏文件中当前存在未完成音频数据采集的伴奏片段,则重新触发将当前部分伴奏片段完成音频数据采集的第一伴奏文件提供其他用户的步骤。
33.根据权利要求23、26-31任一项所述的设备,所述音频数据采集模块,具体用于根据预先统计的用户兴趣数据,以及当前所述第一伴奏文件中伴奏片段的音频数据采集完成进度,确定对所述第一伴奏文件对应的原声音频文件感兴趣的其他用户,其中,所述第一伴奏文件中未完成音频数据采集的伴奏片段越多,确定出的其他用户越多。
34.根据权利要求23、26-28、31任一项所述的设备,所述音频数据采集模块,具体用于采用如下方法统计用户兴趣数据:监测用户播放音频文件时产生的播放行为;根据监测到的播放行为,统计符合如下指标的音频文件:播放达到预设时长、和/或播放达到预设频次;确定统计出的音频文件所属的类型,和/或对应的表演者,作为所述用户的兴趣数据。
35.根据权利要求23-28任一项所述的设备,所述伴奏文件确定模块,具体用于在音频文件的播放界面,接收用户的用于指示针对所播放音频文件生成合成音频文件的第一指示;确定所播放音频文件对应的第一伴奏文件。
36.根据权利要求23-28任一项所述的设备,所述伴奏文件确定模块,具体用于接收用户的用于对任意音频文件进行合成的第一指示;根据预先统计的用户兴趣数据,确定用户感兴趣的音频文件;确定用户感兴趣的所述音频文件对应的第一伴奏文件。
37.根据权利要求23-28任一项所述的设备,还包括:界面设置模块;
所述界面设置模块,用于为所述用户设置第一访问界面,其中,所述第一访问界面用于提供所述第一伴奏文件的访问接口、以及所述第一伴奏文件的相关统计数据;所述相关统计数据包括:所述第一伴奏文件的当前完成进度、和/或参与所述第一伴奏文件合成的用户数。
38.根据权利要求23-28任一项所述的设备,所述伴奏片段确定模块,还用于采用如下方法生成所述第一伴奏文件中的伴奏片段:获取所述第一伴奏文件对应的原声音频文件中除伴奏之外的音频数据;对获取的音频数据进行语法分析,将获取的音频数据以整句为单位进行划分;将划分得到的每个整句在所述第一伴奏文件中对应播放时间段的伴奏作为一个伴奏片段进行标记,得到由多个连续的播放时间段分别标记的多个伴奏片段。
39.一种音频文件的合成设备,包括:
接收模块,用于接收音频数据采集请求;
伴奏片段确定模块,用于从所述音频数据采集请求所针对的第二伴奏文件所包含的伴奏片段中确定第二伴奏片段;其中,所述第二伴奏文件由多个连续的播放时间段分别标记的伴奏片段构成,且存在至少一个伴奏片段已完成音频数据采集;
音频数据采集模块,用于在播放所述第二伴奏片段的同时采集用户发送的第二音频数据;所述用户是根据预先统计的用户兴趣数据,确定对第二伴奏文件对应的原声音频文件感兴趣的用户;
发送模块,用于将采集的结果反馈。
40.根据权利要求39所述的设备,所述伴奏片段确定模块,具体用于根据用户的第三指示,通过所述音频数据采集请求中携带的预设接口访问第二伴奏文件;根据用户的第四指示,发送用于表征用户选择的所述第二伴奏文件中的第二伴奏片段的选择指示;接收所述第二伴奏片段;
所述发送模块,具体用于反馈所述第二音频数据;或者将所述第二伴奏片段和所述第二音频数据合成,并反馈完成合成的第二伴奏片段。
41.根据权利要求39所述的设备,所述伴奏片段确定模块,具体用于根据用户的第五指示,通过所述音频数据采集请求中携带的预设接口获取第二伴奏文件;根据用户的第六指示,确定用户选择的所述第二伴奏文件中的第二伴奏片段;
所述发送模块,具体用于反馈完成本次合成的第二伴奏文件。
42.根据权利要求39-41任一项所述的设备,还包括:界面设置模块;
所述界面设置模块,用于为所述用户设置第二访问界面,其中,所述第二访问界面用于提供所述第二伴奏文件的访问接口、以及所述第二伴奏文件的相关统计数据;所述相关统计数据包括:所述第二伴奏文件的当前完成进度、和/或参与所述第二伴奏文件合成的用户数。
43.一种音频文件的合成系统,包括:发起方终端和参与者终端;
所述发起方终端,用于响应于第一用户的指示,选择伴奏文件并呈现伴奏文件包含的多个伴奏片段所对应的多句歌词;响应于第一用户对任一句歌词的选择,播放对应的伴奏片段,并录制音频数据;将音频文件合成请求发送给其他用户;所述其他用户是根据预先统计的用户兴趣数据,确定对所述伴奏文件对应的原声音频文件感兴趣的其他用户;
所述参与者终端,用于响应于所述其他用户的指示,呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择;响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据;
所述发起方终端,还用于若有剩余歌词未被选择时,重复将音频文件合成请求发送给其他用户;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
44.一种音频文件的合成系统,包括:服务器、发起方终端和参与者终端;
所述服务器,用于响应于第一用户的指示,选择伴奏文件,并将所述伴奏文件提供所述发起方终端;
所述发起方终端,用于呈现伴奏文件包含的多个伴奏片段所对应的多句歌词;
所述服务器,还用于响应于第一用户对任一句歌词的选择,将所述歌词对应的伴奏片段提供所述发起方终端;
所述发起方终端,还用于播放对应的伴奏片段,并录制音频数据,并上传至所述服务器;
所述服务器,还用于将音频文件合成请求发送给其他用户;响应于所述其他用户的指示,将所述伴奏文件提供所述其他用户;所述其他用户是根据预先统计的用户兴趣数据,确定对所述伴奏文件对应的原声音频文件感兴趣的其他用户;
所述参与者终端,用于呈现所述多句歌词,其中录制了音频数据的对应的歌词被标记且不可被选择;响应于所述其他用户对任一句可选歌词的选择,播放对应的伴奏片段,并录制音频数据;并上传至所述服务器;
所述服务器,还用于若有剩余歌词未被选择时,重复将音频文件合成请求发送给其他用户;若歌词被全部选择时,将伴奏文件包含的多个伴奏片段和相应的音频数据进行合成,生成音频文件。
45.一种用于音频文件合成的设备,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行权利要求1-16任一所述方法的步骤。
46.一种计算机可读存储介质,其包括程序代码,当所述程序代码在服务器设备上运行时,所述程序代码用于使所述服务器设备执行权利要求1-16任一所述方法的步骤。
47.一种用于音频文件合成的设备,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行权利要求17-20任一所述方法的步骤。
48.一种计算机可读存储介质,其包括程序代码,当所述程序代码在服务器设备上运行时,所述程序代码用于使所述服务器设备执行权利要求17-20任一所述方法的步骤。
CN201611124036.6A 2016-12-08 2016-12-08 一种音频文件的合成方法和设备 Active CN106686431B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611124036.6A CN106686431B (zh) 2016-12-08 2016-12-08 一种音频文件的合成方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611124036.6A CN106686431B (zh) 2016-12-08 2016-12-08 一种音频文件的合成方法和设备

Publications (2)

Publication Number Publication Date
CN106686431A CN106686431A (zh) 2017-05-17
CN106686431B true CN106686431B (zh) 2019-12-10

Family

ID=58868575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611124036.6A Active CN106686431B (zh) 2016-12-08 2016-12-08 一种音频文件的合成方法和设备

Country Status (1)

Country Link
CN (1) CN106686431B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107591149B (zh) * 2017-09-18 2021-09-28 腾讯音乐娱乐科技(深圳)有限公司 音频合成方法、装置及存储介质
CN109033335B (zh) * 2018-07-20 2021-03-26 广州酷狗计算机科技有限公司 音频录制方法、装置、终端及存储介质
CN109151552A (zh) * 2018-09-26 2019-01-04 传线网络科技(上海)有限公司 多媒体内容的合成方法及装置
CN110675848B (zh) * 2019-09-30 2023-05-30 腾讯音乐娱乐科技(深圳)有限公司 音频处理方法、装置及存储介质
CN112967705B (zh) * 2021-02-24 2023-11-28 腾讯音乐娱乐科技(深圳)有限公司 一种混音歌曲生成方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099050A (ja) * 1998-09-24 2000-04-07 Daiichikosho Co Ltd 複数のボーカルパートを選択的に再生出力するカラオケ装置
CN102456340A (zh) * 2010-10-19 2012-05-16 盛大计算机(上海)有限公司 基于互联网的卡拉ok对唱方法及系统
CN103295568A (zh) * 2013-05-30 2013-09-11 北京小米科技有限责任公司 一种异步合唱方法和装置
CN105023559A (zh) * 2015-05-27 2015-11-04 腾讯科技(深圳)有限公司 K歌处理方法及系统
CN105930429A (zh) * 2016-04-19 2016-09-07 乐视控股(北京)有限公司 一种音乐推荐的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099050A (ja) * 1998-09-24 2000-04-07 Daiichikosho Co Ltd 複数のボーカルパートを選択的に再生出力するカラオケ装置
CN102456340A (zh) * 2010-10-19 2012-05-16 盛大计算机(上海)有限公司 基于互联网的卡拉ok对唱方法及系统
CN103295568A (zh) * 2013-05-30 2013-09-11 北京小米科技有限责任公司 一种异步合唱方法和装置
CN105023559A (zh) * 2015-05-27 2015-11-04 腾讯科技(深圳)有限公司 K歌处理方法及系统
CN105930429A (zh) * 2016-04-19 2016-09-07 乐视控股(北京)有限公司 一种音乐推荐的方法及装置

Also Published As

Publication number Publication date
CN106686431A (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
CN106686431B (zh) 一种音频文件的合成方法和设备
US11375295B2 (en) Method and device for obtaining video clip, server, and storage medium
JP2018519538A (ja) カラオケ処理方法およびシステム
CN112822563A (zh) 生成视频的方法、装置、电子设备和计算机可读介质
CN112135160A (zh) 直播中虚拟对象控制方法及装置、存储介质和电子设备
US20150279424A1 (en) Sound quality of the audio portion of audio/video files recorded during a live event
CN109729372A (zh) 直播间切换方法、装置、终端、服务器及存储介质
US9460203B2 (en) Sound processing apparatus
CN110650366A (zh) 互动配音方法、装置、电子设备及可读存储介质
CN110718239A (zh) 音频处理方法、装置、电子设备及存储介质
JP2015028625A (ja) 情報処理装置、情報処理装置の制御方法、およびプログラム
CN109151598A (zh) 直播间话题的确定方法,装置、计算机设备及存储介质
CN112954390A (zh) 视频处理方法、装置、存储介质及设备
CN111404808A (zh) 一种歌曲的处理方法
EP4170589A1 (en) Music playing method and apparatus based on user interaction, and device and storage medium
CN110102057A (zh) 一种过场动画衔接方法、装置、设备及介质
CN112312163B (zh) 视频生成方法、装置、电子设备及存储介质
JP6051075B2 (ja) 通信障害時にデュエット歌唱を継続可能な通信カラオケシステム
CN114125543B (zh) 弹幕处理方法、计算设备及弹幕处理系统
JP7254842B2 (ja) アプリとウェブサイトの連動によって音声ファイルに対するメモを作成する方法、システム、およびコンピュータ読み取り可能な記録媒体
JP7149193B2 (ja) カラオケシステム
CN108196817B (zh) 音频识别方法、装置及存储介质
JP7149203B2 (ja) カラオケシステム
KR102427213B1 (ko) 음성 파일에 대한 텍스트 변환 기록과 메모를 함께 관리하는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체
KR101475228B1 (ko) 진단 단말기를 이용한 보이스 진단 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant