CN111787353A - 多方音频的处理方法、装置、电子设备及存储介质 - Google Patents

多方音频的处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111787353A
CN111787353A CN202010404086.XA CN202010404086A CN111787353A CN 111787353 A CN111787353 A CN 111787353A CN 202010404086 A CN202010404086 A CN 202010404086A CN 111787353 A CN111787353 A CN 111787353A
Authority
CN
China
Prior art keywords
audio
client
clients
virtual space
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010404086.XA
Other languages
English (en)
Inventor
魏春祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202010404086.XA priority Critical patent/CN111787353A/zh
Publication of CN111787353A publication Critical patent/CN111787353A/zh
Priority to US17/108,014 priority patent/US11392343B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/239Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
    • H04N21/2393Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
    • H04N21/2396Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests characterized by admission policies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • H04N21/8113Monomedia components thereof involving special audio data, e.g. different tracks for different languages comprising music, e.g. song in MP3 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Abstract

本公开关于一种多方音频的处理方法、装置、电子设备及存储介质。其中该方法应用于第一客户端,包括:在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间;接收M个客户端发送的加入请求,所述加入请求用于请求加入所述目标虚拟空间;获取所述目标虚拟空间中的目标音乐;获取第二音频,所述第二音频为所述M个客户端中的W个客户端提供的音频和/或所述第一客户端提供的音频;在所述第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频。本公开可支持多客户端在目标虚拟空间中合唱。

Description

多方音频的处理方法、装置、电子设备及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种多方音频的处理方法、装置、电子设备及存储介质。
背景技术
随着信息技术发展和网络带宽的不断提高,在线观看视频也变得越来越普及。现有的视频网站和视频应用程序不仅可以提供给用户视频播放列表,由用户从视频播放列表中选择自己想要观看的视频,还可以为用户播放直播视频。即在某主播直播时,用户选择进入该主播的直播室,用户客户端上即可播放该主播的直播视频流。
用户在观看直播视频的时候,若对于直播视频中某精彩片段感兴趣可进行剪辑;可以通过赠送特定礼物为直播间内其他观看者发送红包;还可以与直播连麦语音通话。但是在全民K歌这种大氛围下,目前直播间中不支持多用户合唱。
发明内容
本公开提供一种多方音频的处理方法、装置、电子设备及存储介质,以至少解决相关技术中存在的直播间中不支持用户合唱的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种多方音频的处理方法,所述方法应用于第一客户端,包括:
在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
接收M个客户端发送的加入请求,所述加入请求用于请求加入所述目标虚拟空间,所述M为大于0小于等于N-1的整数;
获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
获取第二音频,所述第二音频为所述M个客户端中的W个客户端提供的音频和/或所述第一客户端提供的音频,所述W为大于0小于等于M的整数,所述第二音频为与所述第一音频匹配的音频流;
在所述第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频。
可选地,所述目标音乐还包括:与所述第一音频匹配的歌词;
在所述第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频的步骤,包括:
在所述第一音频播放过程中,确定所述第一音频当前的播放时间戳;
依据所述时间戳,将所述第二音频与所述第一音频当前播放进度对齐后播放,并对应显示与所述播放进度匹配的歌词。
可选地,在所述获取第二音频的步骤之后,所述方法还包括:
从所述第二音频中识别各客户端的音频流,其中,所述客户端包括:W个客户端和/所述第一客户端;
分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分。
可选地,所述分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分的步骤,包括:
针对每个客户端的音频流,提取所述音频流中的预设评分参数;
从所述第一音频和歌词中,提取所述音频流对应的目标评分参数;
将所述预设评分参数与所述目标评分参数进行比对;
依据比对结果确定所述客户端的评分。
可选地,在所述分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分的步骤之后,所述方法还包括:
确定评分超出预设分值的各客户端;
在所述第一音频播放完成后,分别显示各所述合唱客户端的评分,且在评分超出预设分值的客户端的用户头像上添加预设标识。
可选地,从所述第二音频中识别各客户端的音频流,包括:
针对每个客户端输出的音频流,判断所述音频流的预设参数是否满足预设条件;
在满足预设条件的情况下,判断所述音频流中是否包含两个或两个以上用户的声音;
若是,将所述音频流中音量最高的用户对应的音频信号组成的音频流确定为有效音频流。
根据本公开实施例的第二方面,提供一种多方音频的处理方法,所述方法应用于第二客户端,包括:
向第一客户端发送加入请求,所述加入请求用于请求加入目标虚拟空间,所述目标虚拟空间为所述第一客户端在网络数据实时传输过程中,所创建的N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
在所述第一音频播放过程中,采集第二音频,其中,所述第二音频为与所述第一音频匹配的音频流;
将所述第二音频提供给所述第一客户端。
可选地,所述将所述第二音频提供给所述第一客户端的步骤,包括:
将所述第二音频提供给所述目标虚拟空间中的各客户端。
可选地,在所述将所述第二音频提供给所述第一客户端的步骤之后,所述方法还包括:
接收所述第一客户端和所述目标虚拟空间中的各客户端发送的第二音频;
分别基于各所述第二音频以及所述目标音乐中包含的歌词和第一音频,对各所述客户端以及所述第一客户端进行评分。
可选地,在所述分别基于各所述第二音频以及所述目标音乐中包含的歌词和第一音频,对各所述客户端以及所述第一客户端进行评分的步骤之后,所述方法还包括:
将评分结果提供给所述第一客户端和/或目标虚拟空间中的各客户端。
根据本公开实施例的第三方面,提供一种多方音频的处理装置,所述装置设置于第一客户端中,包括:
创建模块,被配置为在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
第一接收模块,被配置为接收M个客户端发送的加入请求,所述加入请求用于请求加入所述目标虚拟空间,所述M为大于0小于等于N-1的整数;
第一获取模块,被配置为获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
第二获取模块,被配置为获取第二音频,所述第二音频为所述M个客户端中的W个客户端提供的音频和/或所述第一客户端提供的音频,所述W为大于0小于等于M的整数,所述第二音频为与所述第一音频匹配的音频流;
播放模块,被配置为在所述第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频。
可选地,所述目标音乐还包括:与所述第一音频匹配的歌词;所述播放模块包括:
时间戳确定子模块,被配置为在所述第一音频播放过程中,确定所述第一音频当前的播放时间戳;
对齐子模块,被配置为依据所述时间戳,将所述第二音频与所述第一音频当前播放进度对齐后播放,并对应显示与所述播放进度匹配的歌词。
可选地,所述装置还包括:
第一识别模块,被配置为在所述第二获取模块获取第二音频之后,从所述第二音频中识别各客户端的音频流,其中,所述客户端包括:W个客户端和/所述第一客户端;
第一评分模块,被配置为分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分。
可选地,所述第一评分模块包括:
第一提取子模块,被配置为针对每个客户端的音频流,提取所述音频流中的预设评分参数;
第二提取子模块,被配置为从所述第一音频和歌词中,提取所述音频流对应的目标评分参数;
比对子模块,被配置为将所述预设评分参数与所述目标评分参数进行比对;
评分确定子模块,被配置为依据比对结果确定所述客户端的评分。
可选地,所述装置还包括:
第一确定模块,被配置为在所述第一评分模块分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分之后,确定评分超出预设分值的各客户端;
标识添加模块,被配置为在所述第一音频播放完成后,分别显示各所述合唱客户端的评分,且在评分超出预设分值的客户端的用户头像上添加预设标识。
可选地,所述第一识别模块包括:
第一判断子模块,被配置为针对每个客户端输出的音频流,判断所述音频流的预设参数是否满足预设条件;
第二判断子模块,被配置为在满足预设条件的情况下,判断所述音频流中是否包含两个或两个以上用户的声音;
有效音频流确定子模块,被配置为若是,将所述音频流中音量最高的用户对应的音频信号组成的音频流确定为有效音频流。
根据本公开实施例的第四方面,提供一种多方音频的处理装置,所述装置设置于第二客户端中,包括:
发送模块,被配置为向第一客户端发送加入请求,所述加入请求用于请求加入目标虚拟空间,所述目标虚拟空间为所述第一客户端在网络数据实时传输过程中,所创建的N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
第三获取模块,被配置为获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
采集模块,被配置为在所述第一音频播放过程中,采集第二音频,其中,所述第二音频为与所述第一音频匹配的音频流;
第一提供模块,被配置为将所述第二音频提供给所述第一客户端。
可选地,所述提供模块被配置为:
将所述第二音频提供给所述目标虚拟空间中的各客户端。
可选地,所述装置还包括:
第二接收模块,被配置为在所述第一提供模块将所述第二音频提供给所述第一客户端之后,接收所述第一客户端和所述目标虚拟空间中的各客户端发送的第二音频;
第二评分模块,被配置为分别基于各所述第二音频以及所述目标音乐中包含的歌词和第一音频,对各所述客户端以及所述第一客户端进行评分。
可选地,所述装置还包括:
第二提供模块,被配置为在所述第二评分模块分别基于各所述第二音频以及所述目标音乐中包含的歌词和第一音频,对各所述客户端以及所述第一客户端进行评分之后,将评分结果提供给所述第一客户端和/或目标虚拟空间中的各客户端。
根据本公开实施例的第五方面,提供一种电子设备,其特征在于,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如上所述的任意一种多方音频的处理方法。
根据本公开实施例的第六方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上所述的任意一种多方音频的处理方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,包括可读程序代码,当所述可读程序代码在计算设备上运行时,可使计算设备执行如上所述的任意一种多方音频的处理方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开的实施例中,在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间;接收M个客户端发送的加入请求;获取目标虚拟空间中的目标音乐;获取第二音频;在第一音频播放过程中,对应播放与第一音频当前匹配的第二音频,可支持多客户端在目标虚拟空间中共同参与音频处理例如合唱。此外,本公开实施例中参与音频处理的各客户端均将目标音乐下载至本地,可缩短参与音频处理的各客户端间衔接所耗时长。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种多方音频的处理方法的流程图。
图2是根据一示例性实施例示出的一种多方音频的处理方法的流程图。
图3是根据一示例性实施例示出的一种多方音频的处理方法的流程图。
图4是根据一示例性实施例示出的一种多方音频的处理装置的框图。
图5是根据一示例性实施例示出的一种多方音频的处理装置的框图。
图6是根据一示例性实施例示出的一种装置的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种多方音频的处理方法的流程图。多方音频的处理方法应用于第一客户端,第一客户端可以为电脑、智能手机等。如图1所示,多方音频的处理方法包括以下步骤。
在步骤S11中,在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间。
N为大于等于1的整数。
例如:在直播过程中多客户端用户欲合唱时,创建目标虚拟空间,参与合唱的各客户端均进入目标虚拟空间中参与合唱。目标虚拟空间的创建可由直播客户端即第一客户端主动创建,也可以由观看直播的客户端发送创建请求至第一客户端,第一客户端依据请求创建目标虚拟空间。
在步骤S12中,接收M个客户端发送的加入请求。
其中,加入请求用于请求加入目标虚拟空间,M为大于0小于等于N-1的整数。M个客户端即第二客户端,第一客户端与M个第二客户端为合唱客户端。
目标虚拟空间创建完成后,欲参与合唱的各第二客户端均可请求进入目标虚拟空间。进入目标虚拟空间后的各第二客户端请求上麦,即可开始进行目标歌曲录制。
在步骤S13中,获取目标虚拟空间中的目标音乐。
目标音乐中包括第一音频,第一音频包括:目标歌曲的原唱以及伴奏等。第一客户端获取目标音乐后,将其存储至本地,并提示加入目标虚拟空间中的各第二客户端获取目标音乐至本地。
预先获取目标音乐至第一客户端以及各第二客户端本地,无需在参与合唱的各客户端上麦后再加载目标音乐,可缩短各合唱客户端间合唱衔接所耗时长,缩短延时。
在步骤S14中,获取第二音频。
第二音频为M个客户端中的W个客户端提供的音频和/或第一客户端提供的音频。W为大于0小于等于M的整数,第二音频为与第一音频匹配的音频流。
参与合唱的W个第二客户端以及第一客户端可预先被分配目标音乐中的段落,参与合唱的各客户端依据预先分配录制被分配到的段落,第一客户端采集自身提供的音频和/或W个第二客户端提供的音频,即第一客户端获取第二音频。需要说明的是,在具体实现过程中,第一客户端还可以在目标虚拟空间中单独对目标音乐进行处理,该种情况下,第一客户端获取的第二音频中仅包含第一客户端提供的音频。第一客户端还可以不参与目标音乐合唱,该种情况下,第一客户端获取的第二音频中仅包含W个第二客户端提供的音频。
W个客户端提供的音频除可被第一客户端获取外,还可被目标虚拟空间中的其他客户端获取。也即,在目标音乐处理过程中,目标虚拟空间中的W个客户端用户均可听到彼此提供的音频。
目标虚拟空间中的各客户端间可通过UDP(User Datagram Protocol,用户数据报协议)发送音频。UDP是一种无需建立连接就可以发送封装的数据报协议,由于无需建立连接因此可节省建立连接所耗时间,故可提升音频传输效率,缩短各目标虚拟空间中各客户端间音频传输的延时。
在步骤S15中,在第一音频播放过程中,对应播放与第一音频当前匹配的第二音频。
对应播放与第一音频当前匹配的第二音频,观看直播的各客户端用户均可听到合唱的目标歌曲。
观看直播的各客户端包括:观看直播且未处于目标虚拟空间中的各客户端。
本公开的实施例中,在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间;接收M个客户端发送的加入请求;获取目标虚拟空间中的目标音乐;获取第二音频;在第一音频播放过程中,对应播放与第一音频当前匹配的第二音频,可支持多客户端在目标虚拟空间中共同参与对音频的处理例如合唱。此外,本公开实施例中参与音频处理的各客户端均将目标音乐获取至本地,可缩短参与音频处理的各客户端间衔接所耗时长。
图2是根据一示例性实施例示出的一种多方音频的处理方法的流程图。
本实施例中所示的多方音频的处理方法应用于第一客户端,如图2所示,多方音频的处理方法包括以下步骤。
在步骤S21中,在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间。
N为大于1的整数。
本实施例中以第一客户端与W个第二客户端合唱目标歌曲为例进行说明。欲进行多方音频处理例如合唱时,首先需创建N个资源共享数据的目标虚拟空间,其次,参与音频处理的各方客户端进入目标虚拟空间中对目标歌曲进行处理。
在步骤S22中,接收M个客户端发送的加入请求。
加入请求用于请求加入目标虚拟空间,M为大于0小于等于N-1的整数。
M个客户端包括:参与对目标音乐进行处理的W个客户端,旁观W个客户端对目标音乐进行处理的客户端。客户端进入目标虚拟空间中才能保证与第一客户端以及其他参与合唱目标音乐的W个客户端之间的延迟足够低。
在步骤S23中,获取目标虚拟空间中的目标音乐。
目标音乐中包括第一音频以及第一音频匹配的歌词。第一客户端将目标音乐获取至本地,并提示目标虚拟空间中的各客户端均获取目标音乐至本地。第一音频可以包括但不限于:目标歌曲的原唱、伴奏以及合唱评分规范文件等。
在步骤S24中,获取第二音频。
第二音频为M个客户端中的W个客户端提供的音频和/或第一客户端提供的音频,W为大于0小于等于M的整数,第二音频为与第一音频匹配的音频流。在多方音频处理过程中,不仅第一客户端获取目标虚拟空间中的W个客户端提供的音频,处于目标虚拟空间内的各客户端也获取其他客户端提供的音频流。位于目标虚拟空间内的各客户端获取其他客户端提供的音频流时,可提高麦克风采集音频的采样率,缩短采样间隔,从而减小采集延迟。
在步骤S25中,从第二音频中识别各客户端的音频流。
所述各客户端包括:W个客户端和/第一客户端。音频流中可携带客户端标识,通过所携带的标识可唯一标定一个客户端。
一种可选实施方式中,从第二音频中识别各客户端的音频流时,针对每个客户端输出的音频流,判断音频流的预设参数是否满足预设条件;在满足预设条件的情况下,判断音频流中是否包含两个或两个以上用户的声音;若是,将音频流中音量最高的用户对应的音频信号组成的音频流确定为有效音频流。针对每个客户端输出的音频流,在音频流的预设参数不满足预设条件的情况下,确定该音频为无效音频流。
该种可选地从第二音频中识别各客户端的音频流的方式,可准确地区分各客户端输出的有效音频流以及无效音频流,便于后续对不同类型的音频流区分处理。对于客户端输出的有效音频流,可作为后续为该客户端评分的基础数据。
一种可选实施方式中,判断音频流的预设参数是否满足预设条件时,判断音频流的强度是否大于预设强度;若是,确定音频流的预设参数满足预设条件;若否,确定音频的预设参数不满足预设条件。
预设强度可由本领域技术人员根据实际需求进行设置,本发明实施例中对此不做具体限制。音频流的强度大于预设强度说明客户端用户在演唱歌曲,反之,说明客户端用户未在演唱歌曲,因此将音频流确定为无效音频流。
另一种可选实施方式中,判断音频流的预设参数是否满足预设条件时,判断音频流的强度是否大于预设强度;若音频流的强度大于预设强度,判断音频流是否为噪声;若音频流为噪声,确定音频流的预设参数不满足预设条件;若音频流不是噪声,确定音频流的预设参数满足预设条件。再一种可选实施方式中,在识别第二音频中各客户端的音频流时,若两个客户端的音频流中包含的声音属于同一用户,虽然接收到的两个客户端的音频流属于两路音频,但可以对这两路音频流进行音色去重,得到有效音频流。例如:一个参与合唱的客户端用户同时两个手机进入目标虚拟空间内,即不同账号参与合唱,客户端用户演唱歌曲时第一客户端将获取到两个手机输出的音频流,而这两路音频流中包含的声音属于同一用户。
在步骤S26中,分别基于各客户端的音频流以及目标音乐中包含的歌词和第一音频,对各客户端进行评分。
一种可选地分别基于各客户端的音频流以及目标音乐中包含的歌词和第一音频,对各客户端进行评分的方式为:
首先,针对每个客户端的音频流,提取音频流中的预设评分参数;
预设评分参数可以包括但不限于:音高、节奏以及能量等参数。
其次,从第一音频和歌词中,提取音频流对应的目标评分参数;
目标评分参数与预设评分参数包含的参数项相同,例如:预设评分参数为音高、节奏两个参数项,则目标评分参数也为音高、节奏两个参数项。
最后,将预设评分参数与目标评分参数进行比对;依据比对结果确定所述客户端的评分。
针对每个客户端,客户端输出的音频流对应的目标评分参数与预设评分参数的匹配度越高,则该客户端的评分越高。
在实现过程中,并不局限于上述所列举的由第一客户端为各客户端进行评分,还可以由服务器依据各客户端上报的音频流为各客户端进行评分,还可以由各客户端为本端用户评分后上报至第一客户端。
在步骤S27中,在第一音频播放过程中,确定第一音频当前的播放时间戳。
通过时间戳可确定第一音频当前的播放进度。
在步骤S28中,依据时间戳,将第二音频与第一音频当前播放进度对齐后播放,并对应显示与播放进度匹配的歌词。
目标虚拟空间内的各客户端输出的音频流中携带有时间戳,通过各客户端输出的音频流中携带的时间戳可将第一音频与第二音频进度对齐后播放。目标虚拟空间中的各客户端所输出的音频流,除可被第一客户端获取外,还可以被目标虚拟空间中的其他客户端获取。各客户端输出音频流时,可将前后相邻语音数据包部分交叠,从而有效抗击网络抖动;客客户端将可通过UDP传输视频流,可提升音频流传输效率,缩短客户端间音频流传输的延时。
一种可选地方式为,为各客户端进行评分后,确定评分超出预设分值的各客户端;在第一音频播放完成后,分别显示各客户端的评分,且在评分超出预设分值的客户端的用户头像上添加预设标识。
例如:当一首歌曲合唱完成后,输出参与合唱的各客户端对应的评分以及各客户端的标识,并向直播间内所有观看直播的客户端广播评分,使得观看直播的各客户端用户能够直观地了解参与合唱的各客户端用户的歌唱水平。在显示各客户端的评分后,在评分超出预设分值的用户头像上添加预设标识,能够增加合唱趣味性。
需要说明的是,确定评分超出预设分值的各客户端,在评分超出预设分值的各客户端的用户头像上添加预设标识;还可以是确定评分排序在前的预设数量各客户端,在评分排序在前的预设数量的客户端的用户头像上添加预设标识。
本公开的实施例中,在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间;接收M个客户端发送的加入请求;获取目标虚拟空间中的目标音乐;获取第二音频;在第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频,可支持多客户端在目标虚拟空间中进行合唱。此外,本公开实施例中参与音频处理的各客户端均将目标音乐获取至本地,可缩短参与音频处理的各客户端间合唱衔接所耗时长。此外,处于目标虚拟空间中的各客户端通过用户数据报协议发送音频流,可提升音频流传输效率,确保输出连贯的第二音频。不仅如此,第一客户端还为目标虚拟空间中的各客户端进行评分,评分完毕后显示各可客户端的评分,能够提升多方音频处理的趣味性。
图3是根据一示例性实施例示出的一种多方音频的处理方法的流程图。
本实施例中所示的多方音频的处理方法应用于第二客户端,如图3所示,多方音频的处理方法包括以下步骤。
在步骤S31中,向第一客户端发送加入请求。
加入请求用于请求加入目标虚拟空间。目标虚拟空间为第一客户端在网络数据实时传输过程中,所创建的N个资源共享数据的目标虚拟空间,N为大于1的整数。目标虚拟空间为第一客户端为多个第二客户端提供多方音频处理的空间。各第二客户端执行相同操作,本实施例中从单个第二客户端的角度对多方音频处理方法进行说明。
在步骤S32中,获取目标虚拟空间中的目标音乐。
目标音乐中包括第一音频。
加入目标虚拟空间后,第二客户端可主动获取目标音乐,也可依据第一客户端提示获取目标音乐。
在步骤S33中,在第一音频播放过程中,采集第二音频。
其中,第二音频为与第一音频匹配的音频流,第二音频为第二客户端用户输入的音频流。
在步骤S34中,将第二音频提供给第一客户端。
第二客户端将第二音频发送至服务器,服务器将第二音频发送至第一客户端。
一种可选实施方式中,将第二音频提供给目标虚拟空间中的各客户端,目标虚拟空间中的各客户端包括:第一客户端以及多个第二客户端。将第二音频提供给目标虚拟空间中的各客户端,便于各客户端及时播放给用户,确保音频传输的时效性。接收到第二音频的客户端用户,可及时地进行音频衔接。
在步骤S35中,接收第一客户端和目标虚拟空间中的各客户端发送的第二音频。
在多方音频处理过程中,第二客户端不仅获取本端用户输入的音频,还接收目标虚拟空间中参与音频处理的各客户端发送的第二音频,可确保所处理的音频能够及时完整的输出。
在步骤S36中,分别基于各第二音频以及目标音乐中包含的歌词和第一音频,对各客户端以及第一客户端进行评分。
第二客户端为各客户端以及第一客户端进行评分时的具体方式,可参照第一客户端对各客户端的评分的相关说明,本实施方式中对此不再赘述。
一种可选实施方式中,第二客户端将评分结果提供给第一客户端和/或目标虚拟空间中的各客户端。
将评分结果提供给目标虚拟空间中的各客户端,便于各客户端用户对参与本次多方音频处理的各用户的歌唱水平进行了解,还可提升各客户端用户之间的互动性。
步骤35与步骤S36为可选步骤,在实现过程中,第二客户端可不执行这两个步骤,仅将第二音频提供给第一客户端,由第一客户端输出各第二客户端提供的第二音频,以及为各第二客户端进行评分。
在公开的实施例中,在网络数据实时传输过程中,第一客户端创建N个资源共享数据的目标虚拟空间;第二客户端向第一客户端发送加入请求,以请求加入目标虚拟空间;第二客户端获取目标虚拟空间中的目标音乐;在第一音频播放过程中,采集第二音频,将第二音频提供给第一客户端,通过第一客户端输出第二音频,多个第二客户端与第一客户端可在目标虚拟空间中共同参与音频处理例如合唱。此外,本公开实施例中参与音频处理的各客户端均将目标音乐获取至本地,可缩短参与音频处理的各客户端间合唱衔接所耗时长。
图4是根据一示例性实施例示出的一种多方音频的处理装置框图。参照图4,该装置包括创建模块401,第一接收模块402,第一获取模块403,第二获取模块404,播放模块405。该装置设置于第一客户端中。
创建模块401,被配置为在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
第一接收模块402,被配置为接收M个客户端发送的加入请求,所述加入请求用于请求加入所述目标虚拟空间,所述M为大于0小于等于N-1的整数;
第一获取模块403,被配置为获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
第二获取模块404,被配置为获取第二音频,所述第二音频为所述M个客户端中的W个客户端提供的音频和/或所述第一客户端提供的音频,所述W为大于0小于等于M的整数,所述第二音频为与所述第一音频匹配的音频流;
播放模块405,被配置为在所述第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频。
在一种可选方式中,所述目标音乐还包括:与所述第一音频匹配的歌词;所述播放模块包括:
时间戳确定子模块,被配置为在所述第一音频播放过程中,确定所述第一音频当前的播放时间戳;
对齐子模块,被配置为依据所述时间戳,将所述第二音频与所述第一音频当前播放进度对齐后播放,并对应显示与所述播放进度匹配的歌词。
在一种可选方式中,所述装置还包括:
第一识别模块,被配置为在所述第二获取模块获取第二音频之后,从所述第二音频中识别各客户端的音频流,其中,所述客户端包括:W个客户端和/所述第一客户端;
第一评分模块,被配置为分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分。
在一种可选方式中,所述第一评分模块包括:
第一提取子模块,被配置为针对每个客户端的音频流,提取所述音频流中的预设评分参数;
第二提取子模块,被配置为从所述第一音频和歌词中,提取所述音频流对应的目标评分参数;
比对子模块,被配置为将所述预设评分参数与所述目标评分参数进行比对;
评分确定子模块,被配置为依据比对结果确定所述客户端的评分。
在一种可选方式中,所述装置还包括:
第一确定模块,被配置为在所述第一评分模块分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分之后,确定评分超出预设分值的各客户端;
标识添加模块,被配置为在所述第一音频播放完成后,分别显示各所述合唱客户端的评分,且在评分超出预设分值的客户端的用户头像上添加预设标识。
在一种可选方式中,所述第一识别模块包括:
第一判断子模块,被配置为针对每个客户端输出的音频流,判断所述音频流的预设参数是否满足预设条件;
第二判断子模块,被配置为在满足预设条件的情况下,判断所述音频流中是否包含两个或两个以上用户的声音;
有效音频流确定子模块,被配置为若是,将所述音频流中音量最高的用户对应的音频信号组成的音频流确定为有效音频流。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种多方音频的处理装置框图。参照图5,该装置包括发送模块501,第三获取模块502,采集模块503以及第一提供模块504。该装置设置于第二客户端中。
发送模块501,被配置为向第一客户端发送加入请求,所述加入请求用于请求加入目标虚拟空间,所述目标虚拟空间为所述第一客户端在网络数据实时传输过程中,所创建的N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
第三获取模块502,被配置为获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
采集模块503,被配置为在所述第一音频播放过程中,采集第二音频,其中,所述第二音频为与所述第一音频匹配的音频流;
第一提供模块504,用于将所述第二音频提供给所述第一客户端。
在一种可选方式中,所述提供模块被配置为:
将所述第二音频提供给所述目标虚拟空间中的各客户端。
在一种可选方式中,所述装置还包括:
第二接收模块,被配置为在所述第一提供模块将所述第二音频提供给所述第一客户端之后,接收所述第一客户端和所述目标虚拟空间中的各客户端发送的第二音频;
第二评分模块,被配置为分别基于各所述第二音频以及所述目标音乐中包含的歌词和第一音频,对各所述客户端以及所述第一客户端进行评分。
在一种可选方式中,所述装置还包括:
第二提供模块,被配置为在所述第二评分模块分别基于各所述第二音频以及所述目标音乐中包含的歌词和第一音频,对各所述客户端以及所述第一客户端进行评分之后,将评分结果提供给所述第一客户端和/或目标虚拟空间中的各客户端。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种电子设备600的框图。例如,电子设备600可以被提供为一客户端设备。
参照图6,电子设备600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述任意一种方法。
电子设备600还可以包括一个电源组件626被配置为执行电子设备600的电源管理,一个有线或无线网络接口650被配置为将电子设备600连接到网络,和一个输入输出(I/O)接口658。电子设备600可以操作基于存储在存储器632的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由资源打包装置的处理器执行以完成上述任意一种方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括可读性程序代码,该可读性程序代码可由多方音频的处理装置的处理器执行以完成上述任意一种方法。可选地,该程序代码可以存储在资源打包装置的存储介质中,该存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种多方音频的处理方法,其特征在于,所述方法应用于第一客户端,包括:
在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
接收M个客户端发送的加入请求,所述加入请求用于请求加入所述目标虚拟空间,所述M为大于0小于等于N-1的整数;
获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
获取第二音频,所述第二音频为所述M个客户端中的W个客户端提供的音频和/或所述第一客户端提供的音频,所述W为大于0小于等于M的整数,所述第二音频为与所述第一音频匹配的音频流;
在所述第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频。
2.根据权利要求1所述的方法,其特征在于,所述目标音乐还包括:与所述第一音频匹配的歌词;
在所述第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频的步骤,包括:
在所述第一音频播放过程中,确定所述第一音频当前的播放时间戳;
依据所述时间戳,将所述第二音频与所述第一音频当前播放进度对齐后播放,并对应显示与所述播放进度匹配的歌词。
3.根据权利要求1所述的方法,其特征在于,在所述获取第二音频的步骤之后,所述方法还包括:
从所述第二音频中识别各客户端的音频流,其中,所述客户端包括:W个客户端和/所述第一客户端;
分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分。
4.根据权利要求3所述的方法,其特征在于,所述分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分的步骤,包括:
针对每个客户端的音频流,提取所述音频流中的预设评分参数;
从所述第一音频和歌词中,提取所述音频流对应的目标评分参数;
将所述预设评分参数与所述目标评分参数进行比对;
依据比对结果确定所述客户端的评分。
5.根据权利要求3所述的方法,其特征在于,在所述分别基于各所述客户端的音频流以及所述目标音乐中包含的歌词和第一音频,对各所述客户端进行评分的步骤之后,所述方法还包括:
确定评分超出预设分值的各客户端;
在所述第一音频播放完成后,分别显示各所述客户端的评分,且在评分超出预设分值的客户端的用户头像上添加预设标识。
6.一种多方音频的处理方法,其特征在于,所述方法应用于第二客户端,包括:
向第一客户端发送加入请求,所述加入请求用于请求加入目标虚拟空间,所述目标虚拟空间为所述第一客户端在网络数据实时传输过程中,所创建的N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
在所述第一音频播放过程中,采集第二音频,其中,所述第二音频为与所述第一音频匹配的音频流;
将所述第二音频提供给所述第一客户端。
7.一种多方音频的处理装置,其特征在于,所述装置设置于第一客户端中,包括:
创建模块,被配置为在网络数据实时传输过程中,创建N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
第一接收模块,被配置为接收M个客户端发送的加入请求,所述加入请求用于请求加入所述目标虚拟空间,所述M为大于0小于等于N-1的整数;
第一获取模块,被配置为获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
第二获取模块,被配置为获取第二音频,所述第二音频为所述M个客户端中的W个客户端提供的音频和/或所述第一客户端提供的音频,所述W为大于0小于等于M的整数,所述第二音频为与所述第一音频匹配的音频流;
播放模块,被配置为在所述第一音频播放过程中,对应播放与所述第一音频当前匹配的第二音频。
8.一种多方音频的处理装置,其特征在于,所述装置设置于第二客户端中,包括:
发送模块,被配置为向第一客户端发送加入请求,所述加入请求用于请求加入目标虚拟空间,所述目标虚拟空间为所述第一客户端在网络数据实时传输过程中,所创建的N个资源共享数据的目标虚拟空间,所述N为大于1的整数;
第三获取模块,被配置为获取所述目标虚拟空间中的目标音乐,所述目标音乐中包括第一音频;
采集模块,被配置为在所述第一音频播放过程中,采集第二音频,其中,所述第二音频为与所述第一音频匹配的音频流;
第一提供模块,用于将所述第二音频提供给所述第一客户端。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至5中任一项或权利要求6中任一项所述多方音频的处理方法。
10.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至5中任一项或权利要求6中所述的多方音频的处理方法。
CN202010404086.XA 2020-05-13 2020-05-13 多方音频的处理方法、装置、电子设备及存储介质 Pending CN111787353A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010404086.XA CN111787353A (zh) 2020-05-13 2020-05-13 多方音频的处理方法、装置、电子设备及存储介质
US17/108,014 US11392343B2 (en) 2020-05-13 2020-12-01 Method and apparatus for processing multi-party audio, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010404086.XA CN111787353A (zh) 2020-05-13 2020-05-13 多方音频的处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111787353A true CN111787353A (zh) 2020-10-16

Family

ID=72754076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010404086.XA Pending CN111787353A (zh) 2020-05-13 2020-05-13 多方音频的处理方法、装置、电子设备及存储介质

Country Status (2)

Country Link
US (1) US11392343B2 (zh)
CN (1) CN111787353A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113645472A (zh) * 2021-07-05 2021-11-12 北京达佳互联信息技术有限公司 一种基于播放对象的交互方法、装置、电子设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11579838B2 (en) * 2020-11-26 2023-02-14 Verses, Inc. Method for playing audio source using user interaction and a music application using the same

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208039A (zh) * 2015-10-10 2015-12-30 广州华多网络科技有限公司 在线演唱会大合唱的方法及系统
CN105788609A (zh) * 2014-12-25 2016-07-20 福建凯米网络科技有限公司 多路音源的关联方法和装置及评定方法和系统
CN110176221A (zh) * 2019-05-30 2019-08-27 广州酷狗计算机科技有限公司 演唱竞技方法、装置及存储介质
CN110267081A (zh) * 2019-04-02 2019-09-20 北京达佳互联信息技术有限公司 直播流处理方法、装置、系统、电子设备及存储介质
CN110718239A (zh) * 2019-10-15 2020-01-21 北京达佳互联信息技术有限公司 音频处理方法、装置、电子设备及存储介质
JP2020017868A (ja) * 2018-07-25 2020-01-30 株式会社ミクシィ 情報処理装置、動画配信方法及び動画配信プログラム
CN110910860A (zh) * 2019-11-29 2020-03-24 北京达佳互联信息技术有限公司 线上ktv实现方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7007098B1 (en) * 2000-08-17 2006-02-28 Nortel Networks Limited Methods of controlling video signals in a video conference
US7319761B2 (en) * 2003-04-04 2008-01-15 Apple Inc. Method and apparatus for locating and correcting sound overload
US7838755B2 (en) * 2007-02-14 2010-11-23 Museami, Inc. Music-based search engine
US20110126103A1 (en) * 2009-11-24 2011-05-26 Tunewiki Ltd. Method and system for a "karaoke collage"
US8653349B1 (en) * 2010-02-22 2014-02-18 Podscape Holdings Limited System and method for musical collaboration in virtual space
US8918484B2 (en) * 2011-03-17 2014-12-23 Charles Moncavage System and method for recording and sharing music

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105788609A (zh) * 2014-12-25 2016-07-20 福建凯米网络科技有限公司 多路音源的关联方法和装置及评定方法和系统
CN105208039A (zh) * 2015-10-10 2015-12-30 广州华多网络科技有限公司 在线演唱会大合唱的方法及系统
JP2020017868A (ja) * 2018-07-25 2020-01-30 株式会社ミクシィ 情報処理装置、動画配信方法及び動画配信プログラム
CN110267081A (zh) * 2019-04-02 2019-09-20 北京达佳互联信息技术有限公司 直播流处理方法、装置、系统、电子设备及存储介质
CN110176221A (zh) * 2019-05-30 2019-08-27 广州酷狗计算机科技有限公司 演唱竞技方法、装置及存储介质
CN110718239A (zh) * 2019-10-15 2020-01-21 北京达佳互联信息技术有限公司 音频处理方法、装置、电子设备及存储介质
CN110910860A (zh) * 2019-11-29 2020-03-24 北京达佳互联信息技术有限公司 线上ktv实现方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113645472A (zh) * 2021-07-05 2021-11-12 北京达佳互联信息技术有限公司 一种基于播放对象的交互方法、装置、电子设备及存储介质
CN113645472B (zh) * 2021-07-05 2023-04-28 北京达佳互联信息技术有限公司 一种基于播放对象的交互方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
US20210357173A1 (en) 2021-11-18
US11392343B2 (en) 2022-07-19

Similar Documents

Publication Publication Date Title
US20230067099A1 (en) Method and server for performing game battle in live broadcast room, and storage medium
CN108600815B (zh) 一种在线实时合唱的方法及系统
WO2016188323A1 (zh) K歌处理方法及系统
CN105808710A (zh) 一种远程 k 歌终端、远程k 歌系统及远程k 歌方法
CN102158745B (zh) 卡拉ok业务的实现方法、终端、服务器端及系统
CN102185862B (zh) 网络游戏系统的通信方法、装置及系统
CN110910860B (zh) 线上ktv实现方法、装置、电子设备及存储介质
CN103021401B (zh) 基于互联网的多人异步合唱混音合成方法及合成系统
CN106531201A (zh) 歌曲录制的方法和装置
CN104918061B (zh) 一种电视频道的识别方法及系统
CN105208039A (zh) 在线演唱会大合唱的方法及系统
CN110856009B (zh) 网络k歌系统、网络k歌的音视频播放方法及相关设备
WO2021180174A1 (zh) 歌曲播放方法、装置及系统、计算机存储介质
CN108074557A (zh) 音调调整方法、装置及存储介质
CN111787353A (zh) 多方音频的处理方法、装置、电子设备及存储介质
US10425758B2 (en) Apparatus and method for reproducing multi-sound channel contents using DLNA in mobile terminal
CN110418182B (zh) 联网合唱方法及计算机可读存储介质
CN112328142A (zh) 直播互动方法、装置、电子设备和存储介质
CN110944226B (zh) 网络k歌系统、k歌场景下的歌词显示方法及相关设备
CN103050114A (zh) 一种网络卡拉ok系统的构建方法
CN107896334A (zh) 进行直播的方法和装置
JP2012129800A (ja) 情報理装置および方法、プログラム、並びに情報処理システム
CN111586430A (zh) 在线互动方法、客户端、服务器和存储介质
CN102104799B (zh) 卡拉ok业务的实现方法、终端、服务器端及系统
JP2000268047A (ja) 情報提供システム、クライアント、情報提供サーバ及び情報提供方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201016