CN110390925B - 人声与伴奏同步方法、终端、蓝牙设备及存储介质 - Google Patents

人声与伴奏同步方法、终端、蓝牙设备及存储介质 Download PDF

Info

Publication number
CN110390925B
CN110390925B CN201910712724.1A CN201910712724A CN110390925B CN 110390925 B CN110390925 B CN 110390925B CN 201910712724 A CN201910712724 A CN 201910712724A CN 110390925 B CN110390925 B CN 110390925B
Authority
CN
China
Prior art keywords
audio
accompaniment
voice
terminal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910712724.1A
Other languages
English (en)
Other versions
CN110390925A (zh
Inventor
夏波
李天边
詹昌寿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Voc Acoustic Technology Co ltd
Hunan Guosheng Acoustics Technology Co ltd Shenzhen Branch
Original Assignee
Hunan Voc Acoustic Technology Co ltd
Hunan Guosheng Acoustics Technology Co ltd Shenzhen Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Voc Acoustic Technology Co ltd, Hunan Guosheng Acoustics Technology Co ltd Shenzhen Branch filed Critical Hunan Voc Acoustic Technology Co ltd
Priority to CN201910712724.1A priority Critical patent/CN110390925B/zh
Publication of CN110390925A publication Critical patent/CN110390925A/zh
Application granted granted Critical
Publication of CN110390925B publication Critical patent/CN110390925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本发明实施例公开了一种人声与伴奏同步方法、终端、蓝牙设备及存储介质,涉及音频处理技术领域。其中方法包括:通过伴奏通道将伴奏音频发送至蓝牙设备;伴奏音频用于触发蓝牙设备采集人声音频,并对伴奏音频和人声音频进行同步压缩,生成同步压缩音频数据,将同步压缩音频数据通过上行通道上传至终端;接收蓝牙设备通过上行通道上传的同步压缩音频数据,对同步压缩音频数据进行解压,获取解压后的人声音频和伴奏音频;对比解压后的伴奏音频和本地伴奏音频,使解压后的伴奏音频和本地伴奏音频中相同的数据帧对齐,根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频。本发明实施例可以实现人声与伴奏的完全同步。

Description

人声与伴奏同步方法、终端、蓝牙设备及存储介质
技术领域
本发明实施例涉及音频处理技术领域,特别涉及一种人声与伴奏同步方法、终端、蓝牙设备及存储介质。
背景技术
随着终端技术的发展,通过手机等终端进行K歌录制已经成为一种非常普遍的娱乐方式,目前终端K歌,一般采用蓝牙耳机作为播放伴奏、采集人声的设备。
在K歌时,由终端将伴奏音频通过蓝牙的伴奏通道传输至蓝牙耳机,由蓝牙耳机的音频输出部件播放接收到的伴奏音频,用户收听伴奏音频的同时进行歌唱,用蓝牙耳机的音频采集部件采集用户歌唱的人声音频,然后将人声音频通过蓝牙的人声通道传输至终端,终端接收到人声音频时将人声音频与本地伴奏音频进行混音,得到歌曲音频。然而,由于伴奏通道自身的特点,伴奏音频从终端传输至蓝牙耳机,使伴奏音频延迟较为严重,导致录制的人声与伴奏不同步,这样会导致后续混音得到的歌曲音频中伴奏音频与人声音频不同步。现有技术中采用的解决方案一般有以下两种:
一种是,预估延时同步法,其先预估延时时间,然后在混音时根据预估延时时间对人声音频与本地伴奏音频进行同步处理。然而,这种同步方式存在预估延时时间不准确,导致无法做到完全同步的问题。
另一种是,时间戳同步法,通过在蓝牙耳机端采集人声音频时,为人声音频的每帧数据加上时间戳,在终端对本地伴奏的每帧数据加上时间戳,然后在混音时根据时间戳对人声音频和本地伴奏音频进行同步处理。然而,由于蓝牙耳机与终端的时钟无法做到完全同步,导致根据时间戳计算得到的伴奏与人声之间的延时值不准确,仍然无法保证人声与伴奏的完全同步。
以上可以看出,现有的上述两种人声与伴奏的同步处理方案均存在无法精确计算出人声与伴奏之间的延迟时间,导致不能实现人声与伴奏的完全同步的问题。
发明内容
有鉴于此,本发明实施例的目的在于提供一种人声与伴奏同步方法、终端、蓝牙设备及存储介质,以解决上述现有的人声与伴奏的同步处理方案存在无法精确计算出人声与伴奏之间的延迟时间,导致不能实现人声与伴奏的完全同步的问题。
本发明实施例解决上述技术问题所采用的技术方案如下:
根据本发明实施例的第一方面,提供一种人声与伴奏同步方法,应用于终端,所述人声与伴奏同步方法包括:
通过伴奏通道将伴奏音频发送至蓝牙设备;所述伴奏音频用于触发所述蓝牙设备采集人声音频,并对所述伴奏音频和所述人声音频进行同步压缩,生成同步压缩音频数据,将所述同步压缩音频数据通过上行通道上传至所述终端;
接收所述蓝牙设备通过所述上行通道上传的同步压缩音频数据,对所述同步压缩音频数据进行解压,获取解压后的人声音频和伴奏音频;
对比解压后的伴奏音频和本地伴奏音频,使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据帧对齐,根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频。
其中,所述通过伴奏通道将伴奏音频发送至蓝牙设备包括:
接收用户输入的K歌指令,所述K歌指令包括演唱歌曲名称;
根据所述K歌指令中包含的演唱歌曲名称搜索对应的伴奏音频,将搜索到的伴奏音频通过伴奏通道发送至所述蓝牙设备。
其中,所述对比解压后的伴奏音频和本地伴奏音频,使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据帧对齐,根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频之后还包括:
播放所述混音音频;和/或,
保存所述混音音频,并将所述混音音频发布至网络。
根据本发明实施例的第二方面,提供一种人声与伴奏同步方法,应用于蓝牙设备,所述人声与伴奏同步方法包括:
通过伴奏通道接收终端发送的伴奏音频;
播放所述伴奏音频,并采集用户根据所述伴奏音频进行演唱的人声音频;
对所述伴奏音频和所述人声音频进行同步压缩,生成同步压缩音频数据,并通过上行通道将所述同步压缩音频数据上传至所述终端;
其中,所述同步压缩数据,用于触发所述终端对所述同步压缩音频数据进行解压,获得解压后的人声音频和伴奏音频,并对比解压后的伴奏音频和所述终端的本地伴奏音频,使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据帧对齐,根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频。
其中,所述通过伴奏通道接收终端发送的伴奏音频之前还包括:
采集用户通过语音方式输入的K歌指令,将所述K歌指令上传至所述终端,使所述终端根据所述K歌指令搜索对应的伴奏音频,并将所述伴奏音频返回至所述蓝牙设备;其中,所述K歌指令至少包括演唱歌曲名称。
其中,所述播放所述伴奏音频,并采集用户根据所述伴奏音频进行演唱的人声音频之后还包括:
对所述伴奏音频和所述人声音频进行混音后通过所述蓝牙设备的音频输出装置进行播放。
根据本发明实施例的第三方面,提供一种终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,该所述计算机程序被所述处理器执行时,实现如上述第一方面实施例任一项所述的人声与伴奏同步方法的步骤。
根据本发明实施例的第四方面,提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述第一方面实施例中任一项所述的人声与伴奏同步方法的步骤。
根据本发明实施例的第五方面,提供一种蓝牙设备,包括音频采集装置和音频输出装置,其特征在于,所述蓝牙设备还包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述音频采集装置和所述音频输出装置均与所述处理器电性连接,所述计算机程序被所述处理器执行时,实现如上述第二方面实施例中任一项所述的人声与伴奏同步方法的步骤。
根据本发明实施例的第六方面,提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述第二方面实施例中任一项所述的人声与伴奏同步方法的步骤。
相对于现有的人声与伴奏的同步处理方案存在无法精确计算出人声与伴奏之间的延迟时间,导致不能实现人声与伴奏的完全同步的问题,本发明实施例提供的人声与伴奏同步方法、终端、蓝牙设备及存储介质,由于在蓝牙设备采集到人声音频后,对人声音频和伴奏音频进行同步压缩,生成同步压缩音频数据,然后将同步压缩音频数据上传至终端,使终端对同步压缩音频数据进行解压,得到解压后的人声音频和伴奏音频,然后根据解压后的伴奏音频和终端的本地伴奏音频得到人声音频与本地伴奏音频之间的同步刻度,最后再根据该精确的同步刻度对人声音频和本地伴奏音频进行混音处理,从而可以实现人声与伴奏的完全同步。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的人声与伴奏同步系统的架构图;
图2是本发明实施例一提供的人声与伴奏同步方法的具体实现流程示意图;
图3是本发明实施例二提供的人声与伴奏同步方法的具体实现流程示意图;
图4是本发明实施例三提供的终端的结构示意图;
图5是本发明实施例五提供的蓝牙设备的结构示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅以解释本发明,并不用于限定本发明。
图1是本发明实施例提供的人声与伴奏同步系统的架构图。参见图1所示,所述人声与伴奏同步系统包括终端100和蓝牙设备200,所述终端100具有蓝牙通信功能,与所述蓝牙设备200建立有蓝牙通信连接。其中,所述终端100包括但不限于具有蓝牙通信功能的手机、电脑及平板等设备。所述蓝牙设备200具有音频采集装置和音频输出装置,包括但不限于蓝牙耳机等设备。
基于上述人声与伴奏同步系统的架构图,提出本发明的以下实施例。
实施例一
图2是本发明实施例一提供的人声与伴奏同步方法的具体实现流程示意图,该方法的执行主体为图1所示系统中的终端100。参见图2所示,本实施例提供的人声与伴奏同步方法包括:
步骤S201,通过伴奏通道将伴奏音频发送至蓝牙设备200;所述伴奏音频用于触发所述蓝牙设备200采集人声音频,并对所述伴奏音频和所述人声音频进行同步压缩,生成同步压缩音频数据,将所述同步压缩音频数据通过上行通道上传至所述终端100。
在本实施例中,所述通过伴奏通道将伴奏音频发送至蓝牙设备200包括:
接收用户输入的K歌指令,所述K歌指令包括演唱歌曲名称;
根据所述K歌指令中包含的演唱歌曲名称搜索对应的伴奏音频,将搜索到的伴奏音频通过伴奏通道发送至所述蓝牙设备200。
其中,所述接收用户输入的K歌指令包括:接收用户通过所述蓝牙设备200下发的语言K歌控制指令;或者,接收用户通过所述终端100上的按键输入的K歌指令;或者,接收用户通过所述终端100的触摸屏输入的K歌指令。
其中,所述K歌指令至少包括演唱歌曲名称。所述终端100在接收到所述K歌指令后,根据所述K歌指令中的演唱歌曲名称从本地曲库或网络曲库中搜索与所述演唱歌曲名称对应的伴奏音频,当搜索结果中仅有一个伴奏音频时,则直接将所述伴奏音频发送至所述蓝牙设备200,当搜索结果中有多个伴奏音频时,则将所述多个伴奏音频显示给用户供用户选择,在用户选择后将用户选择的伴奏音频发送至所述蓝牙设备200。优选的,为了提高伴奏音频的匹配效率,所述K歌指令除包含演唱歌曲名称外,还可以包括歌曲演唱人等信息。当然当用户遗忘演唱歌曲名称时,可以选择歌词或歌手搜素模式,在歌词或歌手搜素模式下,所述K歌指令可以仅包括歌词或歌手名字,终端100同样可以根据K歌指令中的歌词或歌手名字来搜素对应的伴奏音频。
在本实施例中,所述蓝牙设备200在接收到所述伴奏音频后,会通过音频输出装置播放所述伴奏音频,同时通过音频采集装置采集用户根据播放的伴奏音频进行演唱的人声音频,然后将所述人声音频和所述伴奏音频进行同步压缩生成同步压缩音频数据后通过上行通道上传至所述终端100。
步骤S202,接收所述蓝牙设备200通过所述上行通道上传的同步压缩音频数据,对所述同步压缩音频数据进行解压,获取解压后的人声音频和伴奏音频。
在本实施例中,由于同步压缩音频数据中,人声音频和伴奏音频都是经过编码的,且编码后的人声音频的每一帧数据和伴奏音频的每一帧数据中均添加有header,因此可以通过编码后添加的header保证人声音频和伴奏音频的完全同步。所述终端100在接收到所述同步压缩音频数据后,对所述同步压缩音频数据进行解压,即可获取解压后完全同步的人声音频和伴奏音频。
步骤S203,对比解压后的伴奏音频和本地伴奏音频,使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据帧对齐,根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频。
在本实施例中,对比解压后的伴奏音频和本地伴奏音频,使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据对齐,具体包括:根据解压后的伴奏音频的波形匹配所述本地伴奏音频的波形,使所述伴奏音频中的波形与本地伴奏音频中波形相同的数据帧对齐。由于解压后的伴奏音频与解压后的人声音频中的每一帧数据都是对齐的,因此在解压后的伴奏音频与本地伴奏音频对齐后,即可根据该对齐结果使解压后的人声音频在本地伴奏音频刻度上找到自己的定位,获得精确的同步刻度,那么根据该精确的同步刻度对解压后的人声音频和所述本地伴奏音频进行混音处理,即可使获得的混音音频中人声和伴奏是完全同步的。
优选的,在本实施例中,在步骤S203之后还可以包括:
播放所述混音音频;和/或,
保存所述混音音频,并将所述混音音频发布至网络。
在本实施例中,可以将终端100最后合成的混音音频播放输出给用户收听;也可以保存所述混音音频,并将所述混音音频发布至网络,以便于回放以及与他人分享用户的演唱曲目。
以上可以看出,相对于现有的人声与伴奏的同步处理方案存在无法精确计算出人声与伴奏之间的延迟时间,导致不能实现人声与伴奏的完全同步的问题,本实施例提供的人声与伴奏同步方法,由于在蓝牙设备200采集到人声音频后,对人声音频和伴奏音频进行同步压缩,生成同步压缩音频数据,然后将同步压缩音频数据上传至终端100,使终端100对同步压缩音频数据进行解压,得到解压后的人声音频和伴奏音频,然后根据解压后的伴奏音频和终端100的本地伴奏音频得到人声音频与本地伴奏音频之间的精确同步刻度,最后再根据该精确的同步刻度对人声音频和本地伴奏音频进行混音处理,从而可以实现人声与伴奏的完全同步。
实施例二
图3是本发明实施例二提供的人声与伴奏同步方法的具体实现流程示意图,该方法的执行主体为图1所示系统中的蓝牙设备200。参见图3所示,本实施例提供的人声与伴奏同步方法包括:
步骤S301,通过伴奏通道接收终端100发送的伴奏音频。
在本实施例中,蓝牙设备200在在通过伴奏通道接收终端100发送的伴奏音频之前还可以包括:
采集用户通过语音方式输入的K歌指令,将所述K歌指令上传至所述终端100,使所述终端100根据所述K歌指令搜索对应的伴奏音频,并将所述伴奏音频返回至所述蓝牙设备200;其中,所述K歌指令至少包括演唱歌曲名称。
在本实施例中,所述蓝牙设备200包括音频采集装置,其通过音频采集装置采集用户通过语音方式输入的K歌指令,然后通过上行通道将K歌指令上传至所述终端100。其中,所述K歌指令至少包括演唱歌曲名称。所述终端100在接收到所述K歌指令后,根据所述K歌指令中的演唱歌曲名称从本地曲库或网络曲库中搜索与所述演唱歌曲名称对应的伴奏音频,当搜索结果中仅有一个伴奏音频时,则直接将所述伴奏音频发送至所述蓝牙设备200,当搜索结果中有多个伴奏音频时,则将所述多个伴奏音频显示给用户供用户选择,在用户选择后将用户选择的伴奏音频发送至所述蓝牙设备200。优选的,为了提高伴奏音频的匹配效率,所述K歌指令除包含演唱歌曲名称外,还可以包括歌曲演唱人等信息。当然当用户遗忘演唱歌曲名称时,可以通过蓝牙设备200选择歌词或歌手搜素模式,在歌词或歌手搜素模式下,所述K歌指令可以仅包括歌词或歌手名字,所述终端100同样可以根据K歌指令中的歌词或歌手名字来搜素对应的伴奏音频。
步骤S302,播放所述伴奏音频,并采集用户根据所述伴奏音频进行演唱的人声音频。
在本实施例中,所述蓝牙设备200在接收到所述伴奏音频后,通过所述蓝牙设备200的音频输出装置播放所述伴奏音频,用户根据所述蓝牙设备200播放的伴奏音频进行演唱,此时所述蓝牙设备200的音频采集装置会在用户演唱过程中采集用户的人声音频。
步骤S303,对所述伴奏音频和所述人声音频进行同步压缩,生成同步压缩音频数据,并通过上行通道将所述同步压缩音频数据上传至所述终端100;
其中,所述同步压缩数据,用于触发所述终端100对所述同步压缩音频数据进行解压,获得解压后的人声音频和伴奏音频,并对比解压后的伴奏音频和所述终端100的本地伴奏音频,使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据帧对齐,根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频。
在本实施例中,所述蓝牙设备200在采集到用户的人声音频后,对所述人声音频和所述伴奏音频进行同步压缩处理,即对所述人声音频和所述伴奏音频进行编码,编码后的人声音频的每一帧数据和伴奏音频的每一帧数据中均添加有header,通过每一帧数据中的header可以保证压缩后的人声音频和伴奏音频的完全同步。所述终端100在接收到所述同步压缩音频数据后,对所述同步压缩音频数据进行解压,即可获取解压后完全同步的人声音频和伴奏音频。
在本实施例中,对比解压后的伴奏音频和本地伴奏音频,使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据对齐,具体包括:根据解压后的伴奏音频的波形匹配所述本地伴奏音频的波形,使所述伴奏音频中的波形与本地伴奏音频中波形相同的数据帧对齐。由于解压后的伴奏音频与解压后的人声音频中的每一帧数据都是对齐的,因此在解压后的伴奏音频与本地伴奏音频对齐后,即可根据该对齐结果使解压后的人声音频在本地伴奏音频刻度上找到自己的定位,获得精确的同步刻度,那么根据该精确的同步刻度对解压后的人声音频和所述本地伴奏音频进行混音处理,即可使获得的混音音频中人声和伴奏是完全同步的。
优选的,在本实施例中,在步骤S302之后还可以包括:
对所述伴奏音频和所述人声音频进行混音后通过所述蓝牙设备200的音频输出装置进行播放。
在本实施例中,所述蓝牙设备200在采集到人声音频后,在将人声音频和伴奏音频进行同步压缩处理的同时,还可以对所述伴奏音频和所述人声音频进行混音处理,并通过蓝牙设备200的音频输出装置播放混音处理后的音频,这样可以使用户及时获知演唱效果,进一步提升用户体验。
以上可以看出,本实施例提供的人声与伴奏同步方法同样由于在蓝牙设备200采集到人声音频后,对人声音频和伴奏音频进行同步压缩,生成同步压缩音频数据,然后将同步压缩音频数据上传至终端100,使终端100对同步压缩音频数据进行解压,得到解压后的人声音频和伴奏音频,然后根据解压后的伴奏音频和终端100的本地伴奏音频得到人声音频与本地伴奏音频之间的精确同步刻度,最后再根据该精确的同步刻度对人声音频和本地伴奏音频进行混音处理,从而可以实现人声与伴奏的完全同步。
实施例三
图4是本发明实施例三提供的终端的结构示意图。为了便于说明仅仅示出了与本实施例相关的部分。
参见图4所示,本发明实施例三提供的终端100包括存储器101、处理器102及存储在所述存储器101上并可在所述处理器102上运行的计算机程序103,所述计算机程序103被所述处理器102执行时,实现如上述实施例一所述的人声与伴奏同步方法的步骤。
本实施例中的终端100与上述实施例一所述的人声与伴奏同步方法属于同一构思,其具体实现过程详细见对应的方法实施例,且方法实施例中的技术特征在本设备实施例中均对应适用,这里不再赘述。
本领域普通技术人员可以理解,本实施例所公开方法中的全部或某些步骤、可以被实施为软件、固件、硬件及其适当的组合。
实施例四
本发明实施例四提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述实施例一所述的人声与伴奏同步方法的步骤。
本实施例的计算机可读存储介质与上述实施例一所述的人声与伴奏同步方法属于同一构思,其具体实现过程详细见对应的方法实施例,且方法实施例中的技术特征在本设备实施例中均对应适用,这里不再赘述。
本领域普通技术人员可以理解,本实施例所公开方法中的全部或某些步骤、可以被实施为软件、固件、硬件及其适当的组合。
实施例五
图5是本发明实施例五提供的蓝牙设备的结构示意图。为了便于说明仅仅示出了与本实施例相关的部分。
参见图5所示,本发明实施例五提供一种蓝牙设备200,包括音频采集装置201和音频输出装置202,所述蓝牙设备200还包括存储器203、处理器204及存储在所述存储器203上并可在所述处理器204上运行的计算机程序205,所述音频采集装置201和所述音频输出装置202均与所述处理器204电性连接,所述计算机程序205被所述处理器204执行时,实现如上述实施例二所述的人声与伴奏同步方法的步骤。
本实施例的蓝牙设备200与上述实施例二所述的人声与伴奏同步方法属于同一构思,其具体实现过程详细见对应的方法实施例,且方法实施例中的技术特征在本设备实施例中均对应适用,这里不再赘述。
本领域普通技术人员可以理解,本实施例所公开方法中的全部或某些步骤、可以被实施为软件、固件、硬件及其适当的组合。
实施例六
本发明实施例六提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述实施例二所述的人声与伴奏同步方法的步骤。
本实施例的计算机可读存储介质与上述实施例二所述的人声与伴奏同步方法属于同一构思,其具体实现过程详细见对应的方法实施例,且方法实施例中的技术特征在本设备实施例中均对应适用,这里不再赘述。
本领域普通技术人员可以理解,本实施例所公开方法中的全部或某些步骤、可以被实施为软件、固件、硬件及其适当的组合。
在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。本领域技术人员不脱离本发明的范围和实质内所作的任何修改、等同替换和改进,均应在本发明的权利范围之内。

Claims (10)

1.一种人声与伴奏同步方法,应用于终端,其特征在于,所述人声与伴奏同步方法包括:
通过伴奏通道将伴奏音频发送至蓝牙设备;所述伴奏音频用于触发所述蓝牙设备采集人声音频,并对所述伴奏音频和所述人声音频进行同步压缩,生成同步压缩音频数据,将所述同步压缩音频数据通过上行通道上传至所述终端;
接收所述蓝牙设备通过所述上行通道上传的同步压缩音频数据,对所述同步压缩音频数据进行解压,获取解压后的人声音频和伴奏音频;
对比解压后的伴奏音频和本地伴奏音频,用所述解压后的伴奏音频的波形匹配所述本地伴奏音频的波形,将所述解压后的伴奏音频中的波形与本地伴奏音频中波形相同的数据帧对齐,以使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据帧对齐,根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频;
其中,所述同步压缩音频数据中,编码后的人声音频的每一帧数据和伴奏音频的每一帧数据中均添加有header来保证人声音频和伴奏音频的完全同步。
2.如权利要求1所述的人声与伴奏同步方法,其特征在于,所述通过伴奏通道将伴奏音频发送至蓝牙设备包括:
接收用户输入的K歌指令,所述K歌指令包括演唱歌曲名称;
根据所述K歌指令中包含的演唱歌曲名称搜索对应的伴奏音频,将搜索到的伴奏音频通过伴奏通道发送至所述蓝牙设备。
3.如权利要求1所述的人声与伴奏同步方法,其特征在于,所述根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频之后还包括:
播放所述混音音频;和/或,
保存所述混音音频,并将所述混音音频发布至网络。
4.一种人声与伴奏同步方法,应用于蓝牙设备,其特征在于,所述人声与伴奏同步方法包括:
通过伴奏通道接收终端发送的伴奏音频;
播放所述伴奏音频,并采集用户根据所述伴奏音频进行演唱的人声音频;
对所述伴奏音频和所述人声音频进行同步压缩,生成同步压缩音频数据,并通过上行通道将所述同步压缩音频数据上传至所述终端;
其中,所述同步压缩数据,用于触发所述终端对所述同步压缩音频数据进行解压,获得解压后的人声音频和伴奏音频,并对比解压后的伴奏音频和所述终端的本地伴奏音频,用所述解压后的伴奏音频的波形匹配所述本地伴奏音频的波形,将所述解压后的伴奏音频中的波形与本地伴奏音频中波形相同的数据帧对齐,以使所述解压后的伴奏音频和所述本地伴奏音频中相同的数据帧对齐;根据对齐结果对解压后的人声音频和所述本地伴奏音频进行混音处理,得到混音音频;
其中,所述同步压缩音频数据中,编码后的人声音频的每一帧数据和伴奏音频的每一帧数据中均添加有header来保证人声音频和伴奏音频的完全同步。
5.如权利要求4所述的人声与伴奏同步方法,其特征在于,所述通过伴奏通道接收终端发送的伴奏音频之前还包括:
采集用户通过语音方式输入的K歌指令,将所述K歌指令上传至所述终端,使所述终端根据所述K歌指令搜索对应的伴奏音频,并将所述伴奏音频返回至所述蓝牙设备;其中,所述K歌指令至少包括演唱歌曲名称。
6.如权利要求4所述的人声与伴奏同步方法,其特征在于,所述播放所述伴奏音频,并采集用户根据所述伴奏音频进行演唱的人声音频之后还包括:
对所述伴奏音频和所述人声音频进行混音后通过所述蓝牙设备的音频输出装置进行播放。
7.一种终端,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至3中任一项所述的人声与伴奏同步方法的步骤。
8.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至3中任一项所述的人声与伴奏同步方法的步骤。
9.一种蓝牙设备,包括音频采集装置和音频输出装置,其特征在于,所述蓝牙设备还包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述音频采集装置和所述音频输出装置均与所述处理器电性连接,所述计算机程序被所述处理器执行时,实现如权利要求4至6中任一项所述的人声与伴奏同步方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求4至6中任一项所述的人声与伴奏同步方法的步骤。
CN201910712724.1A 2019-08-02 2019-08-02 人声与伴奏同步方法、终端、蓝牙设备及存储介质 Active CN110390925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910712724.1A CN110390925B (zh) 2019-08-02 2019-08-02 人声与伴奏同步方法、终端、蓝牙设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910712724.1A CN110390925B (zh) 2019-08-02 2019-08-02 人声与伴奏同步方法、终端、蓝牙设备及存储介质

Publications (2)

Publication Number Publication Date
CN110390925A CN110390925A (zh) 2019-10-29
CN110390925B true CN110390925B (zh) 2021-08-10

Family

ID=68288175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910712724.1A Active CN110390925B (zh) 2019-08-02 2019-08-02 人声与伴奏同步方法、终端、蓝牙设备及存储介质

Country Status (1)

Country Link
CN (1) CN110390925B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110808021B (zh) * 2019-11-08 2024-06-11 广州酷狗计算机科技有限公司 音频播放的方法、装置、终端及存储介质
CN111008298A (zh) * 2019-12-05 2020-04-14 广州酷狗计算机科技有限公司 查找歌曲伴奏的方法、装置、系统、设备及存储介质
CN112216294B (zh) * 2020-08-31 2024-03-19 北京达佳互联信息技术有限公司 音频处理方法、装置、电子设备及存储介质
CN112017622B (zh) * 2020-09-04 2023-02-21 广州趣丸网络科技有限公司 一种音频数据的对齐方法、装置、设备和存储介质
CN112669798B (zh) * 2020-12-15 2021-08-03 深圳芒果未来教育科技有限公司 一种对音乐信号主动跟随的伴奏方法及相关设备
CN112687247B (zh) * 2021-01-25 2023-08-08 北京达佳互联信息技术有限公司 音频对齐方法、装置、电子设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070218444A1 (en) * 2006-03-02 2007-09-20 David Konetski System and method for presenting karaoke audio features from an optical medium
CN101399036A (zh) * 2007-09-30 2009-04-01 三星电子株式会社 将语音转换为说唱音乐的设备和方法
CN101621745A (zh) * 2008-07-03 2010-01-06 乐金电子(中国)研究开发中心有限公司 基于无线传输的手机同步播放方法
CN103337240A (zh) * 2013-06-24 2013-10-02 华为技术有限公司 处理语音数据的方法、终端、服务器及系统
CN103886881A (zh) * 2014-04-14 2014-06-25 福建星网视易信息系统有限公司 一种扩展点歌曲库的方法及其系统
US20140360340A1 (en) * 2012-10-19 2014-12-11 Sing Trix Llc Vocal processing with accompaniment music input
CN104392711A (zh) * 2014-08-27 2015-03-04 贵阳朗玛信息技术股份有限公司 一种实现卡拉ok功能的方法及装置
CN106251890A (zh) * 2016-08-31 2016-12-21 广州酷狗计算机科技有限公司 一种录制歌曲音频的方法、装置和系统
CN107172449A (zh) * 2017-06-19 2017-09-15 微鲸科技有限公司 多媒体播放方法、装置及多媒体存储方法
US9997153B2 (en) * 2015-08-21 2018-06-12 Yamaha Corporation Information processing method and information processing device
CN108269560A (zh) * 2017-01-04 2018-07-10 北京酷我科技有限公司 一种声音合成方法及系统
CN108538302A (zh) * 2018-03-16 2018-09-14 广州酷狗计算机科技有限公司 合成音频的方法和装置
CN108766410A (zh) * 2018-05-28 2018-11-06 广东小天才科技有限公司 基于智能音响的k歌方法、装置、智能音响及存储介质
CN109300482A (zh) * 2018-09-13 2019-02-01 广州酷狗计算机科技有限公司 音频录制方法、装置、存储介质以及终端

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070218444A1 (en) * 2006-03-02 2007-09-20 David Konetski System and method for presenting karaoke audio features from an optical medium
CN101399036A (zh) * 2007-09-30 2009-04-01 三星电子株式会社 将语音转换为说唱音乐的设备和方法
CN101621745A (zh) * 2008-07-03 2010-01-06 乐金电子(中国)研究开发中心有限公司 基于无线传输的手机同步播放方法
US9418642B2 (en) * 2012-10-19 2016-08-16 Sing Trix Llc Vocal processing with accompaniment music input
US20140360340A1 (en) * 2012-10-19 2014-12-11 Sing Trix Llc Vocal processing with accompaniment music input
CN103337240A (zh) * 2013-06-24 2013-10-02 华为技术有限公司 处理语音数据的方法、终端、服务器及系统
CN103886881A (zh) * 2014-04-14 2014-06-25 福建星网视易信息系统有限公司 一种扩展点歌曲库的方法及其系统
CN104392711A (zh) * 2014-08-27 2015-03-04 贵阳朗玛信息技术股份有限公司 一种实现卡拉ok功能的方法及装置
US9997153B2 (en) * 2015-08-21 2018-06-12 Yamaha Corporation Information processing method and information processing device
CN106251890A (zh) * 2016-08-31 2016-12-21 广州酷狗计算机科技有限公司 一种录制歌曲音频的方法、装置和系统
CN108269560A (zh) * 2017-01-04 2018-07-10 北京酷我科技有限公司 一种声音合成方法及系统
CN107172449A (zh) * 2017-06-19 2017-09-15 微鲸科技有限公司 多媒体播放方法、装置及多媒体存储方法
CN108538302A (zh) * 2018-03-16 2018-09-14 广州酷狗计算机科技有限公司 合成音频的方法和装置
CN108766410A (zh) * 2018-05-28 2018-11-06 广东小天才科技有限公司 基于智能音响的k歌方法、装置、智能音响及存储介质
CN109300482A (zh) * 2018-09-13 2019-02-01 广州酷狗计算机科技有限公司 音频录制方法、装置、存储介质以及终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"智能电视平台唱歌应用的设计与实现";田宇;《中国优秀硕士学位论文全文数据库信息科技辑》;20161215;全文 *
M Ryynänen."Accompaniment separation and karaoke application based on automatic melody transcription".《 IEEE International Conference on Multimedia & Expo》.2008, *

Also Published As

Publication number Publication date
CN110390925A (zh) 2019-10-29

Similar Documents

Publication Publication Date Title
CN110390925B (zh) 人声与伴奏同步方法、终端、蓝牙设备及存储介质
CN111524494B (zh) 一种异地实时合唱方法及装置、存储介质
WO2017130810A1 (ja) 収録データ処理方法、端末装置および編集装置
CN105357604B (zh) 具有蓝牙功能的音频播放装置及音频播放方法
US20080184870A1 (en) System, method, device, and computer program product providing for a multiple-lyric karaoke system
KR101942678B1 (ko) 정보 관리 시스템 및 정보 관리 방법
KR20170033429A (ko) 단말 디바이스, 정보 제공 시스템, 정보 제시 방법, 및 정보 제공 방법
CN110428798B (zh) 人声与伴奏同步方法、蓝牙设备、终端及存储介质
CN102419998B (zh) 一种音频处理方法及系统
US11146901B2 (en) Crowd-sourced device latency estimation for synchronization of recordings in vocal capture applications
CN105450496B (zh) 社交应用中扩展内容来源的方法及系统、客户端和服务器
US10284985B1 (en) Crowd-sourced device latency estimation for synchronization of recordings in vocal capture applications
CN111065012A (zh) 音频播放方法、系统、耳机设备及计算机可读存储介质
CN102394860A (zh) 信号传送系统、方法、电脑程序产品及电脑可读取储存媒体
JP4327165B2 (ja) 楽曲再生装置
KR101230746B1 (ko) 음악데이터와 동시 출력을 위한 동기화된 영상데이터 생성방법과 그 동기화 출력을 위한 재생 방법
US11594113B2 (en) Decoding device, decoding method, and program
CN112927666A (zh) 音频处理方法、装置、电子设备及存储介质
KR20180099375A (ko) 멀티미디어 데이터에서 하이라이트를 찾는 방법 및 그를 이용한 장치
JP2002229576A (ja) 携帯カラオケ端末、模範歌唱信号送出装置および携帯カラオケシステム
CN113539279A (zh) 一种音频数据处理方法、装置以及计算机可读存储介质
JP2005333280A (ja) 番組連動システム
CN103780612A (zh) 数据处理方法和电子设备
KR102056796B1 (ko) 듀엣 모드 및 동시 음향 모드 제공 기반 방송 송출 시스템 및 그 방법
CN215818639U (zh) 一种延时补偿系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant