WO2023221559A1 - K歌音频处理方法、装置及计算机可读存储介质 - Google Patents

K歌音频处理方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
WO2023221559A1
WO2023221559A1 PCT/CN2023/074424 CN2023074424W WO2023221559A1 WO 2023221559 A1 WO2023221559 A1 WO 2023221559A1 CN 2023074424 W CN2023074424 W CN 2023074424W WO 2023221559 A1 WO2023221559 A1 WO 2023221559A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound effect
reverberation sound
reverberation
value
information
Prior art date
Application number
PCT/CN2023/074424
Other languages
English (en)
French (fr)
Inventor
杨婉雨
程光伟
朱长宝
Original Assignee
北京地平线信息技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 北京地平线信息技术有限公司 filed Critical 北京地平线信息技术有限公司
Publication of WO2023221559A1 publication Critical patent/WO2023221559A1/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0091Means for obtaining special acoustic effects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/155Musical effects
    • G10H2210/265Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
    • G10H2210/281Reverberation or echo

Abstract

一种K歌音频处理方法、装置及计算机可读存储介质。其中,方法包括:获取目标歌曲的节奏信息(110);确定与节奏信息匹配的混响音效信息(120);基于混响音效信息,调整目标歌曲的K歌音频的混响音效(130)。能够自动为不同节奏的歌曲适配相应的混响音效,而无需手动调整混响音效,整个过程实施起来非常便捷,且能够有效地保证K歌体验。

Description

K歌音频处理方法、装置及计算机可读存储介质
本公开要求在2022年05月18日提交的、申请号为202210542761.4、发明名称为“K歌音频处理方法、装置及计算机可读存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本公开中。
技术领域
本公开涉及音频处理技术,尤其是一种K歌音频处理方法、装置及计算机可读存储介质。
背景技术
K歌(例如去KTV唱歌或者利用手机上的K歌软件进行K歌等)是受许多人喜爱的一种娱乐项目,混响音效是K歌时普遍使用的音效之一,混响音效可以增加声音的空间感和自然度。在目前的K歌场景中,用户需要手动调整混响音效。
发明内容
为了解决用户需要手动调整混响音效,操作繁琐的技术问题,提出了本公开。
本公开的实施例提供了一种K歌音频处理方法、装置及计算机可读存储介质。
根据本公开的一个方面,提供了一种K歌音频处理方法,包括:
获取目标歌曲的节奏信息;
确定与所述节奏信息匹配的混响音效信息;
基于所述混响音效信息,调整所述目标歌曲的K歌音频的混响音效。
根据本公开的一个方面,提供了一种K歌音频处理装置,包括:
获取模块,用于获取目标歌曲的节奏信息;
确定模块,用于确定与所述获取模块获取的所述节奏信息匹配的混响音效信息;
处理模块,用于基于所述确定模块确定的所述混响音效信息,调整所述目标歌曲的K歌音频的混响音效。
根据本公开实施例的再一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述K歌音频处理方法。
根据本公开实施例的又一个方面,提供了一种电子设备,包括:
处理器:
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述K歌音频处理方法。
基于本公开上述实施例提供的K歌音频处理方法、装置、计算机可读存储介质及电子设备,可以确定与目标歌曲的节奏信息匹配的混响音效信息,并基于所确定的混响音效信息,调整目标歌曲的K歌音频的混响音效,这样,本公开的实施能够自动为不同节奏的歌曲适配相应的混响音效,而无需手动调整混响音效,整个过程实施起来非常便捷,且能够有效地保证K歌体验。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开一示例性实施例提供的K歌音频处理方法的流程示意图。
图2是本公开另一示例性实施例提供的K歌音频处理方法的流程示意图。
图3是本公开再一示例性实施例提供的K歌音频处理方法的流程示意图。
图4是本公开一示例性实施例中混响音效处理装置的结构示意图。
图5是图4中的预延迟模块的结构示意图。
图6是图4中的第一滤波模块的结构示意图。
图7是图4中的第二滤波模块的结构示意图。
图8是用于实现本公开的实施例中的K歌音频处理方法的系统的结构示意图。
图9是本公开又一示例性实施例提供的K歌音频处理方法的流程示意图。
图10是本公开一示例性实施例提供的K歌音频处理装置的结构示意图。
图11是本公开另一示例性实施例提供的K歌音频处理装置的结构示意图。
图12是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
申请概述
混响音效用于增加声音的空间感和自然度,被广泛应用于K歌、演唱会、电影制作、晚会等各种场景。
在实现本公开的过程中,发明人发现,将混响音效应用于K歌场景时,不同歌曲所需的混响音效往往是不同的,因此,K歌场景下需要频繁地进行混响音效的调整,而混响音效目前的调整方式为手动调整,操作起来非常繁琐,从而会降低用户的K歌体验。
示例性方法
图1是本公开一示例性实施例提供的K歌音频处理方法的流程示意图。图1所示的方法包括步骤110、步骤120和步骤130,下面分别对各步骤进行说明。
步骤110,获取目标歌曲的节奏信息。
需要说明的是,本公开的实施例中的K歌场景可以为用户利用手机、车载终端等终端设备上的K歌软件进行K歌的场景,这样,用户可以通过操作K歌软件进行点歌,用户所点的歌曲即可作为目标歌曲。
在步骤110中,可以利用节拍跟踪、基音检测、相似性检测等方式确定目标歌曲的节奏信息,节奏信息可以用于表征目标歌曲的节奏快慢。可选地,节奏信息可以呈节奏类型的形式,节奏类型包括但不限于快节奏类型、中等节奏类型、慢节奏类型等;或者,节奏信息可以呈数值的形式,例如设置为节奏越快数值越大,或者设置为节奏越慢数字越大。
通常情况下,说唱歌曲、摇滚歌曲属于快节奏的歌曲,相应地,说唱歌曲、摇滚歌曲的节奏类型为快节奏类型;节奏布鲁斯歌曲、爵士歌曲属于中等节奏的歌曲,相应地,节奏布鲁斯歌曲、爵士歌曲的节奏类型为中等节奏类型;民谣歌曲、后摇歌曲属于慢节奏的歌曲,相应地,民谣歌曲、后摇歌曲的节奏类型为慢节奏类型。
步骤120,确定与节奏信息匹配的混响音效信息。
可选地,混响音效信息可以用于表征混响音效强弱,与节奏信息类似,混响音效信息既可以呈混响音效类型的形式,也可以呈数值的形式。
需要说明的是,对于快节奏的歌曲,其需要的是较弱的混响音效,以避免歌词不清楚的情况;对于中等节奏的歌曲,其需要的是适中的混响音效,以既不影响节奏上的听感,又使声音变得厚重;对于慢节奏的歌曲,其需要的较强的混响音效,以使声音变得悠扬动人。容易看出,不同节奏的歌曲所需的混响音效是不同的,有鉴于此,在步骤120中,可以确定与步骤110中获取的节奏信息匹配的混响音效信息,所确 定的混响音效信息所表征的混响音效强弱是适合目标歌曲的混响音效强弱。
步骤130,基于混响音效信息,调整目标歌曲的K歌音频的混响音效。
在用户唱目标歌曲的过程中,可以通过终端设备中的麦克风获取用户的人声,所获取的人声即可作为目标歌曲的K歌音频,参考步骤120中确定的混响音效信息,可以对目标歌曲的K歌音频进行混响音效处理,以调整目标歌曲的K歌音频的混响音效,从而使目标歌曲的K歌音频的混响音效与目标歌曲适配。
另外,还可以获取目标歌曲的伴奏,将经混响音效处理后的K歌音频与伴奏进行混合,以得到混合音频,并通过终端设备中的音频播放设备(例如扬声器)播放混合音频,由此利用终端设备上的K歌软件实现了K歌。
基于本公开上述实施例提供的K歌音频处理方法,可以确定与目标歌曲的节奏信息匹配的混响音效信息,并基于所确定的混响音效信息,调整目标歌曲的K歌音频的混响音效,这样,本公开的实施能够自动为不同节奏的歌曲适配相应的混响音效,而无需手动调整混响音效,整个过程实施起来非常便捷,且能够有效地保证K歌体验。
在一个可选示例中,节奏信息包括节拍周期,混响音效信息包括混响音效大小值,并且,混响音效大小值与节拍周期呈正相关。
可选地,节拍周期可以是位于0.3秒至1.5秒之间的时长值,并且,目标歌曲的节奏越快,节拍周期可以越小。需要说明的是,节拍周期可以用于衡量目标歌曲的节拍类型和曲速;其中,节拍类型包括但不限于快节拍、中等节拍、慢节拍等;曲速包括但不限于快速、中等速度、慢速等。
在一个具体例子中,可以预先设置第一预设时长值和第二预设时长值,第一预设时长值和第二预设时长值均位于0.3秒与1.5秒之间,且第一预设时长值小于第二预设时长值。如果目标歌曲的节拍周期位于第一预设时长值与第二预设时长值之间,可以认为目标歌曲的节拍类型为中等节拍,目标歌曲的曲速为中等速度;如果目标歌曲的节拍周期小于第一预设时长值,可以认为目标歌曲的节拍类型为快节拍,目标歌曲的曲速为快速;如果目标歌曲的节拍周期大于第二预设时长值,可以认为目标歌曲的节拍类型为慢节拍,目标歌曲的曲速为慢速。
具体实现时,节拍周期可以采用如下流程得到:
(1)将目标歌曲以音乐信号的形式进行输入;
(2)利用一个滤波器组将信号分解成频域上的多个子带;
(3)对各个子带的信号进行起始位置检测;
(4)估计各个子带的周期值;
(5)对所有子带的周期值进行算术平均,以得到目标歌曲的节拍周期。
可选地,混响音效大小值可以是位于0至100之间的数值,也即,混响音效大小值的数值区间可以是0至100。
本公开的实施例中,混响音效大小值与节拍周期呈正相关,这样,目标歌曲的节奏越快,节拍周期越 小,混响音效大小值也越小,混响音效越弱,相反,目标歌曲的节奏越慢,节拍周期越大,混响音效大小值也越大,混响音效越强,可见,本公开的实施例能够满足不同节奏的歌曲对混响音效的需求,而无需手动调整混响音效,从而能够保证K歌体验。
在图1所示实施例的基础上,如图2所示,步骤120包括步骤1201、步骤1203和步骤1205。
步骤1201,将节拍周期映射至预设数值区间,以得到节拍周期的映射数值,节拍周期的映射数值与节拍周期呈负相关。
需要说明的是,预设数值区间可以与上文中提及的混响音效大小值的数值区间关联,具体地,预设数值区间与混响音效大小值的数值区间可以为同一数值区间,这样,预设数值区间也可以为0至100。当然,根据实际需求,预设数值区间和混响音效大小值的数值区间也可以设置为0至50,0至20等,在此不再一一列举。
在一个例子中,节奏周期为0.3秒至1.5秒之间的时长值,预设数值区间为0至100,则可以依据0.3、1.5、0、100这四个数值,构建一个由节拍周期得到映射数值的目标函数,目标函数需要保证0.3与100映射,1.5与0映射,目标函数具体可以为反比例函数、二次函数等。这样,在步骤1201中,只需将目标歌曲的节拍周期提供给目标函数,目标函数即可基于目标歌曲的节拍周期进行运算,从而得到相应的映射数值。
步骤1203,确定预设数值区间的最大取值与节拍周期的映射数值的第一差值。
假设预设数值区间为0至100,则预设数值区间的最大取值为100,在步骤1203中,可以计算100与节拍周期的映射数值的差值,计算得到的差值即为第一差值,这样,在映射数值为100的情况下,第一差值为0,在映射数值为99的情况下,第一差值为1。
步骤1205,基于第一差值,确定混响音效大小值,混响音效大小值与第一差值呈正相关。
在步骤1205中,可以直接将第一差值作为混响音效大小值;或者,可以将第一差值与一预设系数(例如0.90、0.95等)的乘积作为混响音效大小值,该预设系数可以是预先通过多次实验确定的,适合用于混响音效大小值的计算的系数。
本公开的实施例中,通过引入预设数值区间,结合将节拍周期映射为数值的运算,以及减法运算等简单的运算,能够高效可靠地确定与节拍周期对应的混响音效大小值,以便依据混响音效大小值自动调整混响音效。并且,映射数值与节拍周期呈负相关,第一差值与映射数值呈负相关,混响音效大小值与第一差值呈正相关,那么,由节拍周期确定对应的混响音效大小值的计算流程涉及两处负相关和一处正相关,两处负相关和一处正相关的叠加能够较好地保证混响音效大小值与节拍周期之间的正相关,这样,节奏越快的歌曲的混响音效越弱,节奏越慢的歌曲的混响音效越强,也即,本公开的实施例能够依据歌曲的节奏快慢适配较为合适的混响音效,从而保证K歌体验。
需要说明的是,步骤120的具体实现形式并不局限于此,例如,可以预先构建一个直接由节拍周期得到混响音效大小值的函数,该函数能够保证混响音效大小值与节拍周期之间呈正相关,这样,只需将目标 歌曲的节拍周期提供给该函数,该函数即可基于目标歌曲的节拍周期进行运算,从而得到相应的混响音效大小值。
在图1所示实施例的基础上,如图3所示,步骤130包括步骤1301、步骤1303和步骤1305。
步骤1301,基于混响音效信息,确定混响音效处理装置的工作参数。
在一种具体实施方式中,如图4所示,混响音效处理装置包括顺次连接的预延迟模块和第一滤波模块,如图5所示,预延迟模块包括延时互异且并联设置的多个延迟单元(即延时单元1至延时单元n),如图6所示,第一滤波模块包括延时互异且并联设置的多个梳状滤波器(即梳状滤波器1至梳状滤波器n)。
可选地,多个梳状滤波器均可以为低通梳状滤波器,低通梳状滤波器的时域表达式为y(n)=x(n)-gx(n-1)+gy(n-1)+ay(n-D),其中,y(n)为低通梳状滤波器的输出,x(n)为低通梳状滤波器的输入,x(n-D)为延时D的x(n),g为用于低通滤波的增益,a为用于梳状滤波的增益。
步骤1301,包括:
基于混响音效信息,确定混响时间;
基于混响时间,确定多个梳状滤波器各自的增益;
基于多个梳状滤波器各自的增益,确定混响音效处理装置的工作参数。
需要说明的是,混响时间可以表示为T60,混响时间可以是指声源停止发声后,声压级减少60dB所需的时间,单位为秒。
可选地,混响音效信息包括混响音效大小值;
基于混响音效信息,确定混响时间,包括:
确定混响音效大小值与第一预设数值的比值;
确定比值与第二预设数值的和值;
基于和值,确定混响时间。
这里,第一预设数值可以为50,第二预设数值可以为0.5,假设混响音效大小值表示为X,则混响音效大小值与第一预设数值的比值为X/50,比值与第二预设数值的和值为X/50+0.5,在得到和值之后,可以直接将和值确定为混响时间,这样,若混响时间表示为T60,则有:
T60=X/50+0.5
对上述公式进行变换,则有:
X=50(T60-0.5)
参考上述公式,能够高效可靠地由混响音效大小值确定出混响时间。需要指出的是,该公式中涉及的参数值可以根据实际需求进行调整,例如,第一预设数值可以由50调整为40、60或者其它数值,第二预设数值可以由0.5调整为0.4、0.6或者其它数值。
在得到混响时间之后,可以基于混响时间,确定多个梳状滤波器各自的增益,在多个梳状滤波器均为低通梳状滤波器的情况下,多个梳状滤波器各自的增益实质上是指多个梳状滤波器各自用于梳状滤波的增 益(即上文中的a),a可以采用如下公式进行计算:
a=10^(-3D/(fs*T60))
其中,D表示延时,fs表示采样频率。
在得到多个梳状滤波器各自的增益之后,可以基于多个梳状滤波器各自的增益,确定混响音效处理装置的工作参数,混响音效处理装置的工作参数可以包括多个梳状滤波器各自的增益。需要指出的是,根据实际情况,混响音效处理装置的工作参数还可以包括一些其它参数,例如梳状滤波器的延时或者其它参数,延迟单元的延时或者其它参数等,在此不再一一列举。
需要说明的是,混响时间可以直接影响混响音效强弱,有鉴于此,这种实施方式中可以参考混响音效信息确定混响时间,参考混响时间确定多个梳状滤波器各自的增益并据此进一步确定混响音效处理装置的工作参数,这样有利于保证确定出的工作参数与混响音效信息之间的匹配性。
步骤1303,基于工作参数,对混响音效处理装置进行参数设置。
由于工作参数可以包括多个梳状滤波器各自的增益,在步骤1303中,可以对混响音效处理装置进行参数设置,以使多个梳状滤波器各自使用的增益为工作参数中的相应增益。
步骤1305,基于参数设置后的混响音效处理装置对K歌音频进行混响音效处理。
在步骤1305中,可以将K歌音频逐帧提供给参数设置后的混响音效处理装置,参数设置后的混响音效处理装置中的预延迟模块和第一滤波模块会依次进行相关的信息处理,参数设置后的混响音效处理装置最终能够输出经混响音效处理后的K歌音频。
本公开的实施例中,参考与目标歌曲的节奏信息匹配的混响音效信息,能够针对目标歌曲的节奏,合理确定混响音效处理装置的工作参数,后续参考工作参数对混响音效处理装置进行参数设置,并基于参数设置后的混响音效处理装置对K歌音频进行混响音效处理,能够有效地保证经混响音效处理后的K歌音频的混响音效与目标歌曲适配,从而保证K歌体验。
需要指出的是,声音在空气中传播时,高频相比于低频衰减得更快,本公开的实施例中,在多个梳状滤波器均为低通梳状滤波器的情况下,可以通过低通梳状滤波器阻隔高频信号,并使低频信号通过,这样能够与声音在空气中传播的情况相符,从而保证混响音效的自然度。
在一个可选示例中,如图4所示,混响音效处理装置还包括与顺次连接的预延迟模块和第一滤波模块顺次连接的第二滤波模块,如图7所示,第二滤波模块包括串联设置的多个全通滤波器(即全通滤波器1至全通滤波器n),多个全通滤波器中位于末尾的全通滤波器用于输出经混响音效处理后的K歌音频。
如图4所示,混响音效处理装置还可以包括输入模块和输出模块,输入模块可以与预延迟模块连接,输出模块可以与第二滤波模块连接。具体实施时,可以将K歌音频逐帧提供给输入模块,接下来,针对逐帧提供的K歌音频,预延迟模块、第一滤波模块、第二滤波模块会依次进行相关的信息处理,从而得到经混响音效处理后的K歌音频,之后,第二滤波模块中位于末尾的全通滤波器可以通过输出模块逐帧输出经混响音效处理后的K歌音频。
本公开的实施例中,通过包括多个全通滤波器的第二滤波模块的设置,有利于增加回声密度,从而能够保证混响效果。
在一个可选示例中,如图8所示,为了实现本公开的实施例中的K歌音频处理方法,可以设置终端设备810、网络820、服务器830和信息采集设备840。
终端设备810可以是各种能够进行音频播放的设备,包括但不限于车载终端、移动电话、笔记本电脑、数字广播接收器、平板电脑等移动终端,以及数字电视、台式计算机、智能家居等固定终端,终端设备810可以被设置在一个被限定范围的空间850中,例如车辆内部、房间内部等。
网络820可以是用于在终端设备810与服务器830之间提供通信链路的介质,网络820包括但不限于有线通信链路、无线通信链路、光纤电缆等。
服务器830可以是提供各种服务的服务器,例如对终端设备810上播放的音频提供支持的后台音频服务器。
信息采集设备840可以是用于采集用户语音信息(例如上文中的K歌音频)的麦克风,信息采集设备840也可以被设置在空间850中。
具体实施时,在空间850中,用户可以在终端设备810上进行点歌,这时,如图9所示,终端设备810可以获取当前歌曲信息(例如歌曲名称),并将该歌曲信息通过网络820传输到服务器830。服务器830可以通过检测音乐节拍类型与曲速区分歌曲类型(相当于上文中的确定目标歌曲的节奏信息),并根据不同歌曲类型设定不同混响音效(相当于上文中的确定与节奏信息匹配的混响音效信息)。之后,麦克风获取人声,终端设备810或者服务器830对人声进行混响音效处理(相当于上文中的基于混响音效信息,调整目标歌曲的K歌音频的混响音效),最终将处理后的人声与伴奏混合起来通过扬声器进行播放。
本公开实施例提供的任一种K歌音频处理方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一种K歌音频处理方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种K歌音频处理方法。下文不再赘述。
示例性装置
图10是本公开一示例性实施例提供的K歌音频处理装置的结构示意图。图10所示的装置包括获取模块1010、确定模块1020和处理模块1030。
获取模块1010,用于获取目标歌曲的节奏信息;
确定模块1020,用于确定与获取模块1010获取的节奏信息匹配的混响音效信息;
处理模块1030,用于基于确定模块1020确定的混响音效信息,调整目标歌曲的K歌音频的混响音效。
在一个可选示例中,节奏信息包括节拍周期,混响音效信息包括混响音效大小值,并且,混响音效大小值与节拍周期呈正相关。
在一个可选示例中,如图11所示,确定模块1020,包括:
映射子模块10201,用于将节拍周期映射至预设数值区间,以得到节拍周期的映射数值,节拍周期的映射数值与节拍周期呈负相关;
第一确定子模块10203,用于确定预设数值区间的最大取值与映射子模块10201得到的节拍周期的映射数值的第一差值;
第二确定子模块10205,用于基于第一确定子模块10203确定的第一差值,确定混响音效大小值,混响音效大小值与第一差值呈正相关。
在一个可选示例中,如图11所示,处理模块1030,包括:
第三确定子模块10301,用于基于确定模块1020确定的混响音效信息,确定混响音效处理装置的工作参数;
参数设置子模块10303,用于基于第三确定子模块10301确定的工作参数,对混响音效处理装置进行参数设置;
处理子模块10305,用于基于由参数设置子模块10303进行参数设置后的混响音效处理装置对K歌音频进行混响音效处理。
在一个可选示例中,混响音效处理装置包括顺次连接的预延迟模块和第一滤波模块,预延迟模块包括延时互异且并联设置的多个延迟单元,第一滤波模块包括延时互异且并联设置的多个梳状滤波器;
第三确定子模块,包括:
第一确定单元,用于基于确定模块1020确定的混响音效信息,确定混响时间;
第二确定单元,用于基于第一确定单元确定的混响时间,确定多个梳状滤波器各自的增益;
第三确定单元,用于基于第二确定单元确定的多个梳状滤波器各自的增益,确定混响音效处理装置的工作参数。
在一个可选示例中,混响音效信息包括混响音效大小值;
第一确定单元,包括:
第一确定子单元,用于确定混响音效大小值与第一预设数值的比值;
第二确定子单元,用于确定第一确定子单元确定的比值与第二预设数值的和值;
第三确定子单元,用于基于第二确定子单元确定的和值,确定混响时间。
在一个可选示例中,混响音效处理装置还包括与顺次连接的预延迟模块和第一滤波模块顺次连接的第二滤波模块,第二滤波模块包括串联设置的多个全通滤波器,多个全通滤波器中位于末尾的全通滤波器用于输出经混响音效处理后的K歌音频。
在一个可选示例中,多个梳状滤波器均为低通梳状滤波器。
示例性电子设备
下面,参考图12来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
图12图示了根据本公开实施例的电子设备的框图。
如图12所示,电子设备1200包括一个或多个处理器1210和存储器1220。
处理器1210可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备1200中的其他组件以执行期望的功能。
存储器1220可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器1210可以运行所述程序指令,以实现上文所述的本公开的各个实施例的K歌音频处理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如音频数据、歌曲类型、混响音效信息等各种内容。
在一个示例中,电子设备1200还可以包括:输入装置1230和输出装置1240,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,在该电子设备是第一设备或第二设备时,该输入装置1230可以是麦克风或麦克风阵列,以输入接收到的人声数据。在该电子设备是单机设备时,该输入装置13可以是通信网络连接器,用于从第一设备和第二设备接收所采集的输入信号。
此外,该输入装置1230还可以包括例如键盘、鼠标等等。输入装置1230可以用于输入点歌信息。
该输出装置1240可以向外部输出各种信息,包括经过混响音效处理后的K歌音频与伴奏的混音信号等。该输出装置1240可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图12中仅示出了该电子设备1200中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备1200还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的K歌音频处理方法中的步骤。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须 采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

Claims (11)

  1. 一种K歌音频处理方法,包括:
    获取目标歌曲的节奏信息;
    确定与所述节奏信息匹配的混响音效信息;
    基于所述混响音效信息,调整所述目标歌曲的K歌音频的混响音效。
  2. 根据权利要求1所述的方法,其中,所述节奏信息包括节拍周期,所述混响音效信息包括混响音效大小值,并且,所述混响音效大小值与所述节拍周期呈正相关。
  3. 根据权利要求2所述的方法,其中,所述确定与所述节奏信息匹配的混响音效信息,包括:
    将所述节拍周期映射至预设数值区间,以得到节拍周期的映射数值,所述节拍周期的映射数值与所述节拍周期呈负相关;
    确定所述预设数值区间的最大取值与所述节拍周期的映射数值的第一差值;
    基于所述第一差值,确定所述混响音效大小值,所述混响音效大小值与所述第一差值呈正相关。
  4. 根据权利要求1所述的方法,其中,所述基于所述混响音效信息,调整所述目标歌曲的K歌音频的混响音效,包括:
    基于所述混响音效信息,确定混响音效处理装置的工作参数;
    基于所述工作参数,对所述混响音效处理装置进行参数设置;
    基于所述参数设置后的混响音效处理装置对所述K歌音频进行混响音效处理。
  5. 根据权利要求4所述的方法,其中,所述混响音效处理装置包括顺次连接的预延迟模块和第一滤波模块,所述预延迟模块包括延时互异且并联设置的多个延迟单元,所述第一滤波模块包括延时互异且并联设置的多个梳状滤波器;
    所述基于所述混响音效信息,确定混响音效处理装置的工作参数,包括:
    基于所述混响音效信息,确定混响时间;
    基于所述混响时间,确定所述多个梳状滤波器各自的增益;
    基于所述多个梳状滤波器各自的增益,确定所述混响音效处理装置的工作参数。
  6. 根据权利要求5所述的方法,其中,所述混响音效信息包括混响音效大小值;
    所述基于所述混响音效信息,确定混响时间,包括:
    确定所述混响音效大小值与第一预设数值的比值;
    确定所述比值与第二预设数值的和值;
    基于所述和值,确定混响时间。
  7. 根据权利要求5所述的方法,其中,所述混响音效处理装置还包括与所述顺次连接的预延迟模块和第一滤波模块顺次连接的第二滤波模块,所述第二滤波模块包括串联设置的多个全通滤波器,所述多个全通滤波器中位于末尾的全通滤波器用于输出经所述混响音效处理后的所述K歌音频。
  8. 根据权利要求5-7任一所述的方法,其中,所述多个梳状滤波器均为低通梳状滤波器。
  9. 一种K歌音频处理装置,包括:
    获取模块,用于获取目标歌曲的节奏信息;
    确定模块,用于确定与所述获取模块获取的所述节奏信息匹配的混响音效信息;
    处理模块,用于基于所述确定模块确定的所述混响音效信息,调整所述目标歌曲的K歌音频的混响音效。
  10. 一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-8任一所述的K歌音频处理方法。
  11. 一种电子设备,所述电子设备包括:
    处理器;
    用于存储所述处理器可执行指令的存储器;
    所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-8任一所述的K歌音频处理方法。
PCT/CN2023/074424 2022-05-18 2023-02-03 K歌音频处理方法、装置及计算机可读存储介质 WO2023221559A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202210542761.4 2022-05-18
CN202210542761.4A CN114842820A (zh) 2022-05-18 2022-05-18 K歌音频处理方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
WO2023221559A1 true WO2023221559A1 (zh) 2023-11-23

Family

ID=82571143

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2023/074424 WO2023221559A1 (zh) 2022-05-18 2023-02-03 K歌音频处理方法、装置及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN114842820A (zh)
WO (1) WO2023221559A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114842820A (zh) * 2022-05-18 2022-08-02 北京地平线信息技术有限公司 K歌音频处理方法、装置及计算机可读存储介质
CN115410544B (zh) * 2022-08-26 2024-01-30 镁佳(北京)科技有限公司 一种音效处理方法、装置及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06130943A (ja) * 1992-10-21 1994-05-13 Kawai Musical Instr Mfg Co Ltd 音響効果装置
JPH06138871A (ja) * 1992-10-23 1994-05-20 Kawai Musical Instr Mfg Co Ltd 音響効果装置
JPH06308988A (ja) * 1993-04-19 1994-11-04 Yamaha Corp カラオケ装置
US5424487A (en) * 1992-10-21 1995-06-13 Kabushiki Kaisha Kawai Gakki Seisakusho Sound effect-creating device
CN101034548A (zh) * 2006-02-14 2007-09-12 意法半导体亚太私人有限公司 生成和控制用于音频信号的数字混响的方法和系统
CN105336320A (zh) * 2015-09-29 2016-02-17 南通大学 一种弹簧混响模型
CN109686347A (zh) * 2018-11-30 2019-04-26 北京达佳互联信息技术有限公司 音效处理方法、音效处理装置、电子设备和可读介质
CN113470669A (zh) * 2021-05-26 2021-10-01 广州市迪士普音响科技有限公司 一种数字音频处理方法及系统
CN114842820A (zh) * 2022-05-18 2022-08-02 北京地平线信息技术有限公司 K歌音频处理方法、装置及计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06130943A (ja) * 1992-10-21 1994-05-13 Kawai Musical Instr Mfg Co Ltd 音響効果装置
US5424487A (en) * 1992-10-21 1995-06-13 Kabushiki Kaisha Kawai Gakki Seisakusho Sound effect-creating device
JPH06138871A (ja) * 1992-10-23 1994-05-20 Kawai Musical Instr Mfg Co Ltd 音響効果装置
JPH06308988A (ja) * 1993-04-19 1994-11-04 Yamaha Corp カラオケ装置
CN101034548A (zh) * 2006-02-14 2007-09-12 意法半导体亚太私人有限公司 生成和控制用于音频信号的数字混响的方法和系统
CN105336320A (zh) * 2015-09-29 2016-02-17 南通大学 一种弹簧混响模型
CN109686347A (zh) * 2018-11-30 2019-04-26 北京达佳互联信息技术有限公司 音效处理方法、音效处理装置、电子设备和可读介质
CN113470669A (zh) * 2021-05-26 2021-10-01 广州市迪士普音响科技有限公司 一种数字音频处理方法及系统
CN114842820A (zh) * 2022-05-18 2022-08-02 北京地平线信息技术有限公司 K歌音频处理方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN114842820A (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
WO2023221559A1 (zh) K歌音频处理方法、装置及计算机可读存储介质
RU2743315C1 (ru) Способ классификации музыки и способ детектирования долей музыкального такта, носитель данных и компьютерное устройство
KR20130112898A (ko) 시간 변화 정보를 갖는 기저 함수를 사용한 음악 신호의 분해
CN110211556B (zh) 音乐文件的处理方法、装置、终端及存储介质
US20090052681A1 (en) System and a method of processing audio data, a program element, and a computer-readable medium
WO2014106375A1 (zh) 信息处理的方法、装置和系统
WO2019233361A1 (zh) 对音乐进行音量调节的方法及设备
Colonel et al. Reverse engineering of a recording mix with differentiable digital signal processing
KR100813272B1 (ko) 스테레오 스피커를 이용한 저음 보강 장치 및 방법
US20190172477A1 (en) Systems and methods for removing reverberation from audio signals
US20230186782A1 (en) Electronic device, method and computer program
WO2018066383A1 (ja) 情報処理装置および方法、並びにプログラム
US20220101821A1 (en) Device, method and computer program for blind source separation and remixing
CN112365868A (zh) 声音处理方法、装置、电子设备及存储介质
US8005234B2 (en) Method for synthesizing impulse response and method for creating reverberation
JP2001292491A (ja) イコライザ装置
JP7256164B2 (ja) オーディオ処理装置及びオーディオ処理方法
US20220076687A1 (en) Electronic device, method and computer program
JP5696828B2 (ja) 信号処理装置
Ronan et al. Loudness normalisation: paradigm shift or placebo for the use of hyper-compression in pop music?
US11740862B1 (en) Method and system for accelerated decomposing of audio data using intermediate data
CN113345394B (zh) 音频数据的处理方法、装置、电子设备及存储介质
Evangelista et al. Sound source separation
US11380345B2 (en) Real-time voice timbre style transform
US20230057082A1 (en) Electronic device, method and computer program

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23806521

Country of ref document: EP

Kind code of ref document: A1