CN116959503A - 滑音音频的模拟方法、装置和存储介质及电子设备 - Google Patents
滑音音频的模拟方法、装置和存储介质及电子设备 Download PDFInfo
- Publication number
- CN116959503A CN116959503A CN202310923883.2A CN202310923883A CN116959503A CN 116959503 A CN116959503 A CN 116959503A CN 202310923883 A CN202310923883 A CN 202310923883A CN 116959503 A CN116959503 A CN 116959503A
- Authority
- CN
- China
- Prior art keywords
- target
- audio
- frequency
- sliding
- tone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 116
- 238000004088 simulation Methods 0.000 title claims abstract description 57
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 230000008859 change Effects 0.000 claims abstract description 246
- 230000001960 triggered effect Effects 0.000 claims abstract description 24
- 239000011295 pitch Substances 0.000 claims description 62
- 230000004044 response Effects 0.000 claims description 56
- 230000008569 process Effects 0.000 claims description 40
- 238000012360 testing method Methods 0.000 claims description 39
- 238000005070 sampling Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 18
- 230000001133 acceleration Effects 0.000 claims description 16
- 238000006073 displacement reaction Methods 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 22
- 230000000694 effects Effects 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 238000012952 Resampling Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 208000023514 Barrett esophagus Diseases 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/75—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 for modelling vocal tract parameters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
- G10H7/08—Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Electrophonic Musical Instruments (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了一种滑音音频的模拟方法、装置和存储介质及电子设备。其中,该方法包括:获取滑音样本音频和单音样本音频,其中,滑音样本音频和单音样本音频的起始音高相同;获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化;基于第一谐波强度变化与第二谐波强度变化确定目标谐波强度变化;响应于对目标单音标识触发的滑音操作,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。本申请解决了滑音音频的模拟效率较低的技术问题。
Description
技术领域
本申请涉及计算机领域,具体而言,涉及一种滑音音频的模拟方法、装置和存储介质及电子设备。
背景技术
在滑音音频的模拟场景中,需要尽可能多地录制音频采样,然而,因为音乐的组合是无穷无尽的,所以单靠录音来解决,所需要的音频采样量是海量,进而导致滑音音频的模拟效率较低的问题出现。因此,存在滑音音频的模拟效率较低的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种滑音音频的模拟方法、装置和存储介质及电子设备,以至少解决滑音音频的模拟效率较低的技术问题。
根据本申请实施例的一个方面,提供了一种滑音音频的模拟方法,包括:获取滑音样本音频和单音样本音频,其中,上述滑音样本音频和上述单音样本音频的起始音高相同;获取上述滑音样本音频对应的第一谐波强度变化,和上述单音样本音频对应的第二谐波强度变化,其中,上述第一谐波强度变化用于表示上述滑音样本音频在不同频率上的能量或振幅大小与上述滑音样本音频在基频上的能量或振幅大小之间的比值变化,上述第二谐波强度变化用于表示上述单音样本音频在不同频率上的能量或振幅大小与上述单音样本音频在基频上的能量或振幅大小之间的比值变化;基于上述第一谐波强度变化与上述第二谐波强度变化确定目标谐波强度变化,其中,上述目标谐波强度变化用于表示上述单音样本音频在不同频率上因滑音而产生的能量或振幅变化;响应于对目标单音标识触发的滑音操作,利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。
根据本申请实施例的另一方面,还提供了一种滑音音频的模拟装置,包括:第一获取单元,用于获取滑音样本音频和单音样本音频,其中,上述滑音样本音频和上述单音样本音频的起始音高相同;第二获取单元,用于获取上述滑音样本音频对应的第一谐波强度变化,和上述单音样本音频对应的第二谐波强度变化,其中,上述第一谐波强度变化用于表示上述滑音样本音频在不同频率上的能量或振幅大小与上述滑音样本音频在基频上的能量或振幅大小之间的比值变化,上述第二谐波强度变化用于表示上述单音样本音频在不同频率上的能量或振幅大小与上述单音样本音频在基频上的能量或振幅大小之间的比值变化;确定单元,用于基于上述第一谐波强度变化与上述第二谐波强度变化确定目标谐波强度变化,其中,上述目标谐波强度变化用于表示上述单音样本音频在不同频率上因滑音而产生的能量或振幅变化;模拟单元,用于响应于对目标单音标识触发的滑音操作,利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。
作为一种可选的方案,上述模拟单元,包括:第一获取模块,用于获取上述目标单音音频关联的各个第一频率;第一确定模块,用于从上述目标谐波强度变化中确定出与上述各个第一频率匹配的强度变化信息,其中,上述强度变化信息用于上述目标单音音频在上述各个第一频率上因滑音而产生的能量或振幅变化;第一模拟模块,用于利用上述强度变化信息,增益\衰减上述目标单音音频在上述各个第一频率上的能量或振幅,模拟出上述目标滑音音频,其中,上述目标滑音音频在上述各个第一频率上的能量或振幅与上述目标单音音频在上述各个第一频率上的能量或振幅符合上述强度变化信息。
作为一种可选的方案,上述第二获取单元,包括:第二获取模块,用于获取用于表示上述滑音样本音频在N个关键频率上的能量或振幅大小的上述第一谐波强度变化,和用于表示上述单音样本音频在上述N个关键频率上的能量或振幅大小的上述第二谐波强度变化,其中,上述N个关键频率包括上述第一频率。
作为一种可选的方案,上述第二获取单元,包括:分析模块,用于在获取到上述滑音样本音频对应的基频变化曲线的情况下,基于上述基频变化曲线分析上述滑音样本音频在各个时段不同音高下的谐波序列及强度变化,得到上述第一谐波强度变化,其中,上述基频变化曲线用于表示上述滑音样本音频的基频随时间的变化情况。
作为一种可选的方案,上述分析模块,包括:计算子模块,用于利用上述基频变化曲线计算出上述滑音样本音频的谐波变化曲线;确定子模块,用于从上述谐波变化曲线上确定出上述滑音样本音频在各个时段不同基频下的频率变化曲线;转换子模块,用于以频率与基频之间的比值形式,将上述频率变化曲线转换为上述第一谐波强度变化。
作为一种可选的方案,上述确定单元,包括:相除模块,用于通过逐点相除上述第一谐波强度变化与上述第二谐波强度变化的值,得到上述目标谐波强度变化。
作为一种可选的方案,上述装置还包括:第三获取模块,用于在上述通过逐点相除上述第一谐波强度变化与上述第二谐波强度变化的值,得到上述目标谐波强度变化之前,获取上述滑音样本音频的第一时间信息,其中,上述第一时间信息用于记录上述滑音样本音频的第一起始时间和第一中止时间;筛选模块,用于在上述通过逐点相除上述第一谐波强度变化与上述第二谐波强度变化的值,得到上述目标谐波强度变化之前,利用上述第一时间信息对上述第一谐波强度变化和上述第二谐波强度变化进行筛选,得到上述第一起始时间和上述第一中止时间之间的第一目标谐波强度变化和第二目标谐波强度变化;上述相除模块,包括:相除子模块,用于通过逐点相除上述第一目标谐波强度变化与第二目标谐波强度变化,得到上述第一起始时间和上述第一中止时间之间的上述目标谐波强度变化。
作为一种可选的方案,上述模拟单元,包括:第四获取模块,用于获取上述目标单音音频的初始音频;第二模拟模块,用于以上述初始音频为上述目标单音音频的基频,模拟出上述目标单音音频对应的目标谐波序列及上述目标谐波序列上的各个第二音频上的强度变化;第五获取模块,用于获取上述滑音操作的实时位移距离,并基于上述实时位移距离确定上述滑音操作的第二时间信息,其中,上述用于记录上述滑音操作的第二起始时间和第二中止时间,上述第一时间信息包括上述第二时间信息;第二确定模块,用于从上述目标谐波强度变化中确定出上述第二起始时间和上述第二中止时间之间的指定谐波强度变化,其中,上述指定谐波强度变化用于表示上述目标单音音频在不同频率上因滑音而产生的能量或振幅变化;第三模拟模块,用于利用上述指定谐波强度变化,增益\衰减上述目标单音音频在上述各个第二音频上的能量或振幅,模拟出上述目标滑音音频,其中,上述目标滑音音频的谐波序列为上述目标谐波序列,上述目标单音音频在上述各个第二频率上的能量或振幅与上述目标单音音频在上述目标单音音频的基频上的能量或振幅之间的比值变化符合上述指定谐波强度变化。
作为一种可选的方案,上述装置还包括:采样单元,用于在上述利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频之前,分别使用扫频测试信号和白噪测试信号对待模拟的实体乐器进行响应采样,得到扫频响应信号与冲击响应信号,其中,上述扫频测试信号为一定频率范围内连续改变信号频率的信号,上述白噪测试信号为具有均匀频谱分布的随机信号,上述扫频响应信号为上述实体乐器接收到上述扫频测试信号后的响应信号,上述冲击响应信号为上述实体乐器接收到上述白噪测试信号后的响应信号;差异单元,用于在上述利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频之前,获取上述扫频响应信号与上述冲击响应信号之间的频率强度差异,其中,上述频率强度差异用于表示上述实体乐器共振的频谱特征;上述装置还包括:结合单元,用于在上述利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,获取上述目标单音音频的当前音高,并结合上述频率强度差异确定卷积运算参数;第一整合单元,用于在上述利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,在利用上述目标谐波强度变化对上述目标单音音频进行能量或振幅变化,得到候选滑音音频的情况下,利用上述卷积运算参数对上述候选滑音音频和上述冲击响应信号进行整合处理,模拟出上述目标滑音音频。
作为一种可选的方案,上述装置还包括:第三获取单元,用于在上述利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,获取对上述目标单音标识触发的目标操作对应的操作加速度,其中,上述目标操作包括上述滑音操作;第四获取单元,用于在上述利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,获取与上述操作加速度相匹配的噪声音频;第二整合单元,用于在上述利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,在利用上述目标谐波强度变化对上述目标单音音频进行能量或振幅变化,得到备选滑音音频的情况下,对上述噪声音频和上述备选滑音音频进行整合处理,模拟出上述目标滑音音频。
根据本申请实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上滑音音频的模拟方法。
根据本申请实施例的又一方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的滑音音频的模拟方法。
在本申请实施例中,获取滑音样本音频和单音样本音频,其中,上述滑音样本音频和上述单音样本音频的起始音高相同;获取上述滑音样本音频对应的第一谐波强度变化,和上述单音样本音频对应的第二谐波强度变化,其中,上述第一谐波强度变化用于表示上述滑音样本音频在不同频率上的能量或振幅大小与上述滑音样本音频在基频上的能量或振幅大小之间的比值变化,上述第二谐波强度变化用于表示上述单音样本音频在不同频率上的能量或振幅大小与上述单音样本音频在基频上的能量或振幅大小之间的比值变化;基于上述第一谐波强度变化与上述第二谐波强度变化确定目标谐波强度变化,其中,上述目标谐波强度变化用于表示上述单音样本音频在不同频率上因滑音而产生的能量或振幅变化;响应于对目标单音标识触发的滑音操作,利用上述目标谐波强度变化对上述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。通过谐波强度变化表达出单音音频在不同频率上因滑音而产生的能量或振幅变化,并利用该因滑音而产生的能量或振幅变化模拟出滑音音频,进而达到了降低滑音样本音频和单音样本音频在滑音音频模拟过程中的使用数量的目的,从而实现了提高滑音音频的模拟效率的技术效果,进而解决了滑音音频的模拟效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种可选的滑音音频的模拟方法的应用环境的示意图;
图2是根据本申请实施例的一种可选的滑音音频的模拟方法的流程的示意图;
图3是根据本申请实施例的一种可选的滑音音频的模拟方法的示意图;
图4是根据本申请实施例的另一种可选的滑音音频的模拟方法的示意图;
图5是根据本申请实施例的另一种可选的滑音音频的模拟方法的示意图;
图6是根据本申请实施例的另一种可选的滑音音频的模拟方法的示意图;
图7是根据本申请实施例的另一种可选的滑音音频的模拟方法的示意图;
图8是根据本申请实施例的另一种可选的滑音音频的模拟方法的示意图;
图9是根据本申请实施例的另一种可选的滑音音频的模拟方法的示意图;
图10是根据本申请实施例的另一种可选的滑音音频的模拟方法的示意图;
图11是根据本申请实施例的一种可选的滑音音频的模拟装置的示意图;
图12是根据本申请实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种滑音音频的模拟方法,可选地,作为一种可选的实施方式,上述滑音音频的模拟方法可以但不限于应用于如图1所示的环境中。其中,可以但不限于包括用户设备102以及服务器112,该用户设备102上可以但不限于包括显示器104、处理器106及存储器108,该服务器112包括数据库114以及处理引擎116。
具体过程可如下步骤:
步骤S102,用户设备102获取滑音样本音频和单音样本音频,其中,滑音样本音频和单音样本音频的起始音高相同;
步骤S104-S106,通过网络110将滑音样本音频和单音样本音频发送至服务器112;
步骤S108-S110,服务器112通过处理引擎116获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化,并进一步基于第一谐波强度变化与第二谐波强度变化确定目标谐波强度变化;
步骤S112-S114,通过网络110将目标谐波强度变化发送至用户设备102;
步骤S116-S118,用户设备102获取对目标单音标识触发的滑音操作,并进一步通过处理器106响应于对目标单音标识触发的滑音操作,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频,并将目标滑音音频对应的音频信息显示在显示器104,并将上述目标滑音音频存储在存储器108。
除图1示出的示例之外,上述步骤可以由用户设备或服务器独立完成,或由用户设备和服务器共同协作完成,如由用户设备102执行上述S108-S110等步骤,从而减轻服务器112的处理压力。该用户设备102包括但不限于手持设备(如手机)、笔记本电脑、平板电脑、台式电脑、车载设备、智能电视等,本申请并不限制用户设备102的具体实现方式。服务器112可以是单个的服务器或者是多个服务器组成的服务器集群,也可以是云服务器。
可选地,作为一种可选的实施方式,如图2所示,滑音音频的模拟方法可以由电子设备执行,如图1所示的用户设备或服务器,具体步骤包括:
S202,获取滑音样本音频和单音样本音频,其中,滑音样本音频和单音样本音频的起始音高相同;
S204,获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化,其中,第一谐波强度变化用于表示滑音样本音频在不同频率上的能量或振幅大小与滑音样本音频在基频上的能量或振幅大小之间的比值变化,第二谐波强度变化用于表示单音样本音频在不同频率上的能量或振幅大小与单音样本音频在基频上的能量或振幅大小之间的比值变化;
S206,基于第一谐波强度变化与第二谐波强度变化确定目标谐波强度变化,其中,目标谐波强度变化用于表示单音样本音频在不同频率上因滑音而产生的能量或振幅变化;
S208,响应于对目标单音标识触发的滑音操作,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。
可选地,在本实施例中,上述滑音音频的模拟方法可以但不限于应用在古琴模拟软件的应用场景。古琴演奏技法可笼统分为固定音和走手音,且以走手音或说滑音为主要特色。固定音原理较为简单,但滑音在演奏过程中,因其音色变化非常复杂,以至于缺少成熟的古琴模拟软件,能让用户通过虚拟界面,实时且真实地演奏出古琴滑音。而本实施例提出一种将古琴单音变换为任意长度、任意幅度滑音的软件虚拟演奏实时算法,使得用户能更简单、自由地来接触、演奏古琴。此外,本实施例不仅可以应用于古琴滑音模拟,还可以应用于其他类似的、弦类乐器的滑音模拟,如二胡、小提琴、大提琴等。
可选地,在本实施例中,滑音可以但不限是指在音乐演奏过程中,以连续和平稳的方式滑过一系列音符或音域,通常用于键盘乐器、弦乐器或管乐器等演奏中,可以加入音乐作品中以增加表现力和音乐效果。进而滑音样本音频可以但不限为在音乐演奏过程中,以连续和平稳的方式滑过一系列音符或音域过程中采集到的音频样本。
可选地,在本实施例中,单音可以但不限是指音乐中只有一个声部或只有一个声音在独立演奏。进而滑音样本音频可以但不限为在音乐演奏过程中,以一个声音在独立演奏过程中采集到的音频样本。
可选地,在本实施例中,起始音高可以但不限指的是音乐中某一个音符或音序的音高定位,表示了音符或音序在音乐谱表上的位置,用来确定演奏时应该从哪个音高开始演奏。起始音高通常用音乐记谱法来表示,例如使用标准五线谱,具体音高可以通过谱号和音符的位置来确定。在不同的调式和音乐作品中,起始音高会有所变化,决定了音乐的调性和音域范围;
此外,音高可以但不限是指用户主观上感知到的音调高低的属性,与音波的频率有关。音高越高,对应的频率就越高;音高越低,对应的频率就越低。在音乐中,常用标准音高A4(440Hz)作为参考,其他音符的音高则相对地以半音或全音的间隔来测量和表示。基频可以但不限是指声音中最主要的频率分量,音高决定了声音的音调(pitch)。在物理学和声学中,每个声音都可以看作是由一系列谐波组成的。而基频则是这些谐波中最低频率的成分,也是人耳最容易察觉到的频率。基频可以但不限决定了声音的音高,更高的基频对应较高的音高,更低的基频对应较低的音高。
可选地,在本实施例中,频率可以但不限是指声音或信号中周期性振动发生的次数,而可以但不限通过频点的方式表示特定的频率,对于频率上的能量或振幅大小,也可以但不限理解为频点上的能量或振幅大小。
可选地,在本实施例中,不同频率上的能量或振幅大小通常是由信号的频谱特性决定的,其中,频谱是描述信号在不同频率上的能量分布情况的表示方式。频谱图通常用于可视化这种能量分布。在频谱图中,横轴表示频率,纵轴表示能量或振幅。对于某个特定的声音或信号,可能在某些频率上具有较高的能量或振幅,而在其他频率上能量或振幅较低。这取决于信号的频率成分以及特定的声音或信号所占据的强度。
以音乐为例,不同乐器演奏的声音往往在不同频率上具有不同的能量分布。例如,低音大提琴通常在低频范围内产生较高能量的声音,而小提琴则在中高频范围内产生较高能量的声音。因此,在听觉上,用户会感知到音色的差异。
可选地,在本实施例中,不同频率上的能量或振幅大小可以但不限理解为谐波强度,基频上的能量或振幅大小可以但不限理解为基频强度,其中,基频通常会随着音高的变化而变化,进而音高随着时间变化而变化的滑音样本音频对应基频就是变化的,音高随着时间变化而不变的单音样本音频对应基频就是不变的,如此滑音样本音频对应有多个基频,而不同基频又对应各自的谐波,而单音样本音频只对应一个基频,如此直接计算滑音样本音频与单音样本音频之间的谐波强度差(不同频率上因滑音而产生的能量或振幅变化),就需要先处理为相同维度,如统一为相同的唯一基频,否则就无法顺利得到谐波强度差。
而在本实施例中,为提高滑音音频的模拟效率,选择比值变化将谐波强度差进行表达的方式,省去处理为相同维度的这一步骤,其中,比值变化可以但不限用于表示的是谐波和基频之间的强度比值变化,进而无论基频是不是不同的,比值变化表达的都是相同维度的倍数变化,而与具体的基频并不关联,进而就可顺利得到谐波强度差。
可选地,在本实施例中,如图3所示,虚拟乐器302的模拟界面304上显示有多个单音标识,如单音标识1、单音标识2、单音标识3、单音标识4、单音标识5、单音标识6,进一步获取到对单音标识6(目标单音标识)触发的单音操作,且在单音操作执行的过程中,获取到对单音标识6(目标单音标识)触发的滑音操作,进一步输出的就是为虚拟乐器302模拟出的目标滑音音频。
可选地,在本实施例中,模拟出的目标滑音音除包含因滑音而产生的能量或振幅变化外,还可以但不限将音高、噪声、共振等声音因素都整合进内,如对单音进行重新采样(Resample)处理,通过插入中间值,实时改变当前缓冲区(Buffer)内采样点的密度,以实现无损变调,完成对音高的模拟,其中,Resample可以但不限是指改变数据的采样率,即改变数据点之间的时间或空间间隔,以适应不同的需求或信号处理操作,Resample的过程可以但不限涉及插值、滤波和截断等技术,以保持信号质量并防止混叠误差(aliasing)的引入。
需要说明的是,本实施例模拟出的目标滑音音频,并不是直接输出目标单音标识预先匹配的目标滑音音频,而是随着目标单音标识匹配的目标单音音频的实时音频频率变化,利用目标谐波强度变化,对目标单音音频进行实时的能量或振幅变化,进而无论目标单音音频出现何种变化,都可根据实时音频频率进行实时的能量或振幅变化。
进一步举例说明,可选的例如图4所示,通过对实体乐器402的演奏操作,采集滑音样本音频404-1和单音样本音频404-2,其中,滑音样本音频404-1和单音样本音频404-2的起始音高相同;获取滑音样本音频404-1对应的第一谐波强度变化406-1,和单音样本音频404-2对应的第二谐波强度变化406-2;基于第一谐波强度变化406-1与第二谐波强度变化406-2确定目标谐波强度变化408;响应于对实体乐器402对应的模拟界面410上显示的目标单音标识412触发的滑音操作,利用目标谐波强度变化408对目标单音标识412匹配的目标单音音频414进行能量或振幅变化,模拟出目标滑音音频416。
通过本申请提供的实施例,获取滑音样本音频和单音样本音频,其中,滑音样本音频和单音样本音频的起始音高相同;获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化,其中,第一谐波强度变化用于表示滑音样本音频在不同频率上的能量或振幅大小与滑音样本音频在基频上的能量或振幅大小之间的比值变化,第二谐波强度变化用于表示单音样本音频在不同频率上的能量或振幅大小与单音样本音频在基频上的能量或振幅大小之间的比值变化;基于第一谐波强度变化与第二谐波强度变化确定目标谐波强度变化,其中,目标谐波强度变化用于表示单音样本音频在不同频率上因滑音而产生的能量或振幅变化;响应于对目标单音标识触发的滑音操作,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。通过谐波强度变化表达出单音音频在不同频率上因滑音而产生的能量或振幅变化,并利用该因滑音而产生的能量或振幅变化模拟出滑音音频,进而达到了降低滑音样本音频和单音样本音频在滑音音频模拟过程中的使用数量的目的,从而实现了提高滑音音频的模拟效率的技术效果。
作为一种可选的方案,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频,包括:
S1-1,获取目标单音音频关联的各个第一频率;
S1-2,从目标谐波强度变化中确定出与各个第一频率匹配的强度变化信息,其中,强度变化信息用于目标单音音频在各个第一频率上因滑音而产生的能量或振幅变化;
S1-3,利用强度变化信息,增益\衰减目标单音音频在各个第一频率上的能量或振幅,模拟出目标滑音音频,其中,目标滑音音频在各个第一频率上的能量或振幅与目标单音音频在各个第一频率上的能量或振幅符合强度变化信息。
需要说明的是,由于滑音操作力度、角度、位置,和单音标识之间的组合多样性,导致单音音频的滑音变化也是多样的,如果将各个单音音频对应的滑音音频都预先生成,并与单音标识进行匹配,无论是匹配的工作量,还是采样的数据量,都需要耗费大量成本和时间,进而会降低滑音音频的模拟效率。
而在本实施例中,由于目标谐波强度变化用于表示单音样本音频在不同频率上因滑音而产生的能量或振幅变化,进而获取到对目标单音标识触发的滑音操作,可以但不限先确定目标单音标识匹配的目标单音音频对应的实时音频频率,再从目标谐波强度变化中确定出实时音频频率上因滑音而产生的能量或振幅变化,再利用该能量或振幅变化对目标单音音频进行能量或振幅变化(衰减或增幅),实现低成本且高效的滑音音频模拟。
通过本申请提供的实施例,获取目标单音音频关联的各个第一频率;从目标谐波强度变化中确定出与各个第一频率匹配的强度变化信息,其中,强度变化信息用于目标单音音频在各个第一频率上因滑音而产生的能量或振幅变化;利用强度变化信息,增益\衰减目标单音音频在各个第一频率上的能量或振幅,模拟出目标滑音音频,其中,目标滑音音频在各个第一频率上的能量或振幅与目标单音音频在各个第一频率上的能量或振幅符合强度变化信息,进而达到了降低滑音样本音频和单音样本音频在滑音音频模拟过程中的使用数量的目的,从而实现了提高滑音音频的模拟效率的技术效果。
作为一种可选的方案,获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化,包括:
获取用于表示滑音样本音频在N个关键频率上的能量或振幅大小的第一谐波强度变化,和用于表示单音样本音频在N个关键频率上的能量或振幅大小的第二谐波强度变化,其中,N个关键频率包括第一频率。
可选地,在本实施例中,关键频率可以但不限为人耳对乐音较为敏感的频率,如低频区域(20Hz to 200Hz)内的频率、中频区域(200Hz to 2,000Hz)的频率、高频区域(2,000Hz to 20,000Hz)等。
需要说明的是,并不是对所有频率都进行谐波强度变化的获取,而是有限地模拟人耳听觉感知范围内的,滑音的关键频点的强度变化,进而减少了滑音音频的模拟过程中的计算量,提高了滑音音频的模拟效率。
通过本申请提供的实施例,获取用于表示滑音样本音频在N个关键频率上的能量或振幅大小的第一谐波强度变化,和用于表示单音样本音频在N个关键频率上的能量或振幅大小的第二谐波强度变化,其中,N个关键频率包括第一频率,进而达到了减少滑音音频的模拟过程中的计算量的目的,从而实现了提高滑音音频的模拟效率的技术效果。
作为一种可选的方案,获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化,包括:
在获取到滑音样本音频对应的基频变化曲线的情况下,基于基频变化曲线分析滑音样本音频在各个时段不同音高下的谐波序列及强度变化,得到第一谐波强度变化,其中,基频变化曲线用于表示滑音样本音频的基频随时间的变化情况。
可选地,在本实施例中,基频变化曲线用于表示滑音样本音频的基频随时间的变化情况,也用于描述语音信号中的基频变化情况。再者,基频变化曲线可以但不限以时间为横轴,基频值(Hz)为纵轴,显示了语音信号中基频的变化趋势。
需要说明的是,为提高第一谐波强度变化的准确性,将先获取滑音样本音频对应的基频变化曲线,再利用得到的基频变化曲线分析滑音样本音频在各个时段不同音高下的谐波序列及强度变化。
通过本申请提供的实施例,在获取到滑音样本音频对应的基频变化曲线的情况下,基于基频变化曲线分析滑音样本音频在各个时段不同音高下的谐波序列及强度变化,得到第一谐波强度变化,其中,基频变化曲线用于表示滑音样本音频的基频随时间的变化情况,进而实现了提高第一谐波强度变化的准确性的技术效果。
作为一种可选的方案,基于基频变化曲线分析滑音样本音频在各个时段不同音高下的谐波序列及强度变化,得到第一谐波强度变化,包括:
S2-1,利用基频变化曲线计算出滑音样本音频的谐波变化曲线;
S2-2,从谐波变化曲线上确定出滑音样本音频在各个时段不同基频下的频率变化曲线;
S2-3,以频率与基频之间的比值形式,将频率变化曲线转换为第一谐波强度变化。
可选地,在本实施例中,基频变化曲线描述的是语音信号中基频(声调)的变化情况,而谐波则是基频的倍频,基频的变化可以但不限会影响到谐波的分布和强度。
需要说明的是,考虑到谐波序列中各谐波强度的相对比值才是确定音色的关键,进而为提高滑音音频的模拟真实性,本实施例先利用基频变化曲线计算出滑音样本音频的谐波变化曲线,再以频率从谐波变化曲线上确定出滑音样本音频在各个时段不同基频下的频率变化曲线,进一步与基频之间的比值形式,将频率变化曲线转换为第一谐波强度变化,以真实模拟出滑音音频的音色。
通过本申请提供的实施例,利用基频变化曲线计算出滑音样本音频的谐波变化曲线;从谐波变化曲线上确定出滑音样本音频在各个时段不同基频下的频率变化曲线;以频率与基频之间的比值形式,将频率变化曲线转换为第一谐波强度变化,进而达到了真实模拟出滑音音频的音色的目的,从而实现了提高滑音音频的模拟真实性的技术效果。
作为一种可选的方案,基于第一谐波强度变化与第二谐波强度变化确定目标谐波强度变化,包括:
通过逐点相除第一谐波强度变化与第二谐波强度变化的值,得到目标谐波强度变化。
需要说明的是,为提高目标谐波强度变化的准确性,使用更符合比值特性的计算方式,对第一谐波强度变化与第二谐波强度变化的值进行逐点相除,其中,逐点可以但不限理解为逐个频点(率)对应的谐波强度值进行相除。
通过本申请提供的实施例,通过逐点相除第一谐波强度变化与第二谐波强度变化的值,得到目标谐波强度变化,进而达到了使用更符合比值特性的计算方式,对第一谐波强度变化与第二谐波强度变化的值进行逐点相除的目的,从而实现了提高目标谐波强度变化的准确性的技术效果。
作为一种可选的方案,在通过逐点相除第一谐波强度变化与第二谐波强度变化的值,得到目标谐波强度变化之前,方法还包括:
S3-1,获取滑音样本音频的第一时间信息,其中,第一时间信息用于记录滑音样本音频的第一起始时间和第一中止时间;
S3-2,利用第一时间信息对第一谐波强度变化和第二谐波强度变化进行筛选,得到第一起始时间和第一中止时间之间的第一目标谐波强度变化和第二目标谐波强度变化;
通过逐点相除第一谐波强度变化与第二谐波强度变化的值,得到目标谐波强度变化,包括:通过逐点相除第一目标谐波强度变化与第二目标谐波强度变化,得到第一起始时间和第一中止时间之间的目标谐波强度变化。
需要说明的是,为提高目标谐波强度变化的时效性,将以滑音样本音频的实际起始时间和实际中止时间作为第一谐波强度变化和第二谐波强度变化的筛选条件,对第一谐波强度变化和第二谐波强度变化进行筛选,得到实际起始时间和实际中止时间之间的第一目标谐波强度变化和第二目标谐波强度变化。
通过本申请提供的实施例,获取滑音样本音频的第一时间信息,其中,第一时间信息用于记录滑音样本音频的第一起始时间和第一中止时间;利用第一时间信息对第一谐波强度变化和第二谐波强度变化进行筛选,得到第一起始时间和第一中止时间之间的第一目标谐波强度变化和第二目标谐波强度变化;通过逐点相除第一目标谐波强度变化与第二目标谐波强度变化,得到第一起始时间和第一中止时间之间的目标谐波强度变化,进而达到了以滑音样本音频的实际起始时间和实际中止时间作为第一谐波强度变化和第二谐波强度变化的筛选条件的目的,从而实现了提高目标谐波强度变化的时效性的技术效果。
作为一种可选的方案,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频,包括:
S4-1,获取目标单音音频的初始音频;
S4-2,以初始音频为目标单音音频的基频,模拟出目标单音音频对应的目标谐波序列及目标谐波序列上的各个第二音频上的强度变化;
S4-3,获取滑音操作的实时位移距离,并基于实时位移距离确定滑音操作的第二时间信息,其中,用于记录滑音操作的第二起始时间和第二中止时间,第一时间信息包括第二时间信息;
S4-4,从目标谐波强度变化中确定出第二起始时间和第二中止时间之间的指定谐波强度变化,其中,指定谐波强度变化用于表示目标单音音频在不同频率上因滑音而产生的能量或振幅变化;
S4-5,利用指定谐波强度变化,增益\衰减目标单音音频在各个第二音频上的能量或振幅,模拟出目标滑音音频,其中,目标滑音音频的谐波序列为目标谐波序列,目标单音音频在各个第二频率上的能量或振幅与目标单音音频在目标单音音频的基频上的能量或振幅之间的比值变化符合指定谐波强度变化。
需要说明的是,为提高模拟出目标滑音音频的准确性,使用滑音操作的实时位移距离作为目标谐波强度变化的筛选条件,如从目标谐波强度变化中确定出实时位移距离对应的起始时间和中止时间之间的指定谐波强度变化。
通过本申请提供的实施例,获取目标单音音频的初始音频;以初始音频为目标单音音频的基频,模拟出目标单音音频对应的目标谐波序列及目标谐波序列上的各个第二音频上的强度变化;获取滑音操作的实时位移距离,并基于实时位移距离确定滑音操作的第二时间信息,其中,用于记录滑音操作的第二起始时间和第二中止时间,第一时间信息包括第二时间信息;从目标谐波强度变化中确定出第二起始时间和第二中止时间之间的指定谐波强度变化,其中,指定谐波强度变化用于表示目标单音音频在不同频率上因滑音而产生的能量或振幅变化;利用指定谐波强度变化,增益\衰减目标单音音频在各个第二音频上的能量或振幅,模拟出目标滑音音频,其中,目标滑音音频的谐波序列为目标谐波序列,目标单音音频在各个第二频率上的能量或振幅与目标单音音频在目标单音音频的基频上的能量或振幅之间的比值变化符合指定谐波强度变化,进而达到了使用滑音操作的实时位移距离作为目标谐波强度变化的筛选条件的目的,从而实现了提高模拟出目标滑音音频的准确性的技术效果。
作为一种可选的方案,在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频之前,方法还包括:
S5-1,分别使用扫频测试信号和白噪测试信号对待模拟的实体乐器进行响应采样,得到扫频响应信号与冲击响应信号,其中,扫频测试信号为一定频率范围内连续改变信号频率的信号,白噪测试信号为具有均匀频谱分布的随机信号,扫频响应信号为实体乐器接收到扫频测试信号后的响应信号,冲击响应信号为实体乐器接收到白噪测试信号后的响应信号;
S5-2,获取扫频响应信号与冲击响应信号之间的频率强度差异,其中,频率强度差异用于表示实体乐器共振的频谱特征;
在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,方法还包括:
S6-1,获取目标单音音频的当前音高,并结合频率强度差异确定卷积运算参数;
S6-2,在利用目标谐波强度变化对目标单音音频进行能量或振幅变化,得到候选滑音音频的情况下,利用卷积运算参数对候选滑音音频和冲击响应信号进行整合处理,模拟出目标滑音音频。
可选地,在本实施例中,扫频测试信号为一定频率范围内连续改变信号频率的信号,可以但不限以线性或对数方式按照一定的频率范围进行变化的,以及用来评估系统或设备在不同频率下的响应情况。通过对扫频信号的采样和分析,可以获得被测系统或设备的频率响应曲线。
可选地,在本实施例中,白噪测试信号为具有均匀频谱分布的随机信号,包含了各种频率的成分,类似于自然界中的白噪声。白噪测试信号在信号处理和系统测试中广泛使用,由于白噪声具有平坦的频谱特性,可以用来评估系统或设备对不同频率的处理能力、传输带宽以及噪声干扰的影响等。
可选地,在本实施例中,在信号处理中,利用卷积运算和IR,可以将一个原始信号,处理为带有IR所描述系统特性的新信号,其中,IR代表了系统对单位脉冲的响应特性,包含了系统的时域和频域信息。通过对输入信号与IR进行卷积运算,可以得到输出信号在时域上的响应,从而了解系统对于不同频率和时序特征的输入信号的影响情况。最为常见的应用是卷积混响,可以将一个原始干声信号,处理成为一个带有空间反射声的信号,且可以非常写实地还原目标场景的声学特性。
需要说明的是,为提高模拟出目标滑音音频的真实性,将共振因素考虑进滑音音频的模拟过程,而共振因素将通过扫频响应信号与冲击响应信号之间的频率强度差异进行体现。
通过本申请提供的实施例,分别使用扫频测试信号和白噪测试信号对待模拟的实体乐器进行响应采样,得到扫频响应信号与冲击响应信号,其中,扫频测试信号为一定频率范围内连续改变信号频率的信号,白噪测试信号为具有均匀频谱分布的随机信号,扫频响应信号为实体乐器接收到扫频测试信号后的响应信号,冲击响应信号为实体乐器接收到白噪测试信号后的响应信号;获取扫频响应信号与冲击响应信号之间的频率强度差异,其中,频率强度差异用于表示实体乐器共振的频谱特征;获取目标单音音频的当前音高,并结合频率强度差异确定卷积运算参数;在利用目标谐波强度变化对目标单音音频进行能量或振幅变化,得到候选滑音音频的情况下,利用卷积运算参数对候选滑音音频和冲击响应信号进行整合处理,模拟出目标滑音音频,进而达到了共振因素考虑进滑音音频的模拟过程的目的,从而实现了提高模拟出目标滑音音频的真实性的技术效果。
作为一种可选的方案,在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,方法还包括:
S7-1,获取对目标单音标识触发的目标操作对应的操作加速度,其中,目标操作包括滑音操作;
S7-2,获取与操作加速度相匹配的噪声音频;
S7-3,在利用目标谐波强度变化对目标单音音频进行能量或振幅变化,得到备选滑音音频的情况下,对噪声音频和备选滑音音频进行整合处理,模拟出目标滑音音频。
需要说明的是,为提高模拟出目标滑音音频的真实性,将噪声因素考虑进滑音音频的模拟过程,而由于噪声因素具有随机且不规则的特性,本实施例通过获取对目标单音标识触发的目标操作对应的操作加速度,并基于与操作加速度相匹配的噪声音频,将噪声因素加入滑音音频的模拟过程。
通过本申请提供的实施例,获取对目标单音标识触发的目标操作对应的操作加速度,其中,目标操作包括滑音操作;获取与操作加速度相匹配的噪声音频;在利用目标谐波强度变化对目标单音音频进行能量或振幅变化,得到备选滑音音频的情况下,对噪声音频和备选滑音音频进行整合处理,模拟出目标滑音音频,进而达到了将噪声因素考虑进滑音音频的模拟过程的目的,从而实现了提高模拟出目标滑音音频的真实性的技术效果。
作为一种可选的方案,为方便理解,将上述滑音音频的模拟方法应用在古琴模拟场景。古琴的一大特点在于古琴没有“品”的构造。以吉他为例做对比,“品”的构造决定了,在吉他上做滑音演奏,实际是在品与品间做音的过度,也就是其滑音变化并不是完全连续的。但古琴不同,古琴没有“品”的构造,于是在古琴上演奏滑音,其变化是平滑连续的。也因此,古琴上滑音音高的变化曲线较为复杂,以至于拥有各式各样的技法名称来描述滑音。原理上,所有古琴上带有音高滑动的音的变化服从于波动方程。
需要说明的是,本实施例的技术方案,不再需要大量的录音以及强硬的变速变调处理,而是改为,较少的录制用于分析的滑音参考样本,并进行频谱变化的特征分析,从而凭借分析数据,将单音采样作为原始材料,根据演奏,实时且真实地生成滑音效果。
进一步举例说明,可选的例如图5所示,在制作流程中,通过录音、剪辑、信号特征分析等处理方式,采集数据,并将采样数据映射至乐器数字接口(Musical InstrumentDigital Interface,简称MIDI)信息。进一步在实际使用流程中,乐器数字接口输入调用采样数据,并进行实时信号处理,输出古琴演奏音频,完成古琴音频的模拟。
可选地,在本实施例中,如图6所示,古琴滑音的声音可以分为两个部分,一是乐音模拟,二是噪音模拟。乐音是指跟随演奏而变化的带有音高的声音,而噪音是指演奏时手指与琴弦、琴板相互间摩擦所产生的无音高的声音。
进一步在本实施例中,每件乐器都有其独特的谐波序列(Harmonic Series)和偏离谐波序列的频率成分(Inharmonic),是非常复杂且难以学习到规律的,其中,HarmonicSeries是与乐音基频(最低频点)成整数倍的频率序列。如,以100Hz为基频的谐波序列为:100Hz,200Hz,300Hz,400Hz……不同谐波序列中各个频点强度的差异,是使得,不同乐器演奏出的同音高乐音,听起来音色不同的重要因素之一,nharmonic是塑造一件乐器独特音色的重要因素。纯粹的Harmonic Series是非常难得的,现实中一件乐器的构造非常复杂,于是产生了一些偏离谐波序列的频率成分,是同类乐器音色差异的根源之一。例如,以某一力度弹奏钢琴某一按键,基频以及与基频成整数倍的谐波频点的强度,会随时间进行非线性、非等比的复杂衰减。
然而每个频点都有其独特的衰减曲线,因此在衰减过程中,相互间的强度比例关系会不断变化,从而带来了一个音在衰减过程中产生的音色变化。显然,要模拟这样一种变化已经非常复杂,并且这仅限于一个音的一个力度。那么如果要模拟全按键、各种力度的钢琴按音,势必难上加难。除此之外,这还只是钢琴纯理论条件下产生的“纯音”,现实生活中,钢琴的音色还带有琴体共振、琴锤差异等附加向,那么囊括这些,即使有公式可以拟合归纳出其规律,也没有电脑能通过如此复杂的公式进行实时运算。
然而,突破点在于,虽然自然界的变化是无限的,但人类的感知能力非常有限,听觉层面甚至不如电脑。本实施例对于古琴滑音的乐音模拟便基于此逻辑,即,不图归纳总结规律,而是如实分析,并有限地模拟人类听觉感知范围内的,滑音的关键频点的强度变化。频点数控制在有限范围内,变化的时间间隔也不必非常连续,如此便让实时运算变为了可能。
具体的,对于滑音乐音的模拟,本实施例拆分成了两个部分,一是滑音过程中弦上震动的谐波变化模拟,如图6所示的弦震模拟,二是滑音过程中琴体共振的模拟,如图6所示的箱体模拟。
进一步在本实施例中,针对弦震模拟,对真实滑音进行逐音程的频谱变化分析,而后使用数字滤波器,模拟出频谱跟随滑音位移量所产生的频谱变化。因为人耳的“不精确”,所以滤波器在工作时,频点不必太多,频点强度的变化速度也不必太快,即,将这种模拟,控制在了人耳反应不过来,但电脑能算的过来的程度内。
可选地如图7所示,具体实现步骤如下:
S7-1,录制一些真实的滑音,速度不限,但滑动起始音需要与滑动终止音成固定音程关系,如滑动大三度、纯五度。录制过程不必覆盖一个音起始的全部音程,因为八度以上滑音在古琴演奏中几乎没有,且滑音大多数情况在五声音阶内进行,且距离很近的滑音音程,如大二度和大三度,也没必要录全,因为它们间的差异很小,大多数人听不出来。总之,此步骤中录音数量一定是越多越接近物理真实,但实际不需要很多就可以让人耳感到真实。录制之后,本实施例便获得了一批,固定音程的滑音采样;
S7-2,分析录制好的滑音采样的基频变化曲线。基频变化曲线即是基频变化曲线,本实施例以短时傅里叶变换为基础,分析得出。分析好后,存为数据表以备后用。
S7-3,利用谐波序列跟随技术,结合基频变化曲线,便可分析出滑音在其各时段不同音高下的谐波序列及其强度变化,而后存为数据表以备后用。本实施例中,谐波序列的强度以比值记录,其中基频为1,第二、第三等往后与基频成整数倍的谐波强度记录为基频的多少倍。即,整体不记录具体功率或dBFS值,因为谐波序列中各谐波强度的相对比值才是确定音色的关键;
S7-4,录制与S7-1中录制的滑音的起始音音高相同、拨弦位置相同、力度相近的古琴单音样本,并批量进行Normalize处理。
S7-5,与S7-2、S7-3的操作一样,分析得到此单音的谐波序列及其各时间点的强度变化,存为数据表以备后用;
S7-6,根据S7-2的数据,得出滑音从何时开始滑,何时停止滑动。拿到时间区间后,分别从S7-3和S7-4记录的数据中,找到指定时段内的谐波序列强度数据,而后将两个数据逐谐波次数相除(因为是记录的是比值,所以是相除,而非相减),即得到了,因滑音而产生的,单音与滑音谐波序列强度差异;
重复使用S7-1至S7-6,分析出古琴各个位置滑音的谐波序列极其强度变化特征。而后将数据整合为一个数据矩阵,之间没覆盖的位置点,根据已有数据点交叉过度得出,借此便可覆盖古琴的全范围滑音。(分析样本越多越细腻,但不用很多,也可以做的听觉真实,因为没覆盖的地方也有根据覆盖到的数据得来的中间值);
S7-7,建立一个拥有N个频点的滤波器(人耳对乐音谐波的敏感度集中在前5个谐波,即N>5即可有可观作用,本实施例使用时设为了N=15)。其中,各频点带宽为1Hz,即仅处理范围很小的单一频段,不伤害其他频段。而后,将此滤波器应用于一个单音样本上,设置所有频点的初始增益\衰减值为0。虚拟演奏时,如果只弹奏单音,手指不滑动,则此滤波器不产生任何效果。如果弹了单音,并开始滑音,则触发滤波器启动;
其中,滤波器根据用户弹奏的是哪个音,计算出,以该音频率为基频的谐波序列,并将自身各个频点,按此谐波序列,设定到指定频率值。而后,获得用户滑音操作的实时弦长位移距离(比值,全弦长的0.x倍,故无论虚拟界面弦多长都不影响),此距离可以换算为频率值,所以可以把频率值代入第二步得到的滑音曲线,得到此频率在S7-2的分析数据中,处于什么时间点。而后,根据时间点,调取S7-5获得的谐波强度差异数据,在此时间点的数据,即可得到瞬间的谐波序列强度应为多少。将此数据应用于滤波器各频点的增益\衰减值,对原本的单音进行滤波。而后,同样根据用户滑动的距离,换算为频率,对单音进行重新采样(Resample)处理,通过插入中间值,实时改变当前Buffer内采样点的密度,以实现无损变调。最后,简单分析一下处理后音频信号的音量,而后对其做一定控制,避免产生过大音量变化即可;
其中,Resample用于改变信号的采样率或采样间隔。当需要将信号从原始采样率转换为新的采样率时,可以使用重新采样技术,如增加信号的采样率,即在信号中插入额外的采样点。在上采样过程中,可以使用插值算法(如线性插值、升余弦插值等)来估计插入的新采样点的数值。插值算法根据已知的采样点进行推断,以得到更高采样率下的连续信号。这样可以增加信号的频率范围或提高时域精度;或,增加信号的采样率,即在信号中插入额外的采样点。在上采样过程中,可以使用插值算法(如线性插值、升余弦插值等)来估计插入的新采样点的数值。插值算法根据已知的采样点进行推断,以得到更高采样率下的连续信号。这样可以增加信号的频率范围或提高时域精度。
而在本实施例中,针对箱体模拟,如图8所示,准备一个音箱802,并将古琴804竖置,并将音响802的振膜近距离对准古琴804背面的“龙池”共鸣孔,并将小体积高精度电容话筒放置在古琴804背面的“凤沼”共鸣孔中。
具体流程如图9所示,用音箱802分别播放扫频(20~20000Hz)和白噪(122kHz)这两种测试信号,然后通过录音,记录下测试信号经过古琴腔体后的信号,至此便获得了箱体的扫频响应与冲击响应。分析新扫频信号与原始扫频信号之间有什么明显的频点强度差异,并将频点强度差异确定为古琴箱体共振的频谱特征。在虚拟演奏古琴滑音时,获取滑音当前音高,并根据第四步中得到的,箱体共振的频谱特征,来决定是否启用以及启用多少比例的卷积运算,其中,卷积运算为弦振模拟得到的信号与录制的冲击响应信号,二者间进行的卷积运算,得到加以滑音产生的箱体共振效果。
可选地,在本实施例中,由于噪音的频谱较乐音相比,更为随机且不规则,难以细致地分析其频谱特征,故本实施例中对滑音噪音的模拟使用了,检测虚拟演奏过程中的手指加速度,并按加速度来调取对应剧烈程度的滑音噪音样本的方法。
具体如图10所示,先录制一批按速度档位划分的不同剧烈程度的滑音噪音。而后,在虚拟演奏过程中,检测手指位移的加速度,并按此加速度调用对应档位速度的滑音噪音,并限制回放逻辑,如多少毫秒内不重复触发、上一声滑音噪声没播放完则下一声滑音噪音音头弱化、滑音播放时的声相位置跟随乐音位置等逻辑,即可实现滑音较为真实的噪音模拟。
可选地,在本实施例中,使用短时傅里叶(STFT)滑音音高(基频)曲线分析可以得出一个时间-频率-强度数据矩阵。在计算机中使用STFT对数字音频文件进行频谱分析,可以通过设置窗口大小,将数字音频文件均分为很多份,而后分别进行傅里叶计算,以得到不同时间点的频率-强度曲线。本实施例中便是利用STFT这个性质,以10毫秒量级的时间轴精度,对一个古琴的滑音进行了音高曲线分析。
需要说明的是,STFT得出的是一个庞大的全频谱强度-时间矩阵数据,并不带有“音高搜索”功能。因此,需要从这个庞大矩阵中筛选出每个时间点的前几个最大值。前几个最大值,一定包含基频,可能包含2次、3次等谐波,还可能包含随机干扰项,所以从中找到本实施例所需的基频,是一个难点。于是,本实施例创造了一种工作流来保障频点搜寻的准确性。即,在录制滑音时,就记录好滑音的起始音高,以及它是升高还是降低的滑音,并将这些信息命名在它的文件名上。而后,在分析滑音曲线时,读取文件名,获得其起始音高,并获得了它的滑动趋势。利用它们,创造一个滑音的频率可能性运动区间,来框定程序在此区间内找基频。例如起始音是中央A,且是上滑音,那么在第一时刻,框定在440Hz上下10赫兹内的范围内找基频,且在下一时刻,只找大于等于第一时刻基频频点,且小于880Hz(即小于高八度的起始音)的频点作为基频。以此类推,便可以根据框定死的频率范围和频率趋势,来精确地找出本实施例真正想要的滑音音高曲线。
可选地,在本实施例中,利用谐波序列跟随技术计算出多次谐波的变化曲线。而后从STFT得到的数据中,找寻这些谐波的频率变化曲线,从而可以得到实时强度变化。
可选地,在本实施例中,利用两种测试信号:20-20000Hz的扫频信号和122kHz采样率的白噪信号,激发并拾取了箱体共振的声学特征。其中,白噪在经历了整个流程后,最终被处理为了IR信号。录制和处理方法是,用音响持续以大声压级播放白噪,而后突然停止播放,那么从停止时刻起,往后拾取到的残留的声音尾巴,便是古琴琴体共振产生的。即,共振会因为大声压级的白噪而发生,而后会因白噪的消失而逐渐消耗殆尽,于是消耗殆尽的过程,便是古琴箱体,面对全频段白噪冲击后所产生的单位冲击相应,即本实施例所需的IR。扫频信号决定了IR在什么情况下,以什么程度参与流程中信号的处理与输出。
需要说明的是,当本实施例虚拟演奏单音时,并不希望IR参与其中,因为单音的录制本身就是有箱体共振夹杂其中的。而本实施例之所以需要箱体共振,是因为单音滑动时,会经过箱体的特定共振频点。于是,扫频的作用便是为检测,原本振幅固定的扫频信号,在经过了古琴箱体这一系统后,其振幅会发生什么样的变化。这个变化便预兆了,一个滑音在经过哪些频点时,会使古琴箱体产生共振,以及共振程度。于是,得到此数据,再加以IR,便可为一个滑动的单音带来,在特定频点才会发生的特定强度的箱体共振。
可选地,在本实施例中,信号经过实时滑音滤波技术,会先被滤波。滤波器调用的是现成的Peak型滤波器,频带宽度为1Hz。滤波后,信号根据虚拟演奏情况,按Buffer Size进行实时Resampling,即听觉无损地变化了音高,且是带频谱动态变化的。而后,演奏的信息控制信号与IR信号进行卷积运算。最后,卷积后信号再与噪声信号合并。
通过本申请提供的实施例,不再需要无穷尽的录音采样,大幅减少制作时间,同时大幅减少存储空间;同时,进行虚拟演奏时,滑音的速度、音程均不再受限;用户所弹即所得,节省用户学习成本;而输出的音频,也不再涉及损伤原始样本音质的变速、变调处理。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
根据本申请实施例的另一个方面,还提供了一种用于实施上述滑音音频的模拟方法的滑音音频的模拟装置。如图11所示,该装置包括:
第一获取单元1102,用于获取滑音样本音频和单音样本音频,其中,滑音样本音频和单音样本音频的起始音高相同;
第二获取单元1104,用于获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化,其中,第一谐波强度变化用于表示滑音样本音频在不同频率上的能量或振幅大小与滑音样本音频在基频上的能量或振幅大小之间的比值变化,第二谐波强度变化用于表示单音样本音频在不同频率上的能量或振幅大小与单音样本音频在基频上的能量或振幅大小之间的比值变化;
确定单元1106,用于基于第一谐波强度变化与第二谐波强度变化确定目标谐波强度变化,其中,目标谐波强度变化用于表示单音样本音频在不同频率上因滑音而产生的能量或振幅变化;
模拟单元1108,用于响应于对目标单音标识触发的滑音操作,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。
具体实施例可以参考上述滑音音频的模拟装置中所示示例,本示例中在此不再赘述。
作为一种可选的方案,模拟单元1108,包括:
第一获取模块,用于获取目标单音音频关联的各个第一频率;
第一确定模块,用于从目标谐波强度变化中确定出与各个第一频率匹配的强度变化信息,其中,强度变化信息用于目标单音音频在各个第一频率上因滑音而产生的能量或振幅变化;
第一模拟模块,用于利用强度变化信息,增益\衰减目标单音音频在各个第一频率上的能量或振幅,模拟出目标滑音音频,其中,目标滑音音频在各个第一频率上的能量或振幅与目标单音音频在各个第一频率上的能量或振幅符合强度变化信息。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,第二获取单元1104,包括:
第二获取模块,用于获取用于表示滑音样本音频在N个关键频率上的能量或振幅大小的第一谐波强度变化,和用于表示单音样本音频在N个关键频率上的能量或振幅大小的第二谐波强度变化,其中,N个关键频率包括第一频率。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,第二获取单元1104,包括:
分析模块,用于在获取到滑音样本音频对应的基频变化曲线的情况下,基于基频变化曲线分析滑音样本音频在各个时段不同音高下的谐波序列及强度变化,得到第一谐波强度变化,其中,基频变化曲线用于表示滑音样本音频的基频随时间的变化情况。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,分析模块,包括:
计算子模块,用于利用基频变化曲线计算出滑音样本音频的谐波变化曲线;
确定子模块,用于从谐波变化曲线上确定出滑音样本音频在各个时段不同基频下的频率变化曲线;
转换子模块,用于以频率与基频之间的比值形式,将频率变化曲线转换为第一谐波强度变化。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,确定单元1106,包括:
相除模块,用于通过逐点相除第一谐波强度变化与第二谐波强度变化的值,得到目标谐波强度变化。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,装置还包括:
第三获取模块,用于在通过逐点相除第一谐波强度变化与第二谐波强度变化的值,得到目标谐波强度变化之前,获取滑音样本音频的第一时间信息,其中,第一时间信息用于记录滑音样本音频的第一起始时间和第一中止时间;
筛选模块,用于在通过逐点相除第一谐波强度变化与第二谐波强度变化的值,得到目标谐波强度变化之前,利用第一时间信息对第一谐波强度变化和第二谐波强度变化进行筛选,得到第一起始时间和第一中止时间之间的第一目标谐波强度变化和第二目标谐波强度变化;
相除模块,包括:相除子模块,用于通过逐点相除第一目标谐波强度变化与第二目标谐波强度变化,得到第一起始时间和第一中止时间之间的目标谐波强度变化。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,模拟单元1108,包括:
第四获取模块,用于获取目标单音音频的初始音频;
第二模拟模块,用于以初始音频为目标单音音频的基频,模拟出目标单音音频对应的目标谐波序列及目标谐波序列上的各个第二音频上的强度变化;
第五获取模块,用于获取滑音操作的实时位移距离,并基于实时位移距离确定滑音操作的第二时间信息,其中,用于记录滑音操作的第二起始时间和第二中止时间,第一时间信息包括第二时间信息;
第二确定模块,用于从目标谐波强度变化中确定出第二起始时间和第二中止时间之间的指定谐波强度变化,其中,指定谐波强度变化用于表示目标单音音频在不同频率上因滑音而产生的能量或振幅变化;
第三模拟模块,用于利用指定谐波强度变化,增益\衰减目标单音音频在各个第二音频上的能量或振幅,模拟出目标滑音音频,其中,目标滑音音频的谐波序列为目标谐波序列,目标单音音频在各个第二频率上的能量或振幅与目标单音音频在目标单音音频的基频上的能量或振幅之间的比值变化符合指定谐波强度变化。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,装置还包括:
采样单元,用于在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频之前,分别使用扫频测试信号和白噪测试信号对待模拟的实体乐器进行响应采样,得到扫频响应信号与冲击响应信号,其中,扫频测试信号为一定频率范围内连续改变信号频率的信号,白噪测试信号为具有均匀频谱分布的随机信号,扫频响应信号为实体乐器接收到扫频测试信号后的响应信号,冲击响应信号为实体乐器接收到白噪测试信号后的响应信号;
差异单元,用于在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频之前,获取扫频响应信号与冲击响应信号之间的频率强度差异,其中,频率强度差异用于表示实体乐器共振的频谱特征;
装置还包括:
结合单元,用于在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,获取目标单音音频的当前音高,并结合频率强度差异确定卷积运算参数;
第一整合单元,用于在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,在利用目标谐波强度变化对目标单音音频进行能量或振幅变化,得到候选滑音音频的情况下,利用卷积运算参数对候选滑音音频和冲击响应信号进行整合处理,模拟出目标滑音音频。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,装置还包括:
第三获取单元,用于在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,获取对目标单音标识触发的目标操作对应的操作加速度,其中,目标操作包括滑音操作;
第四获取单元,用于在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,获取与操作加速度相匹配的噪声音频;
第二整合单元,用于在利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,在利用目标谐波强度变化对目标单音音频进行能量或振幅变化,得到备选滑音音频的情况下,对噪声音频和备选滑音音频进行整合处理,模拟出目标滑音音频。
具体实施例可以参考上述滑音音频的模拟方法中所示示例,本示例中在此不再赘述。
根据本申请实施例的又一个方面,还提供了一种用于实施上述滑音音频的模拟方法的电子设备,该电子设备可以但不限于为图1中所示的用户设备102或服务器112,本实施例以电子设备为用户设备102为例说明,进一步如图12所示,该电子设备包括存储器1202和处理器1204,该存储器1202中存储有计算机程序,该处理器1204被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取滑音样本音频和单音样本音频,其中,滑音样本音频和单音样本音频的起始音高相同;
S2,获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化,其中,第一谐波强度变化用于表示滑音样本音频在不同频率上的能量或振幅大小与滑音样本音频在基频上的能量或振幅大小之间的比值变化,第二谐波强度变化用于表示单音样本音频在不同频率上的能量或振幅大小与单音样本音频在基频上的能量或振幅大小之间的比值变化;
S3,基于第一谐波强度变化与第二谐波强度变化确定目标谐波强度变化,其中,目标谐波强度变化用于表示单音样本音频在不同频率上因滑音而产生的能量或振幅变化;
S4,响应于对目标单音标识触发的滑音操作,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。
可选地,本领域普通技术人员可以理解,图12所示的结构仅为示意,图12其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图12中所示更多或者更少的组件(如网络接口等),或者具有与图12所示不同的配置。
其中,存储器1202可用于存储软件程序以及模块,如本申请实施例中的滑音音频的模拟方法和装置对应的程序指令/模块,处理器1204通过运行存储在存储器1202内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的滑音音频的模拟方法。存储器1202可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1202可进一步包括相对于处理器1204远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1202具体可以但不限于用于存储滑音样本音频、单音样本音频以及目标滑音音频等信息。作为一种示例,如图12所示,上述存储器1202中可以但不限于包括上述滑音音频的模拟装置中的第一获取单元1102、第二获取单元1104、确定单元1106及模拟单元1108。此外,还可以包括但不限于上述滑音音频的模拟装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1206用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1206包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1206为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器1208,用于显示上述滑音样本音频、单音样本音频以及目标滑音音频等信息;和连接总线1210,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述用户设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点网络,任意形式的计算设备,比如服务器、用户设备等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
根据本申请的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序/指令,该计算机程序/指令包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理器执行时,执行本申请实施例提供的各种功能。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,电子设备的计算机系统仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
计算机系统包括中央处理器(Central Processing Unit,CPU),其可以根据存储在只读存储器(Read-Only Memory,ROM)中的程序或者从存储部分加载到随机访问存储器(Random Access Memory,RAM)中的程序而执行各种适当的动作和处理。在随机访问存储器中,还存储有系统操作所需的各种程序和数据。中央处理器、在只读存储器以及随机访问存储器通过总线彼此相连。输入/输出接口(Input/Output接口,即I/O接口)也连接至总线。
以下部件连接至输入/输出接口:包括键盘、鼠标等的输入部分;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至输入/输出接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
特别地,根据本申请的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理器执行时,执行本申请的系统中限定的各种功能。
根据本申请的一个方面,提供了一种计算机可读存储介质,计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取滑音样本音频和单音样本音频,其中,滑音样本音频和单音样本音频的起始音高相同;
S2,获取滑音样本音频对应的第一谐波强度变化,和单音样本音频对应的第二谐波强度变化,其中,第一谐波强度变化用于表示滑音样本音频在不同频率上的能量或振幅大小与滑音样本音频在基频上的能量或振幅大小之间的比值变化,第二谐波强度变化用于表示单音样本音频在不同频率上的能量或振幅大小与单音样本音频在基频上的能量或振幅大小之间的比值变化;
S3,基于第一谐波强度变化与第二谐波强度变化确定目标谐波强度变化,其中,目标谐波强度变化用于表示单音样本音频在不同频率上因滑音而产生的能量或振幅变化;
S4,响应于对目标单音标识触发的滑音操作,利用目标谐波强度变化对目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令电子设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的用户设备,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (14)
1.一种滑音音频的模拟方法,其特征在于,包括:
获取滑音样本音频和单音样本音频,其中,所述滑音样本音频和所述单音样本音频的起始音高相同;
获取所述滑音样本音频对应的第一谐波强度变化,和所述单音样本音频对应的第二谐波强度变化,其中,所述第一谐波强度变化用于表示所述滑音样本音频在不同频率上的能量或振幅大小与所述滑音样本音频在基频上的能量或振幅大小之间的比值变化,所述第二谐波强度变化用于表示所述单音样本音频在不同频率上的能量或振幅大小与所述单音样本音频在基频上的能量或振幅大小之间的比值变化;
基于所述第一谐波强度变化与所述第二谐波强度变化确定目标谐波强度变化,其中,所述目标谐波强度变化用于表示所述单音样本音频在不同频率上因滑音而产生的能量或振幅变化;
响应于对目标单音标识触发的滑音操作,利用所述目标谐波强度变化对所述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。
2.根据权利要求1所述的方法,其特征在于,所述利用所述目标谐波强度变化对所述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频,包括:
获取所述目标单音音频关联的各个第一频率;
从所述目标谐波强度变化中确定出与所述各个第一频率匹配的强度变化信息,其中,所述强度变化信息用于所述目标单音音频在所述各个第一频率上因滑音而产生的能量或振幅变化;
利用所述强度变化信息,增益\衰减所述目标单音音频在所述各个第一频率上的能量或振幅,模拟出所述目标滑音音频,其中,所述目标滑音音频在所述各个第一频率上的能量或振幅与所述目标单音音频在所述各个第一频率上的能量或振幅符合所述强度变化信息。
3.根据权利要求2所述的方法,其特征在于,所述获取所述滑音样本音频对应的第一谐波强度变化,和所述单音样本音频对应的第二谐波强度变化,包括:
获取用于表示所述滑音样本音频在N个关键频率上的能量或振幅大小的所述第一谐波强度变化,和用于表示所述单音样本音频在所述N个关键频率上的能量或振幅大小的所述第二谐波强度变化,其中,所述N个关键频率包括所述第一频率。
4.根据权利要求1所述的方法,其特征在于,所述获取所述滑音样本音频对应的第一谐波强度变化,和所述单音样本音频对应的第二谐波强度变化,包括:
在获取到所述滑音样本音频对应的基频变化曲线的情况下,基于所述基频变化曲线分析所述滑音样本音频在各个时段不同音高下的谐波序列及强度变化,得到所述第一谐波强度变化,其中,所述基频变化曲线用于表示所述滑音样本音频的基频随时间的变化情况。
5.根据权利要求4所述的方法,其特征在于,所述基于所述基频变化曲线分析所述滑音样本音频在各个时段不同音高下的谐波序列及强度变化,得到所述第一谐波强度变化,包括:
利用所述基频变化曲线计算出所述滑音样本音频的谐波变化曲线;
从所述谐波变化曲线上确定出所述滑音样本音频在各个时段不同基频下的频率变化曲线;
以频率与基频之间的比值形式,将所述频率变化曲线转换为所述第一谐波强度变化。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一谐波强度变化与所述第二谐波强度变化确定目标谐波强度变化,包括:
通过逐点相除所述第一谐波强度变化与所述第二谐波强度变化的值,得到所述目标谐波强度变化。
7.根据权利要求6所述的方法,其特征在于,
在所述通过逐点相除所述第一谐波强度变化与所述第二谐波强度变化的值,得到所述目标谐波强度变化之前,所述方法还包括:
获取所述滑音样本音频的第一时间信息,其中,所述第一时间信息用于记录所述滑音样本音频的第一起始时间和第一中止时间;
利用所述第一时间信息对所述第一谐波强度变化和所述第二谐波强度变化进行筛选,得到所述第一起始时间和所述第一中止时间之间的第一目标谐波强度变化和第二目标谐波强度变化;
所述通过逐点相除所述第一谐波强度变化与所述第二谐波强度变化的值,得到所述目标谐波强度变化,包括:通过逐点相除所述第一目标谐波强度变化与第二目标谐波强度变化,得到所述第一起始时间和所述第一中止时间之间的所述目标谐波强度变化。
8.根据权利要求7所述的方法,其特征在于,所述利用所述目标谐波强度变化对所述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频,包括:
获取所述目标单音音频的初始音频;
以所述初始音频为所述目标单音音频的基频,模拟出所述目标单音音频对应的目标谐波序列及所述目标谐波序列上的各个第二音频上的强度变化;
获取所述滑音操作的实时位移距离,并基于所述实时位移距离确定所述滑音操作的第二时间信息,其中,所述用于记录所述滑音操作的第二起始时间和第二中止时间,所述第一时间信息包括所述第二时间信息;
从所述目标谐波强度变化中确定出所述第二起始时间和所述第二中止时间之间的指定谐波强度变化,其中,所述指定谐波强度变化用于表示所述目标单音音频在不同频率上因滑音而产生的能量或振幅变化;
利用所述指定谐波强度变化,增益\衰减所述目标单音音频在所述各个第二音频上的能量或振幅,模拟出所述目标滑音音频,其中,所述目标滑音音频的谐波序列为所述目标谐波序列,所述目标单音音频在所述各个第二频率上的能量或振幅与所述目标单音音频在所述目标单音音频的基频上的能量或振幅之间的比值变化符合所述指定谐波强度变化。
9.根据权利要求1至8中任一项所述的方法,其特征在于,
在所述利用所述目标谐波强度变化对所述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频之前,所述方法还包括:
分别使用扫频测试信号和白噪测试信号对待模拟的实体乐器进行响应采样,得到扫频响应信号与冲击响应信号,其中,所述扫频测试信号为一定频率范围内连续改变信号频率的信号,所述白噪测试信号为具有均匀频谱分布的随机信号,所述扫频响应信号为所述实体乐器接收到所述扫频测试信号后的响应信号,所述冲击响应信号为所述实体乐器接收到所述白噪测试信号后的响应信号;
获取所述扫频响应信号与所述冲击响应信号之间的频率强度差异,其中,所述频率强度差异用于表示所述实体乐器共振的频谱特征;
在所述利用所述目标谐波强度变化对所述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,所述方法还包括:
获取所述目标单音音频的当前音高,并结合所述频率强度差异确定卷积运算参数;
在利用所述目标谐波强度变化对所述目标单音音频进行能量或振幅变化,得到候选滑音音频的情况下,利用所述卷积运算参数对所述候选滑音音频和所述冲击响应信号进行整合处理,模拟出所述目标滑音音频。
10.根据权利要求1至8中任一项所述的方法,其特征在于,在所述利用所述目标谐波强度变化对所述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频的过程中,所述方法还包括:
获取对所述目标单音标识触发的目标操作对应的操作加速度,其中,所述目标操作包括所述滑音操作;
获取与所述操作加速度相匹配的噪声音频;
在利用所述目标谐波强度变化对所述目标单音音频进行能量或振幅变化,得到备选滑音音频的情况下,对所述噪声音频和所述备选滑音音频进行整合处理,模拟出所述目标滑音音频。
11.一种滑音音频的模拟装置,其特征在于,包括:
第一获取单元,用于获取滑音样本音频和单音样本音频,其中,所述滑音样本音频和所述单音样本音频的起始音高相同;
第二获取单元,用于获取所述滑音样本音频对应的第一谐波强度变化,和所述单音样本音频对应的第二谐波强度变化,其中,所述第一谐波强度变化用于表示所述滑音样本音频在不同频率上的能量或振幅大小与所述滑音样本音频在基频上的能量或振幅大小之间的比值变化,所述第二谐波强度变化用于表示所述单音样本音频在不同频率上的能量或振幅大小与所述单音样本音频在基频上的能量或振幅大小之间的比值变化;
确定单元,用于基于所述第一谐波强度变化与所述第二谐波强度变化确定目标谐波强度变化,其中,所述目标谐波强度变化用于表示所述单音样本音频在不同频率上因滑音而产生的能量或振幅变化;
模拟单元,用于响应于对目标单音标识触发的滑音操作,利用所述目标谐波强度变化对所述目标单音标识匹配的目标单音音频进行能量或振幅变化,模拟出目标滑音音频。
12.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序被电子设备运行时执行所述权利要求1至10任一项中所述的方法。
13.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至10任一项中所述方法的步骤。
14.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至10任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310923883.2A CN116959503B (zh) | 2023-07-25 | 2023-07-25 | 滑音音频的模拟方法、装置和存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310923883.2A CN116959503B (zh) | 2023-07-25 | 2023-07-25 | 滑音音频的模拟方法、装置和存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116959503A true CN116959503A (zh) | 2023-10-27 |
CN116959503B CN116959503B (zh) | 2024-09-10 |
Family
ID=88447301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310923883.2A Active CN116959503B (zh) | 2023-07-25 | 2023-07-25 | 滑音音频的模拟方法、装置和存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116959503B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4999773A (en) * | 1983-11-15 | 1991-03-12 | Manfred Clynes | Technique for contouring amplitude of musical notes based on their relationship to the succeeding note |
DE102006028330A1 (de) * | 2005-06-22 | 2008-01-03 | Roman Koller | Verfahren zum Transponieren eines Audio Signals |
US20080156176A1 (en) * | 2004-07-08 | 2008-07-03 | Jonas Edlund | System For Generating Music |
CN201470061U (zh) * | 2009-08-04 | 2010-05-19 | 鈊象电子股份有限公司 | 能产生滑音信号的游戏机台 |
CN102610222A (zh) * | 2007-02-01 | 2012-07-25 | 缪斯亚米有限公司 | 音乐转录的方法,系统和装置 |
WO2013149188A1 (en) * | 2012-03-29 | 2013-10-03 | Smule, Inc. | Automatic conversion of speech into song, rap or other audible expression having target meter or rhythm |
JP2014041241A (ja) * | 2012-08-22 | 2014-03-06 | Pioneer Electronic Corp | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
US20210089259A1 (en) * | 2019-09-23 | 2021-03-25 | Netflix, Inc. | Audio metadata smoothing |
CN113314093A (zh) * | 2021-06-01 | 2021-08-27 | 广州酷狗计算机科技有限公司 | 音频合成方法、装置、终端及存储介质 |
CN114758639A (zh) * | 2022-03-18 | 2022-07-15 | 上海妙克信息科技有限公司 | 古筝音频播放方法、装置、电子设备和计算机可读介质 |
DE102021000324A1 (de) * | 2021-01-22 | 2022-07-28 | Christian Schoenebeck | Intuitives und akustisch realistisches Glissando mittels Keyboard |
-
2023
- 2023-07-25 CN CN202310923883.2A patent/CN116959503B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4999773A (en) * | 1983-11-15 | 1991-03-12 | Manfred Clynes | Technique for contouring amplitude of musical notes based on their relationship to the succeeding note |
US20080156176A1 (en) * | 2004-07-08 | 2008-07-03 | Jonas Edlund | System For Generating Music |
DE102006028330A1 (de) * | 2005-06-22 | 2008-01-03 | Roman Koller | Verfahren zum Transponieren eines Audio Signals |
CN102610222A (zh) * | 2007-02-01 | 2012-07-25 | 缪斯亚米有限公司 | 音乐转录的方法,系统和装置 |
CN201470061U (zh) * | 2009-08-04 | 2010-05-19 | 鈊象电子股份有限公司 | 能产生滑音信号的游戏机台 |
WO2013149188A1 (en) * | 2012-03-29 | 2013-10-03 | Smule, Inc. | Automatic conversion of speech into song, rap or other audible expression having target meter or rhythm |
JP2014041241A (ja) * | 2012-08-22 | 2014-03-06 | Pioneer Electronic Corp | タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム |
US20210089259A1 (en) * | 2019-09-23 | 2021-03-25 | Netflix, Inc. | Audio metadata smoothing |
DE102021000324A1 (de) * | 2021-01-22 | 2022-07-28 | Christian Schoenebeck | Intuitives und akustisch realistisches Glissando mittels Keyboard |
CN113314093A (zh) * | 2021-06-01 | 2021-08-27 | 广州酷狗计算机科技有限公司 | 音频合成方法、装置、终端及存储介质 |
CN114758639A (zh) * | 2022-03-18 | 2022-07-15 | 上海妙克信息科技有限公司 | 古筝音频播放方法、装置、电子设备和计算机可读介质 |
Non-Patent Citations (1)
Title |
---|
黄睿: ""多音信号中单滑音的基频提取"", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 03, 15 March 2017 (2017-03-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN116959503B (zh) | 2024-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8842847B2 (en) | System for simulating sound engineering effects | |
US8716586B2 (en) | Process and device for synthesis of an audio signal according to the playing of an instrumentalist that is carried out on a vibrating body | |
US20190066644A1 (en) | Device and method for simulating a sound timbre, particularly for stringed electrical musical instruments | |
US9626949B2 (en) | System of modeling characteristics of a musical instrument | |
Penttinen et al. | Model-based sound synthesis of the guqin | |
US20170024495A1 (en) | Method of modeling characteristics of a musical instrument | |
Gabrielli et al. | A digital waveguide-based approach for Clavinet modeling and synthesis | |
Christensen | Introduction to audio processing | |
Jensen | The timbre model | |
WO2020158891A1 (ja) | 音信号合成方法およびニューラルネットワークの訓練方法 | |
Fritz et al. | Perceptual studies of violin body damping and vibrato | |
CN116959503B (zh) | 滑音音频的模拟方法、装置和存储介质及电子设备 | |
Zhang | Application of audio visual tuning detection software in piano tuning teaching | |
Bader | Characterizing classical guitars using top plate radiation patterns measured by a microphone array | |
CN117275527A (zh) | 滑音音频的模拟方法、装置和存储介质及电子设备 | |
CN112289289A (zh) | 一种可编辑的普遍音色合成分析系统及方法 | |
CN114171037A (zh) | 音色转换处理方法、装置、电子设备及存储介质 | |
Rauhala et al. | A parametric piano synthesizer | |
Bensa et al. | Perceptive and cognitive evaluation of a piano synthesis model | |
Penttinen et al. | Morphing instrument body models | |
Tolonen | Object-based sound source modeling for musical signals | |
Cuzzucoli et al. | The Sound | |
CN113140204B (zh) | 一种用于脉冲星信号控制的数字音乐合成方法及设备 | |
SHI | Extending the Sound of the Guzheng | |
CN117975981A (zh) | 一种变声处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |