发明内容
本申请的主要目的在于提供一种用于语音动态融合的数据处理方法及装置,以解决导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种用于语音动态融合的数据处理方法方法。
根据本申请的用于语音动态融合的数据处理方法:用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述方法包括:
获取播放器中的音频流数据;
计算所述音频流数据的音频流分贝;以及
根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步地,获取播放器中的音频流数据包括:
读取播放器当前的音频流播放进度;
根据所述音频流播放进度获取缓存文件;以及
从所述缓存文件中获取正在播放的音频流数据。
进一步地,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在高分贝动态阈值;
根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步地,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在低分贝动态阈值;
根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步地,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值内;如果判断所述第二音频的播放音量大于高分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
如果判断所述第二音频的播放音量大于低分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,
其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
为了实现上述目的,根据本申请的另一方面,提供了一种用于语音动态融合的数据处理装置。
根据本申请的用于语音动态融合的数据处理装置包括:用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述装置包括:
获取模块,用于获取播放器中的音频流数据;
计算模块,用于计算所述音频流数据的音频流分贝;以及
调节模块,用于根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步的,获取模块包括:
读取单元,用于读取播放器当前的音频流播放进度;
缓存单元,用于根据所述音频流播放进度获取缓存文件;以及
获取单元,用于从所述缓存文件中获取正在播放的音频流数据。
进一步的,计算模块包括:第一计算单元,调节模块包括:第一调节单元,
第一计算单元,用于确定所述音频流分贝所在高分贝动态阈值;
第一调节单元,用于根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步的,计算模块包括:第二计算单元,调节模块包括:第二调节单元,
第二计算单元,用于确定所述音频流分贝所在低分贝动态阈值;
第二调节单元,用于根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步的,计算模块包括:第三计算单元、判断单元,调节模块包括:第三调节单元、第四调节单元,
第三计算单元,用于确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
判断单元,用于判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值内;
第三调节单元,用于判断所述第二音频的播放音量大于高分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
第四调节单元,用于判断所述第二音频的播放音量大于低分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
在本申请实施例中,采用融合导航应用程序播放的第一音频与播放器播放的第二音频的方式,通过获取播放器中的音频流数据,计算所述音频流数据的音频流分贝,设置动态阈值,达到了调节所述第一音频在播放时所述第二音频的播放音量的目的,从而实现了导航应用程序播放的第一音频与播放器播放的第二音频相融合的技术效果,进而解决了导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的技术问题。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本申请实施例中的用于语音动态融合的数据处理方法,获取播放器中的音频流数据;计算所述音频流数据的音频流分贝;以及根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。采用融合导航应用程序播放的第一音频与播放器播放的第二音频的方式,通过获取播放器中的音频流数据,计算所述音频流数据的音频流分贝,设置动态阈值,达到了调节所述第一音频在播放时所述第二音频的播放音量的目的,从而实现了导航应用程序播放的第一音频与播放器播放的第二音频相融合的技术效果,进而解决了导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的技术问题。
根据本申请实施例,提供了一种用于语音动态融合的数据处理方法,如图1 所示,该方法包括如下的步骤S102至步骤S106:
步骤S102,获取播放器中的音频流数据;
音频流数据可以是音频流播放进度、音频流分贝。
可以通过获取音频流数据播放进度确定播放器中音频的播放情况以及音频流分贝。
例如,音频流数据为一首时长为4分钟的歌曲,音频流播放进度为1分48秒处,播放分贝为55DB。
步骤S104,计算所述音频流数据的音频流分贝;以及
计算所述音频流数据的音频流分贝可以根据音频流播放进度以及播放器本身设定的音量大小确定。
例如,对于具有这种功能的硬件设备,可以通过软件算法实时计算出当前音频流的分贝,并回馈给给播放器,实现调整播放器的音量大小。对于无法分离音乐声音的设备,如:手机,可以边播放边缓存,根据读取播放器播放的进度,来获取缓存文件中现在正播放的音乐音频流,再通过软件算法实时计算出当前音频流的分贝,回馈给播放器,以实现控制。
步骤S106,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
预设动态阈值可以是开发人员设置的合理的音频播放分贝段。
第一音频可以是导航语音。
第二音频可以是播放器播放的音频,例如可以是音乐或广播。
在确定第二音频即播放器播放的音频属于高分贝动态阈值的情况时,将第二音频的播放音量向下调节的幅度可适当加大。
具有较高分贝的摇滚音乐,可以多往下调节一些。例如,30分贝的音乐,调节至10分贝,向下调节了20个分贝的音量。
具有较低分贝的轻音乐,可以少往下调节一些。例如,15分贝的音乐,调节至10分贝,向下调节了5个分贝的音量。
如图2所示,获取播放器中的音频流数据包括如下的步骤S202至步骤S206:
步骤S202,读取播放器当前的音频流播放进度;
读取播放器当前的音频流播放进度可以是通过现有技术中的算法或代码实现音频流数据播放进度的读取。
步骤S204,根据所述音频流播放进度获取缓存文件;以及
缓存文件可以是播放器中缓存的待播放内容。
根据所述音频流播放进度获取播放器中缓存的待播放内容。
例如,一首时长为4分钟的歌曲播放至1分30秒时,获取1分30至4分钟时结束位置的歌曲内容。
步骤S206,从所述缓存文件中获取正在播放的音频流数据。
从播放器中缓存的待播放内容中获取正在播放的音乐或广播。
例如,一首时长为4分钟的歌曲播放至1分30秒时,获取1分30秒时的歌曲内容。
如图3所示,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括如下的步骤S302至步骤S304:
步骤S302,确定所述音频流分贝所在高分贝动态阈值;
高分贝动态阈值可以是音频流播放分贝属于高分贝音频的情况下预设的阈值。
例如,比如音频的分贝最大是30内,就在30分贝内调节播放器播放的音量大小。例如,摇滚音乐的分贝较高。
步骤S304,根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
在确定第二音频即播放器播放的音频属于高分贝动态阈值的情况时,将第二音频的播放音量向下调节的幅度可适当加大。
例如,具有较高分贝的摇滚音乐,可以多往下调节一些。
例如,30分贝的音乐,调节至10分贝,向下调节了20个分贝的音量。
如图4所示,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括如下的步骤S402至步骤S404:
步骤S402,确定所述音频流分贝所在低分贝动态阈值;
低分贝动态阈值可以是音频流播放分贝属于低分贝音频的情况下预设的阈值。
例如,比如音频的分贝最大是15内,就在15分贝内调节播放器播放的音量大小。例如,轻音乐的分贝较低。
步骤S404,根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
例如,具有较低分贝的轻音乐,可以少往下调节一些。
例如,15分贝的音乐,调节至10分贝,向下调节了5个分贝的音量。
如图5所示,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括如下的步骤S502至步骤S508:
步骤S502,确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
根据获取的音频流分贝对音频流分贝进行判断。
确定所述音频流分贝可以是对于具有这种功能的硬件设备,可以通过软件算法实时计算出当前音频流的分贝,并回馈给给播放器,实现调整播放器的音量大小。对于无法分离音乐声音的设备,如:手机,可以边播放边缓存,根据读取播放器播放的进度,来获取缓存文件中现在正播放的音乐音频流,再通过软件算法实时计算出当前音频流的分贝,回馈给播放器,以实现控制。
步骤S504,判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值内;
判断正在播放的音频流的分贝是否大于预先设定的高分贝动态阈值或低分贝动态阈值。
例如,设定高分贝动态阈值为30分贝以上,低分贝动态阈值为15分贝以下。
根据获取的音频流分贝,判断出所述音频流分贝属于高分贝动态阈值,还是属于低分贝动态阈值。
步骤S506,如果判断所述第二音频的播放音量大于高分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
如果判断所述第二音频的播放音量大于高分贝动态阈值,例如第二音频的播放音量分贝为40分贝,大于高分贝动态阈值30分贝,则将第二音频的播放音量调节为预先设置的第一音量大小。
需要说明的是,第一音量大小可以是开发人员根据大众较能接收的融合分贝设置。
例如,在导航语音播放时,将第二音频即播放器播放的音频的音量调节至1 0分贝。
步骤S508,如果判断所述第二音频的播放音量大于低分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,
其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
如果判断所述第二音频的播放音量大于低分贝动态阈值,例如第二音频的播放音量分贝为25分贝,大于低分贝动态阈值15分贝,则将第二音频的播放音量调节为预先设置的第二音量大小。
需要说明的是,第二音量大小可以是开发人员根据大众较能接收的融合分贝设置。
例如,在导航语音播放时,将第二音频即播放器播放的音频的音量调节至10 分贝。
对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度,例如,第一音量大小的调节程度为30分贝,第二音量大小的调节程度为15分贝,虽然二者最终都达到了10分贝的音量,但是对属于高分贝动态阈值和属于低分贝动态阈值的音频的调节策略是不同的。
从以上的描述中,可以看出,本申请实现了如下技术效果:本申请实施例中的用于语音动态融合的数据处理方法,获取播放器中的音频流数据;计算所述音频流数据的音频流分贝;以及根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。采用融合导航应用程序播放的第一音频与播放器播放的第二音频的方式,通过获取播放器中的音频流数据,计算所述音频流数据的音频流分贝,设置动态阈值,达到了调节所述第一音频在播放时所述第二音频的播放音量的目的,从而实现了导航应用程序播放的第一音频与播放器播放的第二音频相融合的技术效果,进而解决了导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的技术问题。本申请所提供的用于语音动态融合的数据处理装置可用作SDK或客户端使用。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述用于语音动态融合的数据处理方法的数据处理装置,如图6所示,用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述装置包括:
获取模块10,用于获取播放器中的音频流数据;
根据本申请实施例中的获取模块10,音频流数据可以是音频流播放进度、音频流分贝。
可以通过获取音频流数据播放进度确定播放器中音频的播放情况以及音频流分贝。
例如,音频流数据为一首时长为4分钟的歌曲,音频流播放进度为1分48秒处,播放分贝为55DB。
计算模块20,用于计算所述音频流数据的音频流分贝;以及
根据本申请实施例中的计算模块20,计算所述音频流数据的音频流分贝可以根据音频流播放进度以及播放器本身设定的音量大小确定。
例如,对于具有这种功能的硬件设备,可以通过软件算法实时计算出当前音频流的分贝,并回馈给给播放器,实现调整播放器的音量大小。对于无法分离音乐声音的设备,如:手机,可以边播放边缓存,根据读取播放器播放的进度,来获取缓存文件中现在正播放的音乐音频流,再通过软件算法实时计算出当前音频流的分贝,回馈给播放器,以实现控制。
调节模块30,用于根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
根据本申请实施例中的调节模块30,预设动态阈值可以是开发人员设置的合理的音频播放分贝段。
第一音频可以是导航语音。
第二音频可以是播放器播放的音频,例如可以是音乐或广播。
在确定第二音频即播放器播放的音频属于高分贝动态阈值的情况时,将第二音频的播放音量向下调节的幅度可适当加大。
具有较高分贝的摇滚音乐,可以多往下调节一些。例如,30分贝的音乐,调节至10分贝,向下调节了20个分贝的音量。
具有较低分贝的轻音乐,可以少往下调节一些。例如,15分贝的音乐,调节至10分贝,向下调节了5个分贝的音量。
如图7所示,获取模块10包括:
读取单元101,用于读取播放器当前的音频流播放进度;
根据本申请实施例中的读取单元101,读取播放器当前的音频流播放进度可以是通过现有技术中的算法或代码实现音频流数据播放进度的读取。
缓存单元102,用于根据所述音频流播放进度获取缓存文件;以及
根据本申请实施例中的缓存单元102,缓存文件可以是播放器中缓存的待播放内容。
根据所述音频流播放进度获取播放器中缓存的待播放内容。
例如,一首时长为4分钟的歌曲播放至1分30秒时,获取1分30至4分钟时结束位置的歌曲内容。
获取单元103,用于从所述缓存文件中获取正在播放的音频流数据。
根据本申请实施例中的获取单元103,从播放器中缓存的待播放内容中获取正在播放的音乐或广播。
例如,一首时长为4分钟的歌曲播放至1分30秒时,获取1分30秒时的歌曲内容。
如图8所示,计算模块20包括:第一计算单元201,调节模块30包括:第一调节单元301,
第一计算单元201,用于确定所述音频流分贝所在高分贝动态阈值;
根据本申请实施例中的第一计算单元201,高分贝动态阈值可以是音频流播放分贝属于高分贝音频的情况下预设的阈值。
例如,比如音频的分贝最大是30内,就在30分贝内调节播放器播放的音量大小。例如,摇滚音乐的分贝较高。
第一调节单元301,用于根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
根据本申请实施例中的第一调节单元301,在确定第二音频即播放器播放的音频属于高分贝动态阈值的情况时,将第二音频的播放音量向下调节的幅度可适当加大。
例如,具有较高分贝的摇滚音乐,可以多往下调节一些。
例如,30分贝的音乐,调节至10分贝,向下调节了20个分贝的音量。
如图9所示,计算模块20包括:第二计算单元202,调节模块30包括:第二调节单元302,
第二计算单元202,用于确定所述音频流分贝所在低分贝动态阈值;
根据本申请实施例中的第二计算单元202,低分贝动态阈值可以是音频流播放分贝属于低分贝音频的情况下预设的阈值。
例如,比如音频的分贝最大是15内,就在15分贝内调节播放器播放的音量大小。例如,轻音乐的分贝较低。
第二调节单元302,用于根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
根据本申请实施例中的第二调节单元302,例如,具有较低分贝的轻音乐,可以少往下调节一些。
例如,15分贝的音乐,调节至10分贝,向下调节了5个分贝的音量。
如图10所示,计算模块20包括:第三计算单元203、判断单元204,调节模块30包括:第三调节单元303、第四调节单元304,
第三计算单元203,用于确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
根据本申请实施例中的第三计算单元203,根据获取的音频流分贝对音频流分贝进行判断。
确定所述音频流分贝可以是对于具有这种功能的硬件设备,可以通过软件算法实时计算出当前音频流的分贝,并回馈给给播放器,实现调整播放器的音量大小。对于无法分离音乐声音的设备,如:手机,可以边播放边缓存,根据读取播放器播放的进度,来获取缓存文件中现在正播放的音乐音频流,再通过软件算法实时计算出当前音频流的分贝,回馈给播放器,以实现控制。
判断单元204,用于判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值内;
根据本申请实施例中的判断单元204,判断正在播放的音频流的分贝是否大于预先设定的高分贝动态阈值或低分贝动态阈值。
例如,设定高分贝动态阈值为30分贝以上,低分贝动态阈值为15分贝以下。
根据获取的音频流分贝,判断出所述音频流分贝属于高分贝动态阈值,还是属于低分贝动态阈值。
第三调节单元303,用于判断所述第二音频的播放音量大于高分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
根据本申请实施例中的第三调节单元303,如果判断所述第二音频的播放音量大于高分贝动态阈值,例如第二音频的播放音量分贝为40分贝,大于高分贝动态阈值30 分贝,则将第二音频的播放音量调节为预先设置的第一音量大小。
需要说明的是,第一音量大小可以是开发人员根据大众较能接收的融合分贝设置。
例如,在导航语音播放时,将第二音频即播放器播放的音频的音量调节至1 0分贝。
第四调节单元304,用于判断所述第二音频的播放音量大于低分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
根据本申请实施例中的第四调节单元304,如果判断所述第二音频的播放音量大于低分贝动态阈值,例如第二音频的播放音量分贝为25分贝,大于低 分贝动态阈值15分贝,则将第二音频的播放音量调节为预先设置的第二音量大小。
需要说明的是,第二音量大小可以是开发人员根据大众较能接收的融合分贝设置。
例如,在导航语音播放时,将第二音频即播放器播放的音频的音量调节至10 分贝。
对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度,例如,第一音量大小的调节程度为30 分贝,第二音量大小的调节程度为15 分贝,虽然二者最终都达到了10分贝的音量,但是对属于高分贝动态阈值和属于低分贝动态阈值的音频的调节策略是不同的。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。