CN109117110B - 用于语音动态融合的数据处理方法及装置 - Google Patents

用于语音动态融合的数据处理方法及装置 Download PDF

Info

Publication number
CN109117110B
CN109117110B CN201810750530.6A CN201810750530A CN109117110B CN 109117110 B CN109117110 B CN 109117110B CN 201810750530 A CN201810750530 A CN 201810750530A CN 109117110 B CN109117110 B CN 109117110B
Authority
CN
China
Prior art keywords
audio
decibel
audio stream
volume
playing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810750530.6A
Other languages
English (en)
Other versions
CN109117110A (zh
Inventor
沈峥嵘
陈涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ileja Tech Co ltd
Original Assignee
Beijing Ileja Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ileja Tech Co ltd filed Critical Beijing Ileja Tech Co ltd
Priority to CN201810750530.6A priority Critical patent/CN109117110B/zh
Publication of CN109117110A publication Critical patent/CN109117110A/zh
Application granted granted Critical
Publication of CN109117110B publication Critical patent/CN109117110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本申请公开了一种用于语音动态融合的数据处理方法及装置。该数据处理方法用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述方法包括:获取播放器中的音频流数据;计算所述音频流数据的音频流分贝;以及根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。本申请解决了导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的技术问题。本申请所提供的用于语音动态融合的数据处理装置可用作SDK或客户端使用。

Description

用于语音动态融合的数据处理方法及装置
技术领域
本申请涉及通信领域,具体而言,涉及一种用于语音动态融合的数据处理方法及装置。
背景技术
现有技术中的在进行播放音乐的同时使用导航播报时,做法大致如下:(1 在导航声音播报的时候将音乐的声音降低到最大音量的20%或者某个固定的音量大小,等导航声音播放完成后把音乐声音调高到默认音量大小;(2暂停音乐的播放,等导航声音播放完成继续音乐播放。
发明人发现现有技术存在以下缺点:不同类型音乐的音量大小都不一样,有高分贝的摇滚,有轻柔的抒情歌曲,如果调到固定音量,调高了,音乐声音太大,混在一起导航声音听不清;调低了,轻柔的歌曲又听不见,无法满足更优的播放体验。
针对相关技术中导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种用于语音动态融合的数据处理方法及装置,以解决导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种用于语音动态融合的数据处理方法方法。
根据本申请的用于语音动态融合的数据处理方法:用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述方法包括:
获取播放器中的音频流数据;
计算所述音频流数据的音频流分贝;以及
根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步地,获取播放器中的音频流数据包括:
读取播放器当前的音频流播放进度;
根据所述音频流播放进度获取缓存文件;以及
从所述缓存文件中获取正在播放的音频流数据。
进一步地,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在高分贝动态阈值;
根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步地,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在低分贝动态阈值;
根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步地,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值内;如果判断所述第二音频的播放音量大于高分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
如果判断所述第二音频的播放音量大于低分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,
其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
为了实现上述目的,根据本申请的另一方面,提供了一种用于语音动态融合的数据处理装置。
根据本申请的用于语音动态融合的数据处理装置包括:用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述装置包括:
获取模块,用于获取播放器中的音频流数据;
计算模块,用于计算所述音频流数据的音频流分贝;以及
调节模块,用于根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步的,获取模块包括:
读取单元,用于读取播放器当前的音频流播放进度;
缓存单元,用于根据所述音频流播放进度获取缓存文件;以及
获取单元,用于从所述缓存文件中获取正在播放的音频流数据。
进一步的,计算模块包括:第一计算单元,调节模块包括:第一调节单元,
第一计算单元,用于确定所述音频流分贝所在高分贝动态阈值;
第一调节单元,用于根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步的,计算模块包括:第二计算单元,调节模块包括:第二调节单元,
第二计算单元,用于确定所述音频流分贝所在低分贝动态阈值;
第二调节单元,用于根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
进一步的,计算模块包括:第三计算单元、判断单元,调节模块包括:第三调节单元、第四调节单元,
第三计算单元,用于确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
判断单元,用于判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值内;
第三调节单元,用于判断所述第二音频的播放音量大于高分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
第四调节单元,用于判断所述第二音频的播放音量大于低分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
在本申请实施例中,采用融合导航应用程序播放的第一音频与播放器播放的第二音频的方式,通过获取播放器中的音频流数据,计算所述音频流数据的音频流分贝,设置动态阈值,达到了调节所述第一音频在播放时所述第二音频的播放音量的目的,从而实现了导航应用程序播放的第一音频与播放器播放的第二音频相融合的技术效果,进而解决了导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请第一实施例的用于语音动态融合的数据处理方法示意图;
图2是根据本申请第二实施例的用于语音动态融合的数据处理方法示意图;
图3是根据本申请第三实施例的用于语音动态融合的数据处理方法示意图;
图4是根据本申请第四实施例的用于语音动态融合的数据处理方法示意图;
图5是根据本申请第五实施例的用于语音动态融合的数据处理方法示意图;
图6是根据本申请第一实施例的用于语音动态融合的数据处理装置示意图;
图7是根据本申请第二实施例的用于语音动态融合的数据处理装置示意图;
图8是根据本申请第三实施例的用于语音动态融合的数据处理装置示意图;
图9是根据本申请第四实施例的用于语音动态融合的数据处理装置示意图;以及
图10是根据本申请第五实施例的用于语音动态融合的数据处理装置示意图。本申请所提供的用于语音动态融合的数据处理装置可用作SDK或客户端使用。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本申请实施例中的用于语音动态融合的数据处理方法,获取播放器中的音频流数据;计算所述音频流数据的音频流分贝;以及根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。采用融合导航应用程序播放的第一音频与播放器播放的第二音频的方式,通过获取播放器中的音频流数据,计算所述音频流数据的音频流分贝,设置动态阈值,达到了调节所述第一音频在播放时所述第二音频的播放音量的目的,从而实现了导航应用程序播放的第一音频与播放器播放的第二音频相融合的技术效果,进而解决了导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的技术问题。
根据本申请实施例,提供了一种用于语音动态融合的数据处理方法,如图1 所示,该方法包括如下的步骤S102至步骤S106:
步骤S102,获取播放器中的音频流数据;
音频流数据可以是音频流播放进度、音频流分贝。
可以通过获取音频流数据播放进度确定播放器中音频的播放情况以及音频流分贝。
例如,音频流数据为一首时长为4分钟的歌曲,音频流播放进度为1分48秒处,播放分贝为55DB。
步骤S104,计算所述音频流数据的音频流分贝;以及
计算所述音频流数据的音频流分贝可以根据音频流播放进度以及播放器本身设定的音量大小确定。
例如,对于具有这种功能的硬件设备,可以通过软件算法实时计算出当前音频流的分贝,并回馈给给播放器,实现调整播放器的音量大小。对于无法分离音乐声音的设备,如:手机,可以边播放边缓存,根据读取播放器播放的进度,来获取缓存文件中现在正播放的音乐音频流,再通过软件算法实时计算出当前音频流的分贝,回馈给播放器,以实现控制。
步骤S106,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
预设动态阈值可以是开发人员设置的合理的音频播放分贝段。
第一音频可以是导航语音。
第二音频可以是播放器播放的音频,例如可以是音乐或广播。
在确定第二音频即播放器播放的音频属于高分贝动态阈值的情况时,将第二音频的播放音量向下调节的幅度可适当加大。
具有较高分贝的摇滚音乐,可以多往下调节一些。例如,30分贝的音乐,调节至10分贝,向下调节了20个分贝的音量。
具有较低分贝的轻音乐,可以少往下调节一些。例如,15分贝的音乐,调节至10分贝,向下调节了5个分贝的音量。
如图2所示,获取播放器中的音频流数据包括如下的步骤S202至步骤S206:
步骤S202,读取播放器当前的音频流播放进度;
读取播放器当前的音频流播放进度可以是通过现有技术中的算法或代码实现音频流数据播放进度的读取。
步骤S204,根据所述音频流播放进度获取缓存文件;以及
缓存文件可以是播放器中缓存的待播放内容。
根据所述音频流播放进度获取播放器中缓存的待播放内容。
例如,一首时长为4分钟的歌曲播放至1分30秒时,获取1分30至4分钟时结束位置的歌曲内容。
步骤S206,从所述缓存文件中获取正在播放的音频流数据。
从播放器中缓存的待播放内容中获取正在播放的音乐或广播。
例如,一首时长为4分钟的歌曲播放至1分30秒时,获取1分30秒时的歌曲内容。
如图3所示,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括如下的步骤S302至步骤S304:
步骤S302,确定所述音频流分贝所在高分贝动态阈值;
高分贝动态阈值可以是音频流播放分贝属于高分贝音频的情况下预设的阈值。
例如,比如音频的分贝最大是30内,就在30分贝内调节播放器播放的音量大小。例如,摇滚音乐的分贝较高。
步骤S304,根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
在确定第二音频即播放器播放的音频属于高分贝动态阈值的情况时,将第二音频的播放音量向下调节的幅度可适当加大。
例如,具有较高分贝的摇滚音乐,可以多往下调节一些。
例如,30分贝的音乐,调节至10分贝,向下调节了20个分贝的音量。
如图4所示,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括如下的步骤S402至步骤S404:
步骤S402,确定所述音频流分贝所在低分贝动态阈值;
低分贝动态阈值可以是音频流播放分贝属于低分贝音频的情况下预设的阈值。
例如,比如音频的分贝最大是15内,就在15分贝内调节播放器播放的音量大小。例如,轻音乐的分贝较低。
步骤S404,根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
例如,具有较低分贝的轻音乐,可以少往下调节一些。
例如,15分贝的音乐,调节至10分贝,向下调节了5个分贝的音量。
如图5所示,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括如下的步骤S502至步骤S508:
步骤S502,确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
根据获取的音频流分贝对音频流分贝进行判断。
确定所述音频流分贝可以是对于具有这种功能的硬件设备,可以通过软件算法实时计算出当前音频流的分贝,并回馈给给播放器,实现调整播放器的音量大小。对于无法分离音乐声音的设备,如:手机,可以边播放边缓存,根据读取播放器播放的进度,来获取缓存文件中现在正播放的音乐音频流,再通过软件算法实时计算出当前音频流的分贝,回馈给播放器,以实现控制。
步骤S504,判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值内;
判断正在播放的音频流的分贝是否大于预先设定的高分贝动态阈值或低分贝动态阈值。
例如,设定高分贝动态阈值为30分贝以上,低分贝动态阈值为15分贝以下。
根据获取的音频流分贝,判断出所述音频流分贝属于高分贝动态阈值,还是属于低分贝动态阈值。
步骤S506,如果判断所述第二音频的播放音量大于高分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
如果判断所述第二音频的播放音量大于高分贝动态阈值,例如第二音频的播放音量分贝为40分贝,大于高分贝动态阈值30分贝,则将第二音频的播放音量调节为预先设置的第一音量大小。
需要说明的是,第一音量大小可以是开发人员根据大众较能接收的融合分贝设置。
例如,在导航语音播放时,将第二音频即播放器播放的音频的音量调节至1 0分贝。
步骤S508,如果判断所述第二音频的播放音量大于低分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,
其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
如果判断所述第二音频的播放音量大于低分贝动态阈值,例如第二音频的播放音量分贝为25分贝,大于低分贝动态阈值15分贝,则将第二音频的播放音量调节为预先设置的第二音量大小。
需要说明的是,第二音量大小可以是开发人员根据大众较能接收的融合分贝设置。
例如,在导航语音播放时,将第二音频即播放器播放的音频的音量调节至10 分贝。
对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度,例如,第一音量大小的调节程度为30分贝,第二音量大小的调节程度为15分贝,虽然二者最终都达到了10分贝的音量,但是对属于高分贝动态阈值和属于低分贝动态阈值的音频的调节策略是不同的。
从以上的描述中,可以看出,本申请实现了如下技术效果:本申请实施例中的用于语音动态融合的数据处理方法,获取播放器中的音频流数据;计算所述音频流数据的音频流分贝;以及根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。采用融合导航应用程序播放的第一音频与播放器播放的第二音频的方式,通过获取播放器中的音频流数据,计算所述音频流数据的音频流分贝,设置动态阈值,达到了调节所述第一音频在播放时所述第二音频的播放音量的目的,从而实现了导航应用程序播放的第一音频与播放器播放的第二音频相融合的技术效果,进而解决了导航语音与播放器播放音乐无法合理融合导致的用户体验感较差的技术问题。本申请所提供的用于语音动态融合的数据处理装置可用作SDK或客户端使用。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述用于语音动态融合的数据处理方法的数据处理装置,如图6所示,用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述装置包括:
获取模块10,用于获取播放器中的音频流数据;
根据本申请实施例中的获取模块10,音频流数据可以是音频流播放进度、音频流分贝。
可以通过获取音频流数据播放进度确定播放器中音频的播放情况以及音频流分贝。
例如,音频流数据为一首时长为4分钟的歌曲,音频流播放进度为1分48秒处,播放分贝为55DB。
计算模块20,用于计算所述音频流数据的音频流分贝;以及
根据本申请实施例中的计算模块20,计算所述音频流数据的音频流分贝可以根据音频流播放进度以及播放器本身设定的音量大小确定。
例如,对于具有这种功能的硬件设备,可以通过软件算法实时计算出当前音频流的分贝,并回馈给给播放器,实现调整播放器的音量大小。对于无法分离音乐声音的设备,如:手机,可以边播放边缓存,根据读取播放器播放的进度,来获取缓存文件中现在正播放的音乐音频流,再通过软件算法实时计算出当前音频流的分贝,回馈给播放器,以实现控制。
调节模块30,用于根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
根据本申请实施例中的调节模块30,预设动态阈值可以是开发人员设置的合理的音频播放分贝段。
第一音频可以是导航语音。
第二音频可以是播放器播放的音频,例如可以是音乐或广播。
在确定第二音频即播放器播放的音频属于高分贝动态阈值的情况时,将第二音频的播放音量向下调节的幅度可适当加大。
具有较高分贝的摇滚音乐,可以多往下调节一些。例如,30分贝的音乐,调节至10分贝,向下调节了20个分贝的音量。
具有较低分贝的轻音乐,可以少往下调节一些。例如,15分贝的音乐,调节至10分贝,向下调节了5个分贝的音量。
如图7所示,获取模块10包括:
读取单元101,用于读取播放器当前的音频流播放进度;
根据本申请实施例中的读取单元101,读取播放器当前的音频流播放进度可以是通过现有技术中的算法或代码实现音频流数据播放进度的读取。
缓存单元102,用于根据所述音频流播放进度获取缓存文件;以及
根据本申请实施例中的缓存单元102,缓存文件可以是播放器中缓存的待播放内容。
根据所述音频流播放进度获取播放器中缓存的待播放内容。
例如,一首时长为4分钟的歌曲播放至1分30秒时,获取1分30至4分钟时结束位置的歌曲内容。
获取单元103,用于从所述缓存文件中获取正在播放的音频流数据。
根据本申请实施例中的获取单元103,从播放器中缓存的待播放内容中获取正在播放的音乐或广播。
例如,一首时长为4分钟的歌曲播放至1分30秒时,获取1分30秒时的歌曲内容。
如图8所示,计算模块20包括:第一计算单元201,调节模块30包括:第一调节单元301,
第一计算单元201,用于确定所述音频流分贝所在高分贝动态阈值;
根据本申请实施例中的第一计算单元201,高分贝动态阈值可以是音频流播放分贝属于高分贝音频的情况下预设的阈值。
例如,比如音频的分贝最大是30内,就在30分贝内调节播放器播放的音量大小。例如,摇滚音乐的分贝较高。
第一调节单元301,用于根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
根据本申请实施例中的第一调节单元301,在确定第二音频即播放器播放的音频属于高分贝动态阈值的情况时,将第二音频的播放音量向下调节的幅度可适当加大。
例如,具有较高分贝的摇滚音乐,可以多往下调节一些。
例如,30分贝的音乐,调节至10分贝,向下调节了20个分贝的音量。
如图9所示,计算模块20包括:第二计算单元202,调节模块30包括:第二调节单元302,
第二计算单元202,用于确定所述音频流分贝所在低分贝动态阈值;
根据本申请实施例中的第二计算单元202,低分贝动态阈值可以是音频流播放分贝属于低分贝音频的情况下预设的阈值。
例如,比如音频的分贝最大是15内,就在15分贝内调节播放器播放的音量大小。例如,轻音乐的分贝较低。
第二调节单元302,用于根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
根据本申请实施例中的第二调节单元302,例如,具有较低分贝的轻音乐,可以少往下调节一些。
例如,15分贝的音乐,调节至10分贝,向下调节了5个分贝的音量。
如图10所示,计算模块20包括:第三计算单元203、判断单元204,调节模块30包括:第三调节单元303、第四调节单元304,
第三计算单元203,用于确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
根据本申请实施例中的第三计算单元203,根据获取的音频流分贝对音频流分贝进行判断。
确定所述音频流分贝可以是对于具有这种功能的硬件设备,可以通过软件算法实时计算出当前音频流的分贝,并回馈给给播放器,实现调整播放器的音量大小。对于无法分离音乐声音的设备,如:手机,可以边播放边缓存,根据读取播放器播放的进度,来获取缓存文件中现在正播放的音乐音频流,再通过软件算法实时计算出当前音频流的分贝,回馈给播放器,以实现控制。
判断单元204,用于判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值内;
根据本申请实施例中的判断单元204,判断正在播放的音频流的分贝是否大于预先设定的高分贝动态阈值或低分贝动态阈值。
例如,设定高分贝动态阈值为30分贝以上,低分贝动态阈值为15分贝以下。
根据获取的音频流分贝,判断出所述音频流分贝属于高分贝动态阈值,还是属于低分贝动态阈值。
第三调节单元303,用于判断所述第二音频的播放音量大于高分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
根据本申请实施例中的第三调节单元303,如果判断所述第二音频的播放音量大于高分贝动态阈值,例如第二音频的播放音量分贝为40分贝,大于高分贝动态阈值30 分贝,则将第二音频的播放音量调节为预先设置的第一音量大小。
需要说明的是,第一音量大小可以是开发人员根据大众较能接收的融合分贝设置。
例如,在导航语音播放时,将第二音频即播放器播放的音频的音量调节至1 0分贝。
第四调节单元304,用于判断所述第二音频的播放音量大于低分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
根据本申请实施例中的第四调节单元304,如果判断所述第二音频的播放音量大于低分贝动态阈值,例如第二音频的播放音量分贝为25分贝,大于低 分贝动态阈值15分贝,则将第二音频的播放音量调节为预先设置的第二音量大小。
需要说明的是,第二音量大小可以是开发人员根据大众较能接收的融合分贝设置。
例如,在导航语音播放时,将第二音频即播放器播放的音频的音量调节至10 分贝。
对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度,例如,第一音量大小的调节程度为30 分贝,第二音量大小的调节程度为15 分贝,虽然二者最终都达到了10分贝的音量,但是对属于高分贝动态阈值和属于低分贝动态阈值的音频的调节策略是不同的。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (6)

1.一种用于语音动态融合的数据处理方法,其特征在于,用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述方法包括:
获取播放器中的音频流数据;
计算所述音频流数据的音频流分贝;以及
根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量;
其中,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在高分贝动态阈值;
根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量;
计算所述音频流数据的音频流分贝根据音频流播放进度以及播放器本身设定的音量大小确定,包括:若播放器设备具有分离音乐声音的功能,通过软件算法实时计算出当前音频流的分贝,并回馈给播放器,实现调整播放器的音量大小;若播放器设备不具有分离音乐声音的功能,根据读取播放进度,获取缓存文件中正播放的音乐音频流,通过软件算法实时计算出当前音频流的分贝,回馈给播放器;
根据所述音频流分贝所在预设动态阈值内调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值;
如果判断所述第二音频的播放音量大于高分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
如果判断所述第二音频的播放音量大于低分贝动态阈值,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,
其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
2.根据权利要求1所述的数据处理方法,其特征在于,获取播放器中的音频流数据包括:
读取播放器当前的音频流播放进度;
根据所述音频流播放进度获取缓存文件;以及
从所述缓存文件中获取正在播放的音频流数据。
3.根据权利要求1所述的数据处理方法,其特征在于,根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量包括:
确定所述音频流分贝所在低分贝动态阈值;
根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
4.一种用于语音动态融合的数据处理装置,其特征在于,用于在第一播放事件和第二播放事件同时发生时执行语音动态融合处理,所述第一播放事件用于通过导航应用程序播放第一音频,所述第二播放事件用于通过播放器播放第二音频,所述装置包括:
获取模块,用于获取播放器中的音频流数据;
计算模块,用于计算所述音频流数据的音频流分贝;以及
调节模块,用于根据所述音频流分贝所在预设动态阈值调节所述第一音频在播放时所述第二音频的播放音量;
其中,计算模块包括:第一计算单元,调节模块包括:第一调节单元,
第一计算单元,用于确定所述音频流分贝所在高分贝动态阈值;
第一调节单元,用于根据所述高分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量;
计算所述音频流数据的音频流分贝根据音频流播放进度以及播放器本身设定的音量大小确定,包括:若播放器设备具有分离音乐声音的功能,通过软件算法实时计算出当前音频流的分贝,并回馈给播放器,实现调整播放器的音量大小;若播放器设备不具有分离音乐声音的功能,根据读取播放进度,获取缓存文件中正播放的音乐音频流,通过软件算法实时计算出当前音频流的分贝,回馈给播放器;
计算模块包括:第三计算单元、判断单元,调节模块包括:第三调节单元、第四调节单元,
第三计算单元,用于确定所述音频流分贝所在高分贝动态阈值和低分贝动态阈值;
判断单元,用于判断所述第二音频的播放音量是否大于高分贝动态阈值或低分贝动态阈值;
第三调节单元,用于判断所述第二音频的播放音量大于高分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第一音量大小;
第四调节单元,用于判断所述第二音频的播放音量大于低分贝动态阈值时,则将所述第一音频在播放时所述第二音频的播放音量调节为第二音量大小,
其中,对所述第一音量大小的调节程度大于对所述第二音量大小的调节程度。
5.根据权利要求4所述的数据处理装置,其特征在于,获取模块包括:
读取单元,用于读取播放器当前的音频流播放进度;
缓存单元,用于根据所述音频流播放进度获取缓存文件;以及
获取单元,用于从所述缓存文件中获取正在播放的音频流数据。
6.根据权利要求4所述的数据处理装置,其特征在于,计算模块包括:第二计算单元,调节模块包括:第二调节单元,
第二计算单元,用于确定所述音频流分贝所在低分贝动态阈值;
第二调节单元,用于根据所述低分贝动态阈值调节所述第一音频在播放时所述第二音频的播放音量。
CN201810750530.6A 2018-07-10 2018-07-10 用于语音动态融合的数据处理方法及装置 Active CN109117110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810750530.6A CN109117110B (zh) 2018-07-10 2018-07-10 用于语音动态融合的数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810750530.6A CN109117110B (zh) 2018-07-10 2018-07-10 用于语音动态融合的数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN109117110A CN109117110A (zh) 2019-01-01
CN109117110B true CN109117110B (zh) 2022-04-19

Family

ID=64862073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810750530.6A Active CN109117110B (zh) 2018-07-10 2018-07-10 用于语音动态融合的数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN109117110B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111787462B (zh) * 2020-09-04 2021-01-26 蘑菇车联信息科技有限公司 音频流处理方法及系统、设备、介质
CN113986189A (zh) * 2021-10-27 2022-01-28 北京乐驾科技有限公司 车载终端导航音量动态调整方法以及装置
CN116761114B (zh) * 2023-07-14 2024-01-26 润芯微科技(江苏)有限公司 一种车载音响播放声音调节方法及其系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103137167A (zh) * 2013-01-21 2013-06-05 青岛海信宽带多媒体技术有限公司 播放音乐的方法及音乐播放器
CN105827825A (zh) * 2016-02-29 2016-08-03 维沃移动通信有限公司 一种音频数据的处理方法及移动终端
CN107682547A (zh) * 2017-09-29 2018-02-09 努比亚技术有限公司 一种语音信息调控方法、设备及计算机可读存储介质
CN107807809A (zh) * 2017-10-26 2018-03-16 努比亚技术有限公司 一种终端音量调节方法、终端和计算机可读存储介质
CN108182939A (zh) * 2017-12-13 2018-06-19 苏州车萝卜汽车电子科技有限公司 用于自助服务的语音处理方法及装置
CN108259984A (zh) * 2017-12-29 2018-07-06 广州市百果园信息技术有限公司 视频图像处理方法、计算机可读存储介质及终端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10789041B2 (en) * 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103137167A (zh) * 2013-01-21 2013-06-05 青岛海信宽带多媒体技术有限公司 播放音乐的方法及音乐播放器
CN105827825A (zh) * 2016-02-29 2016-08-03 维沃移动通信有限公司 一种音频数据的处理方法及移动终端
CN107682547A (zh) * 2017-09-29 2018-02-09 努比亚技术有限公司 一种语音信息调控方法、设备及计算机可读存储介质
CN107807809A (zh) * 2017-10-26 2018-03-16 努比亚技术有限公司 一种终端音量调节方法、终端和计算机可读存储介质
CN108182939A (zh) * 2017-12-13 2018-06-19 苏州车萝卜汽车电子科技有限公司 用于自助服务的语音处理方法及装置
CN108259984A (zh) * 2017-12-29 2018-07-06 广州市百果园信息技术有限公司 视频图像处理方法、计算机可读存储介质及终端

Also Published As

Publication number Publication date
CN109117110A (zh) 2019-01-01

Similar Documents

Publication Publication Date Title
US10484813B2 (en) Systems and methods for delivery of personalized audio
CN109117110B (zh) 用于语音动态融合的数据处理方法及装置
US11474775B2 (en) Sound effect adjustment method, device, electronic device and storage medium
CN105390144B (zh) 一种音频处理方法和音频处理装置
CN103177743B (zh) 一种歌曲播放方法及装置
CN108737648B (zh) 音乐音量自适应调节方法、装置、存储介质及终端
WO2017215657A1 (zh) 音效处理方法及终端设备
MX2011005782A (es) Metodo y aparato para controlar la reproduccion de datos de video-audio.
CN106210879A (zh) 智能音量控制系统和智能音量控制方法
CN109413537A (zh) 音频信号播放方法、装置及耳机
CN108924361B (zh) 音频播放和采集控制方法、系统及计算机可读存储介质
WO2021120570A1 (zh) 蓝牙音频传输方法、装置、终端和可读存储介质
CN107526570B (zh) 音量调节方法、装置、终端设备及存储介质
CN104464743B (zh) 一种在语音聊天室中播放背景音乐的方法及移动终端
CN110989968A (zh) 智能音效处理方法、电子设备、存储介质以及多音效音箱
CN106095382A (zh) 音量控制方法及用户终端
US20130132521A1 (en) Presenting alternative media content based on environmental factors
CN112669859B (zh) 一种通信模式控制方法及装置
CN111033614A (zh) 音量调节方法、装置、移动终端及存储介质
KR20080090183A (ko) 무선 통신으로 방송 데이터를 수신하여 재생하는 방법 및장치
CN108989937A (zh) 一种无线耳机的增益调节方法、装置及无线耳机
CN108965904A (zh) 一种直播间的音量调节方法及客户端
CN112449208B (zh) 语音处理方法及其装置
CN107171760B (zh) 一种收音机播放方法、云端服务器及收音机
CN103544958B (zh) 切换音频输出时控制音频啸叫的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 215000 4th floor, building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: Suzhou turnip Electronic Technology Co.,Ltd.

Address before: 215123 unit 4-b202, creative industry park, 328 Xinghu street, Suzhou Industrial Park, Jiangsu Province

Applicant before: SUZHOU CARROBOT AUTOMOTIVE ELECTRONICS TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20220112

Address after: Room 518, 5 / F, block a, Longyu center, building 1, yard 1, Longyu middle street, Huilongguan, Changping District, Beijing 102200

Applicant after: BEIJING ILEJA TECH. Co.,Ltd.

Address before: 215000 4th floor, building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant before: Suzhou turnip Electronic Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant