CN115268828A - 音频播放方法、电子设备及可读存储介质 - Google Patents

音频播放方法、电子设备及可读存储介质 Download PDF

Info

Publication number
CN115268828A
CN115268828A CN202210921684.3A CN202210921684A CN115268828A CN 115268828 A CN115268828 A CN 115268828A CN 202210921684 A CN202210921684 A CN 202210921684A CN 115268828 A CN115268828 A CN 115268828A
Authority
CN
China
Prior art keywords
audio
target
target audio
volume
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210921684.3A
Other languages
English (en)
Inventor
陈洲旋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN202210921684.3A priority Critical patent/CN115268828A/zh
Publication of CN115268828A publication Critical patent/CN115268828A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种音频播放方法、设备及计算机可读存储介质,该方法包括:提供音频播放模式选择界面;在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出目标音频对应的当前音量数据;其中,专辑模式下将所有目标音频作为一个完整音频。获取目标音频对应的预设音量阈值;利用当前音量数据和预设音量阈值,确定目标音频对应的音量调节参数。音量调节参数能够在目标音频播放时对其进行音量调节,使得目标音频能够在与预设音量阈值相匹配的情况下播放,使得同一音频文件内的所有音频能够维持在同一音量水平,无需用户频繁调节音量,避免造成用户听力损伤。

Description

音频播放方法、电子设备及可读存储介质
技术领域
本申请涉及音频处理技术领域,特别涉及一种音频播放方法、电子设备及计算机可读存储介质。
背景技术
随着互联网技术不断发展,互联网上存在海量的各类音频文件,如音乐、演讲、有声书、聊天等各种类型的音频文件。各个音频的响度有不同大小,多个音频连续切换播放时,会出现响度忽大忽小的情况,用户需要频繁调节音量按钮,体验较差,也容易造成听力损伤。
发明内容
有鉴于此,本申请的目的在于提供一种音频播放方法、电子设备及计算机可读存储介质,无需用户频繁调节音量,避免造成用户听力损伤。
为解决上述技术问题,第一方面,本申请提供了一种音频播放方法,包括:
提供音频播放模式选择界面;
在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出所述目标音频对应的当前音量数据;其中,专辑模式下将所有所述目标音频作为一个完整音频;
获取所述目标音频对应的预设音量阈值;
利用所述当前音量数据和所述预设音量阈值,确定所述目标音频对应的音量调节参数;所述音量调节参数用于在所述目标音频播放时对所述目标音频进行音量调节。
可选地,所述获取所述目标音频对应的预设音量阈值包括:
提供音频场景选择界面;
响应于用户对所述目标音频的音频场景的选择,确定出所述目标音频对应的预设音量阈值。
可选地,所述获取所述目标音频对应的预设音量阈值包括:
提供音频场景选择界面;
基于用户选择的目标音频场景以及所述目标音频所属的音频类型,确定出所述目标音频对应的预设音量阈值。
可选地,所述在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出所述目标音频对应的当前音量数据包括:
在用户选择的目标音频的音频播放模式为专辑模式的情况下,分别提取各所述目标音频对应的初始音量数据;
对各个所述初始音量数据进行均值处理,得到所有所述目标音频对应的当前音量数据。
可选地,所述在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出所述目标音频对应的当前音量数据包括:
在用户选择的目标音频的音频播放模式为专辑模式的情况下,将所有所述目标音频拼接为一个音频文件,并对所述音频文件进行数据提取得到所述当前音量数据。
可选地,还包括:
在用户选择的目标音频的音频播放模式为单曲模式的情况下,确定出所述目标音频对应的当前音量数据;其中,单曲模式下将各所述目标音频作为独立的音频。
可选地,所述在用户选择的目标音频的音频播放模式为单曲模式的情况下,确定出所述目标音频对应的当前音量数据包括:
在用户选择的目标音频的音频播放模式为单曲模式的情况下,分别提取各所述目标音频对应的当前音量数据;
相应的,所述利用所述当前音量数据和所述预设音量阈值,确定所述目标音频对应的音量调节参数包括:
依据所述预设音量阈值以及各所述目标音频对应的当前音量数据,确定出各所述目标音频各自对应的音量调节参数。
可选地,还包括:
生成并存储所述目标音频和所述音量调节参数之间的对应关系数据音频播放方法;
获取目标设备发送的待播放音频信息;
利用所述待播放音频信息,基于所述对应关系数据确定对应的待播放音量调节参数,并将所述待播放音量调节参数发送至所述目标设备。
可选地,还包括:
获取目标设备发送的音量调节反馈信息,并基于所述音量调节反馈信息对所述预设音量阈值进行更新。
第二方面,本申请还提供了一种电子设备,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现上述的音频播放方法。
第三方面,本申请还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述的音频播放方法。
本申请提供的音频播放方法,提供音频播放模式选择界面;在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出目标音频对应的当前音量数据;其中,专辑模式下将所有目标音频作为一个完整音频;获取目标音频对应的预设音量阈值;利用当前音量数据和预设音量阈值,确定目标音频对应的音量调节参数;音量调节参数用于在目标音频播放时对目标音频进行音量调节。
可见,该方法考虑到不同音频播放模式下目标音频的当前音量数据的确定方式有所不同,因此提供了音频播放模式选择界面,在用户通过该选择界面选择专辑模式后,可以自动确定出专辑模式下目标音频对应的当前音量数据。为了保证目标音频播放时音量的稳定性,避免出现声音忽大忽小的情况,可以获取目标音频对应的预设音量阈值,根据当前因音量数据和预设音量阈值,确定目标音频与预设音量阈值之间的差距,进而生成对该目标音频的音量进行调节的音量调节参数。音量调节参数能够在目标音频播放时对其进行音量调节,使得目标音频能够在与预设音量阈值相匹配的情况下播放,使得目标音频所包含的所有音频能够维持在同一音量水平,无需用户频繁调节音量,避免造成用户听力损伤。
此外,本申请还提供了一种电子设备及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种音频播放方法所适用的硬件组成框架示意图;
图2为本申请实施例提供的另一种音频播放方法所适用的硬件组成框架示意图;
图3为本申请实施例提供的一种音频播放方法的流程示意图;
图4为本申请实施例提供的一种各类风格乐曲对应的响度差别示意图;
图5为本申请实施例提供的一种终端界面示意图;
图6为本申请实施例提供的一种数据传输方式示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,先对本申请实施例提供的音频播放方法对应的方案所使用的硬件组成框架进行介绍。请参考图1,图1为本申请实施例提供的一种音频播放方法所适用的硬件组成框架示意图。其中电子设备100可以包括处理器101和存储器102,还可以进一步包括多媒体组件103、信息输入/信息输出(I/O)接口104以及通信组件105中的一种或多种。
其中,处理器101用于控制电子设备100的整体操作,以完成音频播放方法中的全部或部分步骤;存储器102用于存储各种类型的数据以支持在电子设备100的操作,这些数据例如可以包括用于在该电子设备100上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,SRAM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、只读存储器(Read-Only Memory,ROM)、磁存储器、快闪存储器、磁盘或光盘中的一种或多种。在本实施例中,存储器102中至少存储有用于实现以下功能的程序和/或数据:
提供音频播放模式选择界面;
在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出目标音频对应的当前音量数据;其中,专辑模式下将所有目标音频作为一个完整音频;
获取目标音频对应的预设音量阈值;
利用当前音量数据和预设音量阈值,确定目标音频对应的音量调节参数;音量调节参数用于在目标音频播放时对目标音频进行音量调节。
多媒体组件103可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器102或通过通信组件105发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口104为处理器101和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件105用于电子设备100与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near Field Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件105可以包括:Wi-Fi部件,蓝牙部件,NFC部件。
电子设备100可以被一个或多个应用专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行音频播放方法。
当然,图1所示的电子设备100的结构并不构成对本申请实施例中电子设备的限定,在实际应用中电子设备100可以包括比图1所示的更多或更少的部件,或者组合某些部件。
可以理解的是,本申请实施例中并不对电子设备的数量进行限定,其可以是多个电子设备共同协作完成音频播放方法。在一种可能的实施方式中,请参考图2,图2为本申请实施例提供的另一种音频播放方法所适用的硬件组成框架示意图。由图2可知,该硬件组成框架可以包括:第一电子设备11和第二电子设备12,二者之间通过网络13连接。
在本申请实施例中,第一电子设备11与第二电子设备12的硬件结构可以参考图1中电子设备100。即可以理解为本实施例中具有两个电子设备100,两者进行数据交互。进一步,本申请实施例中并不对网络13的形式进行限定,即,网络13可以是无线网络(如WIFI、蓝牙等),也可以是有线网络。
其中,第一电子设备11和第二电子设备12可以是同一种电子设备,如第一电子设备11和第二电子设备12均为服务器;也可以是不同类型的电子设备,例如,第一电子设备11可以是智能手机或其它智能终端,第二电子设备12可以是服务器。在一种可能的实施方式中,可以利用计算能力强的服务器作为第二电子设备12来提高数据处理效率及可靠性,进而提高音频音量调节参数生成的处理效率。同时利用成本低,应用范围广的智能手机作为第一电子设备11,用于实现第二电子设备12与用户之间的交互。可以理解的是,该交互过程可以为:智能手机确定并发送目标音频和音频播放模式至服务器,由服务器进行音量调节参数的生成。服务器将音量调节参数发送至智能手机,由智能手机利用音量调节参数播放目标音频。
具体的,请参考图3,图3为本申请实施例提供的一种音频播放方法的流程示意图。该实施例中的方法包括:
S301:提供音频播放模式选择界面。
音频播放模式是指对音频播放形式进行划分的类别,例如可以划分为单曲模式和专辑模式。单曲模式下,是将目标音频包含的各个音频单独进行音量的调整,使得调整音量后的各音频的音量趋于统一。专辑模式下,是将目标音频包含的所有音频作为一个整体进行音量的调整,在保证所有音频的音量不会出现忽大忽小的同时,可以保留所有音频之间原本的响度差异。
以歌曲为例,通常情况下,同一个专辑内的各个歌曲的响度差异是由制作者出于表示其创作目的而刻意设计的,例如对于交响乐专辑来说,其中的各个音频原本应当在一场交响乐表演中连续不断地演奏完毕,在录制为专辑后,为了方便播放,会将其拆分为多个音频。若用户想要完整播放整张专辑以体验整场交响乐,则各个音频之间的响度差异则不应当被消除,否则会影响播放效果。
在本申请实施例中,音频处理设备可以提供音频播放模式选择界面。在音频播放模式选择界面上可以展示可供选择的音频播放模式,例如展示单曲模式和专辑模式。用户可以根据目标音频的播放需求,选择相应的播放模式。
其中,音频处理设备可以为服务器,也可以为终端设备,例如用户的智能手机等。
S302:在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出目标音频对应的当前音量数据。
其中,目标音频可以为任意类型、任意文件格式的音频,目标音频是指需要生成对应的音量调节参数的音频。
当前音量数据的表现形式不做限定,例如在一种实施方式中,可以以响度(Loudness)和真实峰值(True Peak)作为当前音量数据。具体的,可以基于EBU R.128算法进行响度和真实峰值的采集。EBU R.128是欧洲广播联盟出的关于响度控制的建议书,该建议书在ITU-R BS.1770标准的基础之上,对响度的被测主体、积分窗长等细节作了定义。
在提取当前音量数据时,可以基于音频播放模式,确定音量数据提取方式。在确定音量数据提取方式后,基于音量数据提取方式对目标音频进行数据提取,得到当前音量数据。
具体的,在一种实施方式中,对于某些音频来说,其具有特殊的特性使得采用传统的音量数据提取方式无法得到准确的当前音量数据,例如对于有声书音频来说,两句之间或两段之间可能会存在较长时间的无声状态,若将无声状态的时间段也纳入音量数据提取的范畴,则会导致得到的当前音量数据较小,可能大幅小于有声状态下的音量,而有声书音频被进行音量调节的部分仅为有声状态下的部分,因此较小的当前音量数据无法准确表征有声书音频的真正音量。因此,需要为其设置特殊的音量数据提取方式,例如先进行无声状态检测和过滤,然后再进行当前音量数据的提取。可以理解的是,其他类别的音频可能存在其他原因导致其需要对应的音量数据提取方式,在此不做赘述。
此外,在另一种实施方式中,若音频播放模式为专辑模式,专辑模式下会将所有目标音频作为一个完整音频。基于前述内容所描述的理由,为了保证播放效果,应当保留专辑内各个音频之间的响度差异。
对于专辑模式下,目标音频对应的当前音量数据的确定方式可以有两种。一种方式,可以在用户选择的目标音频的音频播放模式为专辑模式的情况下,分别提取各目标音频对应的初始音量数据;对各个初始音量数据进行均值处理,得到所有目标音频对应的当前音量数据。
另一种方式,可以在用户选择的目标音频的音频播放模式为专辑模式的情况下,将所有目标音频拼接为一个音频文件,并对音频文件进行数据提取得到当前音量数据。
但是需要注意的是,在实际处理时可以不对目标音频进行拼接处理,而是通过连续读取各个目标音频的数据的方式实现拼接的效果。对中间音频这一个音频进行数据提取,即可得到当前音量数据。
利用该当前音量数据,在后续得到的音量调节参数能够对所有目标音频进行相同幅度的调节,使得能够保持各个目标音频之间的响度差异。
S303:获取目标音频对应的预设音量阈值。
预设音量阈值可以为预先设定好的音量值。
考虑到实际应用中,音频场景的不同,对目标音频的播放音量的要求也会有所不同。例如,在嘈杂环境下,为了便于用户更加清楚的听到目标音频,需要将目标音频的播放音量调高些;在安静环境下,则可以将目标音频的播放音量调低些。
因此在本申请实施例中,可以基于不同的音频场景设置其对应的预设音量阈值。在具体实现中,音频处理设备可以提供音频场景选择界面。音频场景选择界面上可以展示供用户选择的音频场景。在音频处理设备上可以预先存储不同音频场景各自对应的预设音量阈值。
音频场景用于表征用户播放音频的环境干扰程度,在实际应用中,可以灵活设置音频场景,例如,音频场景可以包括安静环境和嘈杂环境,又或者可以包括地铁环境、屋内环境、室外环境等。
用户可以基于当前所处的环境,在音频场景选择界面上选择对应的音频场景,音频处理设备响应于用户对目标音频的音频场景的选择,可以确定出目标音频对应的预设音量阈值。
除了依赖于音频场景设置预设音量阈值外,也可以针对于不同的音频类型设置各自对应的预设音量阈值。
可以理解的是,不同的音频,无论类别、流派等因素的区别,其音频音量(或称为响度)均可能不同,进一步,不同类别、流派的音频的响度差别更加明显。例如,请参考图4,图4为本申请实施例提供的一种各类风格乐曲对应的响度差别示意图,其中包括流行摇滚(POP&ROCK)、另类说唱
(Alternative,一种由Hip-Hop风格中衍生出来的歌曲风格)、放克爵士乐(JAZZ&FUNK)、电子乐(Electronic)等风格。可以看到,每种风格的音频响度的差异十分明显,以LUFS(Loudness Units relative to Full Scale,相对于满量程的响度单位)为单位,响度最大的风格为-10LKFS(包括disco、hip-hop和另类说唱),响度最小的风格为-20LKFS(包括classical),二者之间差距为10dB。
由此可见,若不对目标用户播放的音频进行音量调节,即便用户连续收听的音频属于同一音频类型,不同音频之间的响度也参差不齐,存在波动;若连续播放的音频属于不同音频类型,则音频间的响度差距更加明显,使得用户需要频繁调节电子设备的音量大小。
音频类型可以根据获取到的目标音频而确定,具体的,可以获取与目标音频相关的属性信息,基于该属性信息确定音频类型。
可以理解的是,不同音频类型的音频的较佳表现响度具体大小可能不同,为了使得各类音频都能够起到较好的播放效果,可以为不同的音频类型设置不同的预设音量阈值。本申请中,预设有各个音频类型对应的预设音量阈值之间的对应关系,该对应关系的具体内容不做限定,每种音频类型对应的预设音量阈值可以相同也可以不同。在确定音频类型后,即可利用该对应关系确定对应的预设音量阈值。
需要说明的是,在本申请实施例中,除了依据属性信息确定音频类型之外,音频处理设备也可以提供音频类型选择界面。音频类型选择界面上可以展示供用户选择的音频类型。
用户可以在音频类型选择界面上选择对应的音频类型,音频处理设备响应于用户对目标音频的音频类型的选择,可以确定出该音频类型对应的预设音量阈值。
音频类型可以为粒度较大的例如歌曲、轻音乐、有声书等大类,或者可以为粒度更小的例如爵士乐歌曲、电子乐歌曲、歌剧歌曲、钢琴曲轻音乐、白噪声音乐、有伴奏有声书、无伴奏有声书等小类。
在本申请实施例中,为了更加合理的选取目标音频的预设音量阈值,可以将音频场景和音频类型相结合来确定预设音量阈值。在具体实现中,音频处理设备可以预先存储不同音频场景下各音频类型各自对应的预设音量阈值。
音频处理设备可以提供音频场景选择界面,用户可以在音频场景选择界面上选取与当前所处环境匹配的音频场景。音频处理设备在获取到目标音频后,可以自动识别出目标音频所属的音频类型。基于用户选择的目标音频场景以及目标音频所属的音频类型,可以确定出目标音频对应的预设音量阈值。
此外,音频处理设备也可以同时提供音频场景选择界面和音频类型选择界面,用户可以在音频场景选择界面上选取与当前所处环境匹配的音频场景,在音频类型选择界面上选取所需设定的音频类型。音频处理设备基于用户选择的目标音频场景以及目标音频所属的音频类型,可以确定出目标音频对应的预设音量阈值。
S304:利用当前音量数据和预设音量阈值,确定目标音频对应的音量调节参数。
基于目标音频的音频播放模式,可以确定出目标音频对应的当前音量数据。当前音量数据为目标音频在当前音频播放模式下所处的音量,在确定当前音量数据和预设音量阈值后,可以确定出音量调节参数。
音量调节参数用于在目标音频播放时对目标音频进行音量调节。
本实施例并不限定生成音量调节参数的具体方式,在一种实施方式中,可以利用预设音量阈值减去当前音量数据得到音量差值,并将该音量差值确定为音量调节参数。
举例说明,假设目标音频对应的预设音量阈值为20db,目标音频包含有四个音频,每个音频对应的初始音量数据分别为15db、20db、18db和19db,将各音频对应的初始音量数据进行均值处理,得到当前音量数据为(15+20+18+19)/4=18db,预设音量阈值和当前音量数据的差值为20-18=2db,音量调节参数即为2db,此时可以将目标音频包含的各音频分别调整为15+2=17db,20+2=22db,18+2=20db,19+2=21db。
上述内容主要是以专辑模式为例展开的介绍,在实际应用中,用户选择的目标音频的音频播放模式也可以为单曲模式。
可以理解的是,有很多音频最初以专辑的形式被发布,但是这些音频同样可以以单曲的形式被播放。因此,可选的,具有所属专辑的各个目标音频可以具有两个当前音量数据,其中一个对应于单曲的当前音量数据,另一个对应于专辑的当前音量数据。基于这两个当前音量数据,在后续分别生成对应的音量调节参数。
单曲模式下会将各目标音频作为独立的音频。在用户选择的目标音频的音频播放模式为单曲模式的情况下,可以分别提取各目标音频对应的当前音量数据;相应的,依据预设音量阈值以及各目标音频对应的当前音量数据,确定出各目标音频各自对应的音量调节参数。
举例说明,假设目标音频对应的预设音量阈值为20db,目标音频包含有四个音频,每个音频对应的初始音量数据分别为15db、20db、18db和19db,则各目标音频对应的音量调节参数分别为20-15=5db,20-20=0db,20-18=2db,20-19=1db。
更进一步的,由于在S303步骤中,根据所选的音频场景和音频类型的不同组合方式,一个目标音频可能对应于多个预设音量阈值,在这种情况下,在S304步骤中可以得到目标音频在多种情况下分别对应的音量调节参数。
在得到音量调节参数后,生成并存储目标音频和音量调节参数之间的对应关系数据。可以在本地存储,或者可以发送给其他电子设备进行存储。
具体的,在一种实施方式中,可以获取目标设备发送的待播放音频信息,待播放音频信息用于指定目标设备播放的待播放音频。在获取到目标设备发送的待播放音频信息时,可以利用待播放音频信息,基于存储的目标音频和音量调节参数之间的对应关系数据,确定对应的待播放音量调节参数,并将待播放音量调节参数发送至目标设备,以便于目标设备利用该音量调节参数对待播放音频信息的音量进行调节,使得待播放音频信息能够保持在相近的响度水平。
在发送待播放音频信息以外,目标设备还可以发送其他数据,例如与待播放音频对应的音频播放模式和音频场景。例如,请参考图5,图5为本申请实施例提供的一种终端界面示意图,该终端界面即为目标设备的设置界面,目标设备可以提供音量平衡开关,其中包括音轨/专辑子开关以及安静/嘈杂子开关,音轨/专辑子开关用于设置待播放音频的播放模式为单曲模式(即音轨模式)或专辑模式。安静/嘈杂子开关用于设置播放的音频场景为安静或嘈杂。音量平衡开关以及子开关可以由用户主动设置,或者可以由目标设备自动设置。例如从专辑进入播放界面进行播放时,默认为专辑模式,否则,将专辑的某一首歌或几首歌添加到歌单,用歌单进行播放时,使用音轨模式。
此外,为了优化用户的听觉感受,还可以获取目标设备发送的音量调节反馈信息,并基于音量调节反馈信息对预设音量阈值进行更新。具体的更新方式不做限定,例如可以在收集到若干数量相同的音量调节反馈信息时,基于该音量调节反馈信息调大或调小预设音量阈值。
综上,请参考图6,图6为本申请实施例提供的一种数据传输方式示意图。若未开放音量平衡开关,则服务器(本申请的执行主体)直接向播放器(即目标设备)发送音频文件。若播放器设置了安静或嘈杂的模式,则服务器在发送音频文件的同时,还向播放器发送基于安静或嘈杂的音频场景生成的音量调节参数。若播放器设置了音轨或专辑模式,则服务器在发送音频文件的同时,还向播放器发送基于音轨或专辑模式生成的音量调节参数。此外,在上述两种发送音量调节参数的情况中,还可以基于音频类型进一步确定音量调节参数。若服务器未生成或无法获取音频文件对应的音量调节参数,则可以实时生成该参数。具体的,首先将音频文件解码为wav格式文件,并利用其执行上述S301步骤~S304步骤,得到音量调节参数并反馈给播放器。播放器根据其获取到的音频文件,或音频文件和音量调节参数,对待播放音频进行播放。
应用本申请实施例提供的音频播放方法,考虑到不同音频播放模式下目标音频的当前音量数据的确定方式有所不同,因此提供了音频播放模式选择界面,在用户通过该选择界面选择专辑模式后,可以自动确定出专辑模式下目标音频对应的当前音量数据。为了保证目标音频播放时音量的稳定性,避免出现声音忽大忽小的情况,可以获取目标音频对应的预设音量阈值,根据当前音量数据和预设音量阈值,确定目标音频与预设音量阈值之间的差距,进而生成对该目标音频的音量进行调节的音量调节参数。音量调节参数能够在目标音频播放时对其进行音量调节,使得目标音频能够在与预设音量阈值相匹配的情况下播放,使得目标音频所包含的所有音频能够维持在同一音量水平,无需用户频繁调节音量,避免造成用户听力损伤。
下面对本申请实施例提供的计算机可读存储介质进行介绍,下文描述的计算机可读存储介质与上文描述的音频播放方法可相互对应参照。
本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的音频播放方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本领域技术人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应该认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语包括、包含或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种音频播放方法,其特征在于,包括:
提供音频播放模式选择界面;
在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出所述目标音频对应的当前音量数据;其中,专辑模式下将所有所述目标音频作为一个完整音频;
获取所述目标音频对应的预设音量阈值;
利用所述当前音量数据和所述预设音量阈值,确定所述目标音频对应的音量调节参数;所述音量调节参数用于在所述目标音频播放时对所述目标音频进行音量调节。
2.根据权利要求1所述的音频播放方法,其特征在于,所述获取所述目标音频对应的预设音量阈值包括:
提供音频场景选择界面;
响应于用户对所述目标音频的音频场景的选择,确定出所述目标音频对应的预设音量阈值。
3.根据权利要求1所述的音频播放方法,其特征在于,所述获取所述目标音频对应的预设音量阈值包括:
提供音频场景选择界面;
基于用户选择的目标音频场景以及所述目标音频所属的音频类型,确定出所述目标音频对应的预设音量阈值。
4.根据权利要求1所述的音频播放方法,其特征在于,所述在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出所述目标音频对应的当前音量数据包括:
在用户选择的目标音频的音频播放模式为专辑模式的情况下,分别提取各所述目标音频对应的初始音量数据;
对各个所述初始音量数据进行均值处理,得到所有所述目标音频对应的当前音量数据。
5.根据权利要求1所述的音频播放方法,其特征在于,所述在用户选择的目标音频的音频播放模式为专辑模式的情况下,确定出所述目标音频对应的当前音量数据包括:
在用户选择的目标音频的音频播放模式为专辑模式的情况下,将所有所述目标音频拼接为一个音频文件,并对所述音频文件进行数据提取得到所述当前音量数据。
6.根据权利要求1所述的音频播放方法,其特征在于,还包括:
在用户选择的目标音频的音频播放模式为单曲模式的情况下,确定出所述目标音频对应的当前音量数据;其中,单曲模式下将各所述目标音频作为独立的音频。
7.根据权利要求6所述的音频播放方法,其特征在于,所述在用户选择的目标音频的音频播放模式为单曲模式的情况下,确定出所述目标音频对应的当前音量数据包括:
在用户选择的目标音频的音频播放模式为单曲模式的情况下,分别提取各所述目标音频对应的当前音量数据;
相应的,所述利用所述当前音量数据和所述预设音量阈值,确定所述目标音频对应的音量调节参数包括:
依据所述预设音量阈值以及各所述目标音频对应的当前音量数据,确定出各所述目标音频各自对应的音量调节参数。
8.根据权利要求1所述的音频播放方法,其特征在于,还包括:
生成并存储所述目标音频和所述音量调节参数之间的对应关系数据音频播放方法;
获取目标设备发送的待播放音频信息;
利用所述待播放音频信息,基于所述对应关系数据确定对应的待播放音量调节参数,并将所述待播放音量调节参数发送至所述目标设备。
9.根据权利要求8所述的音频播放方法,其特征在于,还包括:
获取目标设备发送的音量调节反馈信息,并基于所述音量调节反馈信息对所述预设音量阈值进行更新。
10.一种电子设备,其特征在于,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现如权利要求1至9任一项所述的音频播放方法。
11.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的音频播放方法。
CN202210921684.3A 2022-08-02 2022-08-02 音频播放方法、电子设备及可读存储介质 Pending CN115268828A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210921684.3A CN115268828A (zh) 2022-08-02 2022-08-02 音频播放方法、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210921684.3A CN115268828A (zh) 2022-08-02 2022-08-02 音频播放方法、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN115268828A true CN115268828A (zh) 2022-11-01

Family

ID=83746371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210921684.3A Pending CN115268828A (zh) 2022-08-02 2022-08-02 音频播放方法、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN115268828A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117727334A (zh) * 2023-05-10 2024-03-19 书行科技(北京)有限公司 一种音频处理方法、装置、设备及可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117727334A (zh) * 2023-05-10 2024-03-19 书行科技(北京)有限公司 一种音频处理方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
US7774078B2 (en) Method and apparatus for audio data analysis in an audio player
US7107109B1 (en) Process for adjusting the sound volume of a digital sound recording
US20110066438A1 (en) Contextual voiceover
KR102686742B1 (ko) 객체 기반 오디오 신호 균형화
US8428758B2 (en) Dynamic audio ducking
US11474775B2 (en) Sound effect adjustment method, device, electronic device and storage medium
US20140105411A1 (en) Methods and systems for karaoke on a mobile device
US20120275625A1 (en) Signal processing device, method thereof, program, and data recording medium
US9991861B2 (en) System and method for controlled dynamics adaptation for musical content
US10014841B2 (en) Method and apparatus for controlling audio playback based upon the instrument
US20080134866A1 (en) Filter for dynamic creation and use of instrumental musical tracks
Wolters et al. Loudness normalization in the age of portable media players
Skovenborg Loudness range (LRA)-design and evaluation
CN115268828A (zh) 音频播放方法、电子设备及可读存储介质
Katz Integrated approach to metering, monitoring, and leveling practices, part 1: Two-channel metering
WO2018066383A1 (ja) 情報処理装置および方法、並びにプログラム
US9502017B1 (en) Automatic audio remixing with repetition avoidance
Deruty et al. Human–made rock mixes feature tight relations between spectrum and loudness
Taylor et al. Hyper-compression in music production: Listener preferences on dynamic range reduction
CN106970773A (zh) 媒体项呈现期间的自动音频水平调整
Shelvock Audio Mastering as a Musical Competency
US9998082B1 (en) Comparative balancing
JP4275055B2 (ja) 音質調整装置、放送受信機、プログラム、及び記録媒体
JP4275054B2 (ja) 音声信号判別装置、音質調整装置、放送受信機、プログラム、及び記録媒体
Thiele Some Thoughts on the Dynamiics of Reproduced Sound

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination