CN103761063B - 一种在播放设备中控制音频的输出音量的方法和装置 - Google Patents

一种在播放设备中控制音频的输出音量的方法和装置 Download PDF

Info

Publication number
CN103761063B
CN103761063B CN201310706832.0A CN201310706832A CN103761063B CN 103761063 B CN103761063 B CN 103761063B CN 201310706832 A CN201310706832 A CN 201310706832A CN 103761063 B CN103761063 B CN 103761063B
Authority
CN
China
Prior art keywords
volume
audio
user
played
comfortable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310706832.0A
Other languages
English (en)
Other versions
CN103761063A (zh
Inventor
谢剑
戴俊
陈玉祯
张悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310706832.0A priority Critical patent/CN103761063B/zh
Publication of CN103761063A publication Critical patent/CN103761063A/zh
Priority to PCT/CN2014/093760 priority patent/WO2015090163A1/zh
Application granted granted Critical
Publication of CN103761063B publication Critical patent/CN103761063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明的目的是提供一种用于在播放设备中控制音频的输出音量的方法和装置。根据本发明的方法包括以下步骤:获取当前用户的用户舒适音量;获取所述播放设备的播放环境信息;基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。根据本发明的优点在于:通过获取用户选择的用户舒适音量,以基于该用户舒适音量确定待播放音频的输出音量,使用户收听到的音频音量是其觉得舒适的音量;能够确定当前环境中的噪声和用户与播放设备的距离对输出音量的影响,并对待播放音频的音量进行相应地调节,以保证用户能够清晰地收听到待播放音频。

Description

一种在播放设备中控制音频的输出音量的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于在播放设备中控制音频的输出音量的方法和装置。
背景技术
现有技术中,播放设备在输出音频时,没有考虑到用户对舒适音量的不同需求,因而无法在接收到的音频音量过大或过小时,仍然以用户自己觉得舒适的音量来播放音频。并且,根据现有技术的方法,没有综合考虑噪声和用户与播放设备的距离对音频的输出音量的影响,从而无法结合当前环境中的噪声和用户与播放设备的距离来确定待播放音频的输出音量;另一方面,目前无论是呼叫中心还是移动设备通信中的实时(比如移动电话或者实时语音通话)和非实时(例如微信、易信等)的语音沟通中,都没能根据沟通方语音的音量进行智能的调节,从而使得用户需要手动的去根据对方的音量进行调整音量、大大的降低了用户体验的质量。
发明内容
本发明的目的是提供一种用于在播放设备中控制音频的输出音量的方法和装置。
根据本发明的一个方面,提供了用于在播放设备中控制待播放音频的输出音量的方法,其中,所述方法包括以下步骤:
a获取当前用户的用户舒适音量;
b获取所述播放设备的播放环境信息;
c基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。
根据本发明的一个方面,还提供了一种用于在播放设备中控制待播放音频的输出音量的音量控制装置,其中,所述音量控制装置包括:
第一获取装置,用于获取当前用户的用户舒适音量;
第二获取装置,用于获取所述播放设备的播放环境信息;
确定装置,用于基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。
与现有技术相比,本发明具有以下优点:1)通过获取用户选择的用户舒适音量,以基于该用户舒适音量确定待播放音频的输出音量,使用户收听到的音频音量是其觉得舒适的音量;2)结合环境播放信息确定待播放音频的输出音量,故而能够确定当前环境中的噪声和用户与播放设备的距离对输出音量的影响,并对待播放音频的音量进行相应地调节,以保证用户能够在较为舒适的音量下清晰地收听到待播放音频。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示意出了根据本发明的一种用于在播放设备中控制音频的输出音量的方法流程图;
图2示意出了根据本发明的一种用于在播放设备中控制音频的输出音量的音量控制装置的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示意出了根据本发明的一种用于在播放设备中控制待播放音频的输出音量的方法流程图。根据本发明的方法包括步骤S1、步骤S2和步骤S3。
其中,所述待播放音频包括播放设备中需要被播放的音频数据。优选地,所述待播放音频包括但不限于以下任一种:
1)呼叫通话时的语音音频,例如,手机通话时的对方的音频,又例如,呼叫中心所接收到的呼入电话的音频等;
2)经由网络传输的各类音频,如微信中的语音音频等;
3)存储于播放设备中的各类音频,如mp3等。
其中,根据本发明的方法通过音量控制装置来实现。
优选地,所述音量控制装置包含于播放控制插件中。所述播放控制插件可被加载至各类操作系统、软件、应用(APP)等可独立运行的程序中,以使被加载程序能够对待播放音频执行如本发明所述的相应处理。
更优选地,可通过将现有的插件与该音量控制装置相结合来构成所述播放控制插件,例如,在现有的微信插件中包含该音量控制装置,以获得该播放控制插件等。
优选地,根据本发明的方法通过包含于播放设备中的音量控制装置来实现。所述播放设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述播放设备包括网络设备和/或用户设备。其中,所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述用户设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、PDA、游戏机、或IPTV等。其中,所述用户设备及网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
优选地,所述播放设备还包括声音输出装置,例如扬声器等。
需要说明的是,所述用户设备、网络设备以及网络仅为举例,其他现有的或今后可能出现的用户设备、网络设备以及网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
参照图1,在步骤S1中,所述音量控制装置获取当前用户的用户舒适音量。
其中,所述用户舒适音量用于指示该用户觉得舒适的音量。
其中,所述音量控制装置获取所述当前用户的用户舒适音量的方式包括以下至少任一种:
1)通过读取预存的用户舒适音量来获取;
2)所述音量控制装置播放示例音频,其中,所述示例音频属于示例音频集,所述音频集中包含多个分别属于不同音量区段的示例音频;接着,音量控制装置获取用户对所述示例音频的调节指令;并根据所述用户对所述示例音频的调节指令,选择新的示例音频。音量控制装置重复上述步骤,直至用户确认所播放的示例音频的音量区段为用户舒适音量区段;则音量控制装置获取用户选择的所述舒适音量区段中的音量作为所述用户舒适音量。
优选地,音量控制装置根据所述用户对所述示例音频的调节指令,选择与所播放的示例音频相邻音量区段的音频作为新的示例音频。
优选地,音量控制装置以预定的音量间隔m,对音量区段为[x,y]的音频进行采集,以获得多个示例音频,并基于二分查找的原理从该多个实例音频中选择示例音频并播放,从而逐步确定用户觉得舒适的音量区段。具体地,音量控制装置先播放多个示例音频中音量区段的起始值对应于[x,y]的中间位置的示例音频。接着,音量控制装置根据用户的调节指令确定查找范围是[a,x](如果偏大)或[a+m,y](如果偏小),并在该查找范围内选择新的示例音频并播放,该新的示例音频的音量区段的起始值对应于该查找范围的中间位置。音量控制装置根据用户的后续调剂指令,重复以上播放示例音频并根据用户的调节指令选择新的示例音频的步骤,直至用户确认所播放的示例音频的音量区段为用户舒适音量区段。
更优选地,音量控制装置可基于以下运算规则确定示例音频的音量区段的起始值s:确定的查找范围是[a,b],若a-b不能除尽2m,则s=a+m*(a-b/2m+1),若a-b能够除尽除2m,则s=a+m*(a-b/2m)。
例如,音量控制装置通过对音量区段是20分贝(db,decibel))到80db的音频,以6db为音量间隔进行采集,以获得10个示例音频,其分别对应音量区段:[20db,26db],[26db,32db],[32db,38db],…[74db,80db]。则音量控制装置选择对应于中间位置的音量区段[44db,50db]的示例音频进行播放,并获取到用户对该示例音频的调节指令“偏大”,则音量控制装置选择在[20db,50db]的音量范围内选择中间的音量区段[32db,38db]的示例音频并播放。接着,音量控制装置再次获得用户对该示例音频的调节指令“偏小”,则音量控制装置确定在[38db,50db]之间的中间音量区段为音量区段[44db,50db],并选择其对应的示例音频进行播放,并且,音量控制装置获得用户的调节指令为“确定”,则音量控制装置该示例音频的音量区段[44db,50db]作为用户舒适音量区段。接着,音量控制装置获取用户进一步在该音量区段中选择“46db”的选择操作,确定该用户的用户舒适音量为46db。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述当前用户的用户舒适音量的方法的实现方式,均应包含在本发明的范围内。
接着,在步骤S2中,音量控制装置获取所述播放设备的播放环境信息。
其中,所述播放环境信息包括但不限于以下至少任一项:
1)环境噪声音量;
2)播放距离,该播放距离包括播放设备与接收位置之间的距离。优选地,所述接收位置为人耳的位置。优选地,将播放设备前方的障碍物的位置作为接收位置。
其中,音量控制装置获取所述播放设备的播放环境信息的方式包括以下至少任一种:
1)所述播放环境信息包括环境噪声音量,所述音量控制装置通过检测环境噪声来获取环境噪声音频,以确定环境噪声音量。
具体地,音量控制装置采样获取与所述播放设备所处播放环境对应的噪声音频,然后,所述音量控制装置将所述噪声音频解码为预定格式的音频数据,以确定所述噪声音频的环境噪声音量。
优选地,所述音量控制装置将噪声音频解码为脉码调制(PCM,Pulse CodeModulation)格式。
优选地,所述音量控制装置根据解码为预定格式的音频数据,基于以下公式来确定所述噪声音频的环境噪声音量:
其中,SPL(Noise)表示环境噪声音量,n表示该噪声音频的振幅数量,A(k)表示噪声音频的第k个采样的振幅相对大小。
2)所述播放环境信息包括播放距离,音量控制装置通过检测自身与障碍物的距离来确定该播放距离。例如,音量控制装置通过播放设备中的传感装置获取到播放设备与其前方障碍物的距离,并将该距离作为播放距离。
接着,在步骤S3中,音量控制装置基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。
其中,音量控制装置基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频的方式包括但不限于以下任一种:
1)基于播放环境信息和用户舒适音量来确定待播放音频的输出音量。
具体地,音量控制装置根据播放环境信息和用户舒适音量,并基于预定的运算规则,来确定待播放音频的输出音量值。
例如,音量控制装置确定输出音量值=播放距离*用户舒适音量/标准距离。其中,所述标准距离用于表征最适合用户收听音频的距离。
又例如,用户A通过手机中的微信接收来自用户B和用户C的音频。其中,用户A手机中的音量控制装置获得的用户A的用户舒适音量为32db,其中,输出音量=(1+环境噪声音量/用户舒适音量*100%)*用户舒适音量。在播放来自用户B的音频时,音量控制装置获取到用户A所在环境的环境噪声非常小,约为0db,则音量控制装置确定输出音量=用户舒适音量=32db,并基于该输出音量来播放来自用户B的音频;接着,继续播放来自用户C的音频,此时,音量控制装置获取到用户A所在环境的环境噪声音量为8db,则音频控制装置确定输出音量=(1+8db/32db*100%)*32=40db,则此时音量控制装置以40db的音量来播放来自用户C的音频。显然,根据本发明的该种方式,能够根据用户A自身所处环境的环境播放信息以及用户A所偏好的舒适音量,灵活地对要播放的音频的输出音量进行调节,使得用户A无论在何种环境中,都能清晰、舒适地收听所播放的音频。
2)音量控制装置基于所述播放环境信息、所述待播放音频的原始音量以及所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。
其中,音量控制装置获取原始音量的方式包括但不限于以下任一种:
i)通过软件程序来获取待播放音频的音频数据,并将待播放音频的音频数据解码为预定格式的音频数据,以确定待播放音频的原始音量,该解码以确定原始音量的过程与步骤S2中音量控制装置解码环境噪声音频的过程相同或相似,此处不再赘述;
ii)通过与前述步骤S2中音量控制装置获取环境噪声音量相同或相似的方式来获取播放音频的音频数据,并将待播放音频的音频数据解码为预定格式的音频数据,以确定待播放音频的原始音量,此处不再赘述。
其中,音量控制装置基于所述播放环境信息、所述待播放音频的原始音量以及所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频的方式包括但不限于以下任一种:
i)音量控制装置根据环境噪声音量和待播放音频的原始音量,先确定与环境噪声音量和原始音量对应的音量增益。然后,音量控制装置根据音量增益和用户舒适音量,来确定待播放音频的输出音量。
其中,所述音量增益用于指示所述待播放音频在不同音量区段的环境噪声存在时所需要的增益。
例如,音量控制装置获取到用户舒适音量是40db,环境噪声音量是35db,并且待播放音频的原始音量是30db。接着,音量控制装置在预存的音频音量区段、噪声音量区段和音量增益三者的对应关系中查询,得到对应的音量增益是3db。然后,音量控制装置确定待播放音频的输出音量是用户舒适音量与音量增益的和,即43db。其中,所述对应关系的获取方式与后续优选实施例中获取音量对应关系的方式相似或相同。
ii)音量控制装置基于环境噪声音量、用户舒适音量和播放距离,来确定待播放音频的输出音量。
其中,所述播放环境信息包括环境噪声音量和播放距离,音量控制装置先根据环境噪声音量和待播放音频的原始音量,确定与环境噪声音量和原始音量对应的音量增益。接着,音量控制装置根据音量增益、播放距离以及所述用户舒适音量,来确定待播放音频的输出音量。
具体地,音量控制装置确定所述环境噪声音量对应的噪音音量区段,以及待播放音频的原始音量对应的音频音量区段。然后,音量控制装置根据音量对应关系,确定与环境噪声音量的噪音音量区段,以及所述原始音量的音频音量区段相对应的平均舒适音量。接着,音量控制装置根据所述原始音量以及所述平均舒适音量,来确定待播放音频的音量增益。
其中,前述音量对应关系用于指示音频音量区段、噪音音量区段,以及与测试音频对应的平均舒适音量三者的对应关系。
其中,音量控制控制装置获取所述音量对应关系的方式包括但不限于以下任一种:
i)读取预存的音量对应关系;
ii)播放多个测试音频,分别获取与各个测试音频对应的一个或多个用户舒适音量,根据各个测试音频的一个或多个用户舒适音量,分别确定与各个测试音频对应的平均舒适音量,并保存测试音频中的候选音频的音频音量区段、测试音频中的候选噪声的噪声音量区段,以及测试音频对应的平均舒适音量三者的音量对应关系。其中,该方式的具体实现将在后续优选实施例中予以详述,此处不再赘述。
优选地,所述音量控制装置根据所述音量增益、所述播放距离以及所述用户舒适音量,基于以下公式来确定所述待播放音频的所述输出音量。
其中,SPL(Actual)表示输出音量,SPL(Standard)表示用户舒适音量,L表示播放距离,Lstandard表示标准距离,SPL(Noise_gain)表示音量增益。
其中,所述标准距离是预设的声音输出距离,优选地,标准距离可根据用户使用习惯来确定。例如,将用户历史使用手机时耳朵与手机扬声器之间的距离的平均值作为标准距离;又例如,将用户输入的距离值作为标准距离等。
根据本发明的第一示例,用户D的手机中存储的音量对应关系如下表1所示。
表1
用户D通过该手机接听来自呼叫中心的客服甲的通话音频时,该手机中的音量控制装置确定当前的环境噪声音量为43db,来自客服甲的通话音频的原始音量较轻,为37db。则音量控制装置根据上表1所示的该音量对应关系,确定与当前的环境噪声音量对应的噪音音量区段是40db至60db,与原始音量对应的音频音量区段是20db至50db,并在该音量对应关系中查询,得到对应的平均舒适音量是46db。则音量控制装置确定所述待播放音频的音量增益=|平均舒适音量-原始音量|=9db。接着,音量控制装置根据获取到的用户舒适音量35db,播放距离4cm,预存的标准距离3cm和已确定的音量增益9db,通过公式(2)确定该待播放音频的输出音量是52db;则音量控制装置以52db的音量向用户D输出来自客服甲的音频。
优选地,在实时通话过程中,音量控制装置每隔预定时间段,对音频的原始音量和/或播放环境信息进行测量,并相应地基于新获得的原始音量和/或播放环境信息来更新输出音量值。以应对在实时通话中的多种影响因素的变化。
继续对本发明的第一示例进行说明,在用户D与该客服甲的通话过程中,当音量控制装置间隔预定时间再次测量时,确定客服甲的通话音频的原始音量变为70db,即客服甲的音量变大。则音量控制装置继续根据上表1所示的音量对应关系,确定与当前的环境噪声音量对应的噪音音量区段是40db至60db,与原始音量对应的音频音量区段是50db至80db,并在该音量对应关系中查询,得到对应的平均舒适音量是58db。则音量控制装置确定所述待播放音频的音量增益=|平均舒适音量-原始音量|=12db。接着,音量控制装置根据获取到的用户舒适音量35db,播放距离4cm,预存的标准距离3cm和已确定的音量增益12db,通过公式(2)初步确定该待播放音频的预计输出音量是55db,则音量控制装置55db的音量向用户D输出来自客服甲的音频。
根据本发明的方式,能够对于不同原始音量的音频做进一步调节,从而使得无论原始音频的大小如何,对于接听方,如用户D来说,其听到的音量总是在较为舒适的区域内,从而够避免由于说话方的音量过大或过小而降低用户体验的情况,使得用户能够更加清楚的接听音频。
优选地,所述音量控制装置根据所述音量增益、所述播放距离以及所述用户舒适音量,来确定所述待播放音频的所述输出音量的方式具体包括:音量控制装置根据所述音量增益、所述播放距离、所述用户舒适音量以及所述原始音量来确定所述待播放音频的音量控制信息,然后,基于所述音量控制信息对原始音量进行调节以获得所述待播放音频的所述输出音量。
优选地,所述音量控制信息包括输出音量与原始音量之间的差值。
优选地,所述音量控制信息包括输出音量与原始音量之间的比例关系。
其中,所述音量控制装置基于以下公式来确定所述音量控制信息:
其中,Controlparam表示音量控制信息,SPL(Actual)表示输出音量,SPL(original)表示原始音量。
例如,音量控制根据公式(3)得到的Controlparam是5.62。然后,音量控制装置将待播放音频的能量值调节为原来的5.62倍,以播放该待播放音频。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据环境噪声音量和待播放音频的原始音量,确定与环境噪声音量和原始音量对应的音量增益。接着,音量控制装置根据音量增益、播放距离以及所述用户舒适音量,来确定待播放音频的输出音量的实现方式,均应包含在本发明的范围内。
根据本发明的一个优选实施方案,根据本发明的方法还包括步骤S4(图未示)。
在步骤S4中,音量控制装置呈现处理相关信息。其中,所述处理相关信息用于提示用户所述待播放音频的原始音量的被处理状态。
其中,所述被处理状态包括但不限于以下任一项:
1)将被处理;
2)正在被处理;
3)已被处理。
优选地,所述处理相关信息包括但不限于以下至少任一种形式:
1)文字信息;例如,在播放音频时,呈现该音频的原始音量值以及当前的输出音量值,又例如,向用户呈现“该音频已经过音量转换处理!”的提示信息等;再例如,在实时通话过程中,根据通话对方的语音大小,持续地更新显示来自通话对方的音频的原始音量值大小,以及相应地对该音频进行相应处理后的输出音量的值的大小。
2)用于指示原始音量已经过处理的图像和/或动画信息;例如,在播放过程中,分别用两条声波线来指示待播放音频的原始音量和输出音量,并利用声波线的跳动来显示音量值的实时变化;又例如,当接收到一个微信音频后,先向用户呈现红色叹号以提示用户将要处理该音频,在处理过程中,显示红色进度条以表示正在处理,并当处理完成后,在该微信音频前显示一个绿色的勾以提示用户处理完成等。
根据本发明的一个优选实施方案,所述播放设备包括网络设备,属于网络设备的音量控制装置基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的所述输出音量;将所述待播放音频的所述原始音量更新为所述输出音量;将更新后的所述待播放音频发送至用户设备,以供其播放所述待播放音频。
网络电话服务器,例如云ROM服务器,接收到用户设备反馈的播放环境信息包括:播放距离5cm,环境噪声音量55db。接着,该云ROM服务器中的音量控制装置获取到该用户设备的用户对应的用户舒适音量为31db,用于发送至该用户设备的通话音频的原始音量为56db,标准距离为2cm。并且,该云ROM服务器中所存储的音量对应关系如表1所示。则音量控制装置根据该音量对应关系查询,得到与该用户设备的环境噪声音量以及该通话音频的原始音量对应的平均舒适音量为58db,则音量控制装置根据平均舒适音量58db与所获得的原始音量56db之间的差值2db,确定该通话音频的音量增益为2db,并根据所获得的音量增益、播放距离以及用户舒适音量,通过公式(2)得到输出音量为48db。接着,音量控制装置将该通话音频的原始音量的这一属性更新为48db,并将更新后的通话音频发送至用户设备,以供其播放所述待播放音频,从而保证该用户能够在较舒适的音量下清晰地收听到来自通话方的通话音频。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何确定所述待播放音频的所述输出音量,将所述待播放音频的所述原始音量更新为所述输出音量,然后将更新后的所述待播放音频发送至用户设备的方法的实现方式,均应包含在本发明的范围内。
根据本发明的又一优选实施例,根据本实施例的方法还包括步骤S5(图未示)、步骤S6(图未示)和步骤S7(图未示)。
在步骤S5中,音量控制装置播放多个测试音频。
其中,所述测试音频包括由多个候选音频中选择一个候选音频以及由多个候选噪声中选择一个候选噪声,其中,所述多个候选音频分别对应至少一个音频音量区段,所述多个噪音音频分别对应至少一个噪声音量区段。
接着,在步骤S6中,音量控制装置分别获取与各个测试音频对应的一个或多个用户舒适音量。
其中,音量控制装置获取与测试音频对应的用户舒适音量的方式与前述步骤S1中音量控制装置获取当前用户的用户舒适音量的方式相同或相似,在此不再赘述。
接着,在步骤S7中,音量控制装置根据各个测试音频的一个或多个用户舒适音量,分别确定与各个测试音频对应的平均舒适音量,并保存所述测试音频中的候选音频的音频音量区段、所述测试音频中的候选噪声的噪声音量区段,以及所述测试音频对应的平均舒适音量三者的音量对应关系。
例如,候选音频包括Audio_1和Audio_2,候选噪声包括Noise_1到Noise_4,其各自包括的音量区段如表2所示。音量控制装置基于各个候选音频与各个候选噪声的任意组合,获得如表3所示的测试音频Test_1至Test_8。音量控制装置播放该多个测试音频Test_1,接着,音量控制装置获取与测试音频Test_1对应的三个用户舒适音量20db、28db、24db,并根据该三个用户舒适音量,确定与测试音频Test_1对应的平均舒适音量是24db,并保存测试音频Test_1的候选音频的音量区段[20db,50db]、测试音频Test_1的候选噪声的噪声音量区段[20db,40db]以及所获得的平均舒适音量24db这三者的音量对应关系。并且,音量控制装置分别对测试音频Test_2至Test_8执行相似的操作,以获得如表3中所示的,各个测试音频中的候选音频的音频音量区段、所述测试音频中的候选噪声的噪声音量区段,以及测试音频对应的平均舒适音量三者的音量对应关系。
表2
候选音频 音频音量区段 候选噪声 噪声音量区段
Audio_1 [20db,50db] Noise_1 [20db,40db]
Audio_2 [20db,50db] Noise_2 [40db,60db]
Noise_3 [60db,80db]
Noise_4 [80db,100db]
表3
测试音频 音频音量区段 噪声音量区段 平均舒适音量
Test_1 [20db,50db] [20db,40db] 24
Test_2 [20db,50db] [40db,60db] 46
Test_3 [20db,50db] [60db,80db] 63
Test_4 [20db,50db] [80db,100db] 85
Test_5 [50db,80db] [20db,40db] 54
Test_6 [50db,80db] [40db,60db] 55
Test_7 [50db,80db] [60db,80db] 68
Test_8 [50db,80db] [80db,100db] 82
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何播放多个测试音频并分别获取与各个测试音频对应的一个或多个用户舒适音量,确定与各个测试音频对应的平均舒适音量,并保存所述测试音频中的候选音频的音频音量区段、所述测试音频中的候选噪声的噪声音量区段,以及所述测试音频对应的平均舒适音量三者的音量对应关系的实现方式,均应包含在本发明的范围内。
根据本发明的方案,通过获取用户选择的用户舒适音量,以基于该用户舒适音量确定待播放音频的输出音量,使用户收听到的音频音量是其觉得舒适的音量;结合环境播放信息确定待播放音频的输出音量,故而能够确定当前环境中的噪声和用户与播放设备的距离对输出音量的影响,并对待播放音频的音量进行相应地调节,以保证用户能够在较为舒适的音量下清晰地收听到待播放音频。
图2示意出了根据本发明的一种用于在播放设备中控制音频的输出音量的音量控制装置的结构示意图。跟据本发明的音量控制装置包括第一获取装置1、第二获取装置2和确定装置3。
参照图2,第一获取装置1获取当前用户的用户舒适音量。
其中,所述用户舒适音量用于指示该用户觉得舒适的音量。
其中,第一获取装置1获取所述当前用户的用户舒适音量的方式包括以下至少任一种:
1)通过读取预存的用户舒适音量;
2)第一获取装置1包括第二播放装置(图未示)第二子获取装置(图未示)、选择装置(图未示)、第七子确定装置(图未示)和第八子获取装置(图未示)。其中,第二播放装置播放示例音频,所述示例音频属于示例音频集,所述音频集中包含多个分别属于不同音量区段的示例音频;第二子获取装置获取用户对所述示例音频的调节指令;选择装置根据所述用户对所述示例音频的调节指令,选择新的示例音频。第七子确定装置确认所播放的示例音频的音量区段为用户舒适音量区段;第八子获取装置获取用户选择的所述舒适音量区段中的音量作为所述用户舒适音量。
优选地,选择装置根据所述用户对所述示例音频的调节指令,选择与所播放的示例音频相邻音量区段的音频作为新的示例音频。
优选地,音量控制装置以预定的音量间隔m,对音量区段为[x,y]的音频进行采集,以获得多个示例音频,并基于二分查找的原理从该多个实例音频中选择示例音频并播放,从而逐步确定用户觉得舒适的音量区段。具体地,第二播放装置播放多个示例音频中音量区段的起始值对应于[x,y]的中间位置的示例音频。接着,选择装置根据用户的调节指令确定查找范围是[a,x](如果偏大)或[a+m,y](如果偏小),并在该查找范围内选择新的示例音频并播放,该新的示例音频的音量区段的起始值对应于该查找范围的中间位置。音量控制装置根据用户的后续调剂指令,重复以上播放示例音频并根据用户的调节指令选择新的示例音频的步骤,直至第七子确定装置确认所播放的示例音频的音量区段为用户舒适音量区段。
更优选地,选择装置可基于以下运算规则确定示例音频的音量区段的起始值s:确定的查找范围是[a,b],若a-b不能除尽2m,则s=a+m*(a-b/2m+1),若a-b能够除尽除2m,则s=a+m*(a-b/2m)。
例如,音量控制装置通过对音量区段是20分贝(db,decibel))到80db的音频,以6db为音量间隔进行采集,以获得10个示例音频,其分别对应音量区段:[20db,26db],[26db,32db],[32db,38db],…[74db,80db]。则第二播放装置选择对应于中间位置的音量区段[44db,50db]的示例音频进行播放,第二子获取装置获取到用户对该示例音频的调节指令“偏大”,则选择装置选择在[20db,50db]的音量范围内选择中间的音量区段[32db,38db]的示例音频并由第二播放装置播放该示例音频。接着,第二子获取装置再次获得用户对该示例音频的调节指令“偏小”,则音量控制装置确定在[38db,50db]之间的中间音量区段为音量区段[44db,50db],并选择其对应的示例音频进行播放,并且,第二子获取装置控制装置获得用户的调节指令为“确定”,则第七子确定装置将该示例音频的音量区段[44db,50db]作为用户舒适音量区段。接着,第八子获取装置获取用户进一步在该音量区段中选择“46db”的选择操作,确定该用户的用户舒适音量为46db。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述当前用户的用户舒适音量的方法的实现方式,均应包含在本发明的范围内。
接着,第二获取装置2获取所述播放设备的播放环境信息。
其中,所述播放环境信息包括但不限于以下至少任一项:
1)环境噪声音量;
2)播放距离,该播放距离包括播放设备与接收位置之间的距离。优选地,所述接收位置为人耳的位置。优选地,将播放设备前方的障碍物的位置作为接收位置。
其中,第二获取装置2获取所述播放设备的播放环境信息的方式包括以下至少任一种:
1)所述播放环境信息包括环境噪声音量,第二获取装置2通过检测环境噪声来获取环境噪声音频,以确定环境噪声音量。第二获取装置2包括采集装置(图未示)和解码装置(图未示)。
具体地,采集装置采样获取与所述播放设备所处播放环境对应的噪声音频,然后,解码装置将所述噪声音频解码为预定格式的音频数据,以确定所述噪声音频的环境噪声音量。
优选地,解码装置将噪声音脉码调制(PCM,Pulse Code Modulation)格式。
优选地,解码装置根据解码为预定格式的音频数据,基于以下公式来确定所述噪声音频的环境噪声音量:
其中,SPL(Noise)表示环境噪声音量,n表示该噪声音频的振幅数量,S(k)表示噪声音频的第k个采样的振幅相对大小。
2)所述播放环境信息包括播放距离,第二获取装置2通过检测自身与障碍物的距离来确定该播放距离。例如,第二获取装置2通过播放设备中的传感装置获取到播放设备与其前方障碍物的距离,并将该距离作为播放距离。
接着,确定装置3基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。
其中,确定装置3基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频的方式包括但不限于以下任一种:
1)基于播放环境信息和用户舒适音量来确定待播放音频的输出音量。
具体地,确定装置3根据播放环境信息和用户舒适音量,并基于预定的运算规则,来确定待播放音频的输出音量值。
例如,确定装置3将确定输出音量值=播放距离*用户舒适音量/标准距离。其中,所述标准距离用于表征最适合用户收听音频的距离。
又例如,用户A通过手机中的微信接收来自用户B和用户C的音频。其中,用户A手机中的第一获取装置1获得的用户A的用户舒适音量为32db,其中,输出音量=(1+环境噪声音量/用户舒适音量*100%)*用户舒适音量。在播放来自用户B的音频时,第二获取装置2获取到用户A所在环境的环境噪声非常小,约为0db,则确定装置3确定输出音量=用户舒适音量=32db,则音量控制装置基于该输出音量来播放来自用户B的音频;接着,继续播放来自用户C的音频,此时,第二获取装置2获取到用户A所在环境的环境噪声音量为8db,则确定装置3确定输出音量=(1+8db/32db*100%)*32=40db,则此时音量控制装置以40db的音量来播放来自用户C的音频。显然,根据本发明的该种方式,能够根据用户A自身所处环境的环境播放信息以及用户A所偏好的舒适音量,灵活地对要播放的音频的输出音量进行调节,使得用户A无论在何种环境中,都能清晰、舒适地收听所播放的音频。
2)确定装置3基于所述播放环境信息、所述待播放音频的原始音量以及所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。
其中,音量控制装置获取原始音量的方式包括但不限于以下任一种:
i)通过软件程序来获取待播放音频的音频数据,并将待播放音频的音频数据解码为预定格式的音频数据,以确定待播放音频的原始音量,该解码以确定原始音量的过程与步骤S2中音量控制装置解码环境噪声音频的过程相同或相似,此处不再赘述;
ii)通过与前述步骤S2中音量控制装置获取环境噪声音量相同或相似的方式来获取播放音频的音频数据,并将待播放音频的音频数据解码为预定格式的音频数据,以确定待播放音频的原始音量,此处不再赘述。
其中,确定装置3基于所述播放环境信息、所述待播放音频的原始音量以及所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频的方式包括但不限于以下任一种:
i)确定装置3根据环境噪声音量和待播放音频的原始音量,先确定与环境噪声音量和原始音量对应的音量增益。然后,确定装置3根据音量增益和用户舒适音量,来确定待播放音频的输出音量。
其中,所述音量增益用于指示所述待播放音频在不同音量区段的环境噪声存在时所需要的增益。
例如,第一获取装置1获取到用户舒适音量是40db,第二获取装置2获取到环境噪声音量是35db,并且待播放音频的原始音量是30db。接着,确定装置3在预存的音频音量区段、噪声音量区段和音量增益三者的对应关系中查询,得到对应的音量增益是3db。然后,确定装置3确定待播放音频的输出音量是用户舒适音量与音量增益的和,即43db。其中,所述对应关系的获取方式与后续优选实施例中获取音量对应关系的方式相似或相同。
ii)确定装置3包括输出确定装置,该输出确定装置基于环境噪声音量、用户舒适音量和播放距离来确定待播放音频的输出音量。所述输出确定装置包括第一子确定装置(图未示)和第二子确定装置(图未示);其中,第一子确定装置进一步包括第四子确定装置(图未示)、第五子确定装置(图未示)和第六子确定装置(图未示)。
其中,所述播放环境信息包括环境噪声音量和播放距离。第一子确定装置根据环境噪声音量和待播放音频的原始音量,确定与环境噪声音量和原始音量对应的音量增益。接着,第二子确定装置根据音量增益、播放距离以及所述用户舒适音量,来确定待播放音频的输出音量。
具体地,第四子确定装置确定所述环境噪声音量对应的噪音音量区段,以及待播放音频的原始音量对应的音频音量区段。然后,第五子确定装置根据音量对应关系,确定与环境噪声音量的噪音音量区段,以及所述原始音量的音频音量区段相对应的平均舒适音量。接着,第六子确定装置根据所述原始音量以及所述平均舒适音量,来确定待播放音频的音量增益。
其中,前述音量对应关系用于指示音频音量区段、噪音音量区段,以及与测试音频对应的平均舒适音量三者的对应关系。
其中,第五子确定装置获取所述音量对应关系的方式包括但不限于以下任一种:
i)读取预存的音量对应关系;
ii)播放多个测试音频,分别获取与各个测试音频对应的一个或多个用户舒适音量,根据各个测试音频的一个或多个用户舒适音量,分别确定与各个测试音频对应的平均舒适音量,并保存测试音频中的候选音频的音频音量区段、测试音频中的候选噪声的噪声音量区段,以及测试音频对应的平均舒适音量三者的音量对应关系。其中,该方式的具体实现将在后续优选实施例中予以详述,此处不再赘述。
优选地,第二子确定装置根据所述音量增益、所述播放距离以及所述用户舒适音量,基于以下公式来确定所述待播放音频的所述输出音量。
其中,SPL(Actual)表示输出音量,SPL(Standard)表示用户舒适音量,L表示播放距离,Lstandard表示标准距离,SPL(Noise_gain)表示音量增益。
其中,所述标准距离是预设的声音输出距离,优选地,标准距离可根据用户使用习惯来确定。例如,将用户历史使用手机时耳朵与手机扬声器之间的距离的平均值作为标准距离;又例如,将用户输入的距离值作为标准距离等。
根据本发明的第一示例,用户D的手机中存储的音量对应关系如下表4示。
表4
用户D通过该手机接听来自呼叫中心的客服甲的通话音频时,该手机中的音量控制装置确定当前的环境噪声音量为43db,来自客服甲的通话音频的原始音量较轻,为37db。则第四子确定装置根据该上表4所示的音量对应关系,确定与当前的环境噪声音量对应的噪音音量区段是40db至60db,与原始音量对应的音频音量区段是20db至50db。接着,第五子确定装置在该音量对应关系中查询,得到对应的平均舒适音量是46db。则第六子确定装置确定所述待播放音频的音量增益=|平均舒适音量-原始音量|=9db。接着,第二子确定装置根据第一获取装置1获取到的用户舒适音量35db,第二获取装置获取到的播放距离4cm,预存的标准距离3cm和第六子确定装置已确定的音量增益9db,通过公式(2)确定该待播放音频的输出音量是52db;则音量控制装置以52db的音量向用户D输出来自客服甲的音频。
优选地,在实时通话过程中,音量控制装置每隔预定时间段,对音频的原始音量和/或播放环境信息进行测量,并相应地基于新获得的原始音量和/或播放环境信息来更新输出音量值。以应对在实时通话中的多种影响因素的变化。
继续对本发明的第一示例进行说明,在用户D与该客服甲的通话过程中,当音量控制装置间隔预定时间再次测量时,确定客服甲的通话音频的原始音量变为70db,即客服甲的音量变大。则音量控制装置继续根据上表1所示的音量对应关系,确定与当前的环境噪声音量对应的噪音音量区段是40db至60db,与原始音量对应的音频音量区段是50db至80db,并在该音量对应关系中查询,得到对应的平均舒适音量是58db。则音量控制装置确定所述待播放音频的音量增益=|平均舒适音量-原始音量|=12db。接着,音量控制装置根据获取到的用户舒适音量35db,播放距离4cm,预存的标准距离3cm和已确定的音量增益12db,通过公式(2)初步确定该待播放音频的预计输出音量是55db,则音量控制装置55db的音量向用户D输出来自客服甲的音频。
根据本发明的方式,能够对于不同原始音量的音频做进一步调节,从而使得无论原始音频的大小如何,对于接听方,如用户D来说,其听到的音量总是在较为舒适的区域内,从而够避免由于说话方的音量过大或过小而降低用户体验的情况,使得用户能够更加清楚的接听音频。
优选地,第二子确定装置进一步包括第八子确定装置(图未示)和第九子确定装置(图未示)。其中,第八子确定装置根据所述音量增益、所述播放距离、所述用户舒适音量以及所述原始音量来确定所述待播放音频的音量控制信息,然后,第九子确定装置基于所述音量控制信息对原始音量进行调节以获得所述待播放音频的所述输出音量。
其中,所述音量控制信息包括用于对原始音量进行调节以获得输出音量的音量调节值。
优选地,所述音量控制信息包括输出音量与原始音量之间的差值。
优选地,所述音量控制信息包括输出音量与原始音量之间的比例关系。
其中,第八子确定装置基于以下公式来确定所述音量控制信息:
其中,Controlparam表示音量控制信息,SPL(Actual)表示输出音量,SPL(original)表示原始音量。
例如,第八子确定装置根据公式(3)得到的Controlparam是5.62。然后,第九子确定装置将待播放音频的能量值调节为原来的5.62倍,以播放该待播放音频。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据环境噪声音量和待播放音频的原始音量,确定与环境噪声音量和原始音量对应的音量增益。接着,音量控制装置根据音量增益、播放距离以及所述用户舒适音量,来确定待播放音频的输出音量的实现方式,均应包含在本发明的范围内。
根据本发明的一个优选实施方案,根据本发明的音量控制装置还包括呈现装置(图未示)。
呈现装置呈现处理相关信息。其中,所述处理相关信息用于提示用户所述待播放音频的原始音量的被处理状态。
其中,所述被处理状态包括但不限于以下任一项:
1)将被处理;
2)正在被处理;
3)已被处理。
优选地,所述处理相关信息包括但不限于以下至少任一种形式:
1)文字信息;例如,在播放音频时,呈现装置呈现该音频的原始音量值以及当前的输出音量值,又例如,向用户呈现“该音频已经过音量转换处理!”的提示信息等;再例如,在实时通话过程中,呈现装置根据通话对方的语音大小,持续地更新显示来自通话对方的音频的原始音量值大小,以及相应地对该音频进行相应处理后的输出音量的值的大小。
2)用于指示原始音量已经过处理的图像和/或动画信息;例如,在播放过程中,呈现装置分别用两条声波线来指示待播放音频的原始音量和输出音量,并利用声波线的跳动来显示音量值的实时变化;又例如,当接收到一个微信音频后,呈现装置先向用户呈现红色叹号以提示用户将要处理该音频,在处理过程中,显示红色进度条以表示正在处理,并当处理完成后,在该微信音频前显示一个绿色的勾以提示用户处理完成等。
根据本发明的一个优选实施方案,所述播放设备包括网络设备,属于网络设备的音量控制装置基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的所述输出音量;将所述待播放音频的所述原始音量更新为所述输出音量;将更新后的所述待播放音频发送至用户设备,以供其播放所述待播放音频。
网络电话服务器,例如云ROM服务器,接收到用户设备反馈的播放环境信息包括:播放距离5cm,环境噪声音量55db。接着,该云ROM服务器中的音量控制装置获取到该用户设备的用户对应的用户舒适音量为31db,用于发送至该用户设备的通话待播放音频的原始音量为56db,标准距离为2cm。并且,该云ROM服务器中所存储的音量对应关系如表4所示。则音量控制装置根据该音量对应关系查询,得到与该用户设备的环境噪声音量以及该通话待播放音频的原始音量对应的平均舒适音量为58db,则音量控制装置根据平均舒适音量58db与所获得的原始音量56db之间的差值2db,确定该通话待播放音频的音量增益为db,并根据所获得的音量增益、播放距离以及用户舒适音量,通过公式(2)得到输出音量为48db。接着,音量控制装置将该通话待播放音频的原始音量的这一属性更新为48db,并将更新后的通话待播放音频发送至用户设备,以供其播放所述待播放音频,从而保证该用户能够在较舒适的音量下清晰地收听到来自通话方的通话音频。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何确定所述待播放音频的所述输出音量,将所述待播放音频的所述原始音量更新为所述输出音量,然后将更新后的所述待播放音频发送至用户设备的方法的实现方式,均应包含在本发明的范围内。
根据本发明的又一优选实施例,根据本发明的音量控制装置还包括第一播放装置(图未示)、第一子获取装置(图未示)和第三子确定装置(图未示)。
其中,第一播放装置播放多个测试音频。所述测试音频包括由多个候选音频中选择一个候选音频以及由多个候选噪声中选择一个候选噪声,其中,所述多个候选音频分别对应至少一个音频音量区段,所述多个噪音音频分别对应至少一个噪声音量区段。
接着,第一子获取装置分别获取与各个测试音频对应的一个或多个用户舒适音量。
其中,第一子获取装置获取与测试音频对应的用户舒适音量的方式与前述第一获取装置1获取当前用户的用户舒适音量的方式相同或相似,在此不再赘述。
接着,第三子确定装置根据各个测试音频的一个或多个用户舒适音量,分别确定与各个测试音频对应的平均舒适音量,并保存所述测试音频中的候选音频的音频音量区段、所述测试音频中的候选噪声的噪声音量区段,以及所述测试音频对应的平均舒适音量三者的音量对应关系。
例如,候选音频包括Audio_1和Audio_2,候选噪声包括Noise_1到Noise_4,其各自包括的音量区段如表5所示。音量控制装置基于各个候选音频与各个候选噪声的任意组合,获得如表6所示的测试音频Test_1至Test_8。第一播放装置播放该多个测试音频Test_1,接着,第一子获取装置获取与测试音频Test_1对应的三个用户舒适音量20db、28db、24db。接着,第三子确定装置根据该三个用户舒适音量,确定与测试音频Test_1对应的平均舒适音量是24db,并保存测试音频Test_1的候选音频的音量区段[20db,50db]、测试音频Test_1的候选噪声的噪声音量区段[20db,40db]以及所获得的平均舒适音量24db这三者的音量对应关系。并且,第一播放装置、第一子获取装置和第三子确定装置分别对测试音频Test_2至Test_8执行相似的操作,以获得如表6中所示的,各个测试音频中的候选音频的音频音量区段、所述测试音频中的候选噪声的噪声音量区段,以及测试音频对应的平均舒适音量三者的音量对应关系。
表5
候选音频 音频音量区段 候选噪声 噪声音量区段
Audio_1 [20db,50db] Noise_1 [20db,40db]
Audio_2 [20db,50db] Noise_2 [40db,60db]
Noise_3 [60db,80db]
Noise_4 [80db,100db]
表6
测试音频 音频音量区段 噪声音量区段 平均舒适音量
Test_1 [20db,50db] [20db,40db] 24
Test_2 [20db,50db] [40db,60db] 46
Test_3 [20db,50db] [60db,80db] 63
Test_4 [20db,50db] [80db,100db] 85
Test_5 [50db,80db] [20db,40db] 54
Test_6 [50db,80db] [40db,60db] 55
Test_7 [50db,80db] [60db,80db] 68
Test_8 [50db,80db] [80db,100db] 82
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何播放多个测试音频并分别获取与各个测试音频对应的一个或多个用户舒适音量,确定与各个测试音频对应的平均舒适音量,并保存所述测试音频中的候选音频的音频音量区段、所述测试音频中的候选噪声的噪声音量区段,以及所述测试音频对应的平均舒适音量三者的音量对应关系的实现方式,均应包含在本发明的范围内。
根据本发明的方案,通过获取用户选择的用户舒适音量,以基于该用户舒适音量确定待播放音频的输出音量,使用户收听到的音频音量是其觉得舒适的音量;结合环境播放信息确定待播放音频的输出音量,故而能够确定当前环境中的噪声和用户与播放设备的距离对输出音量的影响,并对待播放音频的音量进行相应地调节,以保证用户能够在较为舒适的音量下清晰地收听到待播放音频。
本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个功能或步骤的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (15)

1.一种用于在播放设备中控制待播放音频的输出音量的方法,其中,所述方法包括以下步骤:
a 获取当前用户的用户舒适音量,其中,所述用户舒适音量用于指示该用户觉得舒适的音量;
b 获取所述播放设备的播放环境信息;
c 基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频;
其中,所述播放环境信息还包括播放距离,其中,所述步骤c包括以下步骤:
m 根据环境噪声音量和所述待播放音频的原始音量,确定与所述环境噪声音量和所述原始音量对应的音量增益;
n 根据所述音量增益、所述播放距离以及所述用户舒适音量,来确定所述待播放音频的所述输出音量;
其中,所述步骤m包括以下步骤:
-确定所述环境噪声音量对应的噪音音量区段,以及待播放音频的原始音量对应的音频音量区段;
-根据音量对应关系,确定与所述环境噪声音量的噪音音量区段,以及所述原始音量的音频音量区段相对应的平均舒适音量,其中,所述音量对应关系用于指示音频音量区段、噪音音量区段,以及与测试音频对应的平均舒适音量三者的对应关系;
-根据所述原始音量以及所述平均舒适音量,来确定所述待播放音频的音量增益。
2.根据权利要求1所述的方法,其中,所述步骤c包括以下步骤:
c1 基于所述播放环境信息、所述待播放音频的原始音量以及所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。
3.根据权利要求1或2所述的方法,其中,所述播放环境信息包括环境噪声音量,其中,所述步骤b包括:
-采样以获取与所述播放设备所处播放环境对应的噪声音频;
-将所述噪声音频解码为预定格式的音频数据,以确定所述噪声音频的环境噪声音量。
4.根据权利要求1所述的方法,其中,所述方法还包括以下步骤:
-播放多个测试音频,其中,所述测试音频包括由多个候选音频中选择一个候选音频以及由多个候选噪声中选择一个候选噪声,其中,所述多个候选音频分别对应至少一个音频音量区段,所述多个候选噪声分别对应至少一个噪声音量区段;
-分别获取与各个测试音频对应的一个或多个用户舒适音量;
-根据各个测试音频的一个或多个用户舒适音量,分别确定与各个测试音频对应的平均舒适音量,并保存所述测试音频中的候选音频的音频音量区段、所述测试音频中的候选噪声的噪声音量区段,以及所述测试音频对应的平均舒适音量三者的音量对应关系。
5.根据权利要求1所述的方法,其中,所述方法通过以下步骤来获取用户舒适音量:
x 播放示例音频,其中,所述示例音频属于示例音频集,所述音频集中包含多个分别属于不同音量区段的示例音频;
y 获取用户对所述示例音频的调节指令;
z 根据所述用户对所述示例音频的调节指令,选择新的示例音频;
-重复上述步骤x、y和z,直至用户确认所播放的示例音频的音量区段为用户舒适音量区段;
-获取用户选择的所述舒适音量区段中的音量作为所述用户舒适音量。
6.根据权利要求1所述的方法,其中,所述方法还包括以下步骤:
-呈现处理相关信息,以提示用户所述待播放音频的原始音量的被处理状态。
7.根据权利要求1所述的方法,其中,所述播放设备包括网络设备,其中,所述步骤c包括以下步骤:
-基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的所述输出音量;
-将所述待播放音频的所述原始音量更新为所述输出音量;
-将更新后的所述待播放音频发送至用户设备,以供其播放所述待播放音频。
8.一种用于在播放设备中控制待播放音频的输出音量的音量控制装置,其中,所述音量控制装置包括:
第一获取装置,用于获取当前用户的用户舒适音量,其中,所述用户舒适音量用于指示该用户觉得舒适的音量;
第二获取装置,用于获取所述播放设备的播放环境信息;
确定装置,用于基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频;
其中,所述播放环境信息还包括播放距离,其中,所述确定装置包括:
第一子确定装置,用于根据环境噪声音量和所述待播放音频的原始音量,确定与所述环境噪声音量和所述原始音量对应的音量增益;
第二子确定装置,用于根据所述音量增益、所述播放距离以及所述用户舒适音量,来确定所述待播放音频的所述输出音量;
其中,所述第一子确定装置包括:
第四子确定装置,用于确定所述环境噪声音量对应的噪音音量区段,以及待播放音频的原始音量对应的音频音量区段;
第五子确定装置,用于根据音量对应关系,确定与所述环境噪声音量的噪音音量区段,以及所述原始音量的音频音量区段相对应的平均舒适音量,其中,所述音量对应关系用于指示音频音量区段、噪音音量区段,以及与测试音频对应的平均舒适音量三者的对应关系;
第六子确定装置,用于根据所述原始音量以及所述平均舒适音量,来确定所述待播放音频的音量增益。
9.根据权利要求8所述的音量控制装置,其中,所述确定装置包括:
输出确定装置,用于基于所述播放环境信息、所述待播放音频的原始音量以及所述用户舒适音量来确定所述待播放音频的输出音量,以播放所述待播放音频。
10.根据权利要求8或9所述的音量控制装置,其中,所述播放环境信息包括环境噪声音量,其中,所述第二获取装置包括:
采集装置,用于采样以获取与所述播放设备所处播放环境对应的噪声音频;
解码装置,用于将所述噪声音频解码为预定格式的音频数据,以确定所述噪声音频的环境噪声音量。
11.根据权利要求8所述的音量控制装置,其中,所述音量控制装置还包括:
第一播放装置,用于播放多个测试音频,其中,所述测试音频包括由多个候选音频中选择一个候选音频以及由多个候选噪声中选择一个候选噪声,其中,所述多个候选音频分别对应至少一个音频音量区段,所述多个候选噪声分别对应至少一个噪声音量区段;
第一子获取装置,用于分别获取与各个测试音频对应的一个或多个用户舒适音量;
第三子确定装置,用于根据各个测试音频的一个或多个用户舒适音量,分别确定与各个测试音频对应的平均舒适音量,并保存所述测试音频中的候选音频的音频音量区段、所述测试音频中的候选噪声的噪声音量区段,以及所述测试音频对应的平均舒适音量三者的音量对应关系。
12.根据权利要求8所述的音量控制装置,其中,所述音量控制装置通过以下装置来获取用户舒适音量:
第二播放装置,用于播放示例音频;
第二子获取装置,用于获取用户对所述示例音频的调节指令;
选择装置,用于根据所述用户对所述示例音频的调节指令,选择新的示例音频;
第七子确定装置,用于确认该示例音频的音量区段为用户舒适音量区段;
第八子获取装置,用于获取用户选择的所述舒适音量区段中的音量作为所述用户舒适音量。
13.根据权利要求8所述的音量控制装置,其中,所述音量控制装置还包括:
呈现装置,用于呈现处理相关信息,以提示用户所述待播放音频的原始音量的被处理状态。
14.根据权利要求8所述的音量控制装置,其中,所述播放设备包括网络设备,其中,所述网络设备用于:
-基于所述播放环境信息和所述用户舒适音量来确定所述待播放音频的所述输出音量;
-将所述待播放音频的所述原始音量更新为所述输出音量;
-将更新后的所述待播放音频发送至用户设备,以供其播放所述待播放音频。
15.一种播放控制插件,其中,所述播放控制插件包括如权利要求8至14中至少任一项所述的音量控制装置。
CN201310706832.0A 2013-12-19 2013-12-19 一种在播放设备中控制音频的输出音量的方法和装置 Active CN103761063B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310706832.0A CN103761063B (zh) 2013-12-19 2013-12-19 一种在播放设备中控制音频的输出音量的方法和装置
PCT/CN2014/093760 WO2015090163A1 (zh) 2013-12-19 2014-12-12 一种在播放设备中控制音频的输出音量的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310706832.0A CN103761063B (zh) 2013-12-19 2013-12-19 一种在播放设备中控制音频的输出音量的方法和装置

Publications (2)

Publication Number Publication Date
CN103761063A CN103761063A (zh) 2014-04-30
CN103761063B true CN103761063B (zh) 2018-09-07

Family

ID=50528308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310706832.0A Active CN103761063B (zh) 2013-12-19 2013-12-19 一种在播放设备中控制音频的输出音量的方法和装置

Country Status (2)

Country Link
CN (1) CN103761063B (zh)
WO (1) WO2015090163A1 (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761063B (zh) * 2013-12-19 2018-09-07 北京百度网讯科技有限公司 一种在播放设备中控制音频的输出音量的方法和装置
CN105225681B (zh) * 2014-06-26 2018-09-04 美的集团股份有限公司 语音播放方法及系统
CN104980415A (zh) * 2014-07-21 2015-10-14 腾讯科技(深圳)有限公司 一种音频播放方法和设备
CN105511832A (zh) * 2014-09-24 2016-04-20 腾讯科技(深圳)有限公司 一种音量输出处理方法及装置
CN105244048B (zh) * 2015-09-25 2017-12-05 小米科技有限责任公司 音频播放控制方法和装置
CN105867873A (zh) * 2015-12-21 2016-08-17 乐视移动智能信息技术(北京)有限公司 一种音量调节方法和终端设备
CN105677289A (zh) * 2015-12-31 2016-06-15 联想(北京)有限公司 一种信息处理方法及电子设备
CN105912296A (zh) * 2016-04-08 2016-08-31 宇龙计算机通信科技(深圳)有限公司 语音控制方法及系统
CN105827853B (zh) * 2016-04-29 2019-06-07 维沃移动通信有限公司 一种终端外放音量的输出控制方法及移动终端
CN106161781A (zh) * 2016-06-22 2016-11-23 北京小米移动软件有限公司 音量调整方法及装置
CN106231108B (zh) * 2016-08-10 2019-10-29 Tcl移动通信科技(宁波)有限公司 一种移动终端音量控制方法及系统
CN106331338A (zh) * 2016-08-22 2017-01-11 北京小米移动软件有限公司 音量调节方法及装置
CN106445451B (zh) * 2016-09-09 2020-04-03 腾讯科技(深圳)有限公司 一种音频音量增益方法和装置
CN106656744A (zh) * 2016-10-13 2017-05-10 广州视源电子科技股份有限公司 一种调整智能设备推送通知的音量的方法及装置
CN106453946A (zh) * 2016-11-15 2017-02-22 维沃移动通信有限公司 一种调节输出音量的方法及移动终端
CN106713653B (zh) * 2017-01-10 2020-06-30 Oppo广东移动通信有限公司 一种音视频的播放控制方法、装置及终端
CN106954125A (zh) * 2017-03-29 2017-07-14 联想(北京)有限公司 信息处理方法及音频设备
CN107231471A (zh) * 2017-05-15 2017-10-03 努比亚技术有限公司 通话音量调整方法、移动终端及存储介质
CN107450882B (zh) * 2017-07-17 2020-11-20 深圳中泰智丰物联网科技有限公司 一种调节声音响度的方法、装置及存储介质
CN107465824B (zh) * 2017-08-18 2020-06-05 Oppo广东移动通信有限公司 音量调节方法、装置、移动终端及存储介质
CN107613390A (zh) * 2017-10-20 2018-01-19 聚好看科技股份有限公司 一种控制开机广告音量的方法及装置
CN108737648B (zh) * 2018-05-10 2020-12-04 上海麦克风文化传媒有限公司 音乐音量自适应调节方法、装置、存储介质及终端
CN108647005A (zh) * 2018-05-15 2018-10-12 努比亚技术有限公司 音频播放方法、移动终端及计算机可读存储介质
CN109814833B (zh) * 2019-02-15 2022-07-26 佛山博智医疗科技有限公司 一种实时控制频响输出装置及其应用方法
CN111610947B (zh) * 2020-05-09 2022-03-29 东风汽车集团有限公司 车载端通话音量自动调节系统
CN112306451A (zh) * 2020-10-30 2021-02-02 西安万像电子科技有限公司 一种音量调整方法、装置及系统
CN114697445B (zh) * 2020-12-31 2023-09-01 华为技术有限公司 一种音量调节方法、终端及可读存储介质
CN113849151A (zh) * 2021-08-26 2021-12-28 明基智能科技(上海)有限公司 一种音频设备及其音量调节方法
CN114416018A (zh) * 2022-03-28 2022-04-29 龙旗电子(惠州)有限公司 音频播放方法、装置、电子设备以及存储介质
CN116033315B (zh) * 2023-03-30 2023-06-23 南昌航天广信科技有限责任公司 一种广播音量控制方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006249228A1 (en) * 2005-12-07 2007-06-21 Apple Inc. Portable audio device providing automated control of audio volume parameters for hearing protection
CN101369805A (zh) * 2008-09-28 2009-02-18 西北工业大学 一种普适计算环境下声源设备音量自动调节的方法
CN102118665A (zh) * 2009-12-30 2011-07-06 北京华旗随身数码股份有限公司 自动调音装置、方法及多媒体播放器
CN102905028A (zh) * 2012-10-15 2013-01-30 深圳市中兴移动通信有限公司 一种移动终端提示信息的调节方法及相应的移动终端
CN102970632A (zh) * 2011-08-30 2013-03-13 杭州新锐信息技术有限公司 基于听感的音量调节装置、产品及方法
CN102981422A (zh) * 2012-11-23 2013-03-20 广州华多网络科技有限公司 一种音量调节方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130094656A1 (en) * 2011-10-16 2013-04-18 Hei Tao Fung Intelligent Audio Volume Control for Robot
CN103761063B (zh) * 2013-12-19 2018-09-07 北京百度网讯科技有限公司 一种在播放设备中控制音频的输出音量的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006249228A1 (en) * 2005-12-07 2007-06-21 Apple Inc. Portable audio device providing automated control of audio volume parameters for hearing protection
CN101369805A (zh) * 2008-09-28 2009-02-18 西北工业大学 一种普适计算环境下声源设备音量自动调节的方法
CN102118665A (zh) * 2009-12-30 2011-07-06 北京华旗随身数码股份有限公司 自动调音装置、方法及多媒体播放器
CN102970632A (zh) * 2011-08-30 2013-03-13 杭州新锐信息技术有限公司 基于听感的音量调节装置、产品及方法
CN102905028A (zh) * 2012-10-15 2013-01-30 深圳市中兴移动通信有限公司 一种移动终端提示信息的调节方法及相应的移动终端
CN102981422A (zh) * 2012-11-23 2013-03-20 广州华多网络科技有限公司 一种音量调节方法及系统

Also Published As

Publication number Publication date
WO2015090163A1 (zh) 2015-06-25
CN103761063A (zh) 2014-04-30

Similar Documents

Publication Publication Date Title
CN103761063B (zh) 一种在播放设备中控制音频的输出音量的方法和装置
CN107509153B (zh) 声音播放器件的检测方法、装置、存储介质及终端
US9197971B2 (en) Personalized hearing profile generation with real-time feedback
CN110870201B (zh) 音频信号调节方法、装置、存储介质及终端
CN111883156B (zh) 音频处理方法、装置、电子设备及存储介质
CN104811891B (zh) 多通道音频中语音相关通道的缩放回避的方法和系统
CN102342020A (zh) 调节针对音频再现的动态范围
CN102724609B (zh) 便携式无线组合音箱系统及其控制方法
CN107799113B (zh) 音频处理方法、装置、存储介质及移动终端
CN107452396A (zh) 降噪方法、装置及系统
CN202948437U (zh) 用于生成用户界面的系统和装置及用于系统、设备或应用的用户界面
CN110931007B (zh) 语音识别方法及系统
CN113241085B (zh) 回声消除方法、装置、设备及可读存储介质
US9671999B2 (en) Methods and apparatus for improving understandability of audio corresponding to dictation
CN108335697A (zh) 会议记录方法、装置、设备及计算机可读介质
US11627421B1 (en) Method for realizing hearing aid function based on bluetooth headset chip and a bluetooth headset
US9391575B1 (en) Adaptive loudness control
WO2024032133A1 (zh) 听力检测方法、装置、电子设备及存储介质
CN105940449A (zh) 音频信号处理
CN106453005A (zh) 一种具备个性化语音播报功能的智能空调系统
CN111918174B (zh) 音量增益平衡的方法、设备、电子设备及交通工具
CN106502620A (zh) 多媒体文件的多终端协同播放方法和终端
CN104464746A (zh) 语音滤波方法、装置以及电子设备
CN115375518A (zh) 异常寻呼的方法以及相关装置
CN114121032A (zh) 语音信号增益补偿方法、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant