CN114827719B - 一种音量调节方法、设备及存储介质 - Google Patents
一种音量调节方法、设备及存储介质 Download PDFInfo
- Publication number
- CN114827719B CN114827719B CN202210215510.5A CN202210215510A CN114827719B CN 114827719 B CN114827719 B CN 114827719B CN 202210215510 A CN202210215510 A CN 202210215510A CN 114827719 B CN114827719 B CN 114827719B
- Authority
- CN
- China
- Prior art keywords
- volume
- equipment
- preset
- video
- playing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 127
- 230000008569 process Effects 0.000 claims abstract description 44
- 230000007613 environmental effect Effects 0.000 claims description 67
- 230000008859 change Effects 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 10
- 238000003062 neural network model Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
- H04N5/602—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Television Receiver Circuits (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请实施例提供的一种音量调节方法、设备及存储介质,涉及音量控制技术领域。该方法通过在预设视频资源播放过程中获取当前音量;根据当前音量和视频播放设备的设定设备音量,计算视频播放设备的目标设备音量;将视频播放设备的音量从设定设备音量调节至目标设备音量;根据调节后的设备音量,继续播放预设视频资源。从而,在用户观看视频资料的过程中,可以自动根据用户的音量需求对设备音量进行调节,使得用户听到的音量总是最佳的音量,提升了用户的观看体验。
Description
技术领域
本发明涉及音量控制技术领域,具体而言,涉及一种音量调节方法、设备及存储介质。
背景技术
人们在观影过程中,经常会遇到影片声音忽然变大又突然变小的情况。在遇到这种情况时,用户往往需要不断调节播放设备的音量来适应不同影像片段的音量,使得在整个观影过程中造成了不佳的观影体验。造成这种现象的原因有两方面:一方面是影片刚开始时影片声音往往比较低,用户误将音量调高;另一方面原因时影片本身的原因,音量起伏波动较大,无法用单一合适的音量覆盖各个片段。
针对播放影像资料时,声音忽大忽小的情况,目前暂无很好的解决办法。因此,亟需一种随影像声音变化而调节音量的方法。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种音量调节方法、设备及存储介质,以解决现有技术中无法解决播放影像资料时声音忽大忽小等问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供一种音量调节方法,包括:
在预设视频资源播放过程中获取当前音量;
根据所述当前音量和视频播放设备的设定设备音量,计算所述视频播放设备的目标设备音量;
将所述视频播放设备的音量从所述设定设备音量调节至所述目标设备音量;
根据调节后的设备音量,继续播放所述预设视频资源。
可选地,所述在预设视频资源播放过程中获取当前音量,包括:
在所述预设视频资源播放过程中,从所述预设视频资源中获取第一片源音量;所述第一片源音量为所述当前音量;
可选地,所述根据所述当前音量和视频播放设备的预设音量,计算所述视频播放设备的目标设备音量,包括:
根据所述第一片源音量、所述设定设备音量、第二片源音量以及所述预设视频资源的片源音量范围、所述视频播放设备的设备音量范围,计算所述目标设备音量,所述第二片源音量为设定所述设定设备音量时所述预设视频资源的片源音量。所。
可选地,所述设定设备音量为所述预设视频资源播放至第一预设时长时用户设定的设备音量,或者,所述预设视频资源播放至第二预设时长内的最大片源音量位置时用户设定的设备音量。
可选地,所述根据所述第一片源音量、所述设定设备音量、设定所述设定设备音量时所述预设视频资源的第二片源音量,计算所述目标设备音量之前,所述方法还包括:
计算所述第一片源音量和所述第二片源音量之间的音量变化范围;
若所述音量变化范围超过预设的音量范围阈值,则触发执行所述根据所述第一片源音量、所述设定设备音量、所述第二片源音量,计算所述目标设备音量的步骤。
可选地,所述在预设视频资源播放过程中获取当前音量,包括:
获取音频采集设备在所述预设视频资源播放过程中采集的第一环境音量;所述第一环境音量为所述当前音量。
可选地,所述根据所述当前音量和视频播放设备的预设音量,计算所述视频播放设备的目标设备音量,包括:
根据所述第一环境音量、所述设定设备音量、设定所述设定设备音量时所述音频采集设备采集的第二环境音量,计算所述目标设备音量。
可选地,所述根据所述第一环境音量、所述设定设备音量、设定所述设定设备音量时所述音频采集设备采集的第二环境音量,计算所述目标设备音量,包括:
对所述第一环境音量进行卡尔曼滤波处理,得到采集所述第一环境音量时所述视频播放设备的播放音量;
根据所述播放音量、所述设定设备音量、所述第二环境音量,以及预设的所述视频播放设备和所述音频采集设备之间的音量校正参数,计算所述目标设备音量。
可选地,所述根据所述播放音量、所述设定设备音量、所述第二环境音量,以及预设的所述视频播放设备和所述音频采集设备之间的音量校正参数,计算所述目标设备音量之前,所述方法还包括:
获取所述音频采集设备的采集音量范围,以及所述视频播放设备的设备音量范围;
根据所述采集音量范围、所述设备音量范围、所述设定设备音量以及所述第二环境音量,确定所述音量校正参数。
可选地,所述根据所述第一环境音量、所述设定设备音量、设定所述设定设备音量时所述音频采集设备采集的第二环境音量,计算所述目标设备音量,还包括:
根据所述播放音量、所述设定设备音量、所述第二环境音量,以及预设的所述视频播放设备和所述音频采集设备之间的音量对应关系,计算所述目标设备音量。
可选地,所述根据所述播放音量、所述设定设备音量、所述第二环境音量,以及预设的所述视频播放设备和所述音频采集设备之间的音量对应关系,计算所述目标设备音量之前,所述方法还包括:
采用预设的神经网络模型,对多组样本音量进行处理,得到所述音量对应关系;
其中,每组样本音量包括:所述视频播放设备的一个设备音量,以及对应的所述音频采集设备采集到的一个环境音量。
第二方面,本申请实施例提供一种电子设备,包括:处理器、存储介质,所述处理器与所述存储介质之间通过总线通信连接,所述存储介质存储有所述处理器可执行的程序指令,所述处理器调用存储介质中存储的程序,以执行如第一方面任一所述的音量调节方法的步骤。
第三方面,本申请实施例提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面任一所述的音量调节方法的步骤。
相对于现有技术而言,本申请具有以下有益效果:
本申请实施例提供的一种音量调节方法、设备及存储介质,该方法通过在预设视频资源播放过程中获取当前音量;根据当前音量和视频播放设备的设定设备音量,计算视频播放设备的目标设备音量;将视频播放设备的音量从设定设备音量调节至目标设备音量;根据调节后的设备音量,继续播放预设视频资源。从而,在用户观看视频资料的过程中,可以自动根据用户的音量需求对设备音量进行调节,使得用户听到的音量总是最佳的音量,提升了用户的观看体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种音量调节方法的流程示意图;
图2为本申请实施例提供的一种基于片源音量的音量调节方法的流程示意图;
图3为本申请实施例提供的一种开始执行音量调节的判断方法的流程示意图;
图4为本申请实施例提供的一种基于环境音量的音量调节方法的流程示意图;
图5为本申请实施例提供的一种基于环境音量计算目标设备音量的方法的流程示意图;
图6为本申请实施例提供的一种基于环境音量确定音量校正参数的方法的流程示意图;
图7为本申请实施例提供的另一种基于环境音量计算目标设备音量的方法的流程示意图;
图8为本申请实施例提供的一种音量调节装置的示意图;
图9为本申请实施例提供的一种电子设备的示意图。
附图说明:801-获取模块、802-计算模块、803-调节模块、804-播放模块、901-处理器、902-存储介质。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
人们在观影过程中,视频播放设备不仅会显示视频画面,还会通过视频播放设备自带/外接的音频播放设备播放视频声音。但由于视频资料的音量起伏较大,或影片刚开始时影片声音往往比较低,用户误将音量调高,等原因,导致用户感受到的影片音量忽大忽小。而本申请提供一种音量调节方法、设备及存储介质,在播放设备在播放视频资源时,可以根据用户的听觉习惯调节视频资源的播放音量。当视频资源的片源音量增大时,自动调小播放设备的设备音量,当视频资源的片源音量降低时,自动调大播放设备的设备音量,保持用户所听到播放设备的播放音量保持不变,一直为用户感受到的最适音量,使得用户的观影体验更佳。
本申请中的视频播放设备可以为多媒体投影仪、显示屏等具备视频播放功能的设备。执行音量调节方法的电子设备可以是视频播放设备内部的具备计算处理功能的智能控制单元,也可以是视频播放设备外部的遥控器中的智能控制单元。智能控制单元获取当前音量,并基于音量调节方法调节视频播放设备的设备音量。
如下通过具体示例,先对本申请实施例所提供的一种音量调节方法进行解释说明。
图1为本申请实施例提供的一种音量调节方法的流程示意图,该方法的执行主体可以是一种电子设备,例如具有计算处理功能的控制单元。如图1所示,该方法包括:
S101、在预设视频资源播放过程中获取当前音量。
为了对播放设备的设备音量进行调节,在预设视频资源播放过程中,需要实时获取当前音量。具体地,可以根据用户的需求而设定音量采集的时间间隔,此处不做限定,例如:音量采集的时间间隔为1秒,则每隔一秒采集一次预设视频资源播放的当前音量。
S102、根据当前音量和视频播放设备的设定设备音量,计算视频播放设备的目标设备音量。
视频播放设备的设备音量为设备可调节的音量。视频播放设备的设定设备音量为用户在预设视频资源播放过程中,根据用户的需求而确定的最佳感知音量对应的设备音量。由于每个用户在使用设备播放预设视频资源时,所喜好的最佳感知音量不同,因此,需要在每次播放视频资源时,由用户确定最佳感知音量,进而记录该最佳感知音量对应时刻的设备音量作为设定设备音量。同时,也将该最佳感知音量对应时刻的当前音量作为设定音量。
视频播放设备的设定设备音量作为用户感受到的最佳感知音量对应的设备音量,可将设定设备音量作为调节标准,并根据当前音量与设定音量之间的关系,计算视频播放设备的目标设备音量。即,计算得到的视频播放设备的目标设备音量与当前音量结合,使得用户听到的音量就是最佳感知音量。
S103、将视频播放设备的音量从设定设备音量调节至目标设备音量。
得到设定设备音量之后,就可以根据设定设备音量进行音量调节。将视频播放设备的音量从设定设备音量调节至目标设备音量。由于音量调节步骤伴随着视频播放一直在进行,因此,每一次确定目标设备音量之后,将上一时刻的设备音量调至目标设备音量。
S104、根据调节后的设备音量,继续播放预设视频资源。
设备音量调节至目标设备音量之后,播放设备根据调节后的设备音量,继续播放预设视频资源。以此,持续进行设备音量调节,持续播放预设视频资源。以使得用户在观看视频资源时,用户听到的音量一直保持为最佳感知音量,提升了用户的观看体验。
综上,本申请实施提供的一种音量调节方法,通过在预设视频资源播放过程中获取当前音量;根据当前音量和视频播放设备的设定设备音量,计算视频播放设备的目标设备音量;将视频播放设备的音量从设定设备音量调节至目标设备音量;根据调节后的设备音量,继续播放预设视频资源。从而,在用户观看视频资料的过程中,可以自动根据用户的音量需求对设备音量进行调节,使得用户听到的音量总是最佳的音量,提升了用户的观看体验。
在上述图1的一种音量调节方法的基础上,本申请实施例还提供了一种基于片源音量的音量调节方法。图2为本申请实施例提供的一种基于片源音量的音量调节方法的流程示意图,如图2所示,S101中的在预设视频资源播放过程中获取当前音量,包括:
S201、在预设视频资源播放过程中,从预设视频资源中获取第一片源音量;第一片源音量为当前音量。
若预设视频资源的片源音量已知,可将片源音量作为当前音量。片源音量为视频资源的原始音量,片源音量和设备音量共同作用,产生设备所播放的播放音量。片源音量、设备音量与设备所播放的音量正相关。
继续参照图2,S102中的根据当前音量和视频播放设备的设定设备音量,计算视频播放设备的目标设备音量,包括:
S202、根据第一片源音量、设定设备音量、第二片源音量以及预设视频资源的片源音量范围、视频播放设备的设备音量范围,计算目标设备音量。
其中,第二片源音量为设定该设定设备音量时预设视频资源的片源音量,通过计算得到的目标设备音量与第一片源音量共同作用,所产生的设备的播放音量为最佳感知音量。
由于预设视频资源的片源音量已知,则可以获取预设视频资源的片源音量范围,通过预设视频资源的片源音量范围可以确定预设视频资源的最大片源音量与预设视频资源的最小片源音量。
由于设备音量为设备可调节的音量,即设备音量已知,则可以获取到预设视频资源的设备音量范围,通过设备音量范围可以确定最大设备音量与最小设备音量。
具体地,根据第一片源音量、设定设备音量、第二片源音量以及预设视频资源的片源音量范围、视频播放设备的设备音量范围,计算目标设备音量,如下述公式(1)所示:
其中,SY’为目标设备音量、SY为设定设备音量、SX’为第一片源音量、SX为第二片源音量、SYmax为最大设备音量、SYmin为最小设备音量、SXmax为最大片源音量、SXmin为最小片源音量。
继续参照图2,设定设备音量为预设视频资源播放至第一预设时长时用户设定的设备音量,或者,预设视频资源播放至第二预设时长内的最大片源音量位置时用户设定的设备音量。
在用户设定设备音量时,可以在预设视频资源播放至第一预设时长时,提醒用户设定设备音量。例如,以对话框或语音的形式提示用户所听到的音量是否为最佳感知音量,若用户确认所听到的音量是最佳感知音量,则将第一预设时长对应时刻的设备音量设定为设定设备音量;若用户确认所听到的音量还不是最佳感知音量,则需要用户调节设备音量,直至用户确认所听到的音量是最佳感知音量,将调节后的设备音量设定为设定设备音量。需要说明的是,由于预设视频资源播放的过程都需要伴随着设备音量调节,因此,需要尽早确定设定设备音量,也就是说第一预设时长不宜过长,例如:1分钟。
或者,预设视频资源播放至第二预设时长内的最大片源音量位置时,提醒用户设定设备音量。具体的设定方法与上述根据第一预设时长确定设定设备音量的方法类似,此处不再赘述。
同时,将设定该设定设备音量时的预设视频资源的片源音量设定为第二片源音量。
综上,本申请实施提供的一种基于片源音量的音量调节方法,通过在预设视频资源播放过程中,从预设视频资源中获取第一片源音量;第一片源音量为当前音量,根据第一片源音量、设定设备音量、第二片源音量以及预设视频资源的片源音量范围、视频播放设备的设备音量范围,计算目标设备音量。从而基于片源音量对设备音量进行调节,使得音量调节更加精准。
在上述图2的一种基于片源音量的音量调节方法的基础上,本申请实施例还提供了一种开始执行音量调节的判断方法。图3为本申请实施例提供的一种开始执行音量调节的判断方法的流程示意图,如图3所示,S201中根据第一片源音量、设定设备音量、第二片源音量以及预设视频资源的片源音量范围、视频播放设备的设备音量范围,计算目标设备音量,包括:
S301、计算第一片源音量和第二片源音量之间的音量变化范围。
在观看视频时,可能会出现相邻时段的情节相近,片源音量的变化幅度较小,这种微小的变化可以被计算到,但人类在听觉上无法感知。并且在获取片源音量的过程中,若片源音量的变化幅度较小,还将每次获取到的片源音量都进行音量调节,将大大增加算力。因此,获取到第二片源音量时,需要计算第一片源音量和第二片源音量之间的音量变化范围。若音量变化范围未超过预设的音量范围阈值,则不进行音量调节,预设的音量范围阈值可根据实际情况设定。
S302、若音量变化范围超过预设的音量范围阈值,则触发执行根据第一片源音量、设定设备音量、第二片源音量,计算目标设备音量的步骤。
若音量变化范围超过预设的音量范围阈值,也就是第二片源音量相较于第一片源音量的变化幅度较大。则开始根据第一片源音量、设定设备音量、第二片源音量,计算目标设备音量,具体计算过程与上述类似,此处不再赘述。
综上,本申请实施提供的一种开始执行音量调节的判断方法,通过计算第一片源音量和第二片源音量之间的音量变化范围;若音量变化范围超过预设的音量范围阈值,则触发执行根据第一片源音量、设定设备音量、第二片源音量,计算目标设备音量的步骤。从而,使得音量变化范围超过预设的音量范围阈值,才进行目标设备音量的计算,节省了算力,降低了调节成本。
在上述图1的一种音量调节方法的基础上,本申请实施例还提供了一种基于环境音量的音量调节方法。图4为本申请实施例提供的一种基于环境音量的音量调节方法的流程示意图,如图4所示,S101中的在预设视频资源播放过程中获取当前音量,包括:
S401、获取音频采集设备在预设视频资源播放过程中采集的第一环境音量;第一环境音量为当前音量。
若由于版权限制等原因,无法获知预设视频资源的片源音量。可通过音频采集设备采集预设视频资源播放过程中的环境音量,以环境音量作为设备音量调节的标准,环境音量为视频播放设备实际播放的音量(由于环境因素的影响,可能会包含环境杂音)。示例地,音频采集设备可以是安装在视频播放设备上的音频采集传感器,该传感器与视频播放设备通过无线或有线的形式连接;也可以是手机等具备音频采集功能的外部设备,与视频播放设备通过无线的形式连接。
通过音频采集设备获取在预设视频资源播放过程中的第一环境音量。
继续参照图4,S102中的根据当前音量和视频播放设备的设定设备音量,计算视频播放设备的目标设备音量,包括:
S402、根据第一环境音量、设定设备音量、设定该设定设备音量时音频采集设备采集的第二环境音量,计算目标设备音量。
第二环境音量为设定该设定设备音量时音频采集设备采集的环境音量,根据上述对设定设备音量的描述,第二环境音量对应用户感知到的最佳感知音量。因此将第二环境音量作为音量调节标准,比较第一环境音量与第二环境音量,若第一环境音量大于第二环境音量,则根据设定设备音量调小设备音量;若第一环境音量小于第二环境音量,则根据设定设备音量调大设备音量。即根据第一环境音量、设定设备音量、第二环境音量,可以计算目标设备音量。再根据目标设备音量进行视频播放。
其中,设定设备音量的设定方法与上述实施例类似,此处不再赘述。设定好设定设备音量的同时,确定该设定设备音量对应的环境音量。开始执行音量调节的判断方法也与上述实施例类似,即比较环境音量变化范围与预设的环境音量范围阈值,此处不再赘述。
综上,本申请实施例提供的一种基于环境音量的音量调节方法,获取音频采集设备在预设视频资源播放过程中采集的第一环境音量;第一环境音量为当前音量;根据第一环境音量、设定设备音量、设定该设定设备音量时音频采集设备采集的第二环境音量,计算目标设备音量。从而,在无法获知预设视频资源的片源音量时,通过采集环境音量完成音量调节,使得音量调节更加多样化。
在上述图4的一种基于片源音量的音量调节方法的基础上,本申请实施例还提供了一种基于环境音量计算目标设备音量的方法。图5为本申请实施例提供的一种基于环境音量计算目标设备音量的方法的流程示意图,如图5所示,S402中的根据第一环境音量、设定设备音量、设定该设定设备音量时音频采集设备采集的第二环境音量,计算目标设备音量,包括:
S501、对第一环境音量进行卡尔曼滤波处理,得到采集第一环境音量时视频播放设备的播放音量。
由于音频采集设备所采集到的环境音量包含环境噪音,而环境噪音并不是恒定的,因此直接根据环境音量计算目标设备音量,会导致最终调节结果不稳定。
因此,可以采用卡尔曼滤波,第一环境音量进行进行滤波去除环境噪音,得到采集第一环境音量时视频播放设备的播放音量。进而以视频播放设备的播放音量继续完成设备音量调节。
具体地,对第一环境音量进行卡尔曼滤波处理,得到采集第一环境音量时视频播放设备的播放音量,如下公式(2)-(6)所述:
其中,为上一时刻音频采集设备采集到的环境音量(初始化为第二环境音量),zk为当前时刻的音频采集设备采集到的环境音量,/>为当前时刻的视频播放设备的播放音量。其他变量为计算迭代过程中的中间量,A为状态转移矩阵(在本实施例中,假定音频的变化是均匀的,初始化状态可指定A为某一常量);B和uk-1可指定为常量;Q为状态转移协方差矩阵(初始化指定Q为某一常量);/>为上一状态协方差矩阵(初始化指定/>为某一常量,后续迭代中可以不断更新);H为观测矩阵(初始化指定H为某一常量);R为观测噪声方差(初始化指定R为某一常量);I为单位矩阵;Kk为卡尔曼增益矩阵,是滤波的中间计算量,后续迭代过程中不断更新。
即,通过获取上一时刻音频采集设备采集到的环境音量以及当前时刻的音频采集设备采集到的环境音量,经过卡尔曼滤波处理,估计出当前时刻的视频播放设备的播放音量,得到的播放音量更加精准。
S502、根据播放音量、设定设备音量、第二环境音量,以及预设的视频播放设备和音频采集设备之间的音量校正参数,计算目标设备音量。
在获取到播放音量,就可以根据播放音量计算目标设备音量。具体的计算方式如下述公式(7)所示:
SY′=SY-(SX″-SX)δ (7)
其中,SY′为目标设备音量、SY为设定设备音量、SX″为播放音量、SX为第二环境音量、δ为预设的视频播放设备和音频采集设备之间的音量校正参数。音量校正参数为预设计算得到的。
综上,本申请实施例提供的一种基于环境音量计算目标设备音量,通过对第一环境音量进行卡尔曼滤波处理,得到采集第一环境音量时视频播放设备的播放音量;根据播放音量、设定设备音量、第二环境音量,以及预设的视频播放设备和音频采集设备之间的音量校正参数,计算目标设备音量。从而,对第一环境音量进行卡尔曼滤波处理得到播放音量,根据播放音量计算目标设备音量,使得音量调节结果更加精准。
在上述图5的一种基于环境音量计算目标设备音量的方法的基础上,本申请实施例还提供了一种基于环境音量确定音量校正参数的方法。图6为本申请实施例提供的一种基于环境音量确定音量校正参数的方法的流程示意图,如图6所示,S502根据播放音量、设定设备音量、第二环境音量,以及预设的视频播放设备和音频采集设备之间的音量校正参数,计算目标设备音量之前,该方法还包括:
S601、获取音频采集设备的采集音量范围,以及视频播放设备的设备音量范围。
由于采集音量为音频采集设备能采集到的音量,即采集音量已知,则可以获取到音频采集设备的采集音量范围,通过采集音量范围可以确定音频采集设备的最大采集音量与音频采集设备的最小采集音量。
由于设备音量为设备可调节的音量,即设备音量已知,则可以获取到预设视频资源的设备音量范围,通过设备音量范围可以确定最大设备音量与最小设备音量。
S602、根据采集音量范围、设备音量范围、设定设备音量以及第二环境音量,确定音量校正参数。
由上述可知,设定设备音量以及第二环境音量由用户设定,采集音量范围、设备音量范围已知。即,在音量调节过程中,采集音量范围中的最大采集音量与最小采集音量、设备音量范围中的最大设备音量与最小设备音量、设定设备音量以及第二环境音量都为已知量。可通过采集音量范围、设备音量范围、设定设备音量以及第二环境音量计算音量校正参数,便于在调节过程中直接使用音量校正参数。
具体的音量校正参数计算方式如下述公式(8)所示:
其中,SY为设定设备音量、SX为第二环境音量、SYmax为最大设备音量、SYmin为最小设备音量、SYmax为最大采集音量、SYmin为最小采集音量。
综上,本申请实施例提供的一种基于环境音量确定音量校正参数的方法,通过获取音频采集设备的采集音量范围,以及视频播放设备的设备音量范围;根据采集音量范围、设备音量范围、设定设备音量以及第二环境音量,确定音量校正参数。从而,在音量调节的过程中,提前计算得到音量校正参数,便于后续的目标设备音量的计算。
在上述图5的一种基于环境音量计算目标设备音量的方法的基础上,本申请实施例还提供了另一种基于环境音量计算目标设备音量的方法。图7为本申请实施例提供的另一种基于环境音量计算目标设备音量的方法的流程示意图,如图7所示,S402中的根据第一环境音量、设定设备音量、设定该设定设备音量时音频采集设备采集的第二环境音量,计算目标设备音量,还包括:
S503、根据播放音量、设定设备音量、第二环境音量,以及预设的视频播放设备和音频采集设备之间的音量对应关系,计算目标设备音量。
上述根据音量校正参数计算目标设备音量为线性公式计算。还可以通过非线性的对应关系进行计算,即,获取预设的视频播放设备和音频采集设备之间的音量对应关系。
将播放音量代入该音量对应关系,播放音量对应的设备音量就是目标设备音量。
继续参照图7,S503中根据播放音量、设定设备音量、第二环境音量,以及预设的视频播放设备和音频采集设备之间的音量对应关系,计算目标设备音量之前,该方法还包括:
采用预设的神经网络模型,对多组样本音量进行处理,得到音量对应关系。
以设定设备音量、第二环境音量为标准,采集获取预设的视频播放设备和音频采集设备之间的音量对应关系。其中,每组样本音量包括:视频播放设备的一个设备音量,以及对应的音频采集设备采集到的一个环境音量。每组样本音量所达到的播放音量都是最适合用户的最佳感知音量。
将多组样本音量输入至预设的神经网络模型,进行神经网络学习,得到音量对应关系。
综上,本申请实施例提供的另一种基于环境音量计算目标设备音量的方法,根据播放音量、设定设备音量、第二环境音量,以及预设的视频播放设备和音频采集设备之间的音量对应关系,计算目标设备音量。从而,使得基于环境音量调节设备音量的方法多样化,调节处理更加灵活。
下述对用以执行的本申请所提供的一种音量调节装置、电子设备及存储介质等进行说明,其具体的实现过程以及技术效果参见上述,下述不再赘述。
图8为本申请实施例提供的一种音量调节装置的示意图,如图8所示,该调节装置可包括:
获取模块801,用于在预设视频资源播放过程中获取当前音量。
计算模块802,用于根据当前音量和视频播放设备的设定设备音量,计算视频播放设备的目标设备音量。
调节模块803,用于将视频播放设备的音量从设定设备音量调节至目标设备音量。
播放模块804,用于根据调节后的设备音量,继续播放预设视频资源。
进一步地,获取模块,具体用于在预设视频资源播放过程中,从预设视频资源中获取第一片源音量;第一片源音量为当前音量。
进一步地,计算模块802,具体用于根据第一片源音量、设定设备音量、第二片源音量以及预设视频资源的片源音量范围、视频播放设备的设备音量范围,计算目标设备音量,第二片源音量为设定该设定设备音量时预设视频资源的片源音量。
进一步地,获取模块801,具体用于设定设备音量为预设视频资源播放至第一预设时长时用户设定的设备音量,或者,预设视频资源播放至第二预设时长内的最大片源音量位置时用户设定的设备音量。
进一步地,计算模块802,具体用于计算第一片源音量和第二片源音量之间的音量变化范围;若音量变化范围超过预设的音量范围阈值,则触发执行根据第一片源音量、设定设备音量、第二片源音量,计算目标设备音量的步骤。
进一步地,获取模块801,具体用于获取音频采集设备在预设视频资源播放过程中采集的第一环境音量;第一环境音量为当前音量。
进一步地,计算模块802,具体用于根据第一环境音量、设定设备音量、设定设定设备音量时音频采集设备采集的第二环境音量,计算目标设备音量。
进一步地,计算模块802,具体用于对第一环境音量进行卡尔曼滤波处理,得到采集第一环境音量时视频播放设备的播放音量;根据播放音量、设定设备音量、第二环境音量,以及预设的视频播放设备和音频采集设备之间的音量校正参数,计算目标设备音量。
进一步地,计算模块802,具体用于获取音频采集设备的采集音量范围,以及视频播放设备的设备音量范围;根据采集音量范围、设备音量范围、设定设备音量以及第二环境音量,确定音量校正参数。
进一步地,计算模块802,具体用于采用预设的神经网络模型,对多组样本音量进行处理,得到音量对应关系;其中,每组样本音量包括:视频播放设备的一个设备音量,以及对应的音频采集设备采集到的一个环境音量。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图9为本申请实施例提供的一种电子设备的示意图,该电子设备可以是具备计算处理功能的设备。
该电子设备包括:处理器901、存储介质902。处理器901和存储介质902通过总线连接。
存储介质902用于存储程序,处理器901调用存储介质902存储的程序,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本发明还提供一种程序产品,例如计算机可读存储介质,包括程序,该程序在被处理器执行时用于执行上述方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (9)
1.一种音量调节方法,其特征在于,包括:
在预设视频资源播放过程中获取当前音量;
根据所述当前音量和视频播放设备的设定设备音量,计算所述视频播放设备的目标设备音量;
将所述视频播放设备的音量从所述设定设备音量调节至所述目标设备音量;
根据调节后的设备音量,继续播放所述预设视频资源;
所述在预设视频资源播放过程中获取当前音量,包括:
在所述预设视频资源播放过程中,从所述预设视频资源中获取第一片源音量;所述第一片源音量为所述当前音量;
所述根据所述当前音量和视频播放设备的预设音量,计算所述视频播放设备的目标设备音量,包括:
根据所述第一片源音量、所述设定设备音量、第二片源音量以及所述预设视频资源的片源音量范围、所述视频播放设备的设备音量范围,计算所述目标设备音量,所述第二片源音量为设定所述设定设备音量时所述预设视频资源的片源音量;
或者,所述在预设视频资源播放过程中获取当前音量,包括:
获取音频采集设备在所述预设视频资源播放过程中采集的第一环境音量;所述第一环境音量为所述当前音量;
所述根据所述当前音量和视频播放设备的预设音量,计算所述视频播放设备的目标设备音量,包括:
根据所述第一环境音量、所述设定设备音量、设定所述设定设备音量时所述音频采集设备采集的第二环境音量,计算所述目标设备音量。
2.根据权利要求1所述的方法,其特征在于,所述设定设备音量为所述预设视频资源播放至第一预设时长时用户设定的设备音量,或者,所述预设视频资源播放至第二预设时长内的最大片源音量位置时用户设定的设备音量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一片源音量、所述设定设备音量、设定所述设定设备音量时所述预设视频资源的第二片源音量,计算所述目标设备音量之前,所述方法还包括:
计算所述第一片源音量和所述第二片源音量之间的音量变化范围;
若所述音量变化范围超过预设的音量范围阈值,则触发执行所述根据所述第一片源音量、所述设定设备音量、所述第二片源音量,计算所述目标设备音量的步骤。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一环境音量、所述设定设备音量、设定所述设定设备音量时所述音频采集设备采集的第二环境音量,计算所述目标设备音量,包括:
对所述第一环境音量进行卡尔曼滤波处理,得到采集所述第一环境音量时所述视频播放设备的播放音量;
根据所述播放音量、所述设定设备音量、所述第二环境音量,以及预设的所述视频播放设备和所述音频采集设备之间的音量校正参数,计算所述目标设备音量。
5.根据权利要求4所述的方法,其特征在于,所述根据所述播放音量、所述设定设备音量、所述第二环境音量,以及预设的所述视频播放设备和所述音频采集设备之间的音量校正参数,计算所述目标设备音量之前,所述方法还包括:
获取所述音频采集设备的采集音量范围,以及所述视频播放设备的设备音量范围;
根据所述采集音量范围、所述设备音量范围、所述设定设备音量以及所述第二环境音量,确定所述音量校正参数。
6.根据权利要求4所述的方法,其特征在于,所述根据所述第一环境音量、所述设定设备音量、设定所述设定设备音量时所述音频采集设备采集的第二环境音量,计算所述目标设备音量,还包括:
根据所述播放音量、所述设定设备音量、所述第二环境音量,以及预设的所述视频播放设备和所述音频采集设备之间的音量对应关系,计算所述目标设备音量。
7.根据权利要求6所述的方法,其特征在于,所述根据所述播放音量、所述设定设备音量、所述第二环境音量,以及预设的所述视频播放设备和所述音频采集设备之间的音量对应关系,计算所述目标设备音量之前,所述方法还包括:
采用预设的神经网络模型,对多组样本音量进行处理,得到所述音量对应关系;
其中,每组样本音量包括:所述视频播放设备的一个设备音量,以及对应的所述音频采集设备采集到的一个环境音量。
8.一种电子设备,其特征在于,包括:处理器、存储介质,所述处理器与所述存储介质之间通过总线通信连接,所述存储介质存储有所述处理器可执行的程序指令,所述处理器调用存储介质中存储的程序,以执行如权利要求1至7任一所述的音量调节方法的步骤。
9.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的音量调节方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210215510.5A CN114827719B (zh) | 2022-03-07 | 2022-03-07 | 一种音量调节方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210215510.5A CN114827719B (zh) | 2022-03-07 | 2022-03-07 | 一种音量调节方法、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114827719A CN114827719A (zh) | 2022-07-29 |
CN114827719B true CN114827719B (zh) | 2023-11-28 |
Family
ID=82529862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210215510.5A Active CN114827719B (zh) | 2022-03-07 | 2022-03-07 | 一种音量调节方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114827719B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104602045A (zh) * | 2015-02-12 | 2015-05-06 | 三星电子(中国)研发中心 | 一种声音自动配置方法、系统及装置 |
CN106210879A (zh) * | 2016-08-16 | 2016-12-07 | 微鲸科技有限公司 | 智能音量控制系统和智能音量控制方法 |
CN110022487A (zh) * | 2018-01-08 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 音量调节方法及装置 |
CN111131860A (zh) * | 2018-10-31 | 2020-05-08 | 北京猎户星空科技有限公司 | 一种音视频播放方法、装置、设备及介质 |
CN112637416A (zh) * | 2019-09-20 | 2021-04-09 | 北京小米移动软件有限公司 | 音量的调节方法、装置和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3671747A4 (en) * | 2017-08-18 | 2020-08-12 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | PROCESS AND APPARATUS FOR ADJUSTING SOUND VOLUME, MOBILE TERMINAL AND STORAGE MEDIA |
-
2022
- 2022-03-07 CN CN202210215510.5A patent/CN114827719B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104602045A (zh) * | 2015-02-12 | 2015-05-06 | 三星电子(中国)研发中心 | 一种声音自动配置方法、系统及装置 |
CN106210879A (zh) * | 2016-08-16 | 2016-12-07 | 微鲸科技有限公司 | 智能音量控制系统和智能音量控制方法 |
CN110022487A (zh) * | 2018-01-08 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 音量调节方法及装置 |
CN111131860A (zh) * | 2018-10-31 | 2020-05-08 | 北京猎户星空科技有限公司 | 一种音视频播放方法、装置、设备及介质 |
CN112637416A (zh) * | 2019-09-20 | 2021-04-09 | 北京小米移动软件有限公司 | 音量的调节方法、装置和存储介质 |
Non-Patent Citations (4)
Title |
---|
Design of smart volume controller for televisions;Chih-Hung Huang et al.;《IEEE Transactions on Consumer Electronics》;第59卷(第3期);623-628 * |
地铁智能广播调节系统设计;张卉依;《轻工科技》;第31卷(第1期);69-70 * |
基于环境噪声的广播音量自适应控制系统;王玉芳等;《自动化仪表》(第12期);14-17 * |
张雅琪.基于用户、环境及信源特征的音频用户体验优化.《信息与电脑(理论版)》.2013,(第07期),199-200. * |
Also Published As
Publication number | Publication date |
---|---|
CN114827719A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109361865B (zh) | 一种拍摄方法及终端 | |
WO2019109801A1 (zh) | 拍摄参数的调整方法、装置、存储介质及移动终端 | |
WO2019120027A1 (zh) | 屏幕亮度的调节方法、装置、存储介质及移动终端 | |
CN109448735B (zh) | 基于声纹识别的视频参数调整方法、装置及读存储介质 | |
US7610260B2 (en) | Methods and apparatus for selecting and providing content data using content data status information | |
US9408002B2 (en) | Learning control of hearing aid parameter settings | |
CN107155133B (zh) | 音量调节方法、音频播放终端及计算机可读存储介质 | |
CN103688531A (zh) | 控制装置、控制方法和程序 | |
WO2018191940A1 (zh) | 生物特征数据的检测方法、生物特征识别装置和电子终端 | |
CN110460900B (zh) | 显示装置的音量调节方法、显示装置及存储介质 | |
CN110837758B (zh) | 一种关键词输入方法、装置及电子设备 | |
CN110363036B (zh) | 基于线控器的扫码方法及装置、扫码系统 | |
CN114827719B (zh) | 一种音量调节方法、设备及存储介质 | |
CN109102813B (zh) | 声纹识别方法、装置、电子设备和存储介质 | |
CN112422862A (zh) | 电视机的控制方法、电视机及可读存储介质 | |
CN110459236B (zh) | 音频信号的噪声估计方法、装置及存储介质 | |
CN112669231A (zh) | 图像处理方法、图像处理模型的训练方法、装置、介质 | |
CN113038257B (zh) | 音量调节方法、装置、智能电视及计算机可读存储介质 | |
CN110708600A (zh) | 识别电视的有效观看者的方法和设备 | |
CN115145525A (zh) | 屏幕亮度调节模型训练方法及装置、存储介质及电子设备 | |
WO2021192991A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN113223553B (zh) | 分离语音信号的方法、装置及介质 | |
JP2014033378A (ja) | 音量調整装置および音量調整方法 | |
CN113159206A (zh) | 图像比对方法、装置、电子设备、计算机可读存储介质 | |
CN108205372B (zh) | 应用于虚拟现实设备的操作方法和装置以及虚拟现实设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 610000 building 4, zone a, Tianfu Software Park, No. 1129, shijicheng Road, high tech Zone, Chengdu, Sichuan Applicant after: Jimi Technology Co.,Ltd. Address before: 610000 building 4, zone a, Tianfu Software Park, No. 1129, shijicheng Road, high tech Zone, Chengdu, Sichuan Applicant before: Chengdu Jimi Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |