CN111736798A - 音量调节方法、音量调节装置及计算机可读存储介质 - Google Patents
音量调节方法、音量调节装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111736798A CN111736798A CN202010451544.5A CN202010451544A CN111736798A CN 111736798 A CN111736798 A CN 111736798A CN 202010451544 A CN202010451544 A CN 202010451544A CN 111736798 A CN111736798 A CN 111736798A
- Authority
- CN
- China
- Prior art keywords
- volume
- pressure value
- sound pressure
- distance
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000004891 communication Methods 0.000 claims description 20
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 10
- 230000003993 interaction Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000002618 waking effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4418—Suspend and resume; Hibernate and awake
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/02—Details of telephonic subscriber devices including a Bluetooth interface
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/04—Details of telephonic subscriber devices including near field communication means, e.g. RFID
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/06—Details of telephonic subscriber devices including a wireless LAN interface
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computational Linguistics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本公开是关于一种音量调节方法、音量调节装置及计算机可读存储介质。音量调节方法,应用于智能设备,包括:响应于获取到的唤醒指令,确定唤醒指令的声压值;确定唤醒指令的发声源与智能设备之间的距离;基于距离和声压值调节智能设备的输出音量。通过本公开提供的音量调节方法,智能设备的输出音量能够根据用户发出唤醒指令的声压以及距离进行智能调节,使输出音量的大小能够取决于用户发出唤醒指令的声压值,进而使智能设备输出的音量能够满足用户的使用需求,从而有利于提升用户的使用体验。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种音量调节方法、音量调节装置及计算机可读存储介质。
背景技术
随着物联网技术的发展,许多人家中的家用电器逐渐使用智能设备进行代替。在一些场景中,人们经常会因为不同的周遭环境和使用需求来调整智能终端进行语音交互时的音量。在一相关技术中,需要用户手动控制调节智能设备上的物理按键或者控制智能设备音量的虚拟音量条进行音量调节,或者需要用户发出明确的调节智能设备的输出音量的语音调节指令,否则智能设备响应的音量有可能是上次使用时调节的较大值。在另一相关技术中,智能设备可以通过智能感知调节智能设备的音量,但此方法需要根据周围环境的噪音信号进行调节,但无法准确的满足用户的实际需求。
发明内容
为克服相关技术中存在的问题,本公开提供一种音量调节方法、音量调节装置及计算机可读存储介质。
根据本公开实施例的第一方面,提供一种音量调节方法,应用于智能设备,包括:响应于获取到的唤醒指令,确定唤醒指令的声压值;确定唤醒指令的发声源与智能设备之间的距离;基于距离和声压值,调节智能设备的输出音量。
在一实施例中,基于距离和声压值调节智能设备的输出音量,包括:基于距离和声压值,确定归一化后的当前声压值,当前声压值表征唤醒指令的声压值在预定单位距离的声压值,预定单位距离为预设发声源与智能设备之间的距离;基于当前声压值,以及预定单位距离对应的基准声压值范围,调节智能设备的输出音量;基准声压值范围表征以正常音量发出唤醒指令时,预设发声源与智能设备之间的预定单位距离的声压值范围。
在另一实施例中,基于当前声压值,以及预定单位距离对应的基准声压值范围,调节智能设备的输出音量,包括:若当前声压值位于基准声压值范围,则调整智能设备的输出音量为用户设置的常用音量;若当前声压值高于基准声压值范围的最高声压值,则调整智能设备的输出音量为第一音量;若当前声压值低于基准声压值范围的最低声压值,则调整智能设备的输出音量为第二音量;第一音量高于常用音量,且第二音量低于常用音量。
在又一实施例中,基于距离和声压值确定归一化后的当前声压值,包括:当前声压值通过Lpx=20lg(x)+y确定;其中,Lpx表示当前声压值,x表示距离,y表示唤醒指令的声压值。。
在又一实施例中,确定唤醒指令的发声源与智能设备之间的距离,包括:通过智能设备和发声源处的可穿戴设备之间的通信信号,确定距离。
在一实施例中,基于距离和声压值,调节智能设备的输出音量,包括:当前声压值高于基准声压值范围的最高声压值时,通过如下公式确定输出音量为第一音量: LPx-LPmax=10*lg(v1/v0);其中,LPx为当前声压值,LPmax为基准声压值范围的最高声压值,v1为第一音量,v0为常用音量。
在另一实施例中,音量调节方法还包括:若第一音量v1大于智能设备可输出音量的最大值vmax时,则取v1=vmax。
在一实施例中,基于距离和声压值,调节智能设备的输出音量,包括:当前声压值低于基准声压值范围的最低声压值时,通过如下公式确定输出音量为第二音量: LPmin-LPx=10*lg(v0/v2);其中,LPx为当前声压值,LPmin为基准声压值范围的最低声压值,v2为第二音量,v0为常用音量。
在一实施例中,若第二音量v2小于智能设备可输出音量的最小值vmin时,则取 v2=vmin。
根据本公开实施例的第二方面,提供一种音量调节装置,应用于智能设备,包括:采集单元,用于响应于获取到用户发出的唤醒指令,确定唤醒指令的声压值;距离确定单元,用于确定唤醒指令的发声源与智能设备之间的距离;调节单元,用于基于距离和声压值调节智能设备的输出音量。
在一实施例中,调节单元采用下述方式基于距离和声压调节智能设备的输出音量:基于距离和声压值,确定归一化后的当前声压值,当前声压值表征唤醒指令的声压值在预定单位距离的声压值,预定单位距离为预设发声源与智能设备之间的距离;基于当前声压值,以及预定单位距离对应的基准声压值范围,调节智能设备的输出音量;基准声压值范围表征以正常音量发出唤醒指令时,预设发声源与智能设备之间的预定单位距离的声压值范围。
在另一实施例中,调节单元采用下述方式基于当前声压值,以及预定单位距离对应的基准声压值范围,调节智能设备的输出音量:若当前声压值位于基准声压值范围,则调整智能设备的输出音量为用户设置的常用音量;若当前声压值高于基准声压值范围的最高声压值,则调整智能设备的输出音量为第一音量;若当前声压值低于基准声压值范围的最低声压值,则调整智能设备的输出音量为第二音量;第一音量高于常用音量,且第二音量低于常用音量。
在又一实施例中,调节单元采用下述方式基于距离和声压值确定归一化后的当前声压值:当前声压值通过Lpx=20lg(x)+y确定;其中,Lpx表示当前声压值,x表示距离,y 表示唤醒指令的声压值。
在又一实施例中,距离确定单元采用下述方式确定唤醒指令的发声源与智能设备之间的距离:通过智能设备和发声源处的可穿戴设备之间的通信信号,确定距离。
在又一实施例中,调节单元采用下述方式基于距离和声压值,调节智能设备的输出音量:当前声压值高于基准声压值范围的最高声压值时,通过如下公式确定输出音量为第一音量:LPx-LPmax=10*lg(v1/v0);其中,LPx为当前声压值,LPmax为基准声压值范围的最高声压值,v1为第一音量,v0为常用音量。
在又一实施例中,若第一音量v1大于智能设备可输出音量的最大值vmax时,则取 v1=vmax。
在一实施例中,调节单元采用下述方式基于距离和声压值,调节智能设备的输出音量:当前声压值低于基准声压值范围的最低声压值时,通过满足如下公式确定输出音量为第二音量:LPmin-LPx=10*lg(v0/v2);其中,LPx为当前声压值,LPmin为基准声压值范围的最低声压值,v2为第二音量,v0为常用音量。
在另一实施例中,若第二音量v2小于智能设备可输出音量的最小值vmin时,则取 v2=vmin。
根据本公开实施例的第三方面,提供一种音量调节装置,包括:存储器,用于存储指令;以及处理器;用于调用存储器存储的指令执行上述任意一种音量调节方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在由处理器执行时,执行上述任意一种音量调节方法。
本公开的实施例提供的技术方案可以包括以下有益效果:通过本公开提供的音量调节方法,智能设备的输出音量能够根据用户发出唤醒指令的声压以及距离进行智能调节,使输出音量的大小能够取决于用户发出唤醒指令的声压值,进而使智能设备输出的音量能够满足用户的使用需求,从而有助于提升用户的使用体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种音量调节方法的流程图。
图2是根据一示例性实施例示出的一种音量调节的工作流程图。
图3是根据一示例性实施例示出的一种音量调节装置的框图。
图4是根据一示例性实施例示出的另一种音量调节装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
进一步可以理解的是,术语“第一”、“第二”等用于描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开,并不表示特定的顺序或者重要程度。实际上,“第一”、“第二”等表述完全可以互换使用。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。
相关技术中,人们会因不同的周围环境以及使用需求来调节智能设备进行交互时的输出音量。但调解智能设备的输出音量时,在一种场景下,需要用户手动控制调节智能设备上的物理按键或者控制智能设备音量的虚拟音量条进行音量调节,或者需要用户发出明确的语音调节指令控制智能设备的音量调节,否则智能设备响应的音量有可能是上次使用时调节的较大值。语音调节指令可以包括:“声音大一点”或者“声音小一点”的。通过这两种方法,用户无法快速且方便的调节音量,且影响用户的使用体验。在另一种场景下,智能设备能够自动调节输出音量,但需要根据周围环境的噪声信号进行调节,若噪声信号不发生变化,则无法进行自动调节,无法贴合用户的实际需求。
在本公开提供一种音量调节方法,能够根据用户的唤醒声压和距离,智能的调节需要输出的输出音量,进而使输出音量的大小取决于用户对其进行唤醒时的声压值,无需考虑周围环境的噪声信号,有助于使智能设备的输出音量更符合用户的实际需求,且无需用户进行手动操作和下达明确的语音调节指令,使调节智能设备的输出音量更方便快捷,从而有助于提升用户的使用体验。
可以理解的是,目前,具有语音交互功能的智能设备均具有麦克风采集装置,能够采集和分析用户发出的指令。在本公开实施例中,涉及的智能设备可以包括:智能音箱、智能电视等能够播放声音且能够与用户进行语音交互的智能设备,在本公开中不进行限定。
图1是根据一示例性实施例示出的一种音量调节方法的流程图,如图1所示,音量调节方法10用于智能设备中,包括以下步骤S11至步骤S13。
在步骤S11中,响应于获取到用户发出的唤醒指令,确定唤醒指令的声压值。
在本公开实施例中,唤醒指令是用于唤醒智能设备与用户进行交互的指令。唤醒指令可以是任意一个预先设置唤醒智能设备的唤醒词。通过用户发出的唤醒指令,使智能设备能够明确用户需要将其进行唤醒,并根据获取的唤醒指令进行响应。
在步骤S12中,确定唤醒指令的发声源与智能设备之间的距离。
在本公开实施例中,由于声压是一种衰减波,随着距离的增大而逐渐降低。为确定用户需要播放的输出音量,智能设备根据用户发出唤醒指令的声压和与用户之间的距离,能够得到用户发出唤醒指令的声压值,进而有助于判断用户期望的输出音量的大小,从而调节需要输出的输出音量,使其能够根据用户发出的声压值便可以输出满足用户需求的输出音量。
在一实施例中,确定用户与智能设备之间的距离,可以利用用户随身携带的电子设备与智能设备进行近距离通信的通信信号,确定电子设备与智能设备之间的距离,进而确定用户与智能设备之间的距离。电子设备可以包括:移动终端或者可穿戴设备:移动终端可以包括:手机、平板等;可穿戴设备可以包括:智能手环、智能手表等。在本公开中电子设备不进行限定。近距离通信的通信信号可以包括:蓝牙的蓝牙信号、ZigBee(紫峰)的ZigBee信号或者无线上网的wifi信号。在一实施场景中,通过电子设备和智能设备的蓝牙装置,进行蓝牙通信,进而得到电子设备与智能设备之间的距离。
在步骤S13中,基于距离和声压值调节智能设备的输出音量。
在本公开实施例中,智能设备根据获取的距离和用户的声压值将输出音量的大小进行调节,使得到的输出音量与用户发出唤醒指令的声压值相匹配,进而能够满足用户的实际需求,从而能够提升用户的使用体验。通过获取距离,有助于智能设备进行调节输出音量时,能够结合用户与智能设备之间的远近距离,辅助判断智能设备发出的音量是否能够满足用户的需求,进而使输出的输出音量更贴合用户需要的音量。
通过上述实施例,智能设备能够根据用户发出唤醒指令的声压值和与用户之间的距离,自动调节输出的输出音量,使输出的音量更适合用户期望的音量,且调节智能设备的输出音量的方式无需用户手动操作,简单快捷。
在一实施例中,由于通过麦克风采集装置获取的声压相当于大气压受到声波扰动后引起的压强变化,因此,为便于衡量获取的声压大小,将其转换为声压值。在实际应用中,用户通过唤醒指令唤醒智能设备的位置是随机的,为便于快速调节音量,使输出音量更贴合用户的需求,将获取的声压值进行预处理。预处理包括:将用户与智能设备之间的距离内获取的唤醒指令的声压值,转换为在预定单位距离内获取的当前声压值,将获取的声压值进行归一化,当前声压值表征唤醒指令在距离用户预定单位距离内的声压值。当前声压值的确定可以采用下述声压值距离变化公式进行确定:LPx-LPy=20lg(ry/rx),其中,LPx为当前声压值,LPy为唤醒指令的声压值,rx为预定单位距离,ry为用户与智能设备之间的距离。唤醒指令的声压值和用户与智能设备之间的距离在用户发出唤醒指令时通过麦克风采集装置进行采集,预定单位距离为预设发声源与智能设备之间的距离,因此,通过该公式便可获取用户当前发出的唤醒指令在预定单位距离内的当前声压值。通过预处理,将转换的当前声压值采用预定单位距离对应的基准声压值范围进行调节,使根据声压值调节输出音量的大小能够具有统一的调节标准,进而有助于快速进行调节,便于及时响应用户,从而提升用户的使用体验。预设发声源与智能设备之间的距离可以依据对数定律进行指定,例如:1米、2米、4米、8米、16米等。在一实施场景中,智能设备位于家里,为便于调节的输出音量更贴合用户的使用场景,采用1米作为预定单位距离。当前声压值通过Lpx=20lg(x)+y确定;其中,Lpx表示当前声压值,x表示所述距离,y表示所述唤醒指令的声压值。根据一米内用户以正常音量发出唤醒指令时的声压值范围作为基准声压值范围。
调节输出音量时,根据预设的声压值范围与输出音量之间的对应关系,将确定的当前声压值与基准声压值范围进行对比,判断智能设备输出的输出音量。其中,不同的声压值范围对应不同的输出音量。声压值范围越大,对应输出的输出音量的音量值越高;反之,声压值范围越低,对应输出的输出音量的音量值越低。
在一实施例中,预先获取用户常设置使用的音量值作为常用音量,将其与基准声压值范围进行对应。在基准声压值范围内,包括相对该基准声压值范围的最高声压值和最低声压值。进行对比时,若当前声压值属于基准声压值范围内,表明用户的声压属于常用的声压,则将智能设备的输出音量调整为常用音量,以满足用户的正常使用。若当前声压值高于基准声压值范围的最高声压值,表明用户有意提高声音,需要智能设备输出音量值较高的输出音量,则调整智能设备的输出音量为第一音量,第一音量高于常用音量。例如:用户正在厨房做饭,需要用客厅的智能设备时,则会提高音量,大声唤醒客厅的智能设备,需要智能设备也能够大声进行答复,和播放大声的内容。若当前声压值低于基准声压值范围的最低声压值,表明用户有意降低声音,需要智能设备输出音量值较低的输出音量,则调整智能设备的输出音量为第二音量,第二音量低于常用音量。例如:家里有孩子在睡觉,需要用智能设备时,用户轻声将智能设备进行唤醒,则智能设备也应轻声答复,和播放小声的内容。
在一实施场景中,若唤醒智能设备前,智能设备设置的音量值高于常用音量的音量值。根据确定的当前声压值属于基准声压值范围内,将智能设备预先设置的音量值从高音量值调整为常用音量的音量值,以常用音量作为输出音量响应用户。若唤醒智能设备前,智能设备设置的音量值低于用音量的音量值,则根据用户的唤醒指令,将智能设备预先设置的音量值从低音量值调整为常用音量的音量值,以常用音量作为输出音量响应用户。若醒智能设备前,智能设备设置的音量值即为常用音量的音量值,则直接采用常用音量作为输出音量。
在另一实施场景中,根据历史实验数据表明,人在正常谈话时语言的声功率为50μw,在距离人1米处的声压值为65分贝~69分贝之间。因此,将65分贝~69分贝之间的范围作为基准声压值范围。将用户常用的常用音量作为65分贝~69分贝之间的输出音量。当确定当前声压值属于65分贝~69分贝之间时,则将智能设备的输出音量调整为常用音量。若当前声压值大于69分贝,则将智能设备的输出音量调整为第一音量。若当前声压值小于65分贝,则将智能设备的输出音量调整为第二音量。
在一实施例中,智能设备的输出音量设置有最大音量,以避免输出的输出音量过大,导致输出音量失控,进而对用户的听力造成损伤,影响用户的使用。为便于输出的第一音量贴合用户的使用需求,第一音量的音量值确定取决于常用音量、当前声压值、基准声压值范围的最高声压值和最大音量,使得到的第一音量更具有针对性。在一实施场景中,采用下述公式确定第一音量的音量值:LPx-LPmax=10*lg(v1/v0),其中,LPx为当前声压值, LPmax为基准声压值范围的最高声压值,v1为第一音量,v0为常用音量。用户提高音量向智能设备发送唤醒指令,因此,需要智能设备采用高音量进行回复。通过该公式可以获取贴合用户使用习惯的第一音量,第一音量高于常用音量。若第一音量低于最大音量,则可以直接进行输出;若第一音量大于或等于最大音量,则采用最大音量作为第一音量进行输出,以降低因输出音量过大导致音量失控,进而影响用户的使用体验的可能。
在另一实施例中,智能设备的输出音量设置有最小音量,以避免输出的输出音量过低,用户听不清,影响用户的使用。为便于输出的第二音量贴合用户的使用需求,第二音量的音量值确定取决于常用音量、当前声压值、基准声压值范围的最低声压值和最小音量,使得到的第二音量更具有针对性。在一实施场景中,采用下述公式确定第二音量的音量值:LPmin-LPx=10*lg(v0/v2),其中,LPx为当前声压值,LPmin为基准声压值范围的最低声压值,v2为第二音量,v0为常用音量。用户降低音量向智能设备发送唤醒指令,表明此时用户需要安静一点,需要智能设备采用低音量的输出音量进行回复。通过该公式可以获取贴合用户使用习惯的第二音量,第二音音量低于常用音量。若第二音量大于最小音量,则可以直接进行输出;若第二参考音量小于或等于最小音量,则采用最小音量作为第二音量进行输出,以保证智能设备的音量正常输出,能够使用户听清,进而降低影响用户的使用体验的可能。
基于相同的构思,本公开实施例还提供一种音量调节的工作流程。
图2是根据一示例性实施例示出的一种音量调节的工作流程图。参照图2,该音量调节的工作流程示意图20应用于智能设备,包括:步骤S21至S26。
在步骤S21中,发声源发出唤醒指令。
在本公开中,用户,即发声源,通过说出唤醒词向智能设备发出唤醒指令。
在步骤S22中,智能设备获取唤醒指令。
在本公开中,通过自身内部的麦克风采集装置将该唤醒指令进行获取。
在步骤S23中,确定唤醒指令的声压值。
在步骤S24中,通过蓝牙设备,确定唤醒指令的发声源与智能设备之间的距离。
在步骤S25中,根据唤醒指令的声压值和距离,确定当前声压值。
在本公开中,根据得到用户在发送唤醒指令时的声压与距离,确定用户当前发出的唤醒指令产生的声压值在1米时的当前声压值。
在步骤S26中,根据当前声压值,调节输出音量。
在本公开中,根据历史实验数据表明,人在正常谈话时语言的声功率为50μW,在距离人1米处的平均声压值为65分贝~69分贝之间,因此确定当前声压值时,采用1米作为预定单位距离。将65分贝~69分贝作为用于判断调节智能设备输出音量的基准声压值范围,用于判断当前声压值是否属于基准声压值范围之内。当当前声压值属于65分贝~69分贝之间时,采用常用音量作为输出音量。当当前声压值大于69分贝时,则将输出音量调节为第一音量进行输出。当当前声压值小于65分贝时,则将输出音量调节为第二音量进行输出。
通过本公开提供的音量调节方法,可以使智能设备能够感知用户的音量意图,在需要智能设备做出大声或者小声的语音交互时,不需要用户提前主动触控智能设备进行调节,使智能设备输出的输出音量大小更智能化。进而有助于智能设备能够更自然的实现用户与智能设备之间的语音交互,模仿真人之间谈话交流时的音量控制。
基于相同的构思,本公开实施例还提供一种音量调节装置。
可以理解的是,本公开实施例提供的音量调节装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤,本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本公开实施例的技术方案的范围。
图3是根据一示例性实施例示出的一种音量调节装置框图。参照图3,该音量调节装置100应用于智能设备,包括:采集单元110,距离确定单元120,调节单元130。
采集单元110,用于响应于获取到用户发出的唤醒指令,确定唤醒指令的声压值。
距离确定单元120,用于确定所述唤醒指令的发声源与所述智能设备之间的距离。
调节单元130,用于基于距离和声压值调节智能设备的输出音量。
在一实施例中,调节单元130采用下述方式基于距离和声压调节智能设备的输出音量:基于距离和声压值,确定归一化后的当前声压值,当前声压值表征唤醒指令的声压值在预定单位距离的声压值,预定单位距离为预设发声源与智能设备之间的距离;基于当前声压值,以及预定单位距离对应的基准声压值范围,调节智能设备的输出音量;基准声压值范围表征以正常音量发出唤醒指令时,预设发声源与智能设备之间的预定单位距离的声压值范围。
在另一实施例中,调节单元130采用下述方式基于当前声压值,以及预定单位距离对应的基准声压值范围,调节智能设备的输出音量:若当前声压值位于基准声压值范围,则调整智能设备的输出音量为用户设置的常用音量;若当前声压值高于基准声压值范围的最高声压值,则调整智能设备的输出音量为第一音量;若当前声压值低于基准声压值范围的最低声压值,则调整智能设备的输出音量为第二音量;第一音量高于常用音量,且第二音量低于常用音量。
在又一实施例中,调节单元130还采用下述方式基于所述距离和所述声压值确定归一化后的当前声压值:当前声压值通过Lpx=20lg(x)+y确定;其中,Lpx表示当前声压值,x表示距离,y表示唤醒指令的声压值。
在又一实施例中,距离确定单元采用下述方式确定唤醒指令的发声源与智能设备之间的距离:通过智能设备和发声源处的可穿戴设备之间的通信信号,确定距离。
在又一实施例中,调节单元130采用下述方式基于距离和声压值,调节智能设备的输出音量:当前声压值高于基准声压值范围的最高声压值时,通过如下公式确定输出音量为第一音量:LPx-LPmax=10*lg(v1/v0);其中,LPx为当前声压值,LPmax为基准声压值范围的最高声压值,v1为第一音量,v0为常用音量。
在又一实施例中,若第一音量v1大于智能设备可输出音量的最大值vmax时,则取 v1=vmax。
在一实施例中,调节单元130采用下述方式基于距离和声压值,调节智能设备的输出音量:当前声压值低于基准声压值范围的最低声压值时,通过满足如下公式确定输出音量为第二音量:LPmin-LPx=10*lg(v0/v2);其中,LPx为当前声压值,LPmin为基准声压值范围的最低声压值,v2为第二音量,v0为常用音量。
在另一实施例中,若第二音量v2小于智能设备可输出音量的最小值vmin时,则取 v2=vmin。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种用于音量调节装置200的框图。例如,音量调节装置200可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置200可以包括以下一个或多个组件:处理组件202,存储器204,电力组件206,多媒体组件208,音频组件210,输入/输出(I/O)的接口212,传感器组件 214,以及通信组件216。
处理组件202通常控制装置200的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件202可以包括一个或多个处理器220来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件202可以包括一个或多个模块,便于处理组件202和其他组件之间的交互。例如,处理组件202可以包括多媒体模块,以方便多媒体组件208和处理组件202之间的交互。
存储器204被配置为存储各种类型的数据以支持在设备200的操作。这些数据的示例包括用于在装置200上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件206为装置200的各种组件提供电力。电力组件206可以包括电源管理系统,一个或多个电源,及其他与为装置200生成、管理和分配电力相关联的组件。
多媒体组件208包括在所述装置200和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件208包括一个前置摄像头和/或后置摄像头。当设备200处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件210被配置为输出和/或输入音频信号。例如,音频组件210包括一个麦克风(MIC),当装置200处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器204或经由通信组件216发送。在一些实施例中,音频组件210还包括一个扬声器,用于输出音频信号。
I/O接口212为处理组件202和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件214包括一个或多个传感器,用于为装置200提供各个方面的状态评估。例如,传感器组件214可以检测到设备200的打开/关闭状态,组件的相对定位,例如所述组件为装置200的显示器和小键盘,传感器组件214还可以检测装置200或装置200 一个组件的位置改变,用户与装置200接触的存在或不存在,装置200方位或加速/减速和装置200的温度变化。传感器组件214可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件214还可以包括光传感器,如CMOS或CCD 图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件214还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件216被配置为便于装置200和其他设备之间有线或无线方式的通信。装置200可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件216还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA) 技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器204,上述指令可由装置200的处理器220执行以完成上述任意一种音量调节方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器 (RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
进一步可以理解的是,本公开中“多个”是指两个或两个以上,其它量词与之类似。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
进一步可以理解的是,本公开实施例中尽管在附图中以特定的顺序描述操作,但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作,或是要求执行全部所示的操作以得到期望的结果。在特定环境中,多任务和并行处理可能是有利的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (20)
1.一种音量调节方法,其特征在于,应用于智能设备,所述音量调节方法包括:
响应于获取到的唤醒指令,确定所述唤醒指令的声压值;
确定所述唤醒指令的发声源与所述智能设备之间的距离;
基于所述距离和所述声压值调节所述智能设备的输出音量。
2.根据权利要求1所述的音量调节方法,其特征在于,所述基于所述距离和所述声压值调节所述智能设备的输出音量,包括:
基于所述距离和所述声压值,确定归一化后的当前声压值,所述当前声压值表征所述唤醒指令的所述声压值在预定单位距离的声压值,所述预定单位距离为预设发声源与所述智能设备之间的距离;
基于所述当前声压值,以及所述预定单位距离定单位距离对应的基准声压值范围,调节所述智能设备的输出音量;
所述基准声压值范围表征以正常音量发出唤醒指令时,所述预设发声源与所述智能设备之间的所述预定单位距离的声压值范围。
3.根据权利要求2所述的音量调节方法,其特征在于,基于所述当前声压值,以及所述预定单位距离对应的基准声压值范围,调节所述智能设备的输出音量,包括:
若所述当前声压值位于所述基准声压值范围,则调整所述智能设备的输出音量为常用音量;
若所述当前声压值高于所述基准声压值范围的最高声压值,则调整所述智能设备的输出音量为第一音量;
若所述当前声压值低于所述基准声压值范围的最低声压值,则调整所述智能设备的输出音量为第二音量;
所述第一音量高于所述常用音量,且所述第二音量低于所述常用音量。
4.根据权利要求2所述的音量调节方法,其特征在于,所述基于所述距离和所述声压值确定归一化后的当前声压值,包括:
当前声压值通过Lpx=20lg(x)+y确定;
其中,Lpx表示当前声压值,x表示所述距离,y表示所述唤醒指令的声压值。
5.根据权利要求4所述的音量调节方法,其特征在于,所述确定所述唤醒指令的发声源与所述智能设备之间的距离,包括:
通过所述智能设备和所述发声源处的可穿戴设备之间的通信信号,确定所述距离。
6.根据权利要求1-5中任一项所述的音量调节方法,其特征在于,所述基于所述距离和所述声压值,调节所述智能设备的输出音量,包括:
当前声压值高于所述基准声压值范围的最高声压值时,通过如下公式确定输出音量为第一音量:
LPx-LPmax=10*lg(v1/v0);
其中,所述LPx为所述当前声压值,所述LPmax为所述基准声压值范围的最高声压值,所述v1为第一音量,所述v0为常用音量。
7.根据权利要求6所述的音量调节方法,其特征在于,若所述第一音量v1大于所述智能设备可输出音量的最大值vmax时,则取v1=vmax。
8.根据权利要求1-5中任一所述的音量调节方法,其特征在于,所述基于所述距离和所述声压值,调节所述智能设备的输出音量,包括:
当前声压值低于所述基准声压值范围的最低声压值时,通过如下公式确定输出音量为第二音量:
LPmin-LPx=10*lg(v0/v2)音量调节;
其中,所述LPx为所述当前声压值,所述LPmin为所述基准声压值范围的最低声压值,所述v2为第二音量,所述v0为常用音量。
9.根据权利要求8所述的音量调节方法,其特征在于,若所述第二音量v2小于所述智能设备可输出音量的最小值vmin时,则取v2=vmin。
10.一种音量调节装置,其特征在于,应用于智能设备,所述音量调节装置包括:
采集单元,用于响应于获取到的唤醒指令,确定所述唤醒指令的声压值;
距离确定单元,用于确定所述唤醒指令的发声源与所述智能设备之间的距离;
调节单元,用于基于所述距离和所述声压值调节所述智能设备的输出音量。
11.根据权利要求10所述的音量调节装置,其特征在于,所述调节单元采用下述方式基于所述距离和所述声压值调节所述智能设备的输出音量:
基于所述距离和所述声压值,确定归一化后的当前声压值,所述当前声压值表征所述唤醒指令的所述声压值在预定单位距离的声压值,所述预定单位距离为预设发声源与所述智能设备之间的距离;
基于所述当前声压值,以及所述预定单位距离对应的基准声压值范围,调节所述智能设备的输出音量;
所述基准声压值范围表征以正常音量发出唤醒指令时,所述预设发声源与所述智能设备之间的所述预定单位距离的声压值范围。
12.根据权利要求11所述的装置,其特征在于,所述调节单元采用下述方式基于所述当前声压值,以及所述预定单位距离对应的基准声压值范围,调节所述智能设备的输出音量:
若所述当前声压值位于所述基准声压值范围,则调整所述智能设备的输出音量为用户设置的常用音量;
若所述当前声压值高于所述基准声压值范围的最高声压值,则调整所述智能设备的输出音量为第一音量;
若所述当前声压值低于所述基准声压值范围的最低声压值,则调整所述智能设备的输出音量为第二音量;
所述第一音量高于所述常用音量,且所述第二音量低于所述常用音量。
13.根据权利要求12所述的音量调节装置,其特征在于,所述调节单元采用下述方式基于所述距离和所述声压值确定归一化后的当前声压值:
当前声压值通过Lpx=20lg(x)+y确定;
其中,Lpx表示当前声压值,x表示所述距离,y表示所述唤醒指令的声压值。
14.根据权利要求13所述的音量调节装置,其特征在于,所述距离确定单元采用下述方式确定所述唤醒指令的发声源与所述智能设备之间的距离:
通过所述智能设备和所述发声源处的可穿戴设备之间的通信信号,确定所述距离。
15.根据权利要求10-14中任一项所述的音量调节装置,其特征在于,所述调节单元采用下述方式基于所述距离和所述声压值,调节所述智能设备的输出音量:
当前声压值高于所述基准声压值范围的最高声压值时,通过如下公式确定输出音量为第一音量:
LPx-LPmax=10*lg(v1/v0);
其中,所述LPx为所述当前声压值,所述LPmax为所述基准声压值范围的最高声压值,所述v1为所述第一音量,所述v0为常用音量。
16.根据权利要求15所述的音量调节装置,其特征在于,若所述第一音量v1大于所述智能设备可输出音量的最大值vmax时,则取v1=vmax。
17.根据权利要求10-14中任一项所述的音量调节装置,其特征在于,所述调节单元还采用下述方式基于所述距离和所述声压值,调节所述智能设备的输出音量:
当前声压值低于所述基准声压值范围的最低声压值时,通过满足如下公式确定输出音量为第二音量:
LPmin-LPx=10*lg(v0/v2);
其中,所述LPx为所述当前声压值,所述LPmin为所述基准声压值范围的最低声压值,所述v2为所述第二音量,所述v0为常用音量。
18.根据权利要求14所述的音量调节装置,其特征在于,若所述第二音量v2小于所述智能设备可输出音量的最小值vmin时,则取v2=vmin。
19.一种音量调节装置,其特征在于,包括:
存储器,用于存储指令;以及
处理器;用于调用所述存储器存储的指令执行权利要求1-9中任一项所述的音量调节方法。
20.一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在由处理器执行时,执行权利要求1-9中任一项所述的音量调节方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010451544.5A CN111736798A (zh) | 2020-05-25 | 2020-05-25 | 音量调节方法、音量调节装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010451544.5A CN111736798A (zh) | 2020-05-25 | 2020-05-25 | 音量调节方法、音量调节装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111736798A true CN111736798A (zh) | 2020-10-02 |
Family
ID=72648157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010451544.5A Pending CN111736798A (zh) | 2020-05-25 | 2020-05-25 | 音量调节方法、音量调节装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111736798A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010139A (zh) * | 2021-03-10 | 2021-06-22 | 北京奇艺世纪科技有限公司 | 一种投屏方法、装置及电子设备 |
-
2020
- 2020-05-25 CN CN202010451544.5A patent/CN111736798A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010139A (zh) * | 2021-03-10 | 2021-06-22 | 北京奇艺世纪科技有限公司 | 一种投屏方法、装置及电子设备 |
CN113010139B (zh) * | 2021-03-10 | 2023-09-05 | 北京奇艺世纪科技有限公司 | 一种投屏方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106527160B (zh) | 设备控制方法及装置 | |
CN109920418B (zh) | 调整唤醒灵敏度的方法及装置 | |
JP6314286B2 (ja) | 音声信号の最適化方法及びその装置、プログラム、及び記録媒体 | |
CN107872576B (zh) | 闹钟提醒方法、装置及计算机可读存储介质 | |
CN108806714B (zh) | 调节音量的方法和装置 | |
CN109410973B (zh) | 变声处理方法、装置和计算机可读存储介质 | |
CN108845787B (zh) | 音频调节的方法、装置、终端及存储介质 | |
CN106406175B (zh) | 开门提醒方法及装置 | |
CN111988704A (zh) | 声音信号处理方法、装置以及存储介质 | |
CN111724783B (zh) | 智能设备的唤醒方法、装置、智能设备及介质 | |
CN111736798A (zh) | 音量调节方法、音量调节装置及计算机可读存储介质 | |
CN106101441B (zh) | 终端控制方法及装置 | |
CN112509596A (zh) | 唤醒控制方法、装置、存储介质及终端 | |
CN105244037B (zh) | 语音信号处理方法及装置 | |
CN106603882A (zh) | 来电音量调节方法、装置及终端 | |
CN107677363B (zh) | 噪音提示的方法及智能终端 | |
CN112866480B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN114639383A (zh) | 设备唤醒方法、装置、电子设备和介质 | |
CN107979695B (zh) | 网络消息接收方法及装置、存储介质 | |
US20240054987A1 (en) | Earphone controlling method and apparatus, electronic device and storage medium | |
CN112637416A (zh) | 音量的调节方法、装置和存储介质 | |
CN111225318A (zh) | 音频调节方法及装置、电子设备 | |
WO2024046416A1 (zh) | 一种音量调节方法、电子设备及系统 | |
CN115579003A (zh) | 语音唤醒方法、装置及存储介质 | |
CN117093182B (zh) | 一种音频播放方法、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |