CN110187860B - 音量模糊调节方法、装置、电子设备及存储介质 - Google Patents

音量模糊调节方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110187860B
CN110187860B CN201910337147.2A CN201910337147A CN110187860B CN 110187860 B CN110187860 B CN 110187860B CN 201910337147 A CN201910337147 A CN 201910337147A CN 110187860 B CN110187860 B CN 110187860B
Authority
CN
China
Prior art keywords
volume
current
voice
user
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910337147.2A
Other languages
English (en)
Other versions
CN110187860A (zh
Inventor
张国超
陈孝良
苏少炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN201910337147.2A priority Critical patent/CN110187860B/zh
Publication of CN110187860A publication Critical patent/CN110187860A/zh
Application granted granted Critical
Publication of CN110187860B publication Critical patent/CN110187860B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种音量模糊调节方法,应用于终端技术领域,包括:当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型,得到当前调整音量,并根据该调整音量更新当前音量,若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算该当前调整音量,并再次执行根据该当前调整音量更新当前音量的步骤,当该第一预设时间结束时,根据该首次语音调节指令和最终的当前音量,更新该音量计算模型。本发明还公开了一种音量模糊调节装置、电子设备及存储介质,不断完善音量计算模型,后续只需要较少指令即能调整到用户想要的音量,易用性高。

Description

音量模糊调节方法、装置、电子设备及存储介质
技术领域
本发明涉及终端技术领域,尤其涉及一种音量模糊调节方法、装置、电子设备及存储介质。
背景技术
传统发音设备通过专门的硬件对音量进行调节,直至达到用户想要的目标音量,硬件例如旋钮,滑动触摸等。而在现今的智能无线时代,用户可直接通过语音的方式发送命令给设备,将设备音量设置到自己想要的音量,例如精准调节“音量设置到80”,也可以模糊调节“音量大一点”。
但是,由于不同设备的声音分档不同,例如,有的设备音量档设置为0~5,有的设备音量档设置为0~10,有的设备音量还可能设置为0~100,因此,使用模糊调节方法来调节设备音量到用户想要的音量会更为便捷、自然。但是现有技术中,大部分模糊调节方法不能良好的控制调节力度,需要多次调节才能调整到用户想要的音量,不够智能,丧失易用性。
发明内容
本发明的主要目的在于提供一种音量模糊调节方法、装置、电子设备及存储介质,以解决现有技术中,通过模糊调节方式调整音量时,需要多次调节才能调整到用户想要的音量,用户体验感差,易用性低的问题。
为实现上述目的,本发明实施例第一方面提供一种音量模糊调节方法,包括:
当接收到用户的首次语音调节指令时,根据所述首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量;
根据所述当前调整音量更新当前音量;
若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算所述当前调整音量,并再次执行所述根据所述当前调整音量更新当前音量的步骤;
当所述第一预设时间结束时,根据所述首次语音调节指令和最终的所述当前音量,更新所述音量计算模型。
进一步地,所述根据所述首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量包括:
提取所述首次语音调节指令中的语音特征,所述语音特征包括声纹、音量、语速、情绪分以及环境音量中的一种或多种;
将所述语音特征输入至所述音量计算模型,得到所述当前调整音量。
进一步地,若在第一预设时间范围内接收到用户的再次语音调节指令为升高音量,则所述通过预置算法,计算所述当前调整音量包括:
当存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及所述上一次语音调节指令为降低音量时系统的当前音量V1,令所述当前调整音量为Vq,则:
Figure BDA0002038776800000021
进一步地,若在第一预设时间范围内接收到用户的再次语音调节指令为升高音量,则所述通过预置算法,计算所述当前调整音量还包括:
当不存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及第二预设时间范围内系统使用过的最高音量Vmax,令所述当前调整音量为Vq,则:
Figure BDA0002038776800000022
进一步地,若在第一预设时间范围内接收到用户的再次语音调节指令为降低音量,则所述通过预置算法,计算所述当前调整音量包括:
当存在上一次语音调节指令为升高音量时系统的当前音量,则获取当前音量Vnow以及所述上一次语音调节指令为升高音量时系统的当前音量V2,令所述当前调整音量为Vq,则:
Figure BDA0002038776800000031
进一步地若在第一预设时间范围内接收到用户的再次语音调节指令为降低音量,则所述通过预置算法,计算所述当前调整音量还包括:
当不存在上一次语音调节指令为升高音量时系统的当前音量,则获取当前音量Vnow以及第二预设时间范围内系统使用过的最低音量Vmin,令当前调整音量为Vq,则:
Figure BDA0002038776800000032
进一步地,所述根据所述首次语音调节指令和最终的所述当前音量,更新所述音量计算模型包括:
根据所述首次语音调节指令中的语音特征和最终的所述当前音量,更新所述音量计算模型。
进一步地,所述方法还包括:
当系统不存在所述音量计算模型时,在接收到用户的所述首次语音调节指令后,通过所述预置算法,计算所述当前调整音量;
根据所述当前调整音量更新当前音量;
若在所述第一预设时间范围内接收到用户的再次语音调节指令,则再次执行所述通过所述预置算法,计算所述当前调整音量的步骤;
当所述第一预设时间结束时,根据所述首次语音调节指令和最终的所述当前音量,建立所述音量计算模型。
本发明实施例第二方面提供一种音量模糊调节装置,包括:
第一音量计算模块,用于当接收到用户的首次语音调节指令时,根据所述首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量;
音量更新模块,用于根据所述当前调整音量更新当前音量;
第二音量计算模块,用于若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算所述当前调整音量,并返回至所述音量更新模型;
模型更新模块,用于当所述第一预设时间结束时,根据所述首次语音调节指令和最终的所述当前音量,更新所述音量计算模型。
进一步地,所述第一音量计算模块包括:
特征提取模块,用于提取所述首次语音调节指令中的语音特征,所述语音特征包括声纹、音量、语速、情绪分以及环境音量中的一种或多种;
输入模块,用于将所述语音特征输入至所述音量计算模型,得到当前调整音量。
本发明实施例第三方面提供了一种电子设备,包括:
存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现本发明实施例第一方面提供的音量模糊调节方法。
本发明实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面提供的音量模糊调节方法。
从上述本发明实施例可知,本发明提供的音量模糊调节方法、装置、电子设备及存储介质,当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量,根据该当前调整音量更新当前音量,若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算该当前调整音量,并执行根据该当前调整音量设更新当前音量的步骤,当该第一预设时间结束时,根据该首次语音调节指令和最终的当前音量,更新该音量计算模型,以不断完善音量计算模型,后续只需要较少指令即能调整到用户想要的音量,易用性高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的音量模糊调节方法的流程示意图;
图2为本发明另一实施例提供的音量模糊调节方法的流程示意图;
图3为本发明又一实施例提供的音量模糊调节方法的流程示意图;
图4为本发明再一实施例提供的音量模糊调节装置的结构示意图;
图5示出了一种电子设备的硬件结构图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下各本发明实施例的典型应用场景是在对设备进行音量调节时,由于不同设备的音量分档不同,用户可能对该设备的音量分档不明确。因此,需要采用模糊调节方法来调节设备音量到用户想要的音量。具体技术方案的描述参见下述各实施例。
请参阅图1,图1为本发明一实施例提供的音量模糊调节方法的流程示意图,该方法可应用于具有音量调节功能的电子设备中,该电子设备包括:手机、平板电脑(PortableAndroid Device,PAD),笔记本电脑以及个人数字助理(Personal Digital Assistant,PDA)等,该方法主要包括以下步骤:
S101、当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量。
该语音调节指令的具体内容可能为“增大音量”、“减小音量”、“把音量调高一点”、“把音量调低一点”、“音量太高了”、“音量太低了”等,此处对语音调节指令的具体内容不做限定,其表达的本质含义可分为升高音量和降低音量两种。其中,根据语音调节指令的具体内容得到其表达的本质含义为本领域现有技术,此处不再赘述。同时,本领域技术人员可以根据本实施例的描述得到其它语音调节指令的具体内容。
首次语音调节指令是指在第一预设时间范围过后接收到的语音调节指令,即,首次语音调节指令与其上一次语音调节指令的时间间隔大于第一预设时间范围。
S102、根据该当前调整音量更新当前音量。
即,将该当前调整音量设置为当前音量。
若在第一预设时间范围内接收到用户的再次语音调节指令,则执行步骤S103:通过预置算法,计算当前调整音量,然后再次执行步骤S102,直至在该第一预设时间范围内没有接收到用户的语音调节指令,则证明最后一次计算出的当前调整音量为用户想要的音量。然后当该第一预设时间结束时,执行步骤S104:根据该首次语音调节指令和最终的当前音量,更新该音量计算模型。
该第一预设时间范围可以是五秒、十秒、半分钟等,具体数值不做限定。
其中,在接收到用户的再次语音调节指令的过程中,发出该语音调节指令的用户与步骤S101中发出语音调节指令的用户可以为同一用户,也可以为不同用户,只要系统接收到语音调节指令即可。
再次语音调节指令是指在首次语音调节指令之后的语音调节指令,例如,第二次语音调节指令、第三次语音调节指令、第N次语音调节指令。相邻两次语音调节指令之间的时间间隔小于或等于第一预设时间范围。
更多的,在超出第一预设时间范围后,若再次接收到用户的语音调节指令,则认为该语音调节指令为首次语音调节指令,执行步骤S101。
在本发明实施例中,当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量,根据该当前调整音量更新当前音量,若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算该当前调整音量,并执行根据该当前调整音量设更新当前音量的步骤,当该第一预设时间结束时,根据该首次语音调节指令和最终的当前音量,更新该音量计算模型,以不断完善音量计算模型,后续只需要较少指令即能调整到用户想要的音量,易用性高。
请参阅图2,图2为本发明另一实施例提供的音量模糊调节方法的流程示意图,该方法可应用于具有音量调节功能的电子设备中,该方法主要包括以下步骤:
S201、当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量。
当系统内存在音量计算模型时,提取该首次语音调节指令中的语音特征,然后将该语音特征输入至该音量计算模型,得到当前调整音量。
进一步地,该语音特征包括声纹、音量、语速、情绪分以及环境音量中的一种或多种。
其中,音量计算模型即一个语音特征的特征值和调整音量之间的映射。在本发明实施例中,将该语音特征输入至该音量计算模型,得到调整音量的过程即,首先得到语音特征的特征值,然后根据音量计算模型中相应语音特征的特征值和调整音量之间的映射,输出当前调整音量。
S202、根据该当前调整音量更新当前音量。
若在第一预设时间范围内接收到用户的再次语音调节指令时,则执行步骤S203:通过预置算法,计算该当前调整音量,然后再次执行步骤S202,多次计算当前调整音量。然后当该第一预设时间结束时,执行步骤S204:根据该首次语音调节指令和最终的当前音量,更新该音量计算模型。
根据该首次语音调节指令和最终的当前音量,更新该音量计算模型的具体过程可为,根据音量计算模型内建立的语音调节指令和当前音量之间的映射,更新音量计算模型,在本发明实施例中,即若当前音量对应的语音调节指令的语音特征的特征值发生变化,则更新其对应的语音调节指令的相关特征值,若音量计算模型内不存在该当前音量,则建立一个该音量和其对应的语音调节指令之间的映射。
通过预置算法,计算该当前调整音量的具体过程如下:
若在第一预设时间范围内接收到用户的再次语音调节指令为升高音量,则:
当存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及上一次语音调节指令为降低音量时系统的当前音量V1,令当前调整音量为Vq,则:
Figure BDA0002038776800000081
示例性的,当前音量为60。在此前当前音量为60的音量调节过程中,首先,当前音量为80,然后接收到用户降低音量的语音调节指令后,将音量调整到40,当前音量变为40,然后接收到用户升高音量的语音调节指令,将音量调整到60,当前音量变为60。此后,又接收到用户升高音量的语音调节指令,然后系统获取当前音量Vnow=60,上一次语音调节指令为降低音量时系统的当前音量V1=80,然后,根据上式得到当前调整音量Vq=70。
当不存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及第二预设时间范围内系统使用过的最高音量Vmax,令当前调整音量为Vq,则:
Figure BDA0002038776800000091
若在第一预设时间范围内再次接收到用户的语音调节指令为降低音量,则:当存在上一次语音调节指令为升高音量时系统的当前音量,则获取当前音量Vnow以及上一次语音调节指令为升高音量时系统的当前音量V2,令当前调整音量为Vq,则:
Figure BDA0002038776800000092
示例性的,当前音量为60。在此前当前音量为60的音量调节过程中,首先,当前音量为80,然后接收到用户降低音量的语音调节指令后,将音量调整到40,当前音量变为40,然后接收到用户升高音量的语音调节指令,将音量调整到60,当前音量变为60。此后,又接收到用户降低音量的语音调节指令,然后系统获取当前音量Vnow=60,上一次语音调节指令为升高音量时系统的当前音量V1=40,然后,根据上式得到当前调整音量Vq=50。
当不存在上一次语音调节指令为升高音量时系统的当前音量,则获取当前音量Vnow以及第二预设时间范围内系统使用过的最低音量Vmin,令当前调整音量为Vq,则:
Figure BDA0002038776800000093
其中,第二预设时间范围可以为过去一周内、过去两周内或过去一个月内等,具体数值不做限定。
可理解的,第二预设时间范围内系统使用过的最值音量可能不为系统最值音量,例如,系统最大音量为100,第二预设时间范围内系统使用过的最大值音量可能为80或90等。
更多的,在本发明实施例中,在超出第一预设时间范围后,若再次接收到用户的语音调节指令,则认为该语音调节指令为首次语音调节指令,执行步骤S201。
本发明实施例中的未描述的技术细节,参见前述图1所示各实施例,此处不再赘述。
在本发明实施中,示例性的,当前音量Vnow为30,当接收到用户的首次语音调节指令为升高音量后,系统按照预置的音量计算模型,将当前音量Vnow调整为50。然后,假设在此后第一预设时间范围内,接收到了用户第二次语音调节指令,且仍为升高音量,同时系统存在上一次语音调节指令为降低音量时系统的当前音量V1=90,则按照上述式1,当前调整音量Vq=70。然后,在此后第一预设时间范围内,又接收到用户第三次语音调节指令为降低音量,同时系统不存在上一次语音调节指令为升高音量时系统的当前音量,则获取到第二预设时间范围内系统使用过的最低音量Vmin=30,则按照式4,将当前音量调整为50。此后,在第一预设时间范围内没有接收到用户的语音调节指令,证明最后一次当前调整音量50为用户想要的目标音量。
在本发明实施例中,当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量,根据该当前调整音量更新当前音量,若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算该当前调整音量,并执行根据该当前调整音量设更新当前音量的步骤,当该第一预设时间结束时,根据该首次语音调节指令和最终的当前音量,更新该音量计算模型,以不断完善音量计算模型,后续只需要较少指令即能调整到用户想要的音量,易用性高。
请参阅图3,图3为本发明又一实施例提供的音量模糊调节方法的流程示意图,该方法可应用于具有音量调节功能的电子设备中,该方法主要包括以下步骤:
S301、当系统不存在音量计算模型时,在接收到用户的首次语音调节指令时,通过预置算法,计算当前调整音量。
通过预置算法,计算当前调整音量的具体过程与本发明实施例中步骤S203相同,故此处不再赘述。
S302、根据该当前调整音量更新当前音量。
若在第一预设时间范围内接收到用户的再次语音调节指令时,则执行步骤S303:通过预置算法,计算该当前调整音量,然后再次执行步骤S302,多次计算当前调整音量。然后当该第一预设时间结束时,执行步骤S304:根据该首次语音调节指令和最终的当前音量,建立该音量计算模型。
通过预置算法,计算当前调整音量的具体过程与本发明实施例中步骤S203相同,故此处不再赘述。
更多的,在本发明实施例中,在超出第一预设时间范围后,若再次接收到用户的语音调节指令,则认为该语音调节指令为首次语音调节指令,若建立的音量模型存在系统内,则执行步骤S201,若建立的音量模型丢失,则执行步骤S301。
在本发明实施中,示例性的,当前音量Vnow为30,当接收到用户的首次语音调节指令为升高音量后,系统不存在上一次语音调节指令为降低音量时系统的当前音量,则获取到第二预设时间范围内系统使用过的最高音量Vmax=90,按照上述式2,当前调整音量Vq=60。然后,在此后第一预设时间范围内,又接收到用户第二次语音调节指令为降低音量,同时系统存在上一次语音调节指令为升高音量时系统的当前音量,则获取到该当前音量V2=30,则按照式3,将当前音量调整为45。此后,在第一预设时间范围内没有接收到用户的语音调节指令,证明最后一次当前调整音量45为用户想要的目标音量。
本发明实施例中的未描述的技术细节,参见前述图1~图2所示各实施例相同,此处不再赘述。
在本发明实施例中,当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量,根据该当前调整音量更新当前音量,若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算该当前调整音量,并执行根据该当前调整音量设更新当前音量的步骤,当该第一预设时间结束时,根据该首次语音调节指令和最终的当前音量,更新该音量计算模型,以不断完善音量计算模型,后续只需要较少指令即能调整到用户想要的音量,易用性高。
请参阅图4,图4是本发明再一实施例提供的音量模糊调节装置的结构示意图,该装置可内置于电子设备中,该装置主要包括:
第一音量计算模块401,当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量。
该语音调节指令的具体内容可能为“增大音量”、“减小音量”、“把音量调高一点”、“把音量调低一点”、“音量太高了”、“音量太低了”等,此处对语音调节指令的具体内容不做限定,其表达的本质含义可分为升高音量和降低音量两种。其中,根据语音调节指令的具体内容得到其表达的本质含义为本领域现有技术,此处不再赘述。同时,本领域技术人员可以根据本实施例的描述得到其它语音调节指令的具体内容。
首次语音调节指令是指在第一预设时间范围过后接收到的语音调节指令,即,首次语音调节指令与其上一次语音调节指令的时间间隔大于第一预设时间范围。
当系统内存在音量计算模型时,提取该首次语音调节指令中的语音特征,然后将该语音特征输入至该音量计算模型,得到当前调整音量。
进一步地,该语音特征包括声纹、音量、语速、情绪分以及环境音量中的一种或多种。
其中,音量计算模型即一个语音特征的特征值和调整音量之间的映射。在本发明实施例中,将该语音特征输入至该音量计算模型,得到调整音量的过程即,首先得到语音特征的特征值,然后根据音量计算模型中相应语音特征的特征值和调整音量之间的映射,输出当前调整音量。
更多的,当系统内不存在音量计算模型时,通过预置算法,计算该当前调整音量,具体过程如下:
若在第一预设时间范围内接收到用户的再次语音调节指令为升高音量,则:
当存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及上一次语音调节指令为降低音量时系统的当前音量V1,令当前调整音量为Vq,则:
Figure BDA0002038776800000131
示例性的,当前音量为60。在此前当前音量为60的音量调节过程中,首先,当前音量为80,然后接收到用户降低音量的语音调节指令后,将音量调整到40,当前音量变为40,然后接收到用户升高音量的语音调节指令,将音量调整到60,当前音量变为60。此后,又接收到用户升高音量的语音调节指令,然后系统获取当前音量Vnow=60,上一次语音调节指令为降低音量时系统的当前音量V1=80,然后,根据上式得到当前调整音量Vq=70。
当不存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及第二预设时间范围内系统使用过的最高音量Vmax,令当前调整音量为Vq,则:
Figure BDA0002038776800000132
若在第一预设时间范围内再次接收到用户的语音调节指令为降低音量,则:当存在上一次语音调节指令为升高音量时系统的当前音量,则获取当前音量Vnow以及上一次语音调节指令为升高音量时系统的当前音量V2,令当前调整音量为Vq,则:
Figure BDA0002038776800000133
示例性的,当前音量为60。在此前当前音量为60的音量调节过程中,首先,当前音量为80,然后接收到用户降低音量的语音调节指令后,将音量调整到40,当前音量变为40,然后接收到用户升高音量的语音调节指令,将音量调整到60,当前音量变为60。此后,又接收到用户降低音量的语音调节指令,然后系统获取当前音量Vnow=60,上一次语音调节指令为升高音量时系统的当前音量V1=40,然后,根据上式得到当前调整音量Vq=50。
当不存在上一次语音调节指令为升高音量时系统的当前音量,则获取当前音量Vnow以及第二预设时间范围内系统使用过的最低音量Vmin,令当前调整音量为Vq,则:
Figure BDA0002038776800000141
其中,第二预设时间范围可以为过去一周内、过去两周内或过去一个月内等,具体数值不做限定。
可理解的,第二预设时间范围内系统使用过的最值音量可能不为系统最值音量,例如,系统最大音量为100,第二预设时间范围内系统使用过的最大值音量可能为80或90等。
音量更新模块402,用于根据该当前调整音量更新当前音量。
第二音量计算模块403,用于若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算该当前调整音量,并返回至音量更新模块402。
通过预置算法,计算当前调整音量的具体过程与本发明实施例中第一音量计算模块中相同,故此处不再赘述。
该第一预设时间范围可以是五秒、十秒、半分钟等,具体数值不做限定。
模型更新模块404,用于当该第一预设时间结束时,根据该首次语音调节指令和最终的当前音量,更新该音量计算模型。
根据该首次语音调节指令和最终的当前音量,更新该音量计算模型的具体过程可为,根据音量计算模型内建立的语音调节指令和当前音量之间的映射,更新音量计算模型,在本发明实施例中,即若当前音量对应的语音调节指令的语音特征的特征值发生变化,则更新其对应的语音调节指令的相关特征值,若音量计算模型内不存在该当前音量,则建立一个该音量和其对应的语音调节指令之间的映射。
更多的,在超出第一预设时间范围后,若再次接收到用户的语音调节指令,则返回第一音量计算模块401。
本发明实施例中的未描述的技术细节,参见前述图1~图3所示各实施例,此处不再赘述。
本发明实施例中,当接收到用户的首次语音调节指令时,根据该首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量,根据该当前调整音量更新当前音量,若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算该当前调整音量,并执行根据该当前调整音量设更新当前音量的步骤,当该第一预设时间结束时,根据该首次语音调节指令和最终的当前音量,更新该音量计算模型,以不断完善音量计算模型,后续只需要较少指令即能调整到用户想要的音量,易用性高。
请参见图5,图5示出了一种电子设备的硬件结构图。
本实施例中所描述的电子设备,包括:
存储器51、处理器52及存储在存储器51上并可在处理器上运行的计算机程序,处理器执行该程序时实现前述图1、图2或图3所示实施例中描述的音量模糊调节方法。
进一步地,该电子设备还包括:
至少一个输入设备53;至少一个输出设备54。
上述存储器51、处理器52输入设备53和输出设备54通过总线55连接。
其中,输入设备53具体可为摄像头、触控面板、物理按键或者鼠标等等。输出设备54具体可为显示屏。
存储器51可以是高速随机存取记忆体(RAM,Random Access Memory)存储器,也可为非不稳定的存储器(non-volatile memory),例如磁盘存储器。存储器51用于存储一组可执行程序代码,处理器52与存储器51耦合。
进一步地,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是设置于上述各实施例中的终端中,该计算机可读存储介质可以是前述图5所示实施例中的存储器。该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现前述图1、图2或图3所示实施例中描述的音量模糊调节方法。进一步地,该计算机可存储介质还可以是U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请所提供的多个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信链接可以是通过一些接口,模块的间接耦合或通信链接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本发明所提供的音量模糊调节方法、装置、电子设备及存储介质的描述,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种音量模糊调节方法,其特征在于,包括:
当接收到用户的首次语音调节指令时,根据所述首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量;
根据所述当前调整音量更新当前音量;
若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算所述当前调整音量,并再次执行所述根据所述当前调整音量更新当前音量的步骤;
当所述第一预设时间结束时,根据所述首次语音调节指令和最终的所述当前音量,更新所述音量计算模型;
其中,若在第一预设时间范围内接收到用户的再次语音调节指令为升高音量,则所述通过预置算法,计算所述当前调整音量包括:
当存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及所述上一次语音调节指令为降低音量时系统的当前音量V1,令所述当前调整音量为Vq,则:
Figure FDA0002616577540000011
2.根据权利要求1所述的音量模糊调节方法,其特征在于,所述根据所述首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量包括:
提取所述首次语音调节指令中的语音特征,所述语音特征包括声纹、音量、语速、情绪分以及环境音量中的一种或多种;
将所述语音特征输入至所述音量计算模型,得到所述当前调整音量。
3.根据权利要求2所述的音量模糊调节方法,其特征在于,若在第一预设时间范围内接收到用户的再次语音调节指令为升高音量,则所述通过预置算法,计算所述当前调整音量还包括:
当不存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及第二预设时间范围内系统使用过的最高音量Vmax,令所述当前调整音量为Vq,则:
Figure FDA0002616577540000021
4.根据权利要求2所述的音量模糊调节方法,其特征在于,若在第一预设时间范围内接收到用户的再次语音调节指令为降低音量,则所述通过预置算法,计算所述当前调整音量包括:
当存在上一次语音调节指令为升高音量时系统的当前音量,则获取当前音量Vnow以及所述上一次语音调节指令为升高音量时系统的当前音量V2,令所述当前调整音量为Vq,则:
Figure FDA0002616577540000022
5.根据权利要求2所述的音量模糊调节方法,其特征在于,若在第一预设时间范围内接收到用户的再次语音调节指令为降低音量,则所述通过预置算法,计算所述当前调整音量还包括:
当不存在上一次语音调节指令为升高音量时系统的当前音量,则获取当前音量Vnow以及第二预设时间范围内系统使用过的最低音量Vmin,令当前调整音量为Vq,则:
Figure FDA0002616577540000023
6.根据权利要求2任意一项所述的音量模糊调节方法,其特征在于,所述根据所述首次语音调节指令和最终的所述当前音量,更新所述音量计算模型包括:
根据所述首次语音调节指令中的语音特征和最终的所述当前音量,更新所述音量计算模型。
7.根据权利要求1至6任意一项所述的音量模糊调节方法,其特征在于,所述方法还包括:
当系统不存在所述音量计算模型时,在接收到用户的所述首次语音调节指令后,通过所述预置算法,计算所述当前调整音量;
根据所述当前调整音量更新当前音量;
若在所述第一预设时间范围内接收到用户的再次语音调节指令,则再次执行所述通过所述预置算法,计算所述当前调整音量的步骤;
当所述第一预设时间结束时,根据所述首次语音调节指令和最终的所述当前音量,建立所述音量计算模型。
8.一种音量模糊调节装置,其特征在于,包括:
第一音量计算模块,用于当接收到用户的首次语音调节指令时,根据所述首次语音调节指令,按照预置的音量计算模型进行计算,得到当前调整音量;
音量更新模块,用于根据所述当前调整音量更新当前音量;
第二音量计算模块,用于若在第一预设时间范围内接收到用户的再次语音调节指令,则通过预置算法,计算所述当前调整音量,并返回至所述音量更新模块;
模型更新模块,用于当所述第一预设时间结束时,根据所述首次语音调节指令和最终的所述当前音量,更新所述音量计算模型;
其中,若在第一预设时间范围内接收到用户的再次语音调节指令为升高音量,则所述通过预置算法,计算所述当前调整音量包括:
当存在上一次语音调节指令为降低音量时系统的当前音量,则获取当前音量Vnow以及所述上一次语音调节指令为降低音量时系统的当前音量V1,令所述当前调整音量为Vq,则:
Figure FDA0002616577540000031
9.根据权利要求8所述的音量模糊调节装置,其特征在于,所述第一音量计算模块包括:
特征提取模块,用于提取所述首次语音调节指令中的语音特征,所述语音特征包括声纹、音量、语速、情绪分以及环境音量中的一种或多种;
输入模块,用于将所述语音特征输入至所述音量计算模型,得到当前调整音量。
10.一种电子设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至7中的任一项所述的音量模糊调节方法中的各个步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至7中的任一项所述的音量模糊调节方法中的各个步骤。
CN201910337147.2A 2019-04-24 2019-04-24 音量模糊调节方法、装置、电子设备及存储介质 Active CN110187860B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910337147.2A CN110187860B (zh) 2019-04-24 2019-04-24 音量模糊调节方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910337147.2A CN110187860B (zh) 2019-04-24 2019-04-24 音量模糊调节方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110187860A CN110187860A (zh) 2019-08-30
CN110187860B true CN110187860B (zh) 2020-10-09

Family

ID=67714899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910337147.2A Active CN110187860B (zh) 2019-04-24 2019-04-24 音量模糊调节方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110187860B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113611297A (zh) * 2021-06-25 2021-11-05 北京智芯微电子科技有限公司 一种智能控制方法、装置和智能产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108495232A (zh) * 2018-02-05 2018-09-04 广东小天才科技有限公司 一种麦克风音量的调节方法、装置、麦克风及存储介质
CN108733342A (zh) * 2018-05-22 2018-11-02 Oppo(重庆)智能科技有限公司 音量调节方法、移动终端及计算机可读存储介质
WO2019057887A1 (fr) * 2017-09-22 2019-03-28 Universite de Bordeaux Procede de simulation d'une dynamique respiratoire d'un poumon virtuel avec une modelisation de la pression musculaire, simulateur virtuel

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10042055B2 (en) * 2016-04-20 2018-08-07 Here Global B.V. Traffic volume estimation
CN106027809B (zh) * 2016-07-27 2019-08-20 维沃移动通信有限公司 一种音量的调节方法及移动终端
JP6817769B2 (ja) * 2016-09-30 2021-01-20 三菱パワー株式会社 発電プラントの運用方法およびその制御装置、ならびにそれを備えた発電プラント
CN108536420A (zh) * 2018-04-16 2018-09-14 Oppo广东移动通信有限公司 音量调节方法、电子装置及计算机可读存储介质
CN108920129A (zh) * 2018-07-27 2018-11-30 联想(北京)有限公司 信息处理方法和信息处理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019057887A1 (fr) * 2017-09-22 2019-03-28 Universite de Bordeaux Procede de simulation d'une dynamique respiratoire d'un poumon virtuel avec une modelisation de la pression musculaire, simulateur virtuel
CN108495232A (zh) * 2018-02-05 2018-09-04 广东小天才科技有限公司 一种麦克风音量的调节方法、装置、麦克风及存储介质
CN108733342A (zh) * 2018-05-22 2018-11-02 Oppo(重庆)智能科技有限公司 音量调节方法、移动终端及计算机可读存储介质

Also Published As

Publication number Publication date
CN110187860A (zh) 2019-08-30

Similar Documents

Publication Publication Date Title
CN108831469B (zh) 语音命令定制方法、装置和设备及计算机存储介质
US8866600B2 (en) Electronic apparatus with haptic feedback and method for providing haptic feedback
CN110677774B (zh) 一种音量自适应调节方法、装置和计算机设备及存储介质
CN105843572B (zh) 一种信息处理方法及可形变的电子设备
US20160173808A1 (en) System and method for level control at a receiver
CN109828740B (zh) 音频调节方法及装置
CN112861548B (zh) 自然语言生成及模型的训练方法、装置、设备和存储介质
CN112102833B (zh) 语音识别方法、装置、设备及存储介质
CN112185369B (zh) 一种基于语音控制的音量调节方法、装置、设备和介质
CN110187860B (zh) 音量模糊调节方法、装置、电子设备及存储介质
CN106601268B (zh) 一种多媒体数据处理方法及装置
CN112015365A (zh) 音量调整方法、装置及电子设备
EP4184310A1 (en) Volume recommendation method and apparatus, device and storage medium
CN105472128B (zh) 一种通话控制方法及装置
CN110491366B (zh) 音频平滑处理方法、装置、计算机设备和存储介质
CN104023102A (zh) 一种可调节的降噪方法、装置及移动终端
CN112822509B (zh) 一种数据处理方法、装置、电子设备和介质
CN114140560A (zh) 动画生成方法、装置、设备和存储介质
CN114630166A (zh) 一种播放控制方法、装置、设备及介质
CN111243631B (zh) 一种自动增益控制方法及电子设备
WO2020134829A1 (zh) 一种神经网络批归一化的优化方法及装置
CN109246554B (zh) 终端及其振动器的调控方法
CN105260345A (zh) 一种颜文字构建方法、装置及电子设备
CN112187204A (zh) 电子装置及其根据音量的均衡器调整方法
CN114302298B (zh) 音量调节方法、装置及电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant