发明内容
本发明主要解决的技术问题是如何方便快捷地根据实际情况自动调节音量,提升用户的通话体验。
有鉴于此,本发明提出一种自动调节音量的方法、音量调节装置及电子设备,能够根据通话者的语义自动调节音量,提升用户的通话体验。
第一方面,本发明实施例提供一种自动调节音量的方法,所述方法包括:在建立通话连接后,第一电子设备接收语音信号;将所述语音信号进行识别并进行语义分析得到语义识别结果,其中语义分析即是从语音识别结果中提取出关键字;将所述语义识别结果与预存的评价语义进行匹配获取音量调节规则;根据所述音量调节规则自动调节所述电子设备的音量输出模式。
结合第一方面,在第一方面的第一种可能的实现方式中:所述语音信号包括所述第一电子设备通过麦克风接收到的语音信号;或所述第一电子设备接收到的第二电子设备发送的语音信号。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中:当所述语音信号为所述第一电子设备通过麦克风接收到的语音信号时,所述预存的评价语义为评价声音太小,对应的音量调节规则为调高所述第一电子设备的听筒音量;或所述预存的评价语义为评价声音太大,对应的音量调节规则为降低所述第一电子设备的听筒音量;或所述预存的评价语义为评价所处环境嘈杂时,对应的音量调节规则为将所述第一电子设备由听筒输出切换为喇叭输出。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中:当所述第一电子设备接收到的第二电子设备发送的语音信号时,所述预存的评价语义为评价声音太小,对应的音量调节规则为调高所述第一电子设备的麦克风增益以提高麦克风音量;或所述预存的评价语义为评价声音太大,对应的音量调节规则为降低所述第一电子设备的麦克增益以降低麦克风音量。
第二方面,本发明实施例提供一种音量调节装置,所述音量调节装置包括接收模块、识别模块、匹配模块以及音量调节模块,所述音量调节装置应用于第一电子设备,其中:所述接收模块用于在所述电子设备建立通话连接后,接收语音信号;所述识别模块用于将所述接收模块接收的所述语音信号进行识别并进行语义分析得到语义识别结果;所述匹配模块用于将所述识别模块识别得到的所述语音识别结果与预存的评价语义进行匹配获取音量调节规则;所述音量调节模块用于根据所述匹配模块获取的所述音量调节规则自动调节所述电子设备的音量输出模式。
结合第二方面,在第二方面的第一种可能的实现方式中:所述音量调节装置应用于第一电子设备,所述语音信号包括所述第一电子设备通过麦克风接收到的语音信号;或所述第一电子设备进行接收到的第二电子设备发送的语音信号。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中:当所述语音信号为所述第一电子设备通过麦克风接收到的语音信号时,所述预存的评价语义为评价声音太小,对应的音量调节规则为调高所述第一电子设备的听筒音量;或所述预存的评价语义为评价声音太大,对应的音量调节规则为降低所述第一电子设备的听筒音量;或所述预存的评价语义为评价所处环境嘈杂时,对应的音量调节规则为将所述第一电子设备由听筒输出切换为喇叭输出。
结合第二方面的第一种可能的实现方式,在第二方面的第三种可能的实现方式中:当所述语音信号为来自与所述第一电子设备进行通话的第二电子设备的语音信号时,所述预存的评价语义为评价声音太小,对应的音量调节规则为调高所述第一电子设备的麦克风增益以提高麦克风音量;或所述预存的评价语义为评价声音太大,对应的音量调节规则为降低所述第一电子设备的麦克风增益以降低麦克风音量。
第三方面,本发明实施例提供一种电子设备,所述电子设备包括处理器、存储器以及接收器,所述处理器分别耦接所述存储器以及接收器,所述电子设备为第一电子设备,其中:所述接收器用于在所述电子设备建立通话连接后,接收语音信号;所述处理器对所述接收器接收的所述语音信号进行识别并进行语义分析得到语义识别结果,将所述语义识别结果与预存的评价语义进行匹配获取音量调节规则,根据所述音量调节规则自动调节所述电子设备的音量输出模式;所述存储器用于存储所述评价语义。
结合第三方面,在第三方面的第一种可能的实现方式中:所述接收器包括麦克风或无线收发器,当所述接收器为麦克风时,所述语音信号为所述第一电子设备通过麦克风接收到的语音信号;或当所述接收器为所述无线收发器时,所述第一电子设备接收到的第二电子设备发送的语音信号。
结合第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式中:当所述语音信号为所述第一电子设备通过所述麦克风接收到的语音信号时,所述预存的评价语义为评价声音太小,对应的音量调节规则为调高所述第一电子设备的听筒音量;或所述预存的评价语义为评价声音太大,对应的音量调节规则为降低所述第一电子设备的听筒音量;或所述预存的评价语义为评价所处环境嘈杂时,对应的音量调节规则为将所述第一电子设备由听筒输出切换为喇叭输出。
结合第三方面的第一种可能的实现方式,在第三方面的第三种可能的实现方式中:当所述语音信号为来自与所述第一电子设备进行通话的第二电子设备的语音信号时,所述预存的评价语义为评价声音太小,对应的音量调节规则为调高所述第一电子设备的所述麦克风增益以提高所述麦克风音量;或所述预存的评价语义为评价声音太大,对应的音量调节规则为降低所述第一电子设备的所述麦克风增益以降低所述麦克风音量。
本发明实施例提供一种自动调节音量的方法及电子设备,通过接收语音信号,识别并进行语义分析得到语义识别结果,通过语义识别结果与预存的评价语义进行匹配获取音量调节规则,根据音量调节规则自动调节电子设备端的音量输出模式。通过上述方式,能够基于语音信号的语义识别结果,自动进行音量调节,无需人工干预,从而避免了通话过程受到影响,提高通话者的通话体验。
具体实施方式
请参阅图1,图1是本发明实施例提供的一种自动调节音量的方法的流程图,本实施例以电子设备的角度来进行描述,本实施例的自动调节音量的方法包括以下步骤:
S101:在建立通话连接后,电子设备接收语音信号;
在电子设备与另一电子设备建立通话后,电子设备接收语音信号。为了便于描述,本发明实施例中,为了描述方便,定义电子设备为第一电子设备,定义与所述电子设备建立通话的另一电子设备为第二电子设备。这里语音信号可以是电子设备通过麦克风接收到的语音信号,也可以是电子设备接收到的第二电子设备发送的语音信号。
S102:将语音信号进行识别并进行语义分析得到语义识别结果;
对接收到的语音信号进行语音识别得到语音识别结果,并进一步对语音识别结果进行语义分析得到语义识别结果。语义分析即是从语音识别结果中进行提取出关键字,进行分析理解得到用户想要表达的意思,从而给出语义识别结果。比如接收来自第一电子设备端的语音信号为“哎呀,声音怎么这么小”,语音识别结果即是“哎呀,声音怎么这么小”。语义分析即是从“哎呀,声音怎么这么小”中提取关键字如“声音”、“小”,进行分析理解得到语义识别结果可能是“声音太小”。在进行语义分析时,可以根据预定规则来进行,比如只要提取的关键字中有“声音”“小”,就认为语义识别结果为“声音太小”。或者是只要提取的关系字中有“大”“声音”,就认为语义识别结果为“声音太大”。
S103:将语义识别结果与预存的评价语义进行匹配获取音量调节规则;
在语义识别得到语义识别结果时,通过将语义识别结果与预存的评价语义进行匹配,评价语义是预存的用于对音量进行评价的。每个预存的评价语义分别对应一个音量调节规则。当语义识别结果与预存的评价语义匹配成功时,获取与匹配的预存的评价语义相对应的音量调节规则。
当语音信号是第一电子设备通过麦克风接收到的语音信号时,预存的评价语义与音量调节规则的对应关系如下表1所示:
表1:预存的评价语义与音量调节规则的一种对应关系
预存的评价语义 |
音量调节规则 |
声音太小 |
调高电子设备的听筒音量 |
声音太大 |
调低电子设备的听筒音量 |
所处环境嘈杂 |
由听筒输出切换为喇叭输出 |
上述的评价语义与音量调节规则的对应关系,可以预存在数据库中,为了便于区分,这里可以将上述的评价语义与音量调节规则的对应关系预存在数据库1中。也就是说,只要接收的语音信号为来自第一电子设备端的语音信号时,在对语音信号进行识别并进行语义分析得到语义识别结果时,将语义识别结果与数据库1中的评价语义进行匹配。
当语音信号为第一电子设备接收到的第二电子设备发送的语音信号时,预存的评价语义与音量调节规则的对应关系如下表2所示:
表2:预存的评价语义与音量调节规则的另一种对应关系
预存的评价语义 |
音量调节规则 |
声音太小 |
调高电子设备的麦克风增益 |
声音太大 |
调低电子设备的麦克风增益 |
上述的评价语义与音量调节规则的对应关系,可以预存在数据库中,为了便于区分,这里可以将上述的评价语义与音量调节规则的对应关系预存在数据库2中。也就是说,只要接收的语音信号为来自第二电子设备端的语音信号时,在对语音信号进行识别并进行语义分析得到语义识别结果时,将语义识别结果与数据库2中的评价语义进行匹配。
上述两种应用场景的预存评价语义与音量调节规则的对应关系为了便于区分才分开来进行描述和保存,事实上,针对上述两种不同应用场景的预存的评价语义与音量调节规则的对应关系也可以存储在同一个数据库中。在进行匹配的时候,如果匹配不成功,不执行音量调节动作。
当然,以上评价语义与音量调节规则的对应关系,只是一种举例,在能够实现本发明目的的情况下,也可以采用其他的对应关系,这可以根据使用者的需要自行决定,本发明对此不作限定。
S104:根据音量调节规则自动调节电子设备的音量输出模式;
根据音量调节规则调节电子设备的音量输出模式。需要说明的是,在具体音量调节的时候,音量调节的幅度可以根据预设的调节阈值来进行调节。比如说,当语义表达的是声音太小,那自动将电子设备的听筒音量调高一个阈值,当语义表达的是声音太大,那自动将电子设备的听筒音量调低一个阈值等等。这个阈值是根据经验预设的一个值,比如可以是一格、两格或者三格等。也就是说,当阈值设定为一格时,每次根据音量调节规则调高或调低音量时,都是将当前听筒音量调高或调低一格。当然,用户也可以根据自己的需要自行设置一个调节阈值。本发明对此不作限定。
通过上述实施例的阐述,可以理解,本发明实施例提供的自动调节音量的方法,通过接收语音信号,识别并进行语义分析得到语义识别结果,通过语义识别结果与预存的评价语义进行匹配获取音量调节规则,根据音量调节规则自动调节电子设备端的音量输出模式。通过上述方式,能够基于语音信号的语义识别结果,自动进行相应的音量调节,无需人工干预,从而避免通话过程受到影响,提高通话者的通话体验。
以下以一个具体的实施例来详细说明本发明的自动调节音量的方法,例如A和B利用手机进行通话,A端手机为上述第一电子设备,电话接通后,假设A说“你那边声音怎么那么小呢”,A端手机经语音并语义分析后得出语义识别结果“声音太小”,以上述语音信号来自第一电子设备的情景下评价语义与音量调节规则的对应关系,匹配为对应的音量调节规则是调高第一电子设备的听筒音量即调高A端手机听筒音量。这时候,A端手机自动将听筒音量调高,以便于A能听清楚B端手机传过来的语音。而如果是A说“我这里好吵”,A端手机经语音并语义分析后得出语义识别结果“环境嘈杂”,以上述语音信号来自第一电子设备的情景下评价语义与音量调节规则的对应关系,匹配为对应的音量调节规则是将第一电子设备由听筒输出切换为喇叭输出即将A端手机由听筒输出模式切换为喇叭输出模式。假设是B说“哎呀,这声音怎么那么小呢”,A端手机经语音并语义分析后得出语义识别结果“声音太小”,以上述语音信号来自第二电子设备的情景下评价语义与音量调节规则的对应关系,匹配为对应的音量调节规则是调高第一电子设备的麦克风增益,以使得A说话的声音调大后再传输到B端手机。对于其他情景以此类推,本发明不一一举例说明。
请参阅图2,图2是本发明实施例提供的第一种音量调节装置的结构示意图,本实施例的音量调节装置100包括接收模块11、识别模块12、匹配模块13以及音量调节模块14,本实施例的音量调节装置为第一音量调节装置,其中:
接收模块11用于在电子设备建立通话连接后,接收语音信号;
在电子设备与另一电子设备建立通话连接后,接收模块11接收语音信号。为了便于描述,本发明实施例中,定义电子设备为第一电子设备,定义与第一电子设备建立通话的另一电子设备为第二电子设备。本实施例的音量调节装置100应用于第一电子设备,这里语音信号可以是第一电子设备通过麦克风接收到的语音信号,也可以是第一电子设备接收到的第二电子设备发送的语音信号。
识别模块12用于将接收模块11接收的语音信号进行识别并进行语义分析得到语义识别结果;
识别模块12对接收到的语音信号进行语音识别得到语音识别结果,并进一步对语音识别结果进行语义分析得到语义识别结果。语义分析即是从语音识别结果中提取出关键字,进行分析理解得到用户想要表达的意思,从而给出语义识别结果。比如第一电子设备端的通话者说“我这里好吵”,经过语音识别得到语音识别结果为“我这里好吵”,进一步进行语义分析得到语义识别结果可能是“环境嘈杂”。
匹配模块13用于将识别模块12识别得到的语音识别结果与预存的评价语义进行匹配获取音量调节规则。
在语义识别得到语义识别结果,通过将语义识别结果与预存的评价语义进行匹配,评价语义是预存的用于对音量进行评价的。每个预存的评价语义分别对应一个音量调节规则。当语义识别结果与预存的评价语义匹配成功时,获取与匹配的预存的评价语义相对应的音量调节规则。
对于语音信号来自第一电子设备或者是来自第二电子设备两种不同的应用场景,评价语义与音量调节规则的对应关系可以参阅上述实施例的详细描述,在此不在赘述。
音量调节模块14用于根据匹配模块13获取的音量调节规则自动调节电子设备的音量输出模块。
根据音量调节规则调节电子设备的音量输出模式。需要说明的是,在具体音量调节的时候,音量调节的幅度可以根据预设的调节阈值来进行调节。比如说,当语义表达的是声音太小,那自动将电子设备的听筒音量调高一个阈值,当语义表达的是声音太大,那自动将电子设备的听筒音量调低一个阈值等等。这个阈值是根据经验预设的一个值,比如可以是一格、两格或者三格等。也就是说,当阈值设定为一格时,每次根据音量调节规则调高或调低音量时,都是将当前听筒音量调高或调低一格。当然,用户也可以根据自己的需要自行设置一个调节阈值。本发明对此不作限定。
请参阅图3,图3是本发明实施例提供的第一种电子设备的结构示意图,本实施例的电子设备200包括处理器21、存储器22、接收器23、发送器24以及总线系统25,本实施例的电子设备为第一电子设备,其中:
处理器21控制电子设备200的操作,处理器21还可以称为CPU(CentralProcessing Unit,中央处理单元)。处理器21可能是一种集成电路芯片,具有信号的处理能力。处理器21还可以是通用处理器、数字信号处理器(DSP,Digital Signal Processing)、专用集成电路(ASIC,Application Specific Integrated Circuit)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器22可以包括只读存储器和随机存取存储器,并向处理器21提供指令和数据。存储器22的一部分还可以包括非易失性随机存取存储器(NVRAM)。
电子设备200的各个组件通过总线系统25耦合在一起,其中总线系统25除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。该总线系统可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外部设备互连)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准体系结构)总线等。所述总线可以是一条或多条物理线路,当是多条物理线路时可以分为地址总线、数据总线、控制总线等。在本发明的其它一些实施例中,处理器21、存储器22以及接收器23、发送器24也可以通过通信线路直接连接。但是为了清楚说明起见,在图中将各种总线都标为总线系统25。
存储器22存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
在本发明实施例中,处理器21调用存储器22存储的操作指令(该操作指令可存储在操作系统中)。
接收器23用于在建立通话连接后,接收语音信号。
在第一电子设备与另一电子设备建立通话后,处理器21控制接收器23接收语音信号。为了便于描述,本发明实施例中,定义电子设备为第一电子设备,定义与所述第一电子设备建立通话的另一电子设备为第二电子设备。
具体实现时,接收器23可以是麦克风,也可以是无线接收器。当接收器23为麦克风时,这里语音信号是第一电子设备通过麦克风接收到的语音信号,当接收器23是无线接收器时,语音信号是第一电子设备接收到的第二电子设备发送的语音信号,通过第一电子设备的听筒来进行播放。
处理器21对接收器23接收的语音信号进行语音识别并进行语义分析得到语义识别结果,将语义识别结果与预存的评价语义进行匹配获取音量调节规则,根据与音量调节规则自动调节电子设备的音量输出模式。
处理器21对接收器23接收到的语音信号进行语音识别得到语音识别结果,并进一步对语音识别结果进行语义分析得到语义识别结果。语义分析即是从语音识别结果中进行提取出关键字,进行分析理解得到用户想要表达的意思,从而给出语义识别结果。比如接收来自第一电子设备端的语音信号为“哎呀,声音怎么这么小”,语音识别结果即是“哎呀,声音怎么这么小”。语义分析即是从“哎呀,声音怎么这么小”中提取关键字如“声音”、“小”,进行分析理解得到语义识别结果可能是“声音太小”。在进行语义分析时,可以根据预定规则来进行,比如只要提取的关键字中有“声音”“小”,就认为语义识别结果为“声音太小”。或者是只要提取的关系字中有“大”“声音”,就认为语义识别记过为“声音太大”。
在语义识别得到语义识别结果,处理器21通过将语义识别结果与预存的评价语义进行匹配,评价语义是预存的用于对音量进行评价的。每个预存的评价语义分别对应一个音量调节规则。
当语义识别结果与预存的评价语义相匹配,获取与预存的评价语义对应的音量调节规则,处理器21就按照音量调节规则调节电子设备端的音量输出模式。
当语音信号是第一电子设备通过麦克风接收到的语音信号时,预存的评价语义与音量调节规则的对应关系可参见上表1所示,而当语音信号是第一电子设备接收到的第二电子设备发送的语音信号时,预存的评价语义与音量调节规则的对应关系可参见上表2所示。
为了便于区分,可以将两种应用场景下评价语义与音量调节规则的对应关系分别对应存储在不同的数据库中。当然,也可以存储在同一个数据库中。在进行匹配的时候,如果匹配不成功,不执行音量调节动作。
当然,以上评价语义与音量调节规则的对应关系,只是一种举例,在能够实现本发明目的的情况下,也可以采用其他的对应关系,这可以根据使用者的需要自行决定,本发明对此不作限定。
存储器22用于存储评价语义。
发送器24用于对外发送数据。
上述本发明实施例揭示的方法可以应用于处理器21中,或者由处理器21实现。在实现过程中,上述方法的各步骤可以通过处理器21中的硬件的集成逻辑电路或者软件形式的指令完成。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器22,处理器21读取存储器22中的信息,结合其硬件完成上述方法的步骤。
通过上述实施例的阐述,本发明实施例提供的自动调节音量的方法及电子设备,通过接收语音信号,识别并进行语义分析得到语义识别结果,通过语义识别结果与预存的评价语义进行匹配获取音量调节规则,根据音量调节规则自动调节电子设备端的音量输出模式。通过上述方式,能够基于语音信号的语义识别结果,自动进行音量调节,无需人工干预,从而避免通话过程受到影响,提高通话者的通话体验。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。