CN107682561A - 音量调节方法、装置、终端及存储介质 - Google Patents

音量调节方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN107682561A
CN107682561A CN201711102986.3A CN201711102986A CN107682561A CN 107682561 A CN107682561 A CN 107682561A CN 201711102986 A CN201711102986 A CN 201711102986A CN 107682561 A CN107682561 A CN 107682561A
Authority
CN
China
Prior art keywords
call
volume adjusting
information
volume
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711102986.3A
Other languages
English (en)
Inventor
梁昆
陈岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201711102986.3A priority Critical patent/CN107682561A/zh
Publication of CN107682561A publication Critical patent/CN107682561A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

本申请实施例公开了一种音量调节方法、装置、终端及存储介质,属于人机交互领域,所述方法包括:当启用通话进程时,获取通话信息,通话信息至少包括当前通话对象的对象标识;获取音量调节模型,音量调节模型是根据历史通话记录训练得到的模型,历史通话记录中包括与不同通话对象进行通话时的通话信息以及音量调节信息;将通话信息输入音量调节模型,并获得音量调节模型输出的目标音量等级;将通话音量由当前音量等级调节至目标音量等级。本申请实施例中,实现了通话音量的自动调节,提高了调节通话音量的效率。

Description

音量调节方法、装置、终端及存储介质
技术领域
本申请实施例涉及人工智能领域,特别涉及一种音量调节方法、装置、终端及存储介质。
背景技术
为了方便用户对终端音量进行调节,终端上设置有音量调节键,当用户在使用终端进行语音通话时,可以利用音量调节键调节听筒播放声音的音量大小。
与不同通话对象进行语音通话时,由于不同通话对象说话声音的大小不同,因此用户需要通过音量调节键手动调节音量大小,以达到较好的通话效果。当通话对象说话声音较大时,用户将听筒播放声音的音量调小,当通话对象说话声音较小时,用户将听筒播放声音的音量调大。
发明内容
本申请实施例提供了一种音量调节方法、装置、终端及存储介质,可以用于解决与不同通话对象进行语音通话时,需要用户手动调节音量大小,导致的调整效率较低的问题。所述技术方案如下:
第一方面,提供了一种音量调节方法,该方法包括:
当启用通话进程时,获取通话信息,通话信息至少包括当前通话对象的对象标识;
获取音量调节模型,音量调节模型是根据历史通话记录训练得到的模型,历史通话记录中包括与不同通话对象进行通话时的通话信息以及音量调节信息;
将通话信息输入音量调节模型,并获得音量调节模型输出的目标音量等级;
将通话音量由当前音量等级调节至目标音量等级。
第二方面,提供了一种音量调节装置,该装置包括:
第一获取模块,用于当启用通话进程时,获取通话信息,通话信息至少包括当前通话对象的对象标识;
第二获取模块,用于获取音量调节模型,音量调节模型是根据历史通话记录训练得到的模型,历史通话记录中包括与不同通话对象进行通话时的通话信息以及音量调节信息;
输入模块,用于将通话信息输入音量调节模型,并获得音量调节模型输出的目标音量等级;
调节模块,用于将通话音量由当前音量等级调节至目标音量等级。
第三方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如第一方面所述的音量调节方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如第一方面所述的音量调节方法。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例中,当启用通话进程时,终端获取当前通话的通话信息,并将通话信息输入到音量调节模型中,得到输出的目标音量等级,进而将当前音量等级调节至目标音量等级,由于该音量调节模型是根据不同通话对象的通话信息以及音量调节信息训练生成,因此利用该音量调节模型能够得到当前通话对象对应的历史音量调节信息,进而基于该历史音量调节信息实现了通话音量的自动调节,从而避免用户手动调节音量,提高了调节通话音量的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一个示例性实施例提供的音量调节方法的流程图;
图2示出了本申请另一个示例性实施例提供的音量调节方法的流程图;
图3示出了本申请另一个示例性实施例提供的音量调节方法的流程图;
图4示出了本申请另一个示例性实施例提供的音量调节方法的流程图;
图5示出了本申请另一个示例性实施例提供的音量调节方法的流程图;
图6示出了本申请一个示例性实施例提供的音量调节装置的结构示意图;
图7示出了本申请一个示例性实施例提供的终端结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,对本申请涉及的若干名词进行介绍。
音量调节模型:一种用于根据输入的通话信息确定出针对当前通话对象的目标通话音量的数学模型。
可选地,音量调节模型包括但不限于:深度神经网络(Deep Neural Network,DNN)模型、循环神经网络(Recurrent Neural Networks,RNN)模型、嵌入(embedding)模型、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型、逻辑回归(LogisticRegression,LR)模型中的至少一种。
DNN模型是一种深度学习框架。DNN模型包括输入层、至少一层隐层(或称,中间层)和输出层。可选地,输入层、至少一层隐层(或称,中间层)和输出层均包括至少一个神经元,神经元用于对接收到的数据进行处理。可选地,不同层之间的神经元的数量可以相同;或者,也可以不同。
RNN模型是一种具有反馈结构的神经网络。在RNN模型中,神经元的输出可以在下一个时间戳直接作用到自身,即,第i层神经元在m时刻的输入,除了(i-1)层神经元在该时刻的输出外,还包括其自身在(m-1)时刻的输出。
embedding模型是基于实体和关系分布式向量表示,将每个三元组实例中的关系看作从实体头到实体尾的翻译。其中,三元组实例包括主体、关系、客体,三元组实例可以表示成(主体,关系,客体);主体为实体头,客体为实体尾。比如:小明的爸爸是大明,则通过三元组实例表示为(小明,爸爸,大明)。
GBDT模型是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结果累加起来作为最终结果。决策树的每个节点都会得到一个预测值,以年龄为例,预测值为属于年龄对应的节点的所有人年龄的平均值。
LR模型是指在线性回归的基础上,套用一个逻辑函数建立的模型。
相关技术中,为了达到较好的通话效果,用户需要通过音量调节键手动调节通话音量的大小。
然而,用户在进行语音通话的过程中,由于握持终端姿势的限制,进行音量调节操作多有不便,容易导致音量调节效率较低。
本申请各个实施例提供的音量调节方法中,终端预先根据历史通话记录(包含与不同用户进行通话时的通话信息以及音量调节信息)训练音量调节模型,当用户再次进行语音通话时,终端将当前的通话信息输入音量调节模型,从而根据音量调节模型输出的目标音量等级进行通话音量的自适应调节,从而提高通话音量调节的效率。
本申请各个实施例提供的音量调节方法应用于终端中,该终端可以是智能手机、智能手表和平板电脑等具备语音通话功能的电子设备。为了方便描述,下述各个实施例以音量调节方法用于终端中为例进行说明。
参考图1,其示出了本申请一个示例性实施例提供的音量调节方法流程图。本实施例以该方法应用于终端来举例说明,该音量调节方法包括如下步骤:
步骤101,当启用通话进程时,获取通话信息,通话信息至少包括当前通话对象的对象标识。
为了针对不同的通话对象进行音量调节,当检测到启用通话进程时(比如进行主动呼叫或被呼叫),终端获取通话信息。其中,该通话进程为系统通话功能或即时通信应用当中的通话功能。
在一种可能的实现方式中,通话信息为当前通话对象的对象标识。其中,对象标识可以为通话对象的电话号码或终端中存储的通话对象的备注名。
例如,当用户与通话对象A进行语音通话时,终端获取通话对象A对应的电话号码为138xxxxxxxx,且备注名为“张三”,从而将“138xxxxxxxx”或“张三”确定为通话信息。
在其他可能的实现方式中,该通话信息中还包括当前通话地点对应的地理位置信息、通话时段和环境噪声中的至少一种。
步骤102,获取音量调节模型,音量调节模型是根据历史通话记录训练得到的模型,历史通话记录中包括与不同通话对象进行通话时的通话信息以及音量调节信息。
在一种可能的实施方式中,当检测到启用通话进程时,终端获取预先训练的音量调节模型,其中,音量调节模型用于根据终端输入的通话信息输出相应的目标音量等级。
本实施例中,音量调节模型根据历史通话记录中与不同通话对象进行通话时的通话信息以及音量调节信息训练得到,该音量调节信息在用户手动调节通话音量时产生。在一种可能的实现方式中,通话过程中,终端接收手动音量调节信号,并根据手动音量调节信号确定出与当前通话对象通话的音量等级;通话结束后,终端将通话信息以及音量调节信息输入到机器学习算法中,通过机器学习算法训练得到音量调节模型。
其中,音量调节信息中至少包括用户手动调节后,通话音量的音量等级(即目标音量等级);机器学习算法可以是基于统计模型的反向传播(Back Propagation,BP)算法,在进行音量调节模型训练时,预先根据每个通话对象对应的通话信息以及音量调节信息建立初始音量调节模型,再根据与不同通话对象进行语音通话时获取到的大量通话信息以及音量调节信息对初始音量调节模型进行训练,得到音量调节模型。
在另一种可能的实现方式中,为了使机器学习训练得到的音量调节模型更加精确,用于训练音量调节模型的通话信息中除了包含对象标识外,还包括通话时终端的地理位置信息、通话时段和环境噪声等级中的至少一种。
需要说明的是,上述步骤101和102不存在严格的先后关系,即步骤101和步骤102可以同时执行,本实施例并不对此进行限定。
在其他可能的实施方式中,终端预先针对不同通话对象训练出不同的音量调节模型,获取到通话信息后,终端即根据通话信息中包含的对象标识,获取当前通话对象对应的音量调节模型,本申请实施例并不对此进行限定。
步骤103,将通话信息输入音量调节模型,并获得音量调节模型输出的目标音量等级。
终端将通话信息输入到音量调节模型中,音量调节模型即根据通话信息输出目标音量等级。比如,终端中存储的音量等级有十级,分别为1~10。
其中,目标音量等级即为音量调节模型根据输出的与当前通话对象通话的最优音量等级。
在一种可能的实现方式中,音量调节模型根据通话对象的对象标识以及音量调节信息训练而成,当终端将通话对象A对应的备注名“张三”输入到音量调节模型后,音量调节模型根据备注名“张三”输出的目标音量等级为8。
步骤104,将通话音量由当前音量等级调节至目标音量等级。
获取到目标音量等级后,终端即基于目标音量等级对通话音量进行调节,在一种实施方式中,终端将当前音量等级调节至目标音量等级。
结合步骤103中的例子,用户与通话对象A进行通话时,终端检测到当前音量等级为4,且获取到的目标音量等级为8时,即将当前音量等级4提高至8。
综上所述,本申请实施例中,当启用通话进程时,终端获取当前通话的通话信息,并将通话信息输入到音量调节模型中,得到输出的目标音量等级,进而将当前音量等级调节至目标音量等级,由于该音量调节模型是根据不同通话对象的通话信息以及音量调节信息训练生成,因此利用该音量调节模型能够得到当前通话对象对应的历史音量调节信息,进而基于该历史音量调节信息实现了通话音量的自动调节,从而避免用户手动调节音量,提高了调节通话音量的效率。
由于在音量调节模型建立初期,用于训练模型的数据较少,音量调节模型不够精确,自动调节音量不符合用户预期,用户需要手动再次调节音量。为了使音量调节模型更加精确,终端需要根据用户手动调节音量产生的音量调节信息对音量调节模型进行修正。
示意性的,如图2所示,上述步骤104后还包括步骤105-106。
步骤105,当接收到音量调节指令时,根据音量调节指令调整通话音量。
在一种可能的实现方式中,当终端自动进行音量调节后,为了满足当前通话音量的需求,用户手动对通话音量再次进行调节。
当终端接收到用户手动调节音量调节按键生成的调节指令后,根据音量调节指令进一步调节通话音量。其中,音量调节指令指示音量调节的级数。
结合步骤104中的例子,用户与通话对象A进行通话时,终端自动将当前音量等级调节为8后,由于自动调节的音量不符合用户预期,用户手动将音量等级下调一级,相应的,终端根据下调音量产生的调节指令将音量等级由8降为7。
步骤106,根据音量调节指令所指示的音量调节系数,对音量调节模型进行修正。
终端自动进行音量调节后,用户再次手动调节音量时,即说明当前音量调节模型输出的目标音量等级与用户预期的通话音量之间存在误差,因此需要对音量调节模型进行修正。
可选的,终端根据音量调节指令所指示的音量调节系数,对音量调节模型进行修正。
其中,音量调节系数可以为音量调节级数。
在一种可能的实现方式中,为了实现对音量调节模型的修正,终端获取音量调节级数,并根据音量调节级数更新目标音量等级。进一步的,终端将更新后的目标音量等级和通话信息输入到机器学习算法中,实现对原音量调节模型的修正。
当终端再次与该通话对象进行通话时,终端即将通话信息输入更新后的音量调节模型,并获取更新后的音量调节模型输出的目标音量等级。
本实施例中,在终端完成音量的自动调节后,根据用户再次通过手动调节音量时产生的音量调节指令对音量调节模型进行修正,保证了音量调节模型的准确性。
一般情况下,用户在不同地点进行语音通话时,对通话音量有不同的要求。例如当用户在声音嘈杂的地点(比如商场)进行语音通话时,需要适应性的上调通话音量;而当用户在较安静的地点(比如家中)进行语音通话时,需要适应性的下调通话音量。
在一种可能的实现方式中,为了提高自动音量调节的精度,使其适用于不同的通话场景,终端中的音量调节模型根据通话时终端的地理位置信息以及音量调节信息训练得到,如图3所示,上述步骤101中还包括如下步骤:
步骤101A,当启用通话进程时,获取终端的当前地理位置信息以及当前通话对象的对象标识。
为了使音量调节符合终端当前所处的通话场景,当检测到启用通话进程时,终端获取当前通话对象的对象标识的同时,还获取终端的当前地理位置信息。
其中,地理位置信息可以为终端内全球定位系统(Global Positioning System,GPS)定位到的经纬度信息。当终端获取到经纬度信息后,根据该信息确定终端所处的地点,从而确定终端当前所处的通话场景。
例如,当终端启用通话进程时,获取当前通话对象A的备注名“张三”和终端所处的地理位置A,根据地理位置A终端确定当前处于商场中,通话场景为嘈杂的通话场景。
步骤101B,将当前地理位置信息和对象标识确定为通话信息。
本实施例中,通话信息包括地理位置信息和对象标识,当终端获取到音量调节模型后,即将当前地理位置信息和对象标识输入到音量调节模型中,进而获得音量调节模型输出的目标音量等级。
例如,当将地理位置信息A和备注名“张三”输入到音量调节模型后,终端即可获得在地理位置信息A所指示的地点与通话对象A进行语音通话时的目标音量等级,进而根据该目标音量等级将当前音量等级调节至目标音量等级。
通过上述方法,终端在嘈杂的场景下终端能适应性的上调通话音量,在安静的场景下终端能适应性的下调通话音量,通话音量的自动调节更符合实际通话场景。
步骤102,获取音量调节模型,音量调节模型是根据历史通话记录训练得到的模型,历史通话记录中包括与不同通话对象进行通话时的通话信息以及音量调节信息。
步骤103,将通话信息输入音量调节模型,并获得音量调节模型输出的目标音量等级。
本实施例中,音量调节模型根据通话时终端的地理位置信息以及音量调节信息训练得到。在一种可能的实现方式中,通话过程中,终端获取当前地理位置信息,同时接收手动音量调节信号,并根据手动音量调节信号确定出与当前通话对象通话的音量等级;通话结束后,终端将当前地理位置信息以及音量调节信息输入到机器学习算法中,通过机器学习算法训练得到音量调节模型。
步骤104,将通话音量由当前音量等级调节至目标音量等级。
本实施例中,终端中的音量调节模型由终端的地理位置信息以及音量调节信息训练得到,在需要调节通话音量时,终端获取当前通话对象的对象标识和当前地理位置信息,并将二者输入到音量调节模型中,得到当前地点与当前通话对象通话时的目标音量等级,进而对当前音量等级进行调节,通话音量的调节更符合实际通话场景。
一般情况下,通话对象在不同通话时段的通话音量不同,例如,当通话对象在上班时间通话时,其通话音量较低;当通话对象在休息时间通话时,其通话音量较高。相应的,当终端启用通话进程的时刻(即与通话对象的通话时刻)处于通话对象的上班时间时,用户需要适应性的调大声音;当终端启用通话进程的时刻处于通话对象的休息时间时,用户需要适应性的调小声音。
在一种可能的实现方式中,为了提高自动音量调节的精度,使其适用于不同的通话场景,终端中的音量调节模型根据通话时所处的通话时段以及音量调节信息训练得到,如图3所示,步骤101还包括步骤101C和101D。
步骤101C,当启用通话进程时,获取当前时刻以及当前通话对象的对象标识。
为了实现针对通话对象所处的通话场景,进行音量的自适应调节,使得音量调节更加精准,当检测到启用通话进程时,终端获取当前时刻以及当前通话对象的标识。
例如,当检测到启用通话进程时,终端获取当前时刻为下午3点56分,对象标识为备注名“张三”。
步骤101D,将当前时刻和对象标识确定为通话信息。
本实施例中,通话信息包括当前时刻和对象标识,当终端获取到音量调节模型后,即将当前时刻和对象标识输入到音量调节模型中,进而获得音量调节模型输出的目标音量等级。
例如,将当前时刻下午3点56分和备注名“张三”输入到音量调节模型后,终端即可获得与“张三”在下午3点56分进行通话时的目标音量等级,进而根据该目标音量等级将当前音量等级调节至目标音量等级。
由于在不同的日期里,同一通话对象在同一通话时段所处的工作状态也不同,因此在一种可能的实现方式中,用于训练音量调节模型的通话信息中还包括通话时段对应的日期,相应的,当检测到启用通话进程时,终端获取当前时刻、当前日期和对象标识,进而将当前时刻、当前日期和对象标识输入到音量调节模型中,以便音量调节模型输出目标音量等级,终端即根据该目标音量等级将当前音量等级调节至目标音量等级。
步骤102,获取音量调节模型,音量调节模型是根据历史通话记录训练得到的模型,历史通话记录中包括与不同通话对象进行通话时的通话信息以及音量调节信息。
步骤103,将通话信息输入音量调节模型,并获得音量调节模型输出的目标音量等级。
本实施例中,音量调节模型根据通话时所处的通话时段以及音量调节信息训练得到。在一种可能的实现方式中,通话过程中,终端获取当前时刻,同时接收手动音量调节信号,并根据手动音量调节信号确定出与当前通话对象通话的音量等级;通话结束后,终端将当前时刻以及音量调节信息输入到机器学习算法中,通过机器学习算法训练得到音量调节模型。
步骤104,将通话音量由当前音量等级调节至目标音量等级。
本实施例中,终端中的音量调节模型由通话时所处的通话时段以及音量调节信息训练得到,在需要调节通话音量时,终端获取通话时所处的通话时段和当前通话对象的对象标识,并将二者输入到音量调节模型中,得到当前通话时段下与当前通话对象通话时的目标音量等级,进而对当前音量等级进行调节,通话音量的调节更精准。
由于同一地点在不同时间段内声音嘈杂程度不同,例如,早晨的菜市场比晚上的菜市场更加嘈杂,因此为了得到更准确的音量调节模型,终端中的音量调节模型可以同时根据通话时终端的地理位置信息、通话时所处的通话时段以及音量调节信息训练得到。
在一种可能的实现方式中,上述步骤101C至101D与101A至101B同时执行,即检测到启用通话进程时,终端获取当前地理位置信息、当前时刻以及当前通话对象的对象标识,并将上述信息同时输入到音量调节模型中,进而获得音量调节模型输出的目标音量等级。
由于考虑到了不同时间段内同一地点的声音嘈杂程度不同,本实施例中的目标音量等级对应当前地理位置信息和当前时刻,因此本实施例中获得的目标音量等级更加精准,通话音量的调节效果更好。
上述实施例中,终端根据当前地理位置信息来间接确定当前通话场景下声音的嘈杂程度不够准确,容易导致音量调节效果较差。
为了进一步提高音量调节的准确性,在一种可能的实现方式中,终端中的音量调节模型根据通话时的环境噪声等级以及音量调节信息训练得到,如图5所示,步骤101还包括步骤101E至101G。
步骤101E,当启用通话进程时,通过麦克风采集环境噪声。
一般情况下,当环境噪声较大时,用户需要上调通话音量;当环境噪声较小时,用户需要下调通话音量。
在一种可能的实现方式中,在对通话音量进行调节时需要考虑到环境噪声,当终端启用通话进程时,通过麦克风采集环境噪声,其中,环境噪声即为终端麦克风采集到的频率不规则的声音。可选的,终端通过内置的降噪麦克风收集环境噪声。
步骤101F,确定环境噪声对应的环境噪声等级。
在一种可能的实现方式中,终端中存储有环境噪声大小对应的环境噪声等级,示意性的,环境噪声大小与环境噪声等级的对应关系如表一所示:
表一
环境噪声大小/dB 环境噪声等级
40~50 1
50~60 2
60~70 3
根据采集到的环境噪声,终端进一步基于上述对应关系确定出当前通话场景下的环境噪声等级。例如,当终端采集到的环境噪声为55dB时,终端即确定环境噪声对应的环境噪声等级为2。
步骤101G,将环境噪声等级和对象标识确定为通话信息。
本实施例中,通话信息包括环境噪声等级和对象标识,当终端获取到音量调节模型后,即将环境噪声等级和对象标识输入到音量调节模型中,进而获得音量调节模型输出的目标音量等级。
例如,当将环境噪声等级2和备注名“张三”输入到音量调节模型后,终端即可获得与“张三”在环境噪声等级为2的环境中进行语音通话时的目标音量的等级。
与图3所示的实施例相比,由于音量调节模型还由环境噪声等级训练得到,因此目标音量等级还对应通话时的环境噪声等级,进一步提高了音量调节的准确性。
步骤102,获取音量调节模型,音量调节模型是根据历史通话记录训练得到的模型,历史通话记录中包括与不同通话对象进行通话时的通话信息以及音量调节信息。
步骤103,将通话信息输入音量调节模型,并获得音量调节模型输出的目标音量等级。
本实施例中,音量调节模型根据通话时所处环境的环境噪声等级以及音量调节信息训练得到。在一种可能的实现方式中,通话过程中,终端获取环境噪声等级,同时接收手动音量调节信号,并根据手动音量调节信号确定出与当前通话对象通话的音量等级;通话结束后,终端将环境噪声等级以及音量调节信息输入到机器学习算法中,通过机器学习算法训练得到音量调节模型。
步骤104,将通话音量由当前音量等级调节至目标音量等级。
本实施例中,终端中的音量调节模型由通话时的环境噪声等级以及音量调节信息训练得到,在需要调节通话音量时,终端获取通话时的环境噪声等级和当前通话对象的对象标识,并将二者输入到音量调节模型中,得到当前环境噪声等级下与当前通话对象通话时的目标音量等级,进而对当前音量等级进行调节,通话音量的调节更精准。
需要说明的是,音量调节模型可以根据包含通话时终端的地理位置信息、通话时所处的通话时段以及通话时的环境噪声等级的历史通话记录训练得到,相应的,终端检测到启用通话进程时,将包含当前地理位置信息、当前时刻和环境噪声等级的通话信息输入音量调节模型,从而得到音量调节模型输出的目标音量等级,本实施例在此不再赘述。
参考图6,其示出了本申请一个示例性实施例提供的音量调节装置的结构框图。该音量调节装置可以通过软件、硬件以及两者的组合实现成为终端的全部或一部分。该音量调节装置包括:第一获取模块610、第二获取模块620、输入模块630、调节模块640:
第一获取模块610,用于当启用通话进程时,获取通话信息,通话信息至少包括当前通话对象的对象标识;
第二获取模块620,用于获取音量调节模型,音量调节模型是根据历史通话记录训练得到的模型,历史通话记录中包括与不同通话对象进行通话时的通话信息以及音量调节信息;
输入模块630,用于将通话信息输入音量调节模型,并获得音量调节模型输出的目标音量等级;
调节模块640,用于将通话音量由当前音量等级调节至目标音量等级。
可选的,音量调节模型根据通话时终端的地理位置信息以及音量调节信息训练得到;
第一获取模块610,包括:
第一获取单元,用于当启用通话进程时,获取终端的当前地理位置信息以及当前通话对象的对象标识;
第一确定单元,用于将当前地理位置信息和对象标识确定为通话信息。
可选的,音量调节模型根据通话时所处的通话时段以及音量调节信息训练得到;
第一获取模块610,包括:
第二获取单元,用于当启用通话进程时,获取当前时刻以及当前通话对象的对象标识;
第二确定单元,用于将当前时刻和对象标识确定为通话信息。
可选的,音量调节模型根据通话时的环境噪声等级以及音量调节信息训练得到;
第一获取模块610,包括:
采集单元,用于当启用通话进程时,通过麦克风采集环境噪声;
第三确定单元,用于确定环境噪声对应的环境噪声等级;
第四确定单元,用于将环境噪声等级和当前通话对象的对象标识确定为通话信息。
可选的,该装置,还包括:
调整模块,用于当接收到音量调节指令时,根据音量调节指令调整通话音量;
修正模块,用于根据音量调节指令所指示的音量调节系数,对音量调节模型进行修正。
综上所述,本申请实施例中,当启用通话进程时,终端获取当前通话的通话信息,并将通话信息输入到音量调节模型中,得到输出的目标音量等级,进而将当前音量等级调节至目标音量等级,由于该音量调节模型是根据不同通话对象的通话信息以及音量调节信息训练生成,因此利用该音量调节模型能够得到当前通话对象对应的历史音量调节信息,进而基于该历史音量调节信息实现了通话音量的自动调节,从而避免用户手动调节音量,提高了调节通话音量的效率。
本实施例中,在终端完成音量的自动调节后,根据用户再次通过手动调节音量时产生的音量调节系数对音量调节模型进行修正,保证了音量调节模型的准确性。
本实施例中,终端中的音量调节模型由终端的地理位置信息以及音量调节信息训练得到,在需要调节通话音量时,终端获取当前通话对象的对象标识和当前地理位置信息,并将二者输入到音量调节模型中,得到当前地点与当前通话对象通话时的目标音量等级,进而对当前音量等级进行调节,通话音量的调节更符合实际通话场景。
本实施例中,终端中的音量调节模型由通话时所处的通话时段以及音量调节信息训练得到,在需要调节通话音量时,终端获取通话时所处的通话时段和当前通话对象的对象标识,并将二者输入到音量调节模型中,得到当前通话时段下与当前通话对象通话时的目标音量等级,进而对当前音量等级进行调节,通话音量的调节更精准。
需要说明的是:上述实施例提供的音量调节装置在进行音量调节时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音量调节装置与音量调节方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
如图7所示,本申请实施例提供了一种终端,该终端包括处理器710和存储器720。存储器720中存储有至少一条指令,该指令由处理器710加载并执行以实现如上述各个实施例提供的音量调节方法。
可选的,终端中还包括传感器、音频播放组件、通讯组件等其他部件,图7所示的终端并不对终端的具体结构构成限定。
本申请实施例还提供了一种计算机可读介质,该计算机可读介质存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的音量调节方法。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的音量调节方法。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种音量调节方法,其特征在于,所述方法包括:
当启用通话进程时,获取通话信息,所述通话信息至少包括当前通话对象的对象标识;
获取音量调节模型,所述音量调节模型是根据历史通话记录训练得到的模型,所述历史通话记录中包括与不同通话对象进行通话时的所述通话信息以及音量调节信息;
将所述通话信息输入所述音量调节模型,并获得所述音量调节模型输出的目标音量等级;
将通话音量由当前音量等级调节至所述目标音量等级。
2.根据权利要求1所述的方法,其特征在于,所述音量调节模型根据通话时终端的地理位置信息以及所述音量调节信息训练得到;
所述当启用通话进程时,获取通话信息,包括:
当启用所述通话进程时,获取所述终端的当前地理位置信息以及所述当前通话对象的所述对象标识;
将所述当前地理位置信息和所述对象标识确定为所述通话信息。
3.根据权利要求1所述的方法,其特征在于,所述音量调节模型根据通话时所处的通话时段以及所述音量调节信息训练得到;
所述当启用通话进程时,获取通话信息,包括:
当启用所述通话进程时,获取当前时刻以及所述当前通话对象的所述对象标识;
将所述当前时刻和所述对象标识确定为所述通话信息。
4.根据权利要求1所述的方法,其特征在于,所述音量调节模型根据通话时的环境噪声等级以及所述音量调节信息训练得到;
所述当启用通话进程时,获取通话信息,包括:
当启用所述通话进程时,通过麦克风采集环境噪声;
确定所述环境噪声对应的所述环境噪声等级;
将所述环境噪声等级和所述对象标识确定为所述通话信息。
5.根据权利要求1至4任一所述的方法,其特征在于,所述将通话音量由当前音量等级调节至所述目标音量等级之后,还包括:
当接收到音量调节指令时,根据所述音量调节指令调整所述通话音量;
根据所述音量调节指令所指示的音量调节系数,对所述音量调节模型进行修正。
6.一种音量调节装置,其特征在于,所述装置包括:
第一获取模块,用于当启用通话进程时,获取通话信息,所述通话信息至少包括当前通话对象的对象标识;
第二获取模块,用于获取音量调节模型,所述音量调节模型是根据历史通话记录训练得到的模型,所述历史通话记录中包括与不同通话对象进行通话时的所述通话信息以及音量调节信息;
输入模块,用于将所述通话信息输入所述音量调节模型,并获得所述音量调节模型输出的目标音量等级;
调节模块,用于将通话音量由当前音量等级调节至所述目标音量等级。
7.根据权利要求6所述的装置,其特征在于,所述音量调节模型根据通话时终端的地理位置信息以及所述音量调节信息训练得到;
所述第一获取模块,包括:
第一获取单元,用于当启用所述通话进程时,获取所述终端的当前地理位置信息以及所述当前通话对象的所述对象标识;
第一确定单元,用于将所述当前地理位置信息和所述对象标识确定为所述通话信息。
8.根据权利要求6所述的装置,其特征在于,所述音量调节模型根据通话时所处的通话时段以及所述音量调节信息训练得到;
所述第一获取模块,包括:
第二获取单元,用于当启用所述通话进程时,获取当前时刻以及所述当前通话对象的所述对象标识;
第二确定单元,用于将所述当前时刻和所述对象标识确定为所述通话信息。
9.一种终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至5任一所述的音量调节方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如权利要求1至5任一所述的音量调节方法。
CN201711102986.3A 2017-11-10 2017-11-10 音量调节方法、装置、终端及存储介质 Pending CN107682561A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711102986.3A CN107682561A (zh) 2017-11-10 2017-11-10 音量调节方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711102986.3A CN107682561A (zh) 2017-11-10 2017-11-10 音量调节方法、装置、终端及存储介质

Publications (1)

Publication Number Publication Date
CN107682561A true CN107682561A (zh) 2018-02-09

Family

ID=61145651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711102986.3A Pending CN107682561A (zh) 2017-11-10 2017-11-10 音量调节方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN107682561A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536420A (zh) * 2018-04-16 2018-09-14 Oppo广东移动通信有限公司 音量调节方法、电子装置及计算机可读存储介质
CN108766460A (zh) * 2018-05-15 2018-11-06 浙江口碑网络技术有限公司 基于语音的交互方法及系统
CN109147816A (zh) * 2018-06-05 2019-01-04 安克创新科技股份有限公司 对音乐进行音量调节的方法及设备
CN109240637A (zh) * 2018-08-21 2019-01-18 中国联合网络通信集团有限公司 音量调节的处理方法、装置、设备及存储介质
CN109348059A (zh) * 2018-10-31 2019-02-15 努比亚技术有限公司 音量调节方法、移动终端及计算机可读存储介质
CN111064843A (zh) * 2018-10-16 2020-04-24 奇酷互联网络科技(深圳)有限公司 应用于终端的通话音量的调节方法、终端及存储装置
CN111210834A (zh) * 2018-11-20 2020-05-29 深圳市声希科技有限公司 语音夸张系统
CN113299310A (zh) * 2020-02-21 2021-08-24 阿里巴巴集团控股有限公司 声音信号处理方法、装置、电子设备及可读存储介质
CN115695642A (zh) * 2022-09-26 2023-02-03 展讯通信(天津)有限公司 通话音量调节方法和设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104506702A (zh) * 2014-11-18 2015-04-08 深圳市金立通信设备有限公司 一种音量调节方法
US20160057279A1 (en) * 2013-05-22 2016-02-25 Zte Corporation Method and Device for Adjusting Call Volume, and Mobile Terminal
CN105704315A (zh) * 2016-01-22 2016-06-22 胡月鹏 一种调节通话音量的方法、装置及电子设备
CN106027809A (zh) * 2016-07-27 2016-10-12 维沃移动通信有限公司 一种音量的调节方法及移动终端
CN107277216A (zh) * 2017-05-16 2017-10-20 努比亚技术有限公司 一种音量调节方法、终端以及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160057279A1 (en) * 2013-05-22 2016-02-25 Zte Corporation Method and Device for Adjusting Call Volume, and Mobile Terminal
CN104506702A (zh) * 2014-11-18 2015-04-08 深圳市金立通信设备有限公司 一种音量调节方法
CN105704315A (zh) * 2016-01-22 2016-06-22 胡月鹏 一种调节通话音量的方法、装置及电子设备
CN106027809A (zh) * 2016-07-27 2016-10-12 维沃移动通信有限公司 一种音量的调节方法及移动终端
CN107277216A (zh) * 2017-05-16 2017-10-20 努比亚技术有限公司 一种音量调节方法、终端以及计算机可读存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536420A (zh) * 2018-04-16 2018-09-14 Oppo广东移动通信有限公司 音量调节方法、电子装置及计算机可读存储介质
CN108766460A (zh) * 2018-05-15 2018-11-06 浙江口碑网络技术有限公司 基于语音的交互方法及系统
CN109147816A (zh) * 2018-06-05 2019-01-04 安克创新科技股份有限公司 对音乐进行音量调节的方法及设备
CN109240637A (zh) * 2018-08-21 2019-01-18 中国联合网络通信集团有限公司 音量调节的处理方法、装置、设备及存储介质
CN109240637B (zh) * 2018-08-21 2022-02-01 中国联合网络通信集团有限公司 音量调节的处理方法、装置、设备及存储介质
CN111064843A (zh) * 2018-10-16 2020-04-24 奇酷互联网络科技(深圳)有限公司 应用于终端的通话音量的调节方法、终端及存储装置
CN109348059A (zh) * 2018-10-31 2019-02-15 努比亚技术有限公司 音量调节方法、移动终端及计算机可读存储介质
CN111210834A (zh) * 2018-11-20 2020-05-29 深圳市声希科技有限公司 语音夸张系统
CN113299310A (zh) * 2020-02-21 2021-08-24 阿里巴巴集团控股有限公司 声音信号处理方法、装置、电子设备及可读存储介质
CN113299310B (zh) * 2020-02-21 2022-05-13 阿里巴巴集团控股有限公司 声音信号处理方法、装置、电子设备及可读存储介质
CN115695642A (zh) * 2022-09-26 2023-02-03 展讯通信(天津)有限公司 通话音量调节方法和设备

Similar Documents

Publication Publication Date Title
CN107682561A (zh) 音量调节方法、装置、终端及存储介质
CN107734126A (zh) 语音调节方法、装置、终端及存储介质
CN109859767B (zh) 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质
CN110288978B (zh) 一种语音识别模型训练方法及装置
CN103886731B (zh) 一种噪声控制方法及设备
CN108429994B (zh) 音频识别、回声消除方法、装置及设备
CN103903627A (zh) 一种语音数据的传输方法及装置
CN108922525B (zh) 语音处理方法、装置、存储介质及电子设备
CN101740036A (zh) 通话音量自动调节方法及装置
CN109741747B (zh) 语音场景识别方法和装置、语音控制方法和设备、空调
CN112634923B (zh) 基于指挥调度系统的音频回声消除方法、设备、存储介质
CN112259112A (zh) 一种结合声纹识别和深度学习的回声消除方法
CN114338623B (zh) 音频的处理方法、装置、设备及介质
CN109714692A (zh) 基于个人数据与人工神经网络的助听器降噪方法
CN111800720B (zh) 基于大数据和云空间的数字助听器参数调整方法和装置
CN109831732A (zh) 基于智能手机的智能啸叫抑制装置和方法
CN111081246B (zh) 直播机器人唤醒方法、装置、电子设备及存储介质
CN112767908A (zh) 基于关键声音识别的主动降噪方法、电子设备及存储介质
CN109783047B (zh) 一种终端上的智能音量控制方法和装置
CN117059068A (zh) 语音处理方法、装置、存储介质及计算机设备
CN113838473A (zh) 设备的语音处理方法、装置以及设备
CN111027675B (zh) 一种多媒体播放设置自动调节方法及系统
US11531516B2 (en) Intelligent volume control
CN112312255A (zh) 一种基于音频解码器的智能降嗓耳机及降噪算法
CN101699837B (zh) 一种电话语音输出增益调节的方法、装置和通信终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180209