CN105282345B - 通话音量的调节方法和装置 - Google Patents

通话音量的调节方法和装置 Download PDF

Info

Publication number
CN105282345B
CN105282345B CN201510819039.0A CN201510819039A CN105282345B CN 105282345 B CN105282345 B CN 105282345B CN 201510819039 A CN201510819039 A CN 201510819039A CN 105282345 B CN105282345 B CN 105282345B
Authority
CN
China
Prior art keywords
user
age
call
preset
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510819039.0A
Other languages
English (en)
Other versions
CN105282345A (zh
Inventor
孙龙
王琪
黄江涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510819039.0A priority Critical patent/CN105282345B/zh
Publication of CN105282345A publication Critical patent/CN105282345A/zh
Application granted granted Critical
Publication of CN105282345B publication Critical patent/CN105282345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本公开提出一种通话音量的调节方法,所述方法包括:识别通话用户的年龄;判断识别出的所述用户的年龄是否达到预设的年龄阈值;当识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节。本公开可以实现在识别出用户的年龄达到预设的年龄阈值时,对该用户的通话音量进行智能调节,从而可以避免用户手动对通话音量进行调节,提升用户的通话体验。

Description

通话音量的调节方法和装置
技术领域
本公开涉及终端领域,尤其涉及通话音量的调节方法和装置。
背景技术
随着通讯终端的普及,在日常生活中使用通讯终端的老年人也越来越多。然而,老年人在使用通讯终端的过程中,很容易误操作将通话音量调节到静音或者比较小的音量,而且由于老年人视力或者其他方面生理上的限制,很难自主的完成对通话音量的调节,从而影响日常通讯。
发明内容
为克服相关技术中存在的问题,本公开提供一种通话音量的调节方法和装置。
根据本公开实施例的第一方面,提供一种通话音量的调节方法,所述方法包括:
识别通话用户的年龄;
判断识别出的所述用户的年龄是否达到预设的年龄阈值;
当识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节。
可选的,所述识别通话用户的年龄包括:
当用户拨打电话时,启用前置摄像头采集所述用户的面部图像;
从采集的所述面部图像中提取所述用户的面部特征;
基于预设模型对提取到的所述用户的面部特征进行分析以获取所述用户的年龄。
可选的,所述识别用户的年龄包括:
当用户接听电话时,采集所述用户的声音;
从采集到的所述用户的声音中提取所述用户的声音特征;
基于预设模型对提取到的所述用户的声音特征进行分析以获取所述用户的年龄。
可选的,所述基于预设策略对所述用户的通话音量进行智能调节包括:
判断当前的通话音量是否低于预设的音量阈值;
如果当前的通话音量低于所述音量阈值,将当前的通话音量调高至最大音量或将当前的通话音量调高至与所述用户的年龄匹配的音量。
可选的,所述将当前的通话音量调高至与所述用户的年龄匹配的音量之前,还包括:
将所述用户的年龄在多个预设的年龄阈值区间中进行匹配;其中,所述多个预设的年龄阈值区间分别被设置了对应的适配音量;
当所述用户的年龄与所述多个预设的年龄阈值区间中任一年龄阈值区间匹配时,将与该年龄阈值区间对应的适配音量确定为与所述用户的年龄匹配的音量。
可选的,所述方法还包括:
如果当前的通话音量大于或等于所述音量阈值,识别所述用户的通话;
当从所述用户的通话中识别出预设的关键词时,将当前的通话音量调高至最大音量;其中,所述预设的关键词为表征所述用户当前无法听清通话内容的关键词。
可选的,所述方法还包括:
当将当前的通话音量调高至最大音量或将当前的通话音量调高至与所述用户的年龄匹配的音量后,开启免提模式。
根据本公开实施例的第二方面,提供一种通话音量的调节装置,所述装置包括:
识别模块,被配置为识别通话用户的年龄;
判断模块,被配置为判断所述识别模块识别出的所述用户的年龄是否达到预设的年龄阈值;
调节模块,被配置为在所述识别模块识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节。
可选的,所述识别模块包括:
第一采集子模块,被配置为在用户拨打电话时,启用前置摄像头采集所述用户的面部图像;
第一提取子模块,被配置为从所述第一采集子模块采集的所述面部图像中提取所述用户的面部特征;
第一获取子模块,被配置为基于预设模型对所述第一提取子模块提取到的所述用户的面部特征进行分析以获取所述用户的年龄。
可选的,所述识别模块还包括:
第二采集子模块,被配置为在用户接听电话时,采集所述用户的声音;
第二提取子模块,被配置为从所述第二采集子模块采集到的所述用户的声音中提取所述用户的声音特征;
第二获取子模块,被配置为基于预设模型对所述第二提取子模块提取到的所述用户的声音特征进行分析以获取所述用户的年龄。
可选的,所述调节模块包括:
判断子模块,被配置为判断当前的通话音量是否低于预设的音量阈值;
第一调高子模块,被配置为在所述判断子模块判断出当前的通话音量低于所述音量阈值时,将当前的通话音量调高至最大音量或将当前的通话音量调高至与所述用户的年龄匹配的音量。
可选的,所述调节模块还包括:
匹配子模块,被配置为在所述第一调高子模块将当前的通话音量调高至与所述用户的年龄匹配的音量之前,将所述用户的年龄在多个预设的年龄阈值区间中进行匹配;其中,所述多个预设的年龄阈值区间分别被设置了对应的适配音量;
确定子模块,被配置为当所述用户的年龄与所述多个预设的年龄阈值区间中任一年龄阈值区间匹配时,将与该年龄阈值区间对应的适配音量确定为与所述用户的年龄匹配的音量。
可选的,所述调节模块还包括:
识别子模块,被配置为在所述判断子模块判断出当前的通话音量大于或等于所述音量阈值时,识别所述用户的通话;
第二调高子模块,被配置为在所述识别子模块从所述用户的通话中识别出预设的关键词时,将当前的通话音量调高至最大音量;其中,所述预设的关键词为表征所述用户当前无法听清通话内容的关键词。
可选的,所述调节模块还包括:
开启子模块,被配置为在所述第一调高子模块或所述第二调高子模块将当前的通话音量调高至最大音量,或者所述第一调高子模块将当前的通话音量调高至与所述用户的年龄匹配的音量后,开启免提模式。
根据本公开实施例的第三方面,提供一种通话音量的调节装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
识别用户在通话过程中的通话环境;
根据识别出的通话环境将当前的通话音量调整至对应的音量。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开的以上实施例中,通过识别通话用户的年龄,并判断识别出的所述用户的年龄是否达到预设的年龄阈值;当识别出的所述用户的年龄达到预设的年龄阈值时,则基于预设策略对所述用户的通话音量进行智能调节,可以实现在识别出用户的年龄达到预设的年龄阈值时,对该用户的通话音量进行智能调节,从而可以避免用户手动对通话音量进行调节,提升用户的通话体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种通话音量的调节方法的流程示意图;
图2是根据一示例性实施例示出的另一种通话音量的调节方法的流程示意图;
图3是根据一示例性实施例示出的一种通话音量的调节装置的示意框图;
图4是根据一示例性实施例示出的另一种通话音量的调节装置的示意框图;
图5是根据一示例性实施例示出的另一种通话音量的调节装置的示意框图;
图6是根据一示例性实施例示出的另一种通话音量的调节装置的示意框图;
图7是根据一示例性实施例示出的另一种通话音量的调节装置的示意框图;
图8是根据一示例性实施例示出的另一种通话音量的调节装置的示意框图;
图9是根据一示例性实施例示出的另一种通话音量的调节装置的示意框图;
图10是根据一示例性实施例示出的一种用于通话音量的调节装置的一结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,图1是根据一示例性实施例示出的一种通话音量的调节方法,该通话音量的调节方法用于通讯终端中,包括以下步骤:
在步骤101中,识别通话用户的年龄;
在本实施例中,通讯终端可以通过采集用户的面部特征,或者用户的声音特征,然后对采集到的该用户的面部特征和声音特征进行分析后来获取该用户的年龄。
其中,该用户的面部特征可以由通讯终端在该用户拨打电话时调用前置摄像头来进行采集。该用户的声音特征可以由通讯终端在该用户接听电话时通过调用内置的声音采集模块(例如声卡或者麦克风)来进行采集。
一方面,当用户通过通讯终端拨打电话时,该用户的面部通常会直接面对该通讯终端的前置摄像头,因此在这种情况下,当通讯终端在后台检测到用户在拨打电话时,可以立即开启前置摄像头来采集该用户的面部图像,然后从该面部图像中提取该用户的面部特征。
在提取该用户的面部特征时,通讯终端可以对采集到的该用户的面部图像进行人脸检测,来确定该面部图像中人脸的位置。当该面部图像中人脸的位置确定后,通讯终端可以根据预设的人脸识别算法在确定出的人脸的位置进行面部特征点定位,然后可以根据定位出的面部特征点来提取该用户的面部特征。例如,在实现时可以采用目前应用最广泛的LBP算法,基于定位出的面部特征点来提取该用户面部的纹理特征。
当提取到该用户的面部特征后,通讯终端可以将提取到的面部特征量化为对应的面部特征向量,然后将该面部特征向量作为输入数据,输入到预设的年龄模型中进行计算,来获取与该用户的面部特征匹配的年龄估计值。
其中,该预设的年龄模型,可以通过针对大量的预先标记了年龄的面部图像样本训练得到。例如,在训练该年龄模型时,可以准备大量的预先标记了年龄的面部图像样本,并针对这些面部图像样本分别进行面部特征的提取,然后将提取到的面部特征和已经标记的年龄作为预测变量,通过预设算法进行训练后,得到一个可以根据输入的面部特征向量来识别用户年龄的年龄模型。值得说明的是,在训练该年龄模型是采用的预设算法,在本实施例中不进行特别限定,在实现时可以采用神经网络等机器学习算法来进行模型训练。
另一方面,当用户接听电话时,此时前置摄像头无法直接采集到用户的面部特征,在这种情况下,当通讯终端在后台检测到用户接听了电话时,可以立即调用内置的声音采集模块(比如声卡或者麦克风),采集该用户在通话过程中的一段声音,然后通讯终端可以针对这一段声音来提取该用户的声音特征。
其中,该用户的声音特征可以用目前应用最广泛的基频参数和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCCs)来表征。基频参数反映了说话人发音的声带震动信息,梅尔频率倒谱系数反映了人耳感知的声道特性信息。
当提取到该用户的声音特征后,通讯终端可以将提取到的声音特征量化为对应的声音特征向量,然后将该声音特征向量作为输入数据,输入到预设的年龄模型中进行计算,来获取与该用户的声音特征匹配的年龄估计值。
其中,该预设的年龄模型,可以通过针对大量的预先标记了年龄的声音样本训练得到。例如,在训练该年龄模型时,可以准备大量的预先标记了年龄的声音样本,并针对这些面部图像样本分别进行基频参数和梅尔频率倒谱系数的提取,然后将提取到的基频参数和梅尔频率倒谱系数作为预测变量,通过预设算法进行训练后,得到一个可以根据输入的声音特征向量来识别用户年龄的年龄模型。基于基频参数和梅尔频率倒谱系数训练出的年龄识别模型,能很好的识别出说话人的年龄。值得说明的是,在训练该年龄模型是采用的预设算法,在本实施例中不进行特别限定,在实现时仍然可以采用神经网络等机器学习算法来进行模型训练。
在步骤102中,判断识别出的所述用户的年龄是否达到预设的年龄阈值;
在本实施例中,当通讯终端识别出该用户的年龄后,可以将该用户的年龄与预设的年龄阈值进行比较,来判断该用户是否为老年用户。例如,通讯终端可以预设一个较大的年龄阈值,比如65岁,当该用户的年龄达到预设的年龄阈值时,则可以确定该用户为老年用户。
在步骤103中,当识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节。
在本实施例中,当通讯终端通过将该用户的年龄与预设的年龄阈值进行比较,确定出该用户为老年用户时,此时通讯终端可以立即启用预设策略针对当前的通话音量进行智能调节。当然,如果该用户的年龄与预设的年龄阈值进行比较后,该用户的年龄小于预设的年龄阈值,此时该用户未非老年用户,通讯终端可以不针对当前的通话音量进行特别处理。
其中,通讯终端在启用预设策略针对当前通话音量进行智能调节时,可以首先判断当前的通话音量是否低于预设的音量阈值,如果当前的通话音量低于该预设的音量阈值时,此时可以触发通讯终端自动将当前的通话音量调高,从而方便老年人更加清晰的听清通话内容。
例如,老年人使用通讯终端时,由于视力或者其他生理上的限制,经常会误操作将通话音量调节到静音状态,或者一个非常小的音量,在这种情况下,在无其他人帮助下,老年人通常无法自主的将当前的通话音量回复到正常。因此,通讯终端可以将该预设的音量阈值设置为一个较小的音量值,当通讯终端判断出当前的通话音量低于该音量阈值时,此时的通话音量很可能被老人误操作调节到了静音状态,在这种情况下,当通讯终端判断出当前的通话音量低于该音量阈值时,此时可以触发通讯终端立即将当前的通话音量调高。
在示出的一种实施方式中,通讯终端在调高当前通话音量时,可以将当前的音量调节至最大音量。其中,在将当前的通话音量调节至最大音量时,可以将当前的通话音量直接调节到最大音量,通过这种方式,可以瞬间将音量调节到最大,从而可以避免用户无法听清在调节过程中产生的通话内容。当然,在将当前的通话音量调节至最大音量时,也可以基于一定的调节幅度逐渐的将当前的音量调节至最大音量,通过这种方式,可以对当前的通话音量进行渐进式的调节,从而可以防止瞬间将音量调节到最大对老人造成惊吓。
在示出的另一种实施方式中,通讯终端在调高当前通话音量时,可以将当前的音量调节至与该用户的年龄匹配的音量。
其中,在确定与该用户的年龄匹配的音量时,通讯终端可以预设多个年龄阈值区间,并为每一个年龄阈值区间分别设置一个对应的适配音量,然后可以将该用户的年龄在设置的各年龄区域间中进行匹配。当该用户的年龄匹配到以上各年龄区域间中的任意一个时,则可以将该年龄区间对应的适配音量确定为与该用户的年龄相匹配的音量。
例如,可以设置65岁~70岁,70岁至75岁,75岁~80岁以及80岁以上等四个年龄阈值区间,并为以上每一个年龄阈值区间分别设置一个数值依次递增的适配音量。假设该用户的年龄为66岁,此时与65岁~70岁这个年龄阈值区间匹配,则可以将为65岁~70岁这个年龄阈值区间设置的适配音量作为与该用户的年龄相匹配的音量。
其中,在将当前的通话音量调节至与该用户的年龄相匹配的音量时,仍然可以将当前的通话音量直接调节到与该用户的年龄相匹配的音量,也可以基于一定的调节幅度逐渐的将当前的音量调节至与该用户的年龄相匹配的音量,不再赘述。
可见,通过这种方式,对于一些老年用户来说,可以避免由于其视力或其他生理上的限制,误操作将当前的通话音量调节至最小或者一个非常小的音量后,无法自主的手动对通话音量进行调节,从而造成的无法进行日常通话的问题。
当然,如果通讯终端判断出当前的通话音量大于或等于该音量阈值时,此时当前的通话音量通常可以维持正常的通话过程,在这种情况下,通讯终端不必立即将当前的通话音量调高。然而,对于老年用户来说,由于老年人的听力通常弱于正常人,即使当前的通话音量不低于该音量阈值,可能仍然无法挺清楚当前的通话内容。因此,在这种情况下,通讯终端可以在该用户通话的过程中,通过语音识别技术实时的识别该用户的通话,然后判断是否从该用户的通话中识别出预设的关键词来确定该用户当前是否无法听清通话内容。
其中,上述预设的关键词,可以是表征所述用户当前无法听清通话内容的关键词。例如,该预设的关键词可以是“请大声点”、“喂、喂、喂”或者“听不见”等关键词。当通讯终端从该用户的通话中识别出这些关键词时,则可以触发通讯终端立即将当前的通话音量调节至最大音量。通讯终端将当前的通话音量调节至最大音量时,仍然可以将当前的通话音量直接调节至最大音量,或者也可以基于一定的调节幅度逐渐的将当前的音量调节至最大的音量。
另外,对于一些年龄较大的老年用户,由于其听力通常弱于正常用户,因此当通讯终端按照以上各步骤中的实施方式,将当前的通话音量调节至最大音量或者与该用户的年龄匹配的音量后,对于这类用户可能仍然无法听清通话内容,因此当通讯终端将当前的通话音量调节至最大音量或者与用户的年龄匹配的音量后,通讯终端还可以同时开启免提模式,从而可以最大限度的保证该用户能够正常的听清通话内容。
例如,通讯终端在将当前的通话音量调节至最大音量或者与用户的年龄匹配的音量后,可以立即自动开启免提模式;或者通讯终端在将当前的通话音量调节至最大音量或者与用户的年龄匹配的音量后,可以继续识别该用户的通话,一旦识别从该用户的通话中识别出上述预设的关键词后,则开启免提模式。
值得说明的是,通讯终端对当前的通话音量进行智能调节,除了以上各实施例中描述的,可以通过判断用户的年龄是否达到预设的年龄阈值来触发以外,在实际的应用中也可以通过其他方式进行触发。例如,在实现时,通讯终端也可以通过检测当前的通话环境是否嘈杂,来触发通讯终端对当前的通话音量进行智能调节。或者仍然可以通过判断用户的年龄是否达到预设的年龄阈值,来触发通讯终端对当前的通话音量进行智能调节,而将当前的通话环境是否嘈杂作为针对当前通话音量进行微调的触发条件。即:当通讯终端判断出用户的年龄达到预设的年龄阈值,将当前的通话音量调高时,可以判断当前的通话环境是否嘈杂,如果当前的通话环境较嘈杂时,可以适当提高本次调高通话音量的幅度。如果当前的通话环境较安静时,可以适当降低本次调高通话音量的幅度。其中,基于当前通话环境来对通话音量进行智能调节的过程,在本实施例中不再进行详述,本领域技术人员可以参考相关技术中的介绍。
在以上实施例中,通过识别通话用户的年龄,并判断识别出的所述用户的年龄是否达到预设的年龄阈值;当识别出的所述用户的年龄达到预设的年龄阈值时,则基于预设策略对所述用户的通话音量进行智能调节,可以实现在识别出用户的年龄达到预设的年龄阈值时,对该用户的通话音量进行智能调节,从而可以避免用户手动对通话音量进行调节,提升用户的通话体验。
如图2所示,图2是根据一示例性实施例示出的另一种通话音量的调节方法,该方法用于通讯终端中,所述方法包括以下步骤:
在步骤201中,识别通话用户的年龄;
在本实施例中,通讯终端可以通过采集用户的面部特征,或者用户的声音特征,然后对采集到的该用户的面部特征和声音特征进行分析后来获取该用户的年龄。
其中,该用户的面部特征可以由通讯终端在该用户拨打电话时调用前置摄像头来进行采集。该用户的声音特征可以由通讯终端在该用户接听电话时通过调用内置的声音采集模块(例如声卡或者麦克风)来进行采集。
一方面,当用户通过通讯终端拨打电话时,该用户的面部通常会直接面对该通讯终端的前置摄像头,因此在这种情况下,当通讯终端在后台检测到用户在拨打电话时,可以立即开启前置摄像头来采集该用户的面部图像,然后从该面部图像中提取该用户的面部特征。
在提取该用户的面部特征时,通讯终端可以对采集到的该用户的面部图像进行人脸检测,来确定该面部图像中人脸的位置。当该面部图像中人脸的位置确定后,通讯终端可以根据预设的人脸识别算法在确定出的人脸的位置进行面部特征点定位,然后可以根据定位出的面部特征点来提取该用户的面部特征。例如,在实现时可以采用目前应用最广泛的LBP算法,基于定位出的面部特征点来提取该用户面部的纹理特征。
当提取到该用户的面部特征后,通讯终端可以将提取到的面部特征量化为对应的面部特征向量,然后将该面部特征向量作为输入数据,输入到预设的年龄模型中进行计算,来获取与该用户的面部特征匹配的年龄估计值。
其中,该预设的年龄模型,可以通过针对大量的预先标记了年龄的面部图像样本训练得到。例如,在训练该年龄模型时,可以准备大量的预先标记了年龄的面部图像样本,并针对这些面部图像样本分别进行面部特征的提取,然后将提取到的面部特征和已经标记的年龄作为预测变量,通过预设算法进行训练后,得到一个可以根据输入的面部特征向量来识别用户年龄的年龄模型。值得说明的是,在训练该年龄模型是采用的预设算法,在本实施例中不进行特别限定,在实现时可以采用神经网络等机器学习算法来进行模型训练。
另一方面,当用户接听电话时,此时前置摄像头无法直接采集到用户的面部特征,在这种情况下,当通讯终端在后台检测到用户接听了电话时,可以立即调用内置的声音采集模块(比如声卡或者麦克风),采集该用户在通话过程中的一段声音,然后通讯终端可以针对这一段声音来提取该用户的声音特征。
其中,该用户的声音特征可以用目前应用最广泛的基频参数和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCCs)来表征。基频参数反映了说话人发音的声带震动信息,梅尔频率倒谱系数反映了人耳感知的声道特性信息。
当提取到该用户的声音特征后,通讯终端可以将提取到的声音特征量化为对应的声音特征向量,然后将该声音特征向量作为输入数据,输入到预设的年龄模型中进行计算,来获取与该用户的声音特征匹配的年龄估计值。
其中,该预设的年龄模型,可以通过针对大量的预先标记了年龄的声音样本训练得到。例如,在训练该年龄模型时,可以准备大量的预先标记了年龄的声音样本,并针对这些面部图像样本分别进行基频参数和梅尔频率倒谱系数的提取,然后将提取到的基频参数和梅尔频率倒谱系数作为预测变量,通过预设算法进行训练后,得到一个可以根据输入的声音特征向量来识别用户年龄的年龄模型。基于基频参数和梅尔频率倒谱系数训练出的年龄识别模型,能很好的识别出说话人的年龄。值得说明的是,在训练该年龄模型是采用的预设算法,在本实施例中不进行特别限定,在实现时仍然可以采用神经网络等机器学习算法来进行模型训练。
在步骤202中,判断识别出的所述用户的年龄是否达到预设的年龄阈值;
在本实施例中,当通讯终端识别出该用户的年龄后,可以将该用户的年龄与预设的年龄阈值进行比较,来判断该用户是否为老年用户。例如,通讯终端可以预设一个较大的年龄阈值,比如65岁,当该用户的年龄达到预设的年龄阈值时,则可以确定该用户为老年用户。
在步骤203中,当识别出的所述用户的年龄达到预设的年龄阈值时,判断当前的通话音量是否低于预设的音量阈值;
在步骤204A中,如果当前的通话音量低于所述音量阈值,将当前的通话音量调高至最大音量或将当前的通话音量调高至与所述用户的年龄匹配的音量;
在本实施例中,当通讯终端通过将该用户的年龄与预设的年龄阈值进行比较,确定出该用户为老年用户时,此时通讯终端可以立即启用预设策略针对当前的通话音量进行智能调节。当然,如果该用户的年龄与预设的年龄阈值进行比较后,该用户的年龄小于预设的年龄阈值,此时该用户未非老年用户,通讯终端可以不针对当前的通话音量进行特别处理。
其中,通讯终端在启用预设策略针对当前通话音量进行智能调节时,可以首先判断当前的通话音量是否低于预设的音量阈值,如果当前的通话音量低于该预设的音量阈值时,此时可以触发通讯终端自动将当前的通话音量调高,从而方便老年人更加清晰的听清通话内容。
例如,老年人使用通讯终端时,由于视力或者其他生理上的限制,经常会误操作将通话音量调节到静音状态,或者一个非常小的音量,在这种情况下,在无其他人帮助下,老年人通常无法自主的将当前的通话音量回复到正常。因此,通讯终端可以将该预设的音量阈值设置为一个较小的音量值,当通讯终端判断出当前的通话音量低于该音量阈值时,此时的通话音量很可能被老人误操作调节到了静音状态,在这种情况下,当通讯终端判断出当前的通话音量低于该音量阈值时,此时可以触发通讯终端立即将当前的通话音量调高。
在示出的一种实施方式中,通讯终端在调高当前通话音量时,可以将当前的音量调节至最大音量。其中,在将当前的通话音量调节至最大音量时,可以将当前的通话音量直接调节到最大音量,通过这种方式,可以瞬间将音量调节到最大,从而可以避免用户无法听清在调节过程中产生的通话内容。当然,在将当前的通话音量调节至最大音量时,也可以基于一定的调节幅度逐渐的将当前的音量调节至最大音量,通过这种方式,可以对当前的通话音量进行渐进式的调节,从而可以防止瞬间将音量调节到最大对老人造成惊吓。
在示出的另一种实施方式中,通讯终端在调高当前通话音量时,可以将当前的音量调节至与该用户的年龄匹配的音量。
其中,在确定与该用户的年龄匹配的音量时,通讯终端可以预设多个年龄阈值区间,并为每一个年龄阈值区间分别设置一个对应的适配音量,然后可以将该用户的年龄在设置的各年龄区域间中进行匹配。当该用户的年龄匹配到以上各年龄区域间中的任意一个时,则可以将该年龄区间对应的适配音量确定为与该用户的年龄相匹配的音量。
例如,可以设置65岁~70岁,70岁至75岁,75岁~80岁以及80岁以上等四个年龄阈值区间,并为以上每一个年龄阈值区间分别设置一个数值依次递增的适配音量。假设该用户的年龄为66岁,此时与65岁~70岁这个年龄阈值区间匹配,则可以将为65岁~70岁这个年龄阈值区间设置的适配音量作为与该用户的年龄相匹配的音量。
其中,在将当前的通话音量调节至与该用户的年龄相匹配的音量时,仍然可以将当前的通话音量直接调节到与该用户的年龄相匹配的音量,也可以基于一定的调节幅度逐渐的将当前的音量调节至与该用户的年龄相匹配的音量,不再赘述。
可见,通过这种方式,对于一些老年用户来说,可以避免由于其视力或其他生理上的限制,误操作将当前的通话音量调节至最小或者一个非常小的音量后,无法自主的手动对通话音量进行调节,从而造成的无法进行日常通话的问题。
在步骤204B中,如果当前的通话音量大于或等于所述音量阈值,识别所述用户的通话,当从所述用户的通话中识别出预设的关键词时,将当前的通话音量调高至最大音量;其中,所述预设的关键词为表征所述用户当前无法听清通话内容的关键词。
在本实施例中,如果通讯终端判断出当前的通话音量大于或等于该音量阈值时,此时当前的通话音量通常可以维持正常的通话过程,在这种情况下,通讯终端不必立即将当前的通话音量调高。然而,对于老年用户来说,由于老年人的听力通常弱于正常人,即使当前的通话音量不低于该音量阈值,可能仍然无法挺清楚当前的通话内容。因此,在这种情况下,通讯终端可以在该用户通话的过程中,通过语音识别技术实时的识别该用户的通话,然后判断是否从该用户的通话中识别出预设的关键词来确定该用户当前是否无法听清通话内容。
其中,上述预设的关键词,可以是表征所述用户当前无法听清通话内容的关键词。例如,该预设的关键词可以是“请大声点”、“喂、喂、喂”或者“听不见”等关键词。当通讯终端从该用户的通话中识别出这些关键词时,则可以触发通讯终端立即将当前的通话音量调节至最大音量。通讯终端将当前的通话音量调节至最大音量时,仍然可以将当前的通话音量直接调节至最大音量,或者也可以基于一定的调节幅度逐渐的将当前的音量调节至最大的音量。
在步骤205中,当将当前的通话音量调高至最大音量或将当前的通话音量调高至与所述用户的年龄匹配的音量后,开启免提模式。
在本实施例中,对于一些年龄较大的老年用户,由于其听力通常弱于正常用户,因此当通讯终端按照以上各步骤中描述的实施方式,将当前的通话音量调节至最大音量或者与该用户的年龄匹配的音量后,对于这类用户可能仍然无法听清通话内容,因此当通讯终端将当前的通话音量调节至最大音量或者与用户的年龄匹配的音量后,通讯终端还可以同时开启免提模式,从而可以最大限度的保证该用户能够正常的听清通话内容。
例如,通讯终端在将当前的通话音量调节至最大音量或者与用户的年龄匹配的音量后,可以立即自动开启免提模式;或者通讯终端在将当前的通话音量调节至最大音量或者与用户的年龄匹配的音量后,可以继续识别该用户的通话,一旦识别从该用户的通话中识别出上述预设的关键词后,则开启免提模式。
值得说明的是,通讯终端对当前的通话音量进行智能调节,除了以上各实施例中描述的,可以通过判断用户的年龄是否达到预设的年龄阈值来触发以外,在实际的应用中也可以通过其他方式进行触发。例如,在实现时,通讯终端也可以通过检测当前的通话环境是否嘈杂,来触发通讯终端对当前的通话音量进行智能调节。或者仍然可以通过判断用户的年龄是否达到预设的年龄阈值,来触发通讯终端对当前的通话音量进行智能调节,而将当前的通话环境是否嘈杂作为针对当前通话音量进行微调的触发条件。即:当通讯终端判断出用户的年龄达到预设的年龄阈值,将当前的通话音量调高时,可以判断当前的通话环境是否嘈杂,如果当前的通话环境较嘈杂时,可以适当提高本次调高通话音量的幅度。如果当前的通话环境较安静时,可以适当降低本次调高通话音量的幅度。其中,基于当前通话环境来对通话音量进行智能调节的过程,在本实施例中不再进行详述,本领域技术人员可以参考相关技术中的介绍。
在以上实施例中,通过识别通话用户的年龄,并判断识别出的所述用户的年龄是否达到预设的年龄阈值;当识别出的所述用户的年龄达到预设的年龄阈值时,则基于预设策略对所述用户的通话音量进行智能调节,可以实现在识别出用户的年龄达到预设的年龄阈值时,对该用户的通话音量进行智能调节,从而可以避免用户手动对通话音量进行调节,提升用户的通话体验。
与前述通话音量的调节方法实施例相对应,本公开还提供了通话音量的调节装置的实施例。
图3是根据一示例性实施例示出的一种通话音量的调节装置的示意框图。
如图3所示,根据一示例性实施例示出的一种通话音量的调节装置30,包括:识别模块301、判断模块302和调节模块303;其中:
所述识别模块301被配置为,识别通话用户的年龄;
所述判断模块302被配置为,判断所述识别模块301识别出的所述用户的年龄是否达到预设的年龄阈值;
所述调节模块303被配置为,在所述识别模块301识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节。
在以上实施例中,通过识别通话用户的年龄,并判断识别出的所述用户的年龄是否达到预设的年龄阈值;当识别出的所述用户的年龄达到预设的年龄阈值时,则基于预设策略对所述用户的通话音量进行智能调节,可以实现在识别出用户的年龄达到预设的年龄阈值时,对该用户的通话音量进行智能调节,从而可以避免用户手动对通话音量进行调节,提升用户的通话体验。
请参见图4,图4是本公开根据一示例性实施例示出的另一种通话音量的调节装置框图,该实施例在前述图4所示实施例的基础上,所述识别模块301可以包括第一采集子模块301A、第一提取子模块301B、第一获取子模块301C;其中:
所述第一采集子模块301A被配置为,在用户拨打电话时,启用前置摄像头采集所述用户的面部图像;
所述第一提取子模块301B被配置为,从所述第一采集子模块301A采集的所述面部图像中提取所述用户的面部特征;
所述第一获取子模块301C被配置为,基于预设模型对所述第一提取子模块301B提取到的所述用户的面部特征进行分析以获取所述用户的年龄。
请参见图5,图5是本公开根据一示例性实施例示出的另一种通话音量的调节装置框图,该实施例在前述图5所示实施例的基础上,所述识别模块301还可以包括第二采集子模块301D、第二提取子模块301E、第二获取子模块301F;其中:
所述第二采集子模块301D被配置为,在用户接听电话时,采集所述用户的声音;
所述第二提取子模块301E被配置为,从所述第二采集子模块301D采集到的所述用户的声音中提取所述用户的声音特征;
所述第二获取子模块301F被配置为,基于预设模型对所述第二提取子模块301E提取到的所述用户的声音特征进行分析以获取所述用户的年龄。
需要说明的是,上述图5所示的装置实施例中示出的第二采集子模块301D、第二提取子模块301E、第二获取子模块301F的结构也可以包含在前述图3的装置实施例中,对此本公开不进行限制。
请参见图6,图6是本公开根据一示例性实施例示出的另一种通话音量的调节装置框图,该实施例在前述图3所示实施例的基础上,所述调节模块303可以包括判断子模块303A和第一调高子模块303B;其中:
所述判断子模块303A被配置为,判断当前的通话音量是否低于预设的音量阈值;
所述第一调高子模块303B被配置为,在所述判断子模块303A判断出当前的通话音量低于所述音量阈值时,将当前的通话音量调高至最大音量或将当前的通话音量调高至与所述用户的年龄匹配的音量。
需要说明的是,上述图6所示的装置实施例中示出的判断子模块303A和第一调高子模块303B的结构也可以包含在前述图4-5的装置实施例中,对此本公开不进行限制。
请参见图7,图7是本公开根据一示例性实施例示出的另一种通话音量的调节装置框图,该实施例在前述图6所示实施例的基础上,所述调节模块303还可以包括匹配子模块303C和确定子模块303D;其中:
所述匹配子模块303C被配置为,在所述第一调高子模块303B将当前的通话音量调高至与所述用户的年龄匹配的音量之前,将所述用户的年龄在多个预设的年龄阈值区间中进行匹配;其中,所述多个预设的年龄阈值区间分别被设置了对应的适配音量;
所述确定子模块303D被配置为,当所述用户的年龄与所述多个预设的年龄阈值区间中任一年龄阈值区间匹配时,将与该年龄阈值区间对应的适配音量确定为与所述用户的年龄匹配的音量。
需要说明的是,上述图7所示的装置实施例中示出的匹配子模块303C和确定子模块303D的结构也可以包含在前述图3-5的装置实施例中,对此本公开不进行限制。
请参见图8,图8是本公开根据一示例性实施例示出的另一种通话音量的调节装置框图,该实施例在前述图6所示实施例的基础上,所述调节模块303还可以包括识别子模块303E和第二调高子模块303F;其中:
所述识别子模块303E被配置为,在所述判断子模块303A判断出当前的通话音量大于或等于所述音量阈值时,识别所述用户的通话;
所述第二调高子模块303F被配置为,在所述识别子模块303A从所述用户的通话中识别出预设的关键词时,将当前的通话音量调高至最大音量;其中,所述预设的关键词为表征所述用户当前无法听清通话内容的关键词。
需要说明的是,上述图8所示的装置实施例中示出的识别子模块303E和第二调高子模块303F的结构也可以包含在前述图3-5、7的装置实施例中,对此本公开不进行限制。
请参见图9,图9是本公开根据一示例性实施例示出的另一种通话音量的调节装置框图,该实施例在前述图8所示实施例的基础上,所述调节模块303还可以包括开启子模块303G;其中:
所述开启子模块303G被配置为,在所述第一调高子模块303B或所述第二调高子模块303F将当前的通话音量调高至最大音量,或者所述第一调高子模块303B将当前的通话音量调高至与所述用户的年龄匹配的音量后,开启免提模式。
需要说明的是,上述图9所示的装置实施例中示出的开启子模块303G的结构也可以包含在前述图3-7的装置实施例中,对此本公开不进行限制。
上述装置中各个模块或单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块或单元可以是或者也可以不是物理上分开的,作为模块或单元显示的部件可以是或者也可以不是物理模块或单元,即可以位于一个地方,或者也可以分布到多个网络模块或单元上。可以根据实际的需要选择其中的部分或者全部模块或单元来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
相应的,本公开还提供一种通话音量的调节装置,所述通话音量的调节
装置包括:处理器;用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
识别通话用户的年龄;
判断识别出的所述用户的年龄是否达到预设的年龄阈值;
当识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节。
相应的,本公开还提供一种终端,所述终端包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
识别通话用户的年龄;
判断识别出的所述用户的年龄是否达到预设的年龄阈值;
当识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节。
图10是根据一示例性实施例示出的一种通话音量的调节装置的结构示意图。
如图10所示,根据一示例性实施例示出的一种通话音量的调节装置1000,该装置1000可以是计算机,移动电话,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图10,装置1000可以包括以下一个或多个组件:处理组件1001,存储器1002,电源组件1003,多媒体组件1004,音频组件1005,输入/输出(I/O)的接口1006,传感器组件1007,以及通信组件1008。
处理组件1001通常控制装置1000的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1001可以包括一个或多个处理器1009来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1001可以包括一个或多个模块,便于处理组件1001和其它组件之间的交互。例如,处理部件1001可以包括多媒体模块,以方便多媒体组件1004和处理组件1001之间的交互。
存储器1002被配置为存储各种类型的数据以支持在装置1000的操作。这些数据的示例包括用于在装置1000上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1002可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件1003为装置1000的各种组件提供电力。电源组件1003可以包括电源管理系统,一个或多个电源,及其它与为装置1000生成、管理和分配电力相关联的组件。
多媒体组件1004包括在所述装置1000和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1004包括一个前置摄像头和/或后置摄像头。当装置1000处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1005被配置为输出和/或输入音频信号。例如,音频组件1005包括一个麦克风(MIC),当装置1000处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1002或经由通信组件1008发送。在一些实施例中,音频组件1005还包括一个扬声器,用于输出音频信号。
I/O接口1002为处理组件1001和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1007包括一个或多个传感器,用于为装置1000提供各个方面的状态评估。例如,传感器组件1007可以检测到装置1000的打开/关闭状态,组件的相对定位,例如所述组件为装置1000的显示器和小键盘,传感器组件1007还可以检测装置1000或装置1000一个组件的位置改变,用户与装置1000接触的存在或不存在,装置1000方位或加速/减速和装置1000的温度变化。传感器组件1007可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1007还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1007还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1008被配置为便于装置1000和其它设备之间有线或无线方式的通信。装置1000可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1008经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1008还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其它技术来实现。
在示例性实施例中,装置1000可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其它电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1002,上述指令可由装置1000的处理器1009执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
其中,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种调节通话音量的方法,包括:
识别通话用户的年龄;
判断识别出的所述用户的年龄是否达到预设的年龄阈值;
当识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (12)

1.一种通话音量的调节方法,其特征在于,所述方法包括:
识别通话用户的年龄;
判断识别出的所述用户的年龄是否达到预设的年龄阈值;
当识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节;
其中,所述预设策略包括:如果当前的通话音量低于预设的音量阈值,将当前的通话音量调高至与所述用户的年龄匹配的音量;如果当前的通话音量大于或等于所述音量阈值,识别所述用户的通话,当从所述用户的通话中识别出预设的关键词时,将当前的通话音量调高至最大音量,所述预设的关键词为表征所述用户当前无法听清通话内容的关键词。
2.如权利要求1所述的方法,其特征在于,所述识别通话用户的年龄包括:
当用户拨打电话时,启用前置摄像头采集所述用户的面部图像;
从采集的所述面部图像中提取所述用户的面部特征;
基于预设模型对提取到的所述用户的面部特征进行分析以获取所述用户的年龄。
3.如权利要求1所述的方法,其特征在于,所述识别用户的年龄包括:
当用户接听电话时,采集所述用户的声音;
从采集到的所述用户的声音中提取所述用户的声音特征;
基于预设模型对提取到的所述用户的声音特征进行分析以获取所述用户的年龄。
4.如权利要求1所述的方法,其特征在于,所述将当前的通话音量调高至与所述用户的年龄匹配的音量之前,还包括:
将所述用户的年龄在多个预设的年龄阈值区间中进行匹配;其中,所述多个预设的年龄阈值区间分别被设置了对应的适配音量;
当所述用户的年龄与所述多个预设的年龄阈值区间中任一年龄阈值区间匹配时,将与该年龄阈值区间对应的适配音量确定为与所述用户的年龄匹配的音量。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
当将当前的通话音量调高至与所述用户的年龄匹配的音量后,开启免提模式。
6.一种通话音量的调节装置,其特征在于,所述装置包括:
识别模块,被配置为识别通话用户的年龄;
判断模块,被配置为判断所述识别模块识别出的所述用户的年龄是否达到预设的年龄阈值;
调节模块,被配置为在所述识别模块识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节;
其中,所述预设策略包括:如果当前的通话音量低于预设的音量阈值,将当前的通话音量调高至与所述用户的年龄匹配的音量;如果当前的通话音量大于或等于所述音量阈值,识别所述用户的通话,当从所述用户的通话中识别出预设的关键词时,将当前的通话音量调高至最大音量,所述预设的关键词为表征所述用户当前无法听清通话内容的关键词。
7.如权利要求6所述的装置,其特征在于,所述识别模块包括:
第一采集子模块,被配置为在用户拨打电话时,启用前置摄像头采集所述用户的面部图像;
第一提取子模块,被配置为从所述第一采集子模块采集的所述面部图像中提取所述用户的面部特征;
第一获取子模块,被配置为基于预设模型对所述第一提取子模块提取到的所述用户的面部特征进行分析以获取所述用户的年龄。
8.如权利要求6所述的装置,其特征在于,所述识别模块还包括:
第二采集子模块,被配置为在用户接听电话时,采集所述用户的声音;
第二提取子模块,被配置为从所述第二采集子模块采集到的所述用户的声音中提取所述用户的声音特征;
第二获取子模块,被配置为基于预设模型对所述第二提取子模块提取到的所述用户的声音特征进行分析以获取所述用户的年龄。
9.如权利要求6所述的装置,其特征在于,所述调节模块还包括:
匹配子模块,被配置为在将当前的通话音量调高至与所述用户的年龄匹配的音量之前,将所述用户的年龄在多个预设的年龄阈值区间中进行匹配;其中,所述多个预设的年龄阈值区间分别被设置了对应的适配音量;
确定子模块,被配置为当所述用户的年龄与所述多个预设的年龄阈值区间中任一年龄阈值区间匹配时,将与该年龄阈值区间对应的适配音量确定为与所述用户的年龄匹配的音量。
10.如权利要求6所述的装置,其特征在于,所述调节模块还包括:
开启子模块,被配置为在将当前的通话音量调高至与所述用户的年龄匹配的音量后,开启免提模式。
11.一种通话音量的调节装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
识别通话用户的年龄;
判断识别出的所述用户的年龄是否达到预设的年龄阈值;
当识别出的所述用户的年龄达到预设的年龄阈值时,基于预设策略对所述用户的通话音量进行智能调节;
其中,所述预设策略包括:如果当前的通话音量低于预设的音量阈值,将当前的通话音量调高至与所述用户的年龄匹配的音量;如果当前的通话音量大于或等于所述音量阈值,识别所述用户的通话,当从所述用户的通话中识别出预设的关键词时,将当前的通话音量调高至最大音量,所述预设的关键词为表征所述用户当前无法听清通话内容的关键词。
12.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-5中任一项所述方法的步骤。
CN201510819039.0A 2015-11-23 2015-11-23 通话音量的调节方法和装置 Active CN105282345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510819039.0A CN105282345B (zh) 2015-11-23 2015-11-23 通话音量的调节方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510819039.0A CN105282345B (zh) 2015-11-23 2015-11-23 通话音量的调节方法和装置

Publications (2)

Publication Number Publication Date
CN105282345A CN105282345A (zh) 2016-01-27
CN105282345B true CN105282345B (zh) 2019-03-15

Family

ID=55150635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510819039.0A Active CN105282345B (zh) 2015-11-23 2015-11-23 通话音量的调节方法和装置

Country Status (1)

Country Link
CN (1) CN105282345B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025745A (zh) * 2016-01-29 2017-08-08 苏州三星电子有限公司 一种冰箱及智能家居系统
CN105763741A (zh) * 2016-04-15 2016-07-13 上海斐讯数据通信技术有限公司 一种具有面部识别功能的通话系统及方法
CN106791067B (zh) * 2016-12-14 2020-03-10 Oppo广东移动通信有限公司 一种通话音量调节方法、装置及移动终端
CN106782544A (zh) * 2017-03-29 2017-05-31 联想(北京)有限公司 语音交互设备及其输出方法
CN107343076A (zh) * 2017-08-18 2017-11-10 广东欧珀移动通信有限公司 音量调节方法、装置、存储介质及移动终端
CN107508979B (zh) * 2017-08-18 2020-04-17 Oppo广东移动通信有限公司 音量调节方法、装置、终端及存储介质
CN107977633B (zh) * 2017-12-06 2019-04-09 平安科技(深圳)有限公司 人脸图像的年龄识别方法、装置及存储介质
CN107895579B (zh) * 2018-01-02 2021-08-17 联想(北京)有限公司 一种语音识别方法及系统
CN110581918B (zh) * 2018-06-11 2022-10-25 佛山市顺德区美的电热电器制造有限公司 一种语音设备及其控制方法、服务器和计算机存储介质
CN108924687A (zh) * 2018-07-05 2018-11-30 Oppo(重庆)智能科技有限公司 一种音量设置方法和设备、及计算机存储介质
CN108900688B (zh) * 2018-07-09 2021-04-13 Oppo广东移动通信有限公司 发声控制方法、装置、电子装置及计算机可读介质
CN109087671A (zh) * 2018-09-20 2018-12-25 重庆先特服务外包产业有限公司 政府综合热线服务平台
CN111105791A (zh) * 2018-10-26 2020-05-05 杭州海康威视数字技术股份有限公司 一种声控方法、装置及系统
CN110677759B (zh) * 2019-09-20 2021-01-26 苏宁智能终端有限公司 智能耳机默认音量的设置方法及系统
CN113033245A (zh) * 2019-12-09 2021-06-25 宇龙计算机通信科技(深圳)有限公司 一种功能调节方法、装置、存储介质及电子设备
CN114900767B (zh) * 2022-04-28 2023-06-13 歌尔股份有限公司 听力的保护方法、装置、终端设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413218A (zh) * 2011-08-03 2012-04-11 宇龙计算机通信科技(深圳)有限公司 一种自动调节通话音质的方法、装置及通信终端
CN103685673A (zh) * 2012-09-20 2014-03-26 索尼公司 信号处理设备和存储介质
CN103713888A (zh) * 2012-09-29 2014-04-09 联想(北京)有限公司 一种信息处理的方法及装置
CN103905650A (zh) * 2014-04-28 2014-07-02 深圳市中兴移动通信有限公司 移动终端及基于语音识别调节通话音量的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008092093A (ja) * 2006-09-29 2008-04-17 Yamaha Corp 楽音再生装置及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413218A (zh) * 2011-08-03 2012-04-11 宇龙计算机通信科技(深圳)有限公司 一种自动调节通话音质的方法、装置及通信终端
CN103685673A (zh) * 2012-09-20 2014-03-26 索尼公司 信号处理设备和存储介质
CN103713888A (zh) * 2012-09-29 2014-04-09 联想(北京)有限公司 一种信息处理的方法及装置
CN103905650A (zh) * 2014-04-28 2014-07-02 深圳市中兴移动通信有限公司 移动终端及基于语音识别调节通话音量的方法

Also Published As

Publication number Publication date
CN105282345A (zh) 2016-01-27

Similar Documents

Publication Publication Date Title
CN105282345B (zh) 通话音量的调节方法和装置
EP2210214B1 (en) Automatic identifying
CN107978316A (zh) 控制终端的方法及装置
CN104991754B (zh) 录音方法及装置
WO2016176951A1 (zh) 声音信号优化方法及装置
CN104378715B (zh) 降低耳机pop音的装置和方法
CN109360549B (zh) 一种数据处理方法、穿戴设备和用于数据处理的装置
CN107945806B (zh) 基于声音特征的用户识别方法及装置
WO2014183529A1 (zh) 切换移动终端通话模式的方法、装置及存储介质
CN108154878A (zh) 控制监控设备的方法及装置
CN110648656A (zh) 语音端点检测方法、装置、电子设备及存储介质
CN104506703B (zh) 语音留言、语音留言播放方法及装置
CN105355195A (zh) 音频识别方法及装置
CN108665889A (zh) 语音信号端点检测方法、装置、设备及存储介质
CN111583919A (zh) 信息处理方法、装置及存储介质
CN107135452A (zh) 助听器适配方法及装置
JP7240445B2 (ja) オーディオ処理方法、装置、端末、及び記憶媒体
CN113113044B (zh) 音频处理方法及装置、终端及存储介质
CN110415703A (zh) 语音备忘信息处理方法及装置
WO2021244058A1 (zh) 一种处理执行方法、装置和可读介质
CN108600625A (zh) 图像获取方法及装置
CN108268667A (zh) 音频文件聚类方法及装置
CN110019936A (zh) 一种媒体文件播放过程中的注释方法和装置
CN109102813A (zh) 声纹识别方法、装置、电子设备和存储介质
CN104869261B (zh) 自动通话方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant