CN112118485B

CN112118485B - 音量自适应调整方法、系统、设备及存储介质

Info

Publication number: CN112118485B
Application number: CN202011004199.7A
Authority: CN
Inventors: 郑勇平; 蔡世光
Original assignee: Inventec Appliances Shanghai Corp; Inventec Appliances Pudong Corp; Inventec Appliances Corp
Current assignee: Inventec Appliances Shanghai Corp; Inventec Appliances Pudong Corp; Inventec Appliances Corp
Priority date: 2020-09-22
Filing date: 2020-09-22
Publication date: 2022-07-08
Anticipated expiration: 2040-09-22
Also published as: TWI753661B; TW202213075A; CN112118485A

Abstract

本发明提供了一种音量自适应调整方法、系统、设备及存储介质，该方法包括：识别请求播放音频的用户身份；根据用户身份获取用户的音量偏好特征；根据用户的音量偏好特征调整当前的音频播放音量。通过采用本发明，自动检测用户身份，并根据用户身份获取对应的音量偏好特征，从而可以根据用户身份和喜好记录，根据每个人的听力差异自适应调整收听音频的音量，满足个体差异化的音量适配，自适应调整音频播放音量，避免用户反复调整耳机音量而使用体验不佳，并且同一耳机可以适用于不同的用户。

Description

音量自适应调整方法、系统、设备及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种音量自适应调整方法、系统、设备及存储介质。

背景技术

在播放音频的过程中，每个人对于音质的需求不同，双耳对于音质的需求也并不相同。每个人的听力敏感度不同，相同音量的声音，不同的人听到的感觉音量是不同的。不同类型的多媒体声音，每个人的喜好音量也是不同的。如何找到自己舒适的音量，通常需要手动调整音量来实现。当内容更换后，总是需要一直来回调音量。

目前的一些实现方式是采用均衡器，来做统一音量控制，避免音量上下剧烈浮动造成损伤。但无法实现各种多媒体内容音量的因人而异的差异需求控制。此外，现有的音量喜好习惯无法记忆，上次调整好的，如今仍然需要重新调整。即已经听过的内容，音量刚刚好，但是重复收听时，因内容切换或更换收听耳机或播放设备，仍然需要重新调整音量，同一个耳机也无法自适应多个不同收听者的喜好。

发明内容

针对现有技术中的问题，本发明的目的在于提供一种音量自适应调整方法、系统、设备及存储介质，根据用户身份和喜好记录，自适应调整音频播放音量。

本发明实施例提供一种音量自适应调整方法，包括如下步骤：

识别请求播放音频的用户身份；

根据用户身份获取用户的音量偏好特征；

根据用户的音量偏好特征调整当前的音频播放音量。

可选地，所述音量偏好特征包括用户之前播放音频的音量记录；

所述根据用户的音量偏好特征调整当前的音频播放音量，包括如下步骤：

判断是否存在用户之前播放该请求播放音频时的音量记录；

如果存在，则根据用户之前播放的音量记录调整当前的音频播放音量。

可选地，所述音量偏好特征还包括用户对应于各个音频类型的偏好音量设置；

所述根据用户的音量偏好特征调整当前的音频播放音量中，如果不存在用户之前播放该请求播放音频时的音量记录，则执行如下步骤：

确定请求播放音频的音频类型；

根据用户对应于该音频类型的偏好音量设置调整当前的音频播放音量。

可选地，所述方法还包括采用如下步骤对音频库中的各个音频进行分类：

基于训练音频样本，建立用于音频分类的机器学习模型；

将音频库中的各个音频的特征输入所述机器学习模型，得到各个音频的分类结果，根据分类结果确定各个音频的音频类型。

可选地，所述机器学习模型包括用于音频风格分类的模型和用于音频情感分类的模型二者中的其中至少一个。

可选地，所述确定请求播放音频的音频类型之后，还包括如下步骤：

确定请求播放音频的音频来源；

根据用户对应于请求播放音频的音频来源所对应的偏好音量设置以及对应于同音频类型的偏好音量设置调整当前的音频播放音量。

可选地，如果存在用户之前播放该请求播放音频时的音量记录，判断用户之前的音量记录中的音频与请求播放音频的音频来源是否一致；

如果不一致，则根据请求播放音频的音频来源所对应的偏好音量设置和根据用户之前播放同个音频的音量调整当前的音频播放音量。

可选地，所述音量偏好特征包括用户的听力损失增益记录；

所述根据用户的音量偏好特征调整当前的音频播放音量，包括根据用户的听力损失增益记录调整当前的音频播放音量。

可选地，所述方法还包括采用如下步骤记录用户的听力损失增益：

播放纯音测试音频，进行耳机气导测试，获取用户的触控反馈数据；

根据用户的触控反馈数据确定用户的耳损等级；

根据预设的耳损等级与听力损失增益的映射关系，记录用户的听力损失增益。

可选地，所述根据预设的耳损等级与听力损失增益的映射关系，记录用户的听力损失增益，包括如下步骤：

获取播放的纯音测试音频的频率，作为当前的耳损测试频率；

根据预设的耳损等级与听力损失增益的映射关系，记录用户对应于当前的耳损测试频率的听力损失增益。

可选地，所述根据用户的听力损失增益记录调整当前的音频播放音量，包括如下步骤：

获取请求播放音频的频率i；

获取用户与频率i相邻的耳损测试频率v和u对应的听力损失增益M_v和M_u；

根据如下公式计算频率i对应的听力损失增益M_i；

M_i＝[(M_v-M_u)/(v-u)]*(i-u)+M_u

在调整前的音频播放音量的基础上叠加听力损失增益M_i作为调整后的音频播放音量。

可选地，所述音量偏好特征包括不同位置对应的偏好音量设置和/或不同时间对应的偏好音量设置；

所述根据用户的音量偏好特征调整当前的音频播放音量包括如下步骤：

获取当前播放的位置信息和/或时间信息；

根据用户对应于当前播放的位置信息和/或时间信息的偏好音量设置，调整当前的音频播放音量。

可选地，所述用户的音量偏好特征存储于耳机、音频播放设备或云端服务器；

所述调整当前的音频播放音量，包括如下步骤：

耳机从音频播放设备接收请求播放的音频后，调整当前的音频播放音量；或

音频播放设备调整当前的音频播放音量后将请求播放的音频和音频播放音量设置发送至耳机。

本发明实施例还提供一种音量自适应调整系统，用于实现所述的音量自适应调整方法，所述系统包括：

身份识别模块，用于识别请求播放音频的用户身份；

偏好获取模块，用于根据用户身份获取用户的音量偏好特征；

音量调整模块，用于根据用户的音量偏好特征调整当前的音频播放音量。

本发明实施例还提供一种音量自适应调整设备，包括：

处理器；

存储器，其中存储有所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行所述的音量自适应调整方法的步骤。

本发明实施例还提供一种计算机可读存储介质，用于存储程序，所述程序被执行时实现所述的音量自适应调整方法的步骤。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

本发明的音量自适应调整方法、系统、设备及存储介质具有如下有益效果：

本发明自动检测用户身份，并根据用户身份获取对应的音量偏好特征，从而可以根据用户身份和喜好记录，根据每个人的听力差异自适应调整收听音频的音量，满足个体差异化的音量适配，自适应调整音频播放音量，避免用户反复调整耳机音量而使用体验不佳，并且同一耳机可以适用于不同的用户；本发明不仅可以应用于耳机音量自适应调整，也可以适用于音频播放设备公放音量的自适应调整。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显。

图1是本发明一实施例的音量自适应调整方法的流程图；

图2是本发明一实施例的在不同场合需要不同音量的示意图；

图3是本发明一实施例的构建音量偏好特征库的示意图；

图4是本发明一实施例的音频情绪分类的示意图；

图5是本发明一实施例的不同音频风格播放音量的示意图；

图6是本发明一实施例的调整音频音量的流程示意图；

图7是本发明一实施例的自适应音量与正常音量的对比示意图；

图8是本发明一实施例的涉及到的各个硬件设备的交互示意图；

图9是本发明一实施例的耳机执行音量自适应调整的流程示意图；

图10是本发明一实施例的BLE主机执行音量自适应调整的流程示意图；

图11是本发明一实施例的音量自适应调整系统的结构示意图；

图12是本发明一实施例的音量自适应调整设备的结构示意图；

图13是本发明一实施例的计算机可读存储介质的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

如图1所示，本发明实施例提供一种音量自适应调整方法，包括如下步骤：

S100：识别请求播放音频的用户身份，识别用户身份可以通过用户在播放设备上输入个人信息，或者通过耳机的麦克风采集用户声纹进行身份识别等等，也可以采用其他生物信息采集识别的方式，例如人脸识别、指纹识别等等，音频播放设备可以是手机、平板电脑、笔记本电脑等；

S200：根据用户身份获取用户的音量偏好特征；

S300：根据用户的音量偏好特征调整当前的音频播放音量。

通过采用本发明的音量自适应调整方法，首先通过步骤S100自动检测用户身份，并通过步骤S200根据用户身份获取对应的音量偏好特征，从而可以通过步骤S300根据用户身份和喜好记录，根据每个人的听力差异自适应调整收听音频的音量，满足个体差异化的音量适配，自适应调整音频播放音量，避免用户反复调整耳机音量而使用体验不佳，并且同一耳机可以适用于不同的用户。

在步骤S300中，调整播放的音频音量，不仅可以是调整耳机中播放的音频音量，也可以是调整音频播放设备直接对外公放的音频音量。因此，本发明不仅可以应用于耳机音量自适应调整，也可以适用于音频播放设备公放音量的自适应调整。

在该实施例中，音量偏好特征可以是存储于耳机中的，也可以是存储于音频播放设备中，也可以是存储于云端服务器中，从而可以实现不同耳机不同人戴时，可以自适应不同人的耳朵。

如图2所示，为本发明适用的不同应用场景的示意图。其中，各个标记对应的场景分别如下：

101：广场A区域(Mary&Jack戴蓝牙耳机正在跳广场舞或观看广场屏幕视频)；

102：广场B区域(Tom&Peter&Carl聆听导游介绍或分享直播等)；

103：BT5.2 BIG(Broadcase Isochronoous Group)广播模式；

104：BT5.2 CIG(Connected Isochronoous Group)个人分享模式；

105：蓝牙耳机(根据音量喜好、位置等特征个性化音量收听)。

在该实施例中，所述音量偏好特征包括用户之前播放音频的音量记录。

所述步骤S300：根据用户的音量偏好特征调整当前的音频播放音量，包括如下步骤：

S310：判断是否存在用户之前播放该请求播放音频时的音量记录，此处在判断是否有记录时，可以采用声纹对比的方式，即将请求播放音频的声纹与记录的用户之前播放过的音频的声纹进行比对；

S320：如果存在，则根据用户之前播放的音量记录调整当前的音频播放音量。由此，用户再次播放一首之前听过的歌时，就可以直接采用之前收听时的音量设置来进行收听，而无需再重复设置。

此外，考虑到虽然是同一首歌，但是在从不同的音频来源获取时，音质会有差别，同等音量下播放给用户的感受也是不同的。因此，可以进一步结合音频来源来自适应调整播放音量。此处音频来源的分类可以包括音频源文件的类型(mkv、mp3、mp4、avi等)和/或音频源文件所对应的播放平台(例如分为酷狗、酷我、QQ音乐等)。在该实施例中，如果存在用户之前播放该请求播放音频时的音量记录，进一步判断用户之前的音量记录中的音频与请求播放音频的音频来源是否一致；

例如，之前记录有用户在听mkv格式的音频相比于mp3格式时，会调高3dB。在用户再次播放一首之前听过的歌时，如果之前用户收听的是mp3格式的，则在用户之前播放的音量的基础上再调高3dB。

如图3所示，为本发明一实施例的音量偏好特征库的构建示意图。其中，音量偏好特征库的音量偏好特征包括已经播放过的音频的声纹特征和音量设置以及各种音频类型所对应的音量偏好。在该实施例中，音频类型可以进一步包括音频风格分类和音频情绪分类。

所述步骤S300：根据用户的音量偏好特征调整当前的音频播放音量中，如果不存在用户之前播放该请求播放音频时的音量记录，则执行如下步骤：

S330：确定请求播放音频的音频类型；

S330：根据用户对应于该音频类型的偏好音量设置调整当前的音频播放音量。

在该实施例中，所述方法还包括采用如下步骤对音频库中的各个音频进行分类：

基于训练音频样本，建立用于音频分类的机器学习模型；

进一步地，所述确定请求播放音频的音频类型之后，还包括如下步骤：

确定请求播放音频的音频来源；

根据用户对应于请求播放音频的音频来源所对应的偏好音量设置以及对应于同音频类型的偏好音量设置调整当前的音频播放音量，即增加了音频来源和音频类型两个维度来匹配音频所对应的偏好音量设置。

如上所述，此处音频来源的分类可以包括音频源文件的类型(mkv、mp3、mp4、avi等)和/或音频源文件所对应的播放平台(例如分为酷狗、酷我、QQ音乐等)。例如，在用户播放一首M类型的音频时，查询用户对应于M类型的音频以及音频来源是酷狗的偏好音量设置为调高5dB，自动将该请求播放音频的音量调高5dB。

在该实施例中，所述机器学习模型包括用于音频风格分类的模型和用于音频情感分类的模型。在一可替代的实施方式中，所述机器学习模型可以只包括用于音频风格分类的模型，在另一可替代的实施方式中，所述机器学习模型可以只包括用于音频情感分类的模型。在其他可替代的实施方式中，所述机器学习模型也可以进一步包括其他类型的分类模型，例如用于节奏快慢分类的模型等。

如图3所示，示出了结合用于音频风格分类的模型和用于音频分类的模型两者，而对于风格分类和情感分类的方式。所述机器学习模型可以为神经网络。基于标记和神经网络深度学习对音频进行风格分类。例如，按照风格分类可以将音频分为：古典、民族、摇滚、爵士、舞曲、儿歌、唯美、劲爆等等。

基于多模态情绪检测和Word2Vec Embeddings神经网络进行深度学习，对音频进行情感分类。

在对音频进行情感分类时，关注情感色彩(从消极到积极)和兴奋程度(从平静到精力旺盛)，将情绪归类为16等级。情绪归类可以如图4所示，Valence表示情感色彩，沿箭头方向，Valence从消极到积极，Arousal表示兴奋程度，沿箭头方向，兴奋程度逐渐增大。-V+A、+V+A、-V-A和+V-A分别表示四个情绪分类象限。

在记录用户对应于不同音频类型的偏好音量设置时，对音频风格分类和音频情绪分类进行笛卡尔组合音量记忆，得到多个组合，每个组合对应一个音频类型，例如古典与Pleasure的组合，民族与Happy的组合，古典与Happy的组合等等。在记录每个组合的偏好音量设置时，可以预设Normal(正常)基准音量上的均衡增益浮动，从而提高收听效果。

例如，可以收集用户日常喜好音频的音量特征，分类进行记录如下表1。

表1偏好音量记录表

通过采用本发明，得到的不同类型的音频的偏好音量可以如图5所示。其中，初始按照统计Normal音量进行播放，播放不同类型的音频，由用户调整合适音量，记录为音量偏好特征，加入到音量偏好特征库中。

因此，通过采用本发明，在用户收听音频时，记录音频声纹，并将已听过的内容进行风格和情绪归类，当再次收听识别出相同声纹音频，则直接使用之前的喜好音量播放，无匹配声纹时，搜寻最接近的风格和情绪喜好音量播放。在采集用户的音量偏好特征时，可以是在用户收听音频过程中逐渐积累采集。也可以是向用户播放不同音频类型的试听音乐，由用户进行音量设置并记录用户的音量偏好特征。

如图3所示，在该实施例中，所述音量偏好特征还包括用户的听力损失增益记录。所述步骤S300：根据用户的音量偏好特征调整当前的音频播放音量，还可以进一步包括根据用户的听力损失增益记录调整当前的音频播放音量。所述听力损失增益记录可以单独应用或与上述之前听过的音频的音量记录以及音频类型的偏好音量设置结合应用。

如图3所示，在该实施例中，所述方法还包括采用如下步骤记录用户的听力损失增益：

耳机麦克风校准测试环境标准，播放纯音测试音频，进行耳机气导测试，获取用户的触控反馈数据；

根据用户的触控反馈数据确定用户的耳损等级，具体地，可以是采用国际标准WHO-1997规定的上升法或升降法，用户的触控反馈数据可以是用户在耳机或音频播放设备上的触控应答；

根据预设的耳损等级与听力损失增益的映射关系，记录用户的听力损失增益。具体地，结合WHO气压和收听时长规范，对中度以下损伤，进行音量补偿，中重度及以上，不建议使用耳机收听节目，耳机需只用于纯助听场景。

在该实施例中，所述根据预设的耳损等级与听力损失增益的映射关系，记录用户的听力损失增益，包括如下步骤：

具体地，可以采用如下步骤进行听力损失测试：

(1)耳机外置麦克风监测环境噪音；

(2)听到测试音时触摸屏幕；

(3)重复多个低，中，高音音频测试，确认对低中高音的听力敏感状态；

(4)建立个人听力状况音量特征及低、中、高音频补偿损益量化表(取500HZ，1000HZ，2000HZ，4000HZ进行平滑处理)。

在该实施例中，所述根据用户的听力损失增益记录调整当前的音频播放音量，包括如下步骤：

获取请求播放音频的频率i；

根据如下公式计算频率i对应的听力损失增益M_i；

M_i＝[(M_v-M_u)/(v-u)]*(i-u)+M_u

如图6所示，为本发明一具体实施例的音量自适应调整方法的流程图。其中，所述音量偏好特征可以包括用户之前播放过的音频的音量记录，也可以包括用户针对于不同音乐类型的音量记录，也可以包括根据用户的听力损失评价得到的偏好音量。最终得到的调整后的播放音量O＝F(K，L，M)，其中，K为声纹音量，即根据已播放的相同音频的音量设置的音量，L为类型音量，即为根据同类型的音频音量设置的音量，M为听力损失增益。

首先判断是否有已播放的相同音频的音量设置，如果有，则O＝K，如果没有，则判断是否有同类型的音频的音量设置，如果有，则O＝L。

如果声纹音量和类型音量都无法匹配到，则O_i＝N_i+M_i，i为当前的音频频率，单位为HZ，N_i为常人在i(HZ)时常规音量，M_i为用户在i(HZ)的听力损伤增益。例如，对125HZ音频，收听者有10dB的听力受损，则对此频率进行10dB的增强；对500HZ音频，收听者有5dB的听力增益，则对此进行5dB的音量减扣。

在将图6中的方法应用到图2的场景中时，例如，Jack和Mary同时在收听同一首音乐。假设Jack双耳听力正常，戴蓝牙耳机收听时，系统识别当前收听的音乐，Jack从未听过，但属于摇滚欢快类型，系统按此类型统计的常规音量40dB播放，Jack收听过程中对音量进行了微调到50dB，系统记录了结果。下一次Jack再收听此音乐时，系统声纹识别出并按上次微调后的音量50dB进行播放。Mary双耳有轻度听力损伤(26dB)，戴蓝牙耳机收听时，系统识别当前收听的音乐，Mary从未听过，但属于摇滚欢快类型，系统按此类型常规的音量40dB放大26dB即66dB播放，并监听收听累积时长，提醒保护听力。

如图3所示，进一步地，音量偏好特征库中的音量偏好特征还可以包括不同位置对应的偏好音量设置和/或不同时间对应的偏好音量设置。

获取当前播放的位置信息和/或时间信息；

根据用户对应于当前播放的位置信息和/或时间信息的偏好音量设置，调整当前的音频播放音量，此处偏好音量设置可以包括对应于当前播放的位置信息和/或时间信息的音量调节设置，包括调高音量XdB、调低音量YdB等。

此处不同位置对应的偏好音量设置和/或不同时间对应的偏好音量设置可以单独应用。例如，记录到用户在A地时会将音乐音量调高5dB，A地可能是比较吵闹的公共场所。则下一次用户再到达A地并听音乐时，自动将音乐音量调高5dB。而用户在B地时会将音乐音量调低3dB，B地可能是办公室或家中等比较安静的场所。则下一次用户再到达B地并听音乐时，自动将音乐音量调低3dB。又例如，记录到用户在晚上10:00-11:00时听音乐会将音量调低5dB，则在下一次用户在晚上10:00-11:00时听音乐自动将音量调低5dB。

在另一种可替代的实施方式中，不同位置对应的偏好音量设置和/或不同时间对应的偏好音量设置也可以跟用户之前播放音频的音量记录以及用户对应于各个音频类型的偏好音量设置结合使用，即将时间和/或位置增加为音量记录的匹配维度。所述不同位置对应的偏好音量设置和/或不同时间对应的偏好音量设置，可以包括一首歌在一特定位置的偏好音量设置、一首歌在一特定时间的偏好音量设置、一个歌曲类型在一特定位置的偏好音量设置、一个歌曲类型在一特定时间的偏好音量设置、一首歌在一特定位置和特定时间的偏好音量设置、一个歌曲类型在一特定位置和特定时间的偏好音量设置中的至少一种。此处偏好音量设置指的即为调高音量或降低音量的分贝数。

例如，用户在A地听一首歌时，查询到用户之前在A地听同一首歌将音量调高了3dB，则自动将该歌曲的音量调高3dB。如果查询不到用户之前在A地听同一首歌的记录，则可以查询与该歌曲同类型的歌曲在A地的播放时的记录，并且按照同类型的歌曲的记录来自动调整音量。又例如，用户在早上7:00-9:00听一首歌时，查询到用户之前在7:00-9:00听同一首歌将音量调高了5dB，则自动将该歌曲的音量调高5dB。如果查询不到用户之前在7:00-9:00听同一首歌的记录，则可以查询与该歌曲同类型的歌曲在7:00-9:00播放时的记录，并且按照同类型的歌曲的记录来自动调整音量。

如图7所示，为采用本发明的方法进行音量自适应调整后的自适应音量与未采用本发明方法进行自适应调整时Normal音量的对比示意图。可以获得更符合用户需求的音量。在用户请求播放音频时，可以快速扫描整首歌的音频或截取一段扫描获得输出音量增益，从而自适应调整播放音量。

如图8所示，在该实施例中，所述步骤S300中，调整当前的音频播放音量，可以由耳机执行，也可以由音频播放设备(在采用蓝牙耳机时，对应于BLE主机)执行。具体地，采用耳机和BLE主机执行音量自适应调整的流程图可以分别参见图9和图10。

具体地，所述步骤S300中，调整当前的音频播放音量可以包括如下步骤：

耳机从音频播放设备接收请求播放的音频后，调整当前的音频播放音量；或音频播放设备调整当前的音频播放音量后将请求播放的音频和音频播放音量设置发送至耳机。

如图11所示，本发明实施例还提供一种音量自适应调整系统，用于实现所述的音量自适应调整方法，所述系统包括：

身份识别模块M100，用于识别请求播放音频的用户身份；

偏好获取模块M200，用于根据用户身份获取用户的音量偏好特征；

音量调整模块M300，用于根据用户的音量偏好特征调整当前的音频播放音量。

通过采用本发明的音量自适应调整系统，首先通过身份识别模块M100自动检测用户身份，并通过偏好获取模块M200根据用户身份获取对应的音量偏好特征，从而可以通过音量调整模块M300根据用户身份和喜好记录，根据每个人的听力差异自适应调整收听音频的音量，满足个体差异化的音量适配，自适应调整音频播放音量，避免用户反复调整耳机音量而使用体验不佳，并且同一耳机可以适用于不同的用户。

本发明的音量自适应调整系统中，各个模块的功能可以采用如上所述的音量自适应调整方法的具体实施方式来实现，此处不予赘述。

本发明实施例还提供一种音量自适应调整设备，包括处理器；存储器，其中存储有所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行所述的音量自适应调整方法的步骤。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“平台”。

下面参照图12来描述根据本发明的这种实施方式的电子设备600。图12显示的电子设备600仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图12所示，电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于：至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元610执行，使得所述处理单元610执行本说明书上述音量自适应调整方法部分中描述的根据本发明各种示例性实施方式的步骤。例如，所述处理单元610可以执行如图1中所示的步骤。

所述存储单元620可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202，还可以进一步包括只读存储单元(ROM)6203。

所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204，这样的程序模块6205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备600交互的设备通信，和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且，电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备600使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

本发明实施例还提供一种计算机可读存储介质，用于存储程序，所述程序被执行时实现所述的音量自适应调整方法的步骤。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上执行时，所述程序代码用于使所述终端设备执行本说明书上述音量自适应调整方法部分中描述的根据本发明各种示例性实施方式的步骤。

参考图13所示，描述了根据本发明的实施方式的用于实现上述方法的程序产品800，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上执行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

综上所述，通过采用本发明的音量自适应调整方法、系统、设备及存储介质，自动检测用户身份，并根据用户身份获取对应的音量偏好特征，从而可以根据用户身份和喜好记录，根据每个人的听力差异自适应调整收听音频的音量，满足个体差异化的音量适配，自适应调整音频播放音量，避免用户反复调整耳机音量而使用体验不佳，并且同一耳机可以适用于不同的用户；本发明不仅可以应用于耳机音量自适应调整，也可以适用于音频播放设备公放音量的自适应调整。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种音量自适应调整方法，其特征在于，包括如下步骤：

识别请求播放音频的用户身份；

根据用户身份获取用户的音量偏好特征；

根据用户的音量偏好特征调整当前的音频播放音量；

所述音量偏好特征包括用户之前播放音频的音量记录；

判断是否存在用户之前播放该请求播放音频时的音量记录；

如果存在，则根据用户之前播放的音量记录调整当前的音频播放音量；

所述音量偏好特征还包括用户对应于各个音频类型的偏好音量设置；

确定请求播放音频的音频类型，所述音频类型包括根据音频风格分类的类型和根据音频情感分类的类型，在记录用户对应于不同音频类型的偏好音量设置时，对音频风格分类和音频情绪分类进行组合，得到多个组合，每个组合对应一个音频类型；

2.根据权利要求1所述的音量自适应调整方法，其特征在于，所述方法还包括采用如下步骤对音频库中的各个音频进行分类：

基于训练音频样本，建立用于音频分类的机器学习模型；

3.根据权利要求2所述的音量自适应调整方法，其特征在于，所述机器学习模型包括用于音频风格分类的模型和用于音频情感分类的模型二者中的其中至少一个。

4.根据权利要求1所述的音量自适应调整方法，其特征在于，所述确定请求播放音频的音频类型之后，还包括如下步骤：

确定请求播放音频的音频来源；

5.根据权利要求1所述的音量自适应调整方法，其特征在于，如果存在用户之前播放该请求播放音频时的音量记录，判断用户之前的音量记录中的音频与请求播放音频的音频来源是否一致；

6.根据权利要求1所述的音量自适应调整方法，其特征在于，所述音量偏好特征包括用户的听力损失增益记录；

7.根据权利要求6所述的音量自适应调整方法，其特征在于，所述方法还包括采用如下步骤记录用户的听力损失增益：

根据用户的触控反馈数据确定用户的耳损等级；

8.根据权利要求7所述的音量自适应调整方法，其特征在于，所述根据预设的耳损等级与听力损失增益的映射关系，记录用户的听力损失增益，包括如下步骤：

9.根据权利要求8所述的音量自适应调整方法，其特征在于，所述根据用户的听力损失增益记录调整当前的音频播放音量，包括如下步骤：

获取请求播放音频的频率i；

根据如下公式计算频率i对应的听力损失增益M_i；

M_i＝[(M_v-M_u)/(v-u)]*(i-u)+M_u

10.根据权利要求1所述的音量自适应调整方法，其特征在于，所述音量偏好特征包括不同位置对应的偏好音量设置和/或不同时间对应的偏好音量设置；

获取当前播放的位置信息和/或时间信息；

11.根据权利要求1所述的音量自适应调整方法，其特征在于，所述用户的音量偏好特征存储于耳机、音频播放设备或云端服务器；

所述调整当前的音频播放音量，包括如下步骤：

12.一种音量自适应调整系统，用于实现权利要求1至11中任一项所述的音量自适应调整方法，其特征在于，所述系统包括：

身份识别模块，用于识别请求播放音频的用户身份；

13.一种音量自适应调整设备，其特征在于，包括：

处理器；

存储器，其中存储有所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至11中任一项所述的音量自适应调整方法的步骤。

14.一种计算机可读存储介质，用于存储程序，其特征在于，所述程序被执行时实现权利要求1至11中任一项所述的音量自适应调整方法的步骤。