CN111128202B

CN111128202B - 声音的处理方法和装置

Info

Publication number: CN111128202B
Application number: CN201911260445.2A
Authority: CN
Inventors: 聂镭; 王竹欣; 聂颖
Original assignee: Longma Zhixin Zhuhai Hengqin Technology Co ltd
Current assignee: Longma Zhixin Zhuhai Hengqin Technology Co ltd
Priority date: 2019-12-10
Filing date: 2019-12-10
Publication date: 2022-09-30
Anticipated expiration: 2039-12-10
Also published as: CN111128202A

Abstract

本申请公开了一种声音的处理方法和装置。该方法包括：采集目标对象发出的音频数据；使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音；基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围；基于目标对象的属性，确定对应的止鼾命令。通过本申请，解决了相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题。

Description

声音的处理方法和装置

技术领域

本申请涉及声音处理技术领域，具体而言，涉及一种声音的处理方法和装置。

背景技术

打鼾是一种常见的生理现象，据统计，大约有20％～40％的人群患有打鼾症状，且随着年龄的增长，人群中患有打鼾症状的人的占比增高，据统计，到60岁，近60％的男性和40％的女性患有打鼾症状。

此外，打鼾也是一种睡眠呼吸障碍最常见的症状，打鼾过程中伴随有鼾声，也即，入睡后从上气道咽部发出的一种粗重鼻息声，通常发生在吸气阶段。而睡眠呼吸障碍表征为病理呼吸事件的频繁发生，例如，呼吸暂停事件，是指至少10s的呼吸完全停止，在此期间，没有呼吸声，呼吸的恢复则与鼾声序列相关联。

大多数人认为打鼾不会对健康造成影响，但长期打鼾或是打鼾严重的人往往都伴有睡眠呼吸暂停综合征，具体地，在睡眠的全过程中出现呼吸暂停，导致血中氧气减少，形成一个短时间的缺氧状态。在该缺氧状态，若打鼾者血液和大脑长期供氧不足，则可能会诱发一些慢性疾病，例如高血压、心肌梗死、心绞痛及脑血管意外等，严重时，如夜间呼吸暂停时间超过120秒，甚至会导致猝死。

成年人和幼童均有可能存在打鼾症状，相对成年人而言，幼童在睡眠过程中如果出现打鼾症状，对身体的危害性往往更大，尤其是对其生长发育有很大的影响。一般而言，健康的幼童不打鼾，幼童打鼾则可能是睡眠呼吸暂停综合征的表现，是身体发出的一种危险信号。

为了消除打鼾症状，相关技术中出现了针对鼾声的止鼾仪器，该类仪器通常是通过对鼾声进行识别，进而进行止鼾操作。在识别鼾声的过程中，止鼾仪器可能将较重的呼吸声以及说话声识别为鼾声，从而提高了误唤醒率。此外，幼童的骨头较软，现有的止鼾仪器接有电源，连接有导线，存在导线缠绕头部，电信号辐射头部的可能性，相关技术中的止鼾仪器对于幼童来说是较为不安全的。

针对相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题，目前尚未提出有效的解决方案。

发明内容

本申请提供一种声音的处理方法和装置，以解决相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题。

根据本申请的一个方面，提供了一种声音的处理方法。该方法包括：采集目标对象发出的音频数据；使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音；基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围；基于目标对象的属性，确定对应的止鼾命令。

可选地，使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音包括：利用声音的能量和过零率对鼾声的声音进行初步检测，得到初步检测结果；使用深度检测模型对初步检测结果进行深度检测，识别出初步检测结果中属于鼾声的声音。

可选地，在使用深度检测模型对初步检测结果进行深度检测，识别出初步检测结果中属于鼾声的声音之前，该方法还包括：采集预定数量的年龄落在目标年龄范围内的多个对象的哭声音频和鼾声音频；利用MFCC特征提取模型提取多个对象的哭声音频的MFCC声学特征，得到提取结果；利用GMM算法处理提取结果，建立深度检测模型。

可选地，基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为未成年人的年龄范围，止鼾命令为播放止鼾音乐，止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放止鼾音乐。

可选地，基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为未成年人的年龄范围，止鼾命令为启动睡眠唤醒装置，唤醒佩戴睡眠唤醒装置的对象，其中，如果检测到鼾声停止，睡眠唤醒装置停止工作。

可选地，基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为成年人的年龄范围，止鼾命令为按照预设的播放频率随机播放内置的止鼾音乐，止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放止鼾音乐。

可选地，基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为成年人的年龄范围，止鼾命令为触发至少一种类型的止鼾设备工作，且按照鼾声的持续时长，控制止鼾设备的工作强度和时长，其中，止鼾设备包括如下至少之一：止鼾枕、止鼾手环。

根据本申请的另一方面，提供了另一种声音的处理方法。该方法包括：在交互界面上显示当前采集到目标对象发出的音频数据；在交互界面上播放音频数据中属于鼾声的声音，其中，使用音频识别模型识别音频数据中的音频特征，并提取到鼾声的声音；在交互界面上显示目标对象所属的年龄范围，其中，基于鼾声的声音，确定目标对象所属的年龄范围；基于目标对象所属的年龄范围，确定对应的止鼾命令。

根据本申请的另一方面，提供了一种声音的处理装置。该装置包括：第一采集单元，用于采集目标对象发出的音频数据；识别单元，用于使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音；第一确定单元，用于基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围；第二确定单元，用于基于目标对象的属性，确定对应的止鼾命令。

根据本申请的另一方面，提供了另一种声音的处理装置。该装置包括：第一显示单元，用于在交互界面上显示当前采集到目标对象发出的音频数据；播放单元，用于在交互界面上播放音频数据中属于鼾声的声音，其中，使用音频识别模型识别音频数据中的音频特征，并提取到鼾声的声音；第二显示单元，用于在交互界面上显示目标对象所属的年龄范围，其中，基于鼾声的声音，确定目标对象所属的年龄范围；第三确定单元，用于基于目标对象所属的年龄范围，确定对应的止鼾命令。

通过本申请，采用以下步骤：采集目标对象发出的音频数据；使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音；基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围；基于目标对象的属性，确定对应的止鼾命令，解决了相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题。通过从目标对象发出的音频数据确定鼾声，并根据鼾声确定目标对象的属性，根据属性确定对应的止鼾命令，进而达到了针对不同年龄段的对象执行合适的止鼾操作的效果。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例提供的声音的处理方法的流程图；

图2是根据本申请实施例提供的另一种声音的处理方法的流程图；

图3是根据本申请实施例提供的声音的处理装置的示意图；以及

图4是根据本申请实施例提供的另一种声音的处理装置的示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请的实施例，提供了一种声音的处理方法。

图1是根据本申请实施例的声音的处理方法的流程图。如图1所示，该方法包括以下步骤：

步骤S101，采集目标对象发出的音频数据。

具体地，目标对象可以为各个年龄段的人员，采集各个年龄段的人员在睡眠中发出的声音，得到音频数据。

此外，由于采集装置采集到的音频中存在有声部分和静默部分，可以将采集到的音频输入VAD检测设备，剔除掉音频中的静默部分，提取有声音的部分，得到有效的音频数据。

步骤S102，使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音。

需要说明的是，由于幼童的哭声和大人鼾声的音频类似，大多止鼾设备容易将小孩哭声识别为鼾声，故导致误识别率较高，因而，本申请实施例中训练音频识别模型，并利用音频识别模型识别音频数据中的鼾声和幼童的哭声。

为了准确地识别出音频数据中属于鼾声的声音，可选地，在本申请实施例提供的声音的处理方法中，使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音包括：利用声音的能量和过零率对鼾声的声音进行初步检测，得到初步检测结果；使用深度检测模型对初步检测结果进行深度检测，识别出初步检测结果中属于鼾声的声音。

具体地，将鼾声分成一段一段来处理，利用声音信号能量和过零率区分清音和浊音区，从背景噪声中分离得到初步判别为鼾声的声音，再将初步判别为鼾声的声音输入深度检测模型的输入，对其进行检测，从中剔除类似鼾声的幼童哭声的声音，得到属于鼾声的声音，降低误识别率。

可选地，在本申请实施例提供的声音的处理方法中，在使用深度检测模型对初步检测结果进行深度检测，识别出初步检测结果中属于鼾声的声音之前，该方法还包括：采集预定数量的年龄落在目标年龄范围内的多个对象的哭声音频和鼾声音频；利用MFCC特征提取模型提取多个对象的哭声音频的MFCC声学特征，得到提取结果；利用GMM算法处理提取结果，建立深度检测模型。

需要说明的是，由于幼童的哭声容易被识别为鼾声，本申请建立深度检测模型，将鼾声从存在幼童哭声的声音中识别出来。

具体的，目标年龄范围可以为6岁以下，采集多个6岁以下的幼童在睡眠中发出的声音，包括哭声和鼾声，利用MFCC(Mel-scsleFrequency Cepstral Coefficients)特征提取方法来提取幼童哭声的MFCC声学特征，得到提取结果，并利用GMM算法(高斯混合模型算法)处理提取结果，建立深度检测模型，从而可以根据深度检测模型将判断为鼾声的哭声识别出来，得到鼾声数据，提高了鼾声识别的准确率。

步骤S103，基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围。

需要说明的是，幼童的鼾声与成年人的鼾声音频有明显的不同，具体地，幼童的鼾声周期较短、且发出的鼾声音频较细，而成年人的鼾声周期较长，且发出的鼾声较粗重，当终端设备接收到鼾声数据时，可以通过鼾声的周期以及音频特定确定发出鼾声的人员的年龄范围。

步骤S104，基于目标对象的属性，确定对应的止鼾命令。

需要说明的是，先通过对鼾声进行深度检测，正确识别出音频数据中的鼾声，并根据鼾声确定采集对象的年龄范围，从而根据不同年龄特点的人员的特定确定不同的止鼾命令，以达到良好止鼾效果。

本申请实施例提供的声音的处理方法，通过采集目标对象发出的音频数据；使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音；基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围；基于目标对象的属性，确定对应的止鼾命令，解决了相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题。通过从目标对象发出的音频数据确定鼾声，并根据鼾声确定目标对象的属性，根据属性确定对应的止鼾命令，进而达到了针对不同年龄段的对象执行合适的止鼾操作的效果。

为了舒缓有效地对未成年人进行止鼾，可选地，在本申请实施例提供的声音的处理方法中，基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为未成年人的年龄范围，止鼾命令为播放止鼾音乐，止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放止鼾音乐。

具体地，在目标对象为未成年人的情况下，可以在止鼾装置中的声音止鼾部件内存储止鼾音乐，在止鼾装置识别到鼾声时，播放止鼾音乐，且在鼾声没有停止的情况下，止鼾音乐的音量逐步变大，为了避免音量太大影响睡眠，在达到一定的音量后，音量不再增大。

同时，在播放止鼾音乐的过程中检测鼾声，在检测不同鼾声的情况下，说明达到了止鼾效果，控制止鼾音乐声即可停止。

此外，需要说明的是，除了在止鼾装置中的声音止鼾部件内存储止鼾音乐，还可以通过根据幼童的个人喜好设定设置声音止鼾方式。

为了达到更好的止鼾效果，可选地，在本申请实施例提供的声音的处理方法中，基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为未成年人的年龄范围，止鼾命令为启动睡眠唤醒装置，唤醒佩戴睡眠唤醒装置的对象，其中，如果检测到鼾声停止，睡眠唤醒装置停止工作。

需要说明的是，为了方便家长观察幼童睡眠的情况，同时幼童佩戴睡眠唤醒装置的风险，可以给家长佩戴睡眠唤醒装置，例如止鼾手环，在检测到幼童的鼾声后，通过睡眠唤醒装置唤醒家长，对幼童的睡姿进行调整，以起到良好的止鼾效果。

为了舒缓有效地对成年人进行止鼾，可选地，在本申请实施例提供的声音的处理方法中，基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为成年人的年龄范围，止鼾命令为按照预设的播放频率随机播放内置的止鼾音乐，止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放止鼾音乐。

具体地，在目标对象为成年人的情况下，止鼾方式可以为声音止鼾，可以在止鼾装置中的声音止鼾部件内存储止鼾音乐，在止鼾装置识别到鼾声时，播放止鼾音乐，且在鼾声没有停止的情况下，止鼾音乐的音量逐步变大，为了避免音量太大影响睡眠，在达到一定的音量后，音量不再增大。

此外，需要说明的是，为了防止人员对同一种止鼾音乐产生免疫，同时增加趣味性，可以在声音止鼾部件内存储多首止鼾音乐，随着打鼾次数随机播放，例如：内部对象一晚上打了5次鼾，每次识别到鼾声后，止鼾音乐随机播放，从而达到有效止鼾的效果。

除了声音止鼾，可以根据需求设置不同的止鼾方式，可选地，在本申请实施例提供的声音的处理方法中，基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为成年人的年龄范围，止鼾命令为触发至少一种类型的止鼾设备工作，且按照鼾声的持续时长，控制止鼾设备的工作强度和时长，其中，止鼾设备包括如下至少之一：止鼾枕、止鼾手环。

需要说明的是，当用户选择声音止鼾以外的止鼾方式时，需要借助其他止鼾设备，如止鼾枕、止鼾手环等。止鼾设备可以设置不同的止鼾等级，等级越高，止鼾设备的幅度越大，止鼾强度越大。例如，若止鼾设备为充放气枕头，当止鼾操作等级为0时，对止鼾设备进行缓慢放气，当等级大于0时，对止鼾设备充气，随着等级的递增，充气的强度越大。

具体地，可以根据鼾声的持续时长控制止鼾设备工作在不同的止鼾等级。例如，在成年人鼾声的持续时长达到预设时长的情况下，可以控制止鼾设备进行等级强度为2等级的止鼾操作，若从2等级的止鼾操作开始的t时间内，依然能检测到鼾声，则开始等级强度为3等级的止鼾操作，以此类推。此外，每个等级操作之间的时间可以设定为固定时长，也可以设置为不固定时长，例如，在固定时长的情况下，可以设置时长为90s。

根据本申请的实施例，提供了另一种声音的处理方法。

图2是根据本申请实施例的声音的处理方法的流程图。如图2所示，该方法包括以下步骤：

步骤S201，在交互界面上显示当前采集到目标对象发出的音频数据。

具体地，目标对象可以为各个年龄段的人员，采集各个年龄段的人员在睡眠中发出的声音，得到音频数据，并在在交互界面上显示。

步骤S202，在交互界面上播放音频数据中属于鼾声的声音，其中，使用音频识别模型识别音频数据中的音频特征，并提取到鼾声的声音。

具体的，目标年龄范围可以为6岁以下，采集多个6岁以下的幼童在睡眠中发出的声音，包括哭声和鼾声，利用MFCC(Mel-scsleFrequency Cepstral Coefficients)特征提取方法来提取幼童哭声的MFCC声学特征，得到提取结果，并利用GMM算法处理提取结果，建立深度检测模型，从而可以根据深度检测模型将判断为鼾声的哭声识别出来，得到鼾声数据，提高了鼾声识别的准确率。

步骤S203，在交互界面上显示目标对象所属的年龄范围，其中，基于鼾声的声音，确定目标对象所属的年龄范围。

需要说明的是，幼童的鼾声与成年人的鼾声音频有明显的不同，具体地，幼童的鼾声周期较短、且发出的鼾声音频较细，而成年人的鼾声周期较长，且发出的鼾声较粗重，当终端设备接收到鼾声数据时，可以通过鼾声的周期以及音频特定确定发出鼾声的人员的年龄范围，并在交互界面上予以显示。

步骤S204，基于目标对象所属的年龄范围，确定对应的止鼾命令。

具体地，在目标对象为未成年人或成年人的情况下，均可以在止鼾装置中的声音止鼾部件内存储止鼾音乐，在止鼾装置识别到鼾声时，播放止鼾音乐，且在鼾声没有停止的情况下，止鼾音乐的音量逐步变大，直至预定音量。

除了声音止鼾，可以根据需求设置不同的止鼾方式，例如，在目标对象为成年人的情况下，可以佩戴止鼾手环等装置。再例如，在目标对象为未成年人的情况下，还可以将止鼾手环佩戴在家长手上，方便家长观察幼童睡眠的情况的同时，并对幼童的睡姿进行调整，以起到良好的止鼾的效果。

本申请实施例提供的声音的处理方法，通过在交互界面上显示当前采集到目标对象发出的音频数据；在交互界面上播放音频数据中属于鼾声的声音，其中，使用音频识别模型识别音频数据中的音频特征，并提取到鼾声的声音；在交互界面上显示目标对象所属的年龄范围，其中，基于鼾声的声音，确定目标对象所属的年龄范围；基于目标对象所属的年龄范围，确定对应的止鼾命令，解决了相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题。通过从目标对象发出的音频数据确定鼾声，并根据鼾声确定目标对象的属性，根据属性确定对应的止鼾命令，进而达到了针对不同年龄段的对象执行合适的止鼾操作的效果。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例还提供了一种声音的处理装置，需要说明的是，本申请实施例的声音的处理装置可以用于执行本申请实施例所提供的用于声音的处理方法。以下对本申请实施例提供的声音的处理装置进行介绍。

图3是根据本申请实施例的声音的处理装置的示意图。如图3所示，该装置包括：第一采集单元31、识别单元32、第一确定单元33和第二确定单元34。

具体地，第一采集单元31，用于采集目标对象发出的音频数据。

识别单元32，用于使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音。

第一确定单元33，用于基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围。

第二确定单元34，用于基于目标对象的属性，确定对应的止鼾命令。

可选地，在本申请实施例提供的声音的处理装置中，识别单元32包括：第一检测模块，用于利用声音的能量和过零率对鼾声的声音进行初步检测，得到初步检测结果；第二检测模块，用于使用深度检测模型对初步检测结果进行深度检测，识别出初步检测结果中属于鼾声的声音。

可选地，在本申请实施例提供的声音的处理装置中，该装置还包括：第二采集单元，用于在使用深度检测模型对初步检测结果进行深度检测，识别出初步检测结果中属于鼾声的声音之前，采集预定数量的年龄落在目标年龄范围内的多个对象的哭声音频和鼾声音频；提取单元，用于利用MFCC特征提取模型提取多个对象的哭声音频的MFCC声学特征，得到提取结果；去除单元，用于处理单元，用于利用GMM算法处理提取结果，建立深度检测模型。

可选地，在本申请实施例提供的声音的处理装置中，第二确定单元34包括：第一确定模块，用于在目标对象的年龄范围为未成年人的年龄范围，且小于预设年龄的情况下，确定止鼾命令为播放止鼾音乐，止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放止鼾音乐。

可选地，在本申请实施例提供的声音的处理装置中，第二确定单元34还包括：第二确定模块，用于在目标对象的年龄范围为未成年人的年龄范围，且小于预设年龄的情况下，确定止鼾命令为启动睡眠唤醒装置，唤醒佩戴睡眠唤醒装置的对象，其中，如果检测到鼾声停止，睡眠唤醒装置停止工作。

可选地，在本申请实施例提供的声音的处理装置中，第二确定单元34还包括：第三确定模块，用于在目标对象的年龄范围为成年人的年龄范围的情况下，确定止鼾命令为按照预设的播放频率随机播放内置的止鼾音乐，止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放止鼾音乐。

可选地，在本申请实施例提供的声音的处理装置中，第二确定单元34还包括：第四确定模块，用于在目标对象的年龄范围为成年人的年龄范围的情况下，确定止鼾命令为触发至少一种类型的止鼾设备工作，且按照鼾声的持续时长，控制止鼾设备的工作强度和时长，其中，止鼾设备包括如下至少之一：止鼾枕、止鼾手环。

本申请实施例提供的声音的处理装置，通过第一采集单元31，用于采集目标对象发出的音频数据；识别单元32，用于使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音；第一确定单元33，用于基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围；第二确定单元34，用于基于目标对象的属性，确定对应的止鼾命令，解决了相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题，通过从目标对象发出的音频数据确定鼾声，并根据鼾声确定目标对象的属性，根据属性确定对应的止鼾命令，进而达到了针对不同年龄段的对象执行合适的止鼾操作的效果。

图4是根据本申请实施例的声音的处理装置的示意图。如图4所示，该装置包括：第一显示单元41、播放单元42、第二显示单元43和第三确定单元44。

具体地，第一显示单元41，用于在交互界面上显示当前采集到目标对象发出的音频数据。

播放单元42，用于在交互界面上播放音频数据中属于鼾声的声音，其中，使用音频识别模型识别音频数据中的音频特征，并提取到鼾声的声音。

第二显示单元43，用于在交互界面上显示目标对象所属的年龄范围，其中，基于鼾声的声音，确定目标对象所属的年龄范围。

第三确定单元44，用于基于目标对象所属的年龄范围，确定对应的止鼾命令。

本申请实施例提供的声音的处理装置，通过第一显示单元41，用于在交互界面上显示当前采集到目标对象发出的音频数据；播放单元42，用于在交互界面上播放音频数据中属于鼾声的声音，其中，使用音频识别模型识别音频数据中的音频特征，并提取到鼾声的声音；第二显示单元43，用于在交互界面上显示目标对象所属的年龄范围，其中，基于鼾声的声音，确定目标对象所属的年龄范围；第三确定单元44，用于基于目标对象所属的年龄范围，确定对应的止鼾命令，解决了相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题，通过从目标对象发出的音频数据确定鼾声，并根据鼾声确定目标对象的属性，根据属性确定对应的止鼾命令，进而达到了针对不同年龄段的对象执行合适的止鼾操作的效果。

所述声音的处理装置包括处理器和存储器，上述第一采集单元31、识别单元32、第一确定单元33和第二确定单元34等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来解决相关技术中无法针对不同年龄段的对象执行合适的止鼾操作的问题。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

本发明实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现所述声音的处理方法。

本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行所述声音的处理方法。

本发明实施例提供了一种设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行程序时实现以下步骤：采集目标对象发出的音频数据；使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音；基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围；基于目标对象的属性，确定对应的止鼾命令。

使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音包括：利用声音的能量和过零率对鼾声的声音进行初步检测，得到初步检测结果；使用深度检测模型对初步检测结果进行深度检测，识别出初步检测结果中属于鼾声的声音。

在使用深度检测模型对初步检测结果进行深度检测，识别出初步检测结果中属于鼾声的声音之前，该方法还包括：采集预定数量的年龄落在目标年龄范围内的多个对象的哭声音频和鼾声音频；利用MFCC特征提取模型提取多个对象的哭声音频的MFCC声学特征，得到提取结果；利用GMM算法处理提取结果，建立深度检测模型。

基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为未成年人的年龄范围，止鼾命令为播放止鼾音乐，止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放止鼾音乐。

基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为未成年人的年龄范围，止鼾命令为启动睡眠唤醒装置，唤醒佩戴睡眠唤醒装置的对象，其中，如果检测到鼾声停止，睡眠唤醒装置停止工作。

基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为成年人的年龄范围，止鼾命令为按照预设的播放频率随机播放内置的止鼾音乐，止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放止鼾音乐。

基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为成年人的年龄范围，止鼾命令为触发至少一种类型的止鼾设备工作，且按照鼾声的持续时长，控制止鼾设备的工作强度和时长，其中，止鼾设备包括如下至少之一：止鼾枕、止鼾手环。本文中的设备可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序：采集目标对象发出的音频数据；使用音频识别模型识别音频数据中的音频特征，提取属于鼾声的声音；基于鼾声的声音，确定目标对象的属性，属性包括：目标对象的年龄范围；基于目标对象的属性，确定对应的止鼾命令。

基于目标对象的属性，确定对应的止鼾命令包括：如果目标对象的年龄范围为成年人的年龄范围，止鼾命令为触发至少一种类型的止鼾设备工作，且按照鼾声的持续时长，控制止鼾设备的工作强度和时长，其中，止鼾设备包括如下至少之一：止鼾枕、止鼾手环。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种声音的处理方法，其特征在于，包括：

采集目标对象发出的音频数据；

使用音频识别模型识别所述音频数据中的音频特征，提取属于鼾声的声音；

基于所述鼾声的声音，确定所述目标对象的属性，所述属性包括：所述目标对象的年龄范围；

基于所述目标对象的属性，确定对应的止鼾命令，其中，如果所述目标对象的年龄范围为未成年人的年龄范围，所述止鼾命令为播放止鼾音乐，所述止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放所述止鼾音乐。

2.根据权利要求1所述的方法，其特征在于，使用音频识别模型识别所述音频数据中的音频特征，提取属于鼾声的声音包括：

利用声音的能量和过零率对所述鼾声的声音进行初步检测，得到初步检测结果；

使用深度检测模型对所述初步检测结果进行深度检测，识别出所述初步检测结果中属于所述鼾声的声音。

3.根据权利要求2所述的方法，其特征在于，在使用深度检测模型对所述初步检测结果进行深度检测，识别出所述初步检测结果中属于所述鼾声的声音之前，所述方法还包括：

采集预定数量的年龄落在目标年龄范围内的多个对象的哭声音频和鼾声音频；

利用MFCC特征提取模型提取所述多个对象的哭声音频的MFCC声学特征，得到提取结果；

利用GMM算法处理所述提取结果，建立所述深度检测模型。

4.根据权利要求1所述的方法，其特征在于，基于所述目标对象的属性，确定对应的止鼾命令包括：

如果所述目标对象的年龄范围为未成年人的年龄范围，所述止鼾命令为启动睡眠唤醒装置，唤醒佩戴所述睡眠唤醒装置的对象，其中，如果检测到鼾声停止，所述睡眠唤醒装置停止工作。

5.根据权利要求1所述的方法，其特征在于，基于所述目标对象的属性，确定对应的止鼾命令包括：

如果所述目标对象的年龄范围为成年人的年龄范围，所述止鼾命令为按照预设的播放频率随机播放内置的止鼾音乐，所述止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放所述止鼾音乐。

6.根据权利要求1所述的方法，其特征在于，基于所述目标对象的属性，确定对应的止鼾命令包括：

如果所述目标对象的年龄范围为成年人的年龄范围，所述止鼾命令为触发至少一种类型的止鼾设备工作，且按照鼾声的持续时长，控制所述止鼾设备的工作强度和时长，其中，所述止鼾设备包括如下至少之一：止鼾枕、止鼾手环。

7.一种声音的处理方法，其特征在于，包括：

在交互界面上显示当前采集到目标对象发出的音频数据；

在所述交互界面上播放所述音频数据中属于鼾声的声音，其中，使用音频识别模型识别所述音频数据中的音频特征，并提取到所述鼾声的声音；

在所述交互界面上显示所述目标对象所属的年龄范围，其中，基于所述鼾声的声音，确定所述目标对象所属的年龄范围；

基于所述目标对象所属的年龄范围，确定对应的止鼾命令，其中，如果所述目标对象的年龄范围为未成年人的年龄范围，所述止鼾命令为播放止鼾音乐，所述止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放所述止鼾音乐。

8.一种声音的处理装置，其特征在于，包括：

第一采集单元，用于采集目标对象发出的音频数据；

识别单元，用于使用音频识别模型识别所述音频数据中的音频特征，提取属于鼾声的声音；

第一确定单元，用于基于所述鼾声的声音，确定所述目标对象的属性，所述属性包括：所述目标对象的年龄范围；

第二确定单元，用于基于所述目标对象的属性，确定对应的止鼾命令，其中，如果所述目标对象的年龄范围为未成年人的年龄范围，所述止鼾命令为播放止鼾音乐，所述止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放所述止鼾音乐。

9.一种声音的处理装置，其特征在于，包括：

第一显示单元，用于在交互界面上显示当前采集到目标对象发出的音频数据；

播放单元，用于在所述交互界面上播放所述音频数据中属于鼾声的声音，其中，使用音频识别模型识别所述音频数据中的音频特征，并提取到所述鼾声的声音；

第二显示单元，用于在所述交互界面上显示所述目标对象所属的年龄范围，其中，基于所述鼾声的声音，确定所述目标对象所属的年龄范围；

第三确定单元，用于基于所述目标对象所属的年龄范围，确定对应的止鼾命令，其中，如果所述目标对象的年龄范围为未成年人的年龄范围，所述止鼾命令为播放止鼾音乐，所述止鼾音乐按照预设音量设置逐步变大，且在达到预定音量的情况下保持不变，其中，如果检测到鼾声停止，停止播放所述止鼾音乐。