WO2023240512A1

WO2023240512A1 - 跌倒检测方法、装置、耳机及存储介质

Info

Publication number: WO2023240512A1
Application number: PCT/CN2022/099024
Authority: WO
Inventors: 周岭松
Original assignee: 北京小米移动软件有限公司; 北京小米松果电子有限公司
Priority date: 2022-06-15
Filing date: 2022-06-15
Publication date: 2023-12-21
Also published as: CN117597065A

Abstract

本申请公开一种跌倒检测方法、装置、耳机及存储介质。跌倒检测方法应用于耳机，耳机包括反馈麦克风，方法包括:通过反馈麦克风采集耳道内的音频信号，得到耳道音频信号，耳道音频信号包括:当耳机处于被用户佩戴的状态下，用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号（S100）；对耳道音频信号进行特征提取，得到音频信号特征参数（S200）；根据预设频率范围对耳道音频信号进行滤波，得到预设频率范围的周期信号，周期信号中包括波形的峰值或谷值（S300）；根据音频信号特征参数以及峰值或者谷值的数量，生成待识别特征（S400）；将待识别特征输入至跌倒检测模型，得到检测结果，检测结果至少用于表示用户发生跌倒（S500）。

Description

跌倒检测方法、装置、耳机及存储介质

技术领域

本公开涉及信息处理技术领域但不限于信息处理技术领域，尤其涉及一种跌倒检测方法、装置、耳机及存储介质。

背景技术

随着技术的发展，在各个应用场景中出现了越来越多的电子设备，不同的电子设备在对应的应用场景中可以实现不同的功能。

随着健康监测设备的广泛应用，通过健康监测设备可以检测到被检测对象的健康状态。例如，对目标人群的跌倒检测，通过在目标人群身体上佩戴相应的传感器，或者让目标人群穿戴具有相应传感器的服饰等，根据传感器检测的信号确定目标人群是否跌倒。目标人群可以包括老人和行动不便的人群等。

发明内容

本公开实施例提供一种跌倒检测方法、装置、耳机及存储介质。

本公开实施例第一方面提供一种跌倒检测方法，应用于耳机，所述耳机包括反馈麦克风，所述方法包括：

通过所述反馈麦克风采集耳道内的音频信号，得到耳道音频信号；其中，所述耳道音频信号包括：当所述耳机处于被用户佩戴的状态下，所述用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号；

对所述耳道音频信号进行特征提取，得到音频信号特征参数；

根据预设频率范围对所述耳道音频信号进行滤波，得到所述预设频率范围的周期信号；其中，所述周期信号中包括波形的峰值或谷值；

根据所述音频信号特征参数以及所述峰值或者所述谷值的数量，生成待识别特征；

将所述待识别特征输入至跌倒检测模型，得到检测结果；其中，所述检测结果用于表示所述用户发生跌倒。

本公开实施例第二方面提供一种跌倒检测装置，应用于耳机，所述耳机包括反馈麦克风，所述装置包括：

耳道音频信号检测模块，被配置为通过所述反馈麦克风采集耳道内的音频信号，得到耳道音频信号；其中，所述耳道音频信号包括：当所述耳机处于被用户佩戴的状态下，所述用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号；

音频信号特征参数获取模块，被配置为对所述耳道音频信号进行特征提取，得到音频信号特征参数；

周期信息确定模块，被配置为根据预设频率范围对所述耳道音频信号进行滤波，得到所述预设频率范围的周期信号；其中，所述周期信号中包括波形的峰值或谷值；

待识别特征生成模块，被配置为根据所述音频信号特征参数以及所述峰值或所述谷值的数量，生成待识别特征；

检测模块，被配置为将所述待识别特征输入至跌倒检测模型，得到检测结果；其中，所述检测结果用于表示所述用户发生跌倒。

本公开实施例第三方面提供一种耳机，所述耳机包括壳体以及设置于所述壳体上的控制器、反馈麦克风、前馈麦克风和扬声器；所述前馈麦克风与所述控制器连接，用于采集耳道外音频数据并发送给所述控制器；所述反馈麦克风与所述控制器连接，用于采集耳道内音频数据并发送给所述控制器；所述控制器包括存储器和处理器，所述存储器上存储有可执行的计算机指令，所述处理器能够调用所述存储器上存储的计算机指令，以执行上述任意一实施例所述的方法。

本公开实施例第四方面提供一种计算机存储介质，所述计算机存储介质存储有可执行程序；所述可执行程序被处理器执行后，能够实现前述的第一方面提供的跌倒检测方法。

本公开实施例提供的跌倒检测方法可以应用于耳机，通过耳机即可确定出用户的是否跌倒，无需其他检测传感器，从而提高了检测用户跌倒的便利性，提高了用户的使用体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开实施例。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明实施例，并与说明书一起用于解释本发明实施例的原理。

图1是根据一示例性实施例示出的一种耳机的示意图；

图2是根据一示例性实施例示出的一种耳机的示意图；

图3是根据一示例性实施例示出的一种耳机处于被用户佩戴状态时的示意图；

图4是根据一示例性实施例示出的另一种跌倒检测方法的示意图；

图5是根据一示例性实施例示出的一种周期信号的示意图；

图6是根据一示例性实施例示出的一种跌倒检测装置的示意图；

图7是根据一示例性实施例示出的一种电子设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明实施例相一致的所有实施方式。相反，它们仅是本发明实施例的一些方面相一致的装置和方法的例子。

在本公开实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开实施例。在本公开所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

通常情况下，对老人或者腿部功能出现异常等行动不便的人的人群进行跌倒检测，是通过多个传感器进行检测的。例如，在这些人群的身体上部署多个加速度传感器，或者这些人群穿戴配备有加速度传感器的服饰等，根据加速度传感器检测的信号的变化信息确定相关用户是否跌倒。

由于这些用户本身行动不便，通过该方法在这些用户身上再增加多个传感器进而会对这些用户产生影响，带来不适感并且导致行动更加不便。

参考图1，其示出了本公开实施例提供的一种跌倒检测方法的示意图，该方法至少可以应用于耳机，该耳机至少可以包括反馈麦克风。

如图1所示，该方法包括：

步骤S100，通过反馈麦克风采集耳道内的音频信号，得到耳道音频信号；其中，耳道音频信号包括：当耳机处于被用户佩戴的状态下，用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号。

步骤S200，对耳道音频信号进行特征提取，得到音频信号特征参数。

步骤S300，根据预设频率范围对耳道音频信号进行滤波，得到预设频率范围的周期信号；其中，周期信号中包括波形的峰值或谷值。

步骤S400，根据音频信号特征参数以及峰值或者谷值的数量，生成待识别特征。

步骤S500，将待识别特征输入至跌倒检测模型，得到检测结果；其中，检测结果至少用于表示用户发生跌倒。

耳机可以是不同形状的耳机，包括入耳式、半入耳式和头戴式等不同形式的耳机。耳机的通信方式可以包括有线耳机和无线耳机，无线耳机可以包括蓝牙耳机，例如真无线立体声耳机(True Wireless Stereo，TWS)。耳机还可以包括助听器等具有反馈麦克风并且能够实现该方案的设备。

耳机中的反馈麦克风可以位于耳机的出音通道附近，耳机处于佩戴状态时，反馈麦克风位于耳道内，可以采集耳道内的音频信号，例如入耳式耳机。在耳机为其他形式的耳机时，如半入耳式耳机和头戴式耳机等，在耳机处于佩戴状态时反馈麦克风能够采集耳道内的音频信号即可。

参考图2，为一种耳机的示意图，包括反馈麦克风A，在耳机处于佩戴状态时，该反馈麦克风A可以位于耳道内。该耳机还可以包括前馈麦克风B，前馈麦克风B可以位于耳机柄上，在耳机处于佩戴状态时，前馈麦克风位于耳道外，可以采集外部环境的环境音频信号。耳机还可以包括通话麦克风C，在通话状态下采集用户发出的音频信号。反馈麦克风A比前馈麦克风B采集到的音频信号的信噪比更高，所以通过反馈麦克风A采集到噪声更少、质量更高的耳道音频信号。

在耳机为头戴式耳机时，也会形成一定程度的堵耳效应，在耳机处于佩戴状态时，反馈麦克风A可以位于耳道外或者朝向耳道，能够采集耳道音频信号即可。

参考图3，为一种耳机处于被用户佩戴状态时的示意图，耳机1对耳道2形成一定程度的堵塞，形成堵耳效应。反馈麦克风采集的耳道音频信号包括：当耳机处于被用户佩戴的状态下，用户在呼吸过程中产生的震动通过骨传导方式被传递至耳道而产生的音频信号，即音频信号3。

对于步骤S100，在耳机处于佩戴状态时，对耳道产生一定的堵塞，形成一定程度的堵耳效应，产生原因是有部分声音会经人的骨头传导到内耳，例如，由于走路时脚部会与地面接触产生震动，震动通过骨传导的方式传递至耳道的音频信号。在耳机未处于佩戴状态时，骨传导来的声音一部分经外耳向外扩散，但是在耳机处于佩戴状态时，耳道在一定程度上被堵住，减少了骨传导来的声音通过耳道向外扩散的扩散量，形成一定程度的堵耳效应，也称闭塞效应。闭塞效应产生的声音特性表现为低频信号加强、高频信号衰弱。

由于耳机对耳道产生一定的堵塞，形成不同程度的堵耳效应，在产生堵耳效应后，耳机阻挡了外界音频信号进入耳道，减少了外界音频信号对耳道内音频信号的影响。反馈麦克风可以采集耳道内的音频信号得到呼吸音频信号，该呼吸音频信号包括当耳机处于被用户佩戴的状态下，用户在走路时脚部会与地面接触产生的震动通过骨传导方式被传递至耳道而产生的音频信号。

在形成一定程度的堵耳效应后，用户在走路时脚部会与地面接触产生的震动可以通过骨传导至耳道，产生音频信号，堵耳效应可以放大该音频信号，从而可以便于反馈麦克风采集耳道内的音频信号，得到耳道音频信号。

对于步骤S200，在得到耳道音频信号后，可以对耳道音频信号进行特征提取，得到音频信号特征参数。特征提取方式可以包括多种，例如通过特征提取算法提取相应的特征，得到的音频信号特征参数可以是梅尔谱系数和梅尔倒谱系数(MFCC)等，梅尔谱系数和梅尔倒谱系数都可以是40维的特征参数。当然还可以是耳道音频信号的其他特征。

在耳道音频信号不同时，对应的音频信号特征也会不同，不同的耳道音频信号具有各自的音频信号特征。在用户跌倒时身体与地面接触产生的震动通过骨传导方式被传递至耳道而产生的音频信号的音频信号特征，不同于用户在非跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号的音频信号特征，也不同于其他震动通过骨传导方式被传递至耳道而产生的音频信号的音频信号特征，例如，说话声、外界环境声音的信号的音频信号特征。

对于步骤S300，在得到耳道音频信号后，可以根据预设频率范围对耳道音频信号进行滤波，得到预设频率范围的周期信号，在该周期信号中包括波形的峰值。预设频率范围可以根据实际的使用需求确定，也可以是预设的。也可以根据预设数量的用户走路的步频确定。例如，预设频率范围可以是1Hz至50Hz，根据预设频率范围对耳道音频信号进行低通滤波。

根据预设频率范围，将耳道音频信号中预设频率范围之外的音频信号滤除，得到频率在预设频率范围之内的音频信号，预设频率范围之内的音频信号可以是周期信号，该周期信号可以是时域内的信号。

在该周期信号以波形的形式表示，包括时间和振幅的关系，根据周期信号可以确定出波形中波峰的峰值。波形中波峰的峰值表示在该峰值对应的时间用户的脚部与地面接触，一个峰值表示脚部与地面接触一次。根据峰值的数量可以确定出用户所走的步数。

根据周期信号可以确定出波形中波谷的谷值。波形中波谷的谷值表示在该谷值对应的时间用户的脚部与地面接触，一个谷值表示脚部与地面接触一次。根据谷值的数量可以确定出用户所走的步数。

步骤S200和步骤S300之间并没有必然的先后顺序关系，可以先执行步骤S200，也可以先执行步骤S300。

对于步骤S400，在确定出峰值或者谷值的数量以及音频信号特征参数后，可以根据峰值的数量和音频信号特征参数生成待识别特征，也可以根据谷值的数量和音频信号特征参数生成待识别特征。例如可以将峰值的数量和音频信号特征参数共同作为一个待识别特征，待识别特征中包括峰值的数量和音频信号特征参数两个维度的信息，用于确定检测结果。还可以将谷值的数量和音频信号特征参数共同作为一个待识别特征，待识别特征中包括谷值的数量和音频信号特征参数两个维度的信息，用于确定检测结果。

峰值的数量和/或音频信号特征参数不同时，得到的待识别特征不同。谷值的数量和/或音频信号特征参数不同时，得到的待识别特征不同。在峰值的数量和音频信号特征参数中的至少一个发生变化时，待识别特征则发生变化。谷值的数量和音频信号特征参数中的至少一个发生变化时，待识别特征则发生变化。这样可以减少在峰值的数量和音频信号特征参数同时发生变化时，或谷值的数量和音频信号特征参数同时发生变化时，得到的待识别特征不变的情况，从而可以提高检测结果的准确度。

对于步骤S500，将待识别特征输入至跌倒检测模型，得到检测结果。该检测结果至少用于表示用户发生跌倒。跌倒检测模型为提前训练完成的检测模型。

由于当耳机处于被用户佩戴的状态下，用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号的音频信号特征，不同于其他音频信号的音频信号特征，并且对应的周期信号中峰值或者谷值的数量也不同，所以将待识别特征输入至跌倒检测模型可以确定出用户是否跌倒。

当然还可以通过其他方式确定，如映射表等，映射表中包括待识别特征和检测结果之间的映射关系，通过查找映射表，根据待识别特征可以确定检测结果。

本公开示例通过耳机可以获取用户的耳道音频信号，然后对耳道音频信号进行处理，并利用跌倒检测模型检测用户是否跌倒。利用已有的内置麦克风，无需新的硬件成本，无需使用其他各种传感器等监测设备，通过耳机即可确定出用户是否跌倒。降低了检测用户跌倒的难度和不便性，提高了检测用户跌倒的便利性，同时减少了在检测用户跌倒的过程给用户带来的不适感和不便性，提高了用户的使用体验。

在另一实施例中，在耳道音频信号中不包括当所述耳机处于被用户佩戴的状态下，所述用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号时，则通过步骤S200至S500的步骤，可以得到表示用户未跌倒的检测结果，此时可以输出该检测结果。

在一个实施例中，参考图4，图4为另一种跌倒检测方法的示意图。该方法还包括：

步骤S10，根据预设步数对应的时长确定至少一帧周期信号的目标帧长。

步骤S20，在目标帧长内确定出各帧周期信号中包括的峰值或者谷值的数量；其中，每一步对应一个峰值或谷值。

在生成待识别特征之前，还需求确定出峰值或者谷值的数量，可以根据预设步数对应的时长确定出至少一帧周期信号的目标帧长。预设步数可以根据实际的应用需求确定，例如可以是两步的时长，三步的时长或四步的时长等。预设步数对应的时长可以是以秒为单位，将预设步数对应的时长确定为一帧周期信号的目标帧长，也可以将预设步数对应的时长确定为N帧周期信号的目标帧长。在该实施例中，以N等于1，即预设步数对应的时长确定一帧周期信号的目标帧长为例，这样可以提高确定峰值或谷值的数量的准确度和便利性。

在确定目标帧长后，可以在目标帧长内确定出各帧周期信号中包括的峰值或者谷值的数量。由于周期信号以波形的形式表示，所以也可以根据周期信号确定出波形的波峰或波谷，根据波峰即可确定出波峰的峰值，根据波谷接口确定出波谷的谷值。根据目标帧长，确定出目标帧长内峰值或谷值的数量。每一步对应一个峰值或谷值，由于用户的脚部与地面接触时产生震动，音频信号的强度比脚部未与地面接触时对应的音频信号的强度大，所以目标帧长内峰值或谷值的数量可以表示用户所走的步数，即用户的脚部与地面的接触次数。

通过该方法可以确定出每一帧周期信号内对应的峰值或谷值的数量。

确定峰值的数量可以通过峰值检测算法对各帧周期信号进行检测，确定出各帧周期信号中的峰值。谷值的数量可以通过谷值检测算法对各帧周期信号进行检测，确定出各帧周期信号中的谷值。峰值检测算法可以检测出周期信号中波形的波峰，进而确定出对应的峰值，谷值检测算法可以检测出周期信号中波形的波谷，进而确定出对应的谷值。

在另一实施例中，步骤S400，可以根据一帧周期信号内峰值的数量生成待识别特征，也可以根据多帧周期信号内峰值的数量生成待识别特征。例如，可以根据多帧连续的周期信号内峰值的数量的平均值和音频信号特征参数生成待识别特征。

根据多帧周期信号内峰值的数量生成待识别特征，这样可以减少个别少数帧的周期信号内峰值出现异常时对峰值的数量产生的影响，从而减少对待识别特征的影响，减少对检测结果的影响，提高检测结果的准确度。

参考图5，图5为一种周期信号的示意图。图5示出的周期信号为根据预设频率范围，对在未跌倒的情况下，正常走路对应音频信号进行滤波后得到的周期信号。图5中每个目标帧长都为两步对应的时长，时长为1秒。在振幅的正方向上，每个周期信号在目标帧长内包括三个峰值，以最左边一个目标帧长对应的周期信号为例，每个峰值表示脚部与地面接触，表示用户在通过脚部进行移动，最左边一个峰值至中间一个峰值的时长则为第一步的时长，中间峰值至最右边一个峰值的时长为下一步的时长。

图5中每个目标帧长内对应的波峰的峰值或者波谷的谷值用圆点表示，通过相应的检测算法可以确定出圆点表示的峰值或者谷值。

在另一实施例中，对于耳道音频信号中包括当所述耳机处于被用户佩戴的状态下，所述用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号时，由于跌倒时身体的多个部位会与地面接触碰撞，则在目标帧长每个周期信号中内包括峰值或谷值的数量多于未跌倒正常走路时对应峰值或谷值的数量。

根据图5可以得出，在未跌倒正常走路时对应的波峰或者波谷呈周期性，具有一定的规律，各个峰值之间的差值保持在一定的范围之内，各个峰值的大小相近，不会出现忽大忽小的情况。在跌倒时，身体多个不同部位与地面碰撞对应的波峰或者波谷则呈不规则状态，对应的峰值或者谷值也是不规则的。不同部位与地面的碰撞力度也不同，导致对应波峰的峰值或者波谷的谷值也不同。

在另一实施例中，跌倒检测模型为预先采用机器学习的方式基于跌倒信息训练样本集对初始神经网络模型进行训练得到。初始神经网络模型的结构并不进行限定，在通过机器学习的方式通过训练样本集进行训练后，能够根据待识别特征输出识别结果即可。

在一个实施例中，训练样本集包括正样本集，正样本集包括多个正样本。每个正样本包括：目标碰撞的音频特征、第一数量和第一标签。

目标碰撞的音频特征为耳机处于被用户佩戴的状态下，用户在跌倒时身体与地面碰撞产生碰撞时，通过反馈麦克风采集耳道内的音频信号得到的音频特征。在耳机中反馈麦克风采集到耳道内低音频信号后，耳机可以对采集的音频信号进行特征提取，得到目标碰撞的音频特征。

第一数量为：根据预设频率范围对目标碰撞的音频特征进行滤波后，得到的预设频率范围的周期信号中包括的波形中峰值或谷值的数量。

第一标签用于表示目标碰撞的音频特征和第一数量对应所述初始神经网络模型的输出。

将正样本集中的各个正样本输入至初始神经网络模型中，第一标签作为初始神经网络的输出，训练初始神经网络模型，得到跌倒检测模型。正样本集中正样本的数量可以根据实际需求进行确定，数量越多，训练得到的跌倒检测模型的检测准确度越高。

目标碰撞的音频特征可以包括梅尔谱特征参数和梅尔倒谱特征参数等，梅尔谱系数和梅尔倒谱系数都可以是40维的系数。

在另一实施例中，不同正样本包括的目标碰撞的音频特征，对应的用户跌倒时身体与地面发生碰撞的姿势和/或碰撞次数不同。

每个正样本可以是不同用户在不同的跌倒姿势时，身体的不同部位与地面发生碰撞的音频信号的音频特征，并且不同的正样本包括的目标碰撞的音频特征对应的用户跌倒时身体与地面发生碰撞的姿势、与地面发生碰撞的部位和/或碰撞次数不同。

每个正样本也可以是同一用户在不同的跌倒姿势时，身体的不同部位与地面发生碰撞的音频信号的音频特征，并且不同的正样本包括的目标碰撞的音频特征对应的用户跌倒时身体与地面发生碰撞的姿势、与地面发生碰撞的部位和/或碰撞次数不同。

例如，正样本1包括的音频特征为用户1以姿态1跌倒时身体与地面发生碰撞的音频特征，用户1以姿态1跌倒时身体不同部位与地面发生碰撞的次数为次数1，与地面发生碰撞的部位边框手部和膝盖部位。正样本2包括的音频特征为用户2以姿态2跌倒时身体与地面发生碰撞的音频特征，用户2以姿态2跌倒时身体不同部位与地面发生碰撞的次数为次数2，与地面发生碰撞的部位包括手部和臀部。正样本3包括的音频特征为用户1以姿态2跌倒时身体与地面发生碰撞的音频特征，用户1以姿态2跌倒时身体不同部位与地面发生碰撞的次数为次数3，与地面发生碰撞的部位包括背部和头部。

在另一实施例中，第一数量为在目标帧长内的峰值或谷值的数量。正样本中对应第一数量和生成待识别特征的峰值或谷值的数量都是在相同的帧长内确定的，这样可以减少变量，提高检测的准确度。

在一个实施例中，训练样本集还包括负样本集，负样本集包括多个负样本。每个负样本包括：非目标碰撞的音频特征、第二数量和第二标签。

非目标碰撞的音频特征为耳机处于被用户佩戴的状态下，用户在除了跌倒时身体与地面碰撞产生碰撞以外的情况下，通过反馈麦克风采集耳道内的音频信号得到的音频特征。

第二数量为：根据预设频率范围对非目标碰撞的音频特征进行滤波后，得到的预设频率范围的周期信号中包括的波形的峰值或谷值的数量。

第二标签用于表示非目标碰撞的音频特征和第二数量对应的初始神经网络模型的输出。

负样本包括的音频特征与正样本包括的音频特征不同，正样本包括的是反馈麦克风采集的各种跌倒状态下身体与地面碰撞的音频信号的音频特征，负样本包括的是反馈麦克风采集的非跌倒状态下，耳道内的各种音频信号的音频特征。非跌倒状态下，耳道内的音频信号可以包括环境音频、说话的音频以及用户的其他交互操作产生的音频的音频特征，这些音频特征与正样本包括的目标碰撞的音频特征不同。

将负样本集中的各个负样本输入至初始神经网络模型中，第二标签作为初始神经网络的输出，训练初始神经网络模型，得到跌倒检测模型。负样本集中负样本的数量可以根据实际需求进行确定，数量越多，训练得到的跌倒检测模型的检测准确度越高。

非目标碰撞的音频特征可以包括梅尔谱特征参数和梅尔倒谱特征参数等，梅尔谱系数和梅尔倒谱系数都可以是40维的系数。

在另一实施例中，第二数量为在目标帧长内的峰值或谷值的数量。负样本中对应第二数量和生成待识别特征的峰值或谷值的数量都是在相同的帧长内确定的，这样可以减少变量，提高检测的准确度。

利用正样本和负样本训练初始神经网络模型，得到跌倒检测模型，提高了跌倒检测模型的检测能力，得到的检测结果更加准确。

在另一实施例中，跌倒检测方法还包括：

在检测结果为表示用户跌倒的检测结果时，向与耳机建立有通信连接的预设设备发送提示信息。预设设备可以是手机、平板电脑等设备，还可以是与被检测用户具有社交关系的用户持有的设备。例如，用户为老人，则预设设备可以是看护人员的电子设备

向与耳机建立有通信连接的预设设备发送提示信息，以便通知相关人员，从而有利对用户进行帮助。

提示信息可以弹窗消息、声音提示信息或者短消息等。

在另一实施例中，参考图6，为一种跌倒检测装置的示意图，其中，应用于耳机，耳机包括反馈麦克风，所述装置包括：

耳道音频信号检测模块1，被配置为通过所述反馈麦克风采集耳道内的音频信号，得到耳道音频信号；其中，所述耳道音频信号包括：当所述耳机处于被用户佩戴的状态下，所述用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号；

音频信号特征参数获取模块2，被配置为对所述耳道音频信号进行特征提取，得到音频信号特征参数；

周期信号确定模块3，被配置为根据预设频率范围对所述耳道音频信号进行滤波，得到所述预设频率范围的周期信号；其中，所述周期信号中包括波形的峰值或谷值；

待识别特征生成模块4，被配置为根据所述音频信号特征参数以及所述峰值或所述谷值的数量，生成待识别特征；

检测模块5，被配置为将所述待识别特征输入至跌倒检测模型，得到检测结果；其中，所述检测结果至少用于表示所述用户发生跌倒。

在另一实施例中，所述装置还包括：

目标帧长确定模块，被配置为根据预设步数对应的时长确定至少一帧所述周期信号的目标帧长；

数量确定模块，被配置为在所述目标帧长内确定出各帧所述周期信号中包括的所述峰值或者所述谷值的数量；其中，每一步对应一个所述峰值或所述谷值。

在另一实施例中，所述跌倒检测模型为预先采用机器学习的方式基于跌倒信息训练样本集对初始神经网络模型进行训练得到。

在另一实施例中，所述训练样本集包括正样本集，所述正样本集包括多个正样本；

每个所述正样本包括：目标碰撞的音频特征、第一数量和第一标签；

其中，所述目标碰撞的音频特征为耳机处于被用户佩戴的状态下，用户在跌倒时身体与地面碰撞产生碰撞时，通过所述反馈麦克风采集耳道内的音频信号得到的音频特征；

所述第一数量为：根据所述预设频率范围对所述目标碰撞的音频特征进行滤波后，得到的所述预设频率范围的周期信号中包括的波形中峰值或谷值的数量；

所述第一标签用于表示所述目标碰撞的音频特征和所述第一数量对应所述初始神经网络模型的输出。

在另一实施例中，所述第一数量为在目标帧长内的峰值或谷值的数量。

在另一实施例中，不同所述正样本包括的目标碰撞的音频特征，对应的用户跌倒时身体与地面发生碰撞的姿势、与地面发生碰撞的部位和/或碰撞次数不同。

在另一实施例中，所述训练样本集还包括负样本集，所述负样本集包括多个负样本；

每个所述负样本包括：非目标碰撞的音频特征、第二数量和第二标签；

所述非目标碰撞的音频特征为耳机处于被用户佩戴的状态下，用户在除了跌倒时身体与地面碰撞产生碰撞以外的情况下，通过所述反馈麦克风采集耳道内的音频信号得到的音频特征；

所述第二数量为：根据所述预设频率范围对所述非目标碰撞的音频特征进行滤波后，得到的所述预设频率范围的周期信号中包括的波形中峰值或谷值的数量；

所述第二标签用于表示所述非目标碰撞的音频特征和所述第二数量对应所述初始神经网络模型的输出。

在另一实施例中，所述第二数量为在目标帧长内的峰值或谷值的数量。

在另一实施例中，所述装置还包括：

提示信息发送模块，被配置为向预设设备发送提示信息；其中，所述预设设备与所述耳机之间建立有通信连接。

在另一实施例中，提供一种耳机，所述耳机包括壳体以及设置于所述壳体上的控制器、反馈麦克风、前馈麦克风和扬声器；

所述前馈麦克风与所述控制器连接，用于采集耳道外音频数据并发送给所述控制器；

所述反馈麦克风与所述控制器连接，用于采集耳道内音频数据并发送给所述控制器；

所述控制器包括存储器和处理器，所述存储器上存储有可执行的计算机指令，所述处理器能够调用所述存储器上存储的计算机指令，以执行上述任意一实施例所述的方法。

在另一实施例中，提供一种计算机存储介质，所述计算机存储介质存储有可执行程序；所述可执行程序被处理器执行后，能够实现上述任意一实施例所述的方法。

图7是根据一示例性实施例示出的一种电子设备800的框图。

参照图7，电子设备800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制电子设备800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以生成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统，一个或多个电源，及其他与为电子设备800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当电子设备800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为电子设备800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为电子设备800的显示器和小键盘，传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变，用户与电子设备800接触的存在或不存在，电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络，如WiFi，4G或5G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由电子设备800的处理器820执行以生成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本公开旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

一种跌倒检测方法，应用于耳机，所述耳机包括反馈麦克风，所述方法包括：

通过所述反馈麦克风采集耳道内的音频信号，得到耳道音频信号；其中，所述耳道音频信号包括：当所述耳机处于被用户佩戴的状态下，所述用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号；

对所述耳道音频信号进行特征提取，得到音频信号特征参数；

根据预设频率范围对所述耳道音频信号进行滤波，得到所述预设频率范围的周期信号；其中，所述周期信号中包括波形的峰值或谷值；

根据所述音频信号特征参数以及所述峰值或者所述谷值的数量，生成待识别特征；

将所述待识别特征输入至跌倒检测模型，得到检测结果；其中，所述检测结果至少用于表示所述用户发生跌倒。
根据权利要求1所述的方法，其中，所述方法还包括：

根据预设步数对应的时长确定至少一帧所述周期信号的目标帧长；

在所述目标帧长内确定出各帧所述周期信号中包括的所述峰值或者所述谷值的数量；其中，每一步对应一个所述峰值或所述谷值。
根据权利要求1或2所述的方法，其中，所述跌倒检测模型为预先采用机器学习的方式基于跌倒信息训练样本集对初始神经网络模型进行训练得到。
根据权利要求3所述的方法，其中，所述训练样本集包括正样本集，所述正样本集包括多个正样本；

每个所述正样本包括：目标碰撞的音频特征、第一数量和第一标签；

其中，所述目标碰撞的音频特征为耳机处于被用户佩戴的状态下，用户在跌倒时身体与地面碰撞产生碰撞时，通过所述反馈麦克风采集耳道内的音频信号得到的音频特征；

所述第一数量为：根据所述预设频率范围对所述目标碰撞的音频特征进行滤波后，得到的所述预设频率范围的周期信号中包括的波形中峰值或谷值的数量；

所述第一标签用于表示所述目标碰撞的音频特征和所述第一数量对应所述初始神经网络模型的输出。
根据权利要求4所述的方法，其中，所述第一数量为在目标帧长内的峰值或谷值的数量。
根据权利要求4所述的方法，其中，不同所述正样本包括的目标碰撞的音频特征，对应的用户跌倒时身体与地面发生碰撞的姿势、与地面发生碰撞的部位和/或碰撞次数不同。
根据权利要求3所述的方法，其中，所述训练样本集还包括负样本集，所述负样本集包括多个负样本；

每个所述负样本包括：非目标碰撞的音频特征、第二数量和第二标签；

所述非目标碰撞的音频特征为耳机处于被用户佩戴的状态下，用户在除了跌倒时身体与地面碰撞产生碰撞以外的情况下，通过所述反馈麦克风采集耳道内的音频信号得到的音频特征；

所述第二数量为：根据所述预设频率范围对所述非目标碰撞的音频特征进行滤波后，得到的所述预设频率范围的周期信号中包括的波形中峰值或谷值的数量；

所述第二标签用于表示所述非目标碰撞的音频特征和所述第二数量对应所述初始神经网络模型的输出。
根据权利要求7所述的方法，其中，所述第二数量为在目标帧长内的峰值或谷值的数量。
根据权利要求1所述的方法，其中，所述方法还包括：

向预设设备发送提示信息；其中，所述预设设备与所述耳机之间建立有通信连接。
一种跌倒检测装置，应用于耳机，所述耳机包括反馈麦克风，所述装置包括：

耳道音频信号检测模块，被配置为通过所述反馈麦克风采集耳道内的音频信号，得到耳道音频信号；其中，所述耳道音频信号包括：当所述耳机处于被用户佩戴的状态下，所述用户在跌倒时身体与地面碰撞产生的震动通过骨传导方式被传递至耳道而产生的音频信号；

音频信号特征参数获取模块，被配置为对所述耳道音频信号进行特征提取，得到音频信号特征参数；

周期信号确定模块，被配置为根据预设频率范围对所述耳道音频信号进行滤波，得到所述预设频率范围的周期信号；其中，所述周期信号中包括波形的峰值或谷值；

待识别特征生成模块，被配置为根据所述音频信号特征参数以及所述峰值或者所述谷值的数量，生成待识别特征；

检测模块，被配置为将所述待识别特征输入至跌倒检测模型，得到检测结果；其中，所述检测结果至少用于表示所述用户发生跌倒。
根据权利要求10所述的装置，其中，所述装置还包括：

目标帧长确定模块，被配置为根据预设步数对应的时长确定至少一帧所述周期信号的目标帧长；

数量确定模块，被配置为在所述目标帧长内确定出各帧所述周期信号中包括的所述峰值或者所述谷值的数量；其中，每一步对应一个所述峰值或所述谷值。
根据权利要求10或11所述的装置，其中，所述跌倒检测模型为预先采用机器学习的方式基于跌倒信息训练样本集对初始神经网络模型进行训练得到。
根据权利要求12所述的装置，其中，所述训练样本集包括正样本集，所述正样本集包括多个正样本；

每个所述正样本包括：目标碰撞的音频特征、第一数量和第一标签；

其中，所述目标碰撞的音频特征为耳机处于被用户佩戴的状态下，用户在跌倒时身体与地面碰撞产生碰撞时，通过所述反馈麦克风采集耳道内的音频信号得到的音频特征；

所述第一数量为：根据所述预设频率范围对所述目标碰撞的音频特征进行滤波后，得到的所述预设频率范围的周期信号中包括的波形中峰值或谷值的数量；

所述第一标签用于表示所述目标碰撞的音频特征和所述第一数量对应所述初始神经网络模型的输出。
根据权利要求13所述的装置，其中，所述第一数量为在目标帧长内的峰值或谷值的数量。
根据权利要求13所述的装置，其中，不同所述正样本包括的目标碰撞的音频特征，对应的用户跌倒时身体与地面发生碰撞的姿势、与地面发生碰撞的部位和/或碰撞次数不同。
根据权利要求12所述的装置，其中，所述训练样本集还包括负样本集，所述负样本集包括多个负样本；

每个所述负样本包括：非目标碰撞的音频特征、第二数量和第二标签；

所述非目标碰撞的音频特征为耳机处于被用户佩戴的状态下，用户在除了跌倒时身体与地面碰撞产生碰撞以外的情况下，通过所述反馈麦克风采集耳道内的音频信号得到的音频特征；

所述第二数量为：根据所述预设频率范围对所述非目标碰撞的音频特征进行滤波后，得到的所述预设频率范围的周期信号中包括的波形中峰值或谷值的数量；

所述第二标签用于表示所述非目标碰撞的音频特征和所述第二数量对应所述初始神经网络模型的输出。
根据权利要求16所述的装置，其中，所述第二数量为在目标帧长内的峰值或谷值的数量。
根据权利要求10所述的装置，其中，所述装置还包括：

提示信息发送模块，被配置为向预设设备发送提示信息；其中，所述预设设备与所述耳机之间建立有通信连接。
一种耳机，所述耳机包括壳体以及设置于所述壳体上的控制器、反馈麦克风、前馈麦克风和扬声器；

所述前馈麦克风与所述控制器连接，用于采集耳道外音频数据并发送给所述控制器；

所述反馈麦克风与所述控制器连接，用于采集耳道内音频数据并发送给所述控制器；

所述控制器包括存储器和处理器，所述存储器上存储有可执行的计算机指令，所述处理器能够调用所述存储器上存储的计算机指令，以执行权利要求1至9中任意一项所述的方法。
一种计算机存储介质，所述计算机存储介质存储有可执行程序；所述可执行程序被处理器执行后，能够实现如权利要求1至9任一项提供的方法。