WO2022027895A1

WO2022027895A1 - 异常坐姿识别方法、装置、电子设备、存储介质及程序

Info

Publication number: WO2022027895A1
Application number: PCT/CN2020/136267
Authority: WO
Inventors: 王飞; 钱晨
Original assignee: 上海商汤临港智能科技有限公司
Priority date: 2020-08-07
Filing date: 2020-12-14
Publication date: 2022-02-10
Also published as: JP2022547246A; CN111931640A; US20220084316A1; CN111931640B; KR20220019097A

Abstract

一种异常坐姿识别方法、装置、电子设备、存储介质及程序，该方法包括：获取车舱内的当前场景图像（S101）；基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿（S102）；在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型包括存在安全风险的坐姿类型（S103）。该方法通过对获取的车舱内的当前场景图像进行识别，确定车舱内包括的至少一个用户的当前坐姿，并进一步在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息，从而对处于异常坐姿的用户进行提示，提高用户乘车的安全性。

Description

异常坐姿识别方法、装置、电子设备、存储介质及程序

相关申请的交叉引用

本公开基于申请号为202010790210.0、申请日为2020年08月07日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本公开作为参考。

技术领域

本公开涉及深度学习技术领域，具体而言，涉及一种异常坐姿识别方法、装置、电子设备、存储介质及程序。

背景技术

随着当前汽车电子行业的迅速发展，方便、舒适、安全的车舱环境已成为用户乘车的基本需求，故使得车舱智能化成为当前汽车电子行业发展的重要方向。

在相关技术中，车舱智能化包括个性化服务、安全感知等方面。在安全感知方面，由于用户在车辆行驶过程中保持的坐姿与用户的安全程度相关，即不合适的坐姿会在车辆发生碰撞事件时增加用户受伤的概率，进而降低用户乘车的安全度。

发明内容

有鉴于此，本公开实施例期望提供一种异常坐姿识别方法、装置、电子设备、存储介质及程序。

本公开实施例提供了一种异常坐姿识别方法，包括：

获取车舱内的当前场景图像；

基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿；

在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型包括存在安全风险的坐姿类型。如此，通过对获取的车舱内的当前场景图像进行识别，确定车舱内包括的至少一个用户的当前坐姿，并进一步在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息，从而对处于异常坐姿的用户进行提示，提高用户乘车的安全性。

在一些实施例中，所述异常坐姿类型包括以下至少一种：

用户身体前倾的第一异常坐姿、用户身体侧倾的第二异常坐姿和用户身体横躺的第三异常坐姿。如此，通过定义多种异常坐姿，使得异常坐姿类型较丰富，进而可以更全面的覆盖多种异常坐姿，保障用户的乘车的安全性。

在一些实施例中，基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿，包括：

基于所述当前场景图像，确定所述当前场景图像中至少一个用户的关键点信息；

基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿。如此，通过当前场景图像中至少一个用户的关键点信息和设置的参考物之间的相对位置关系，能够准确地确定出车舱内的各个用户的当前坐姿。

在一些实施例中，所述关键点信息包括头部关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿，包括：

若任一用户的所述头部关键点信息低于设置的方向盘下沿线，确定所述任一用户的当前坐姿为用户身体前倾的第一异常坐姿。如此，通过判断用户的头部关键点信息低于设置的方向盘下沿线，快速确定出用户当前坐姿为用户身体前倾的第一异常坐姿。

在一些实施例中，所述关键点信息包括左肩关键点信息和右肩关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿，包括：

若任一用户的左肩关键点与右肩关键点之间的连线、与设置的座椅参考面之间的角度大于设置的第一角度阈值，确定所述任一用户的当前坐姿为用户身体侧倾的第二异常坐姿。如此，在用户肩部关键点与座椅参考面之间的角度大于第一角度阈值时，快速地确定出用户当前坐姿为用户身体侧倾的第二异常坐姿。

在一些实施例中，所述关键点信息包括脖子关键点信息和胯部关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿，包括：

若任一用户的脖子关键点与胯部关键点之间的连线、与设置的水平参考面之间的角度小于设置的第二角度阈值，确定所述任一用户的当前坐姿为用户身体横躺的第三异常坐姿。如此，在用户脖子关键点、胯部关键点与水平参考面之间的角度小于第二角度阈值时，快速地确定出用户当前坐姿为用户身体横躺的第三异常坐姿。

基于所述当前场景图像，生成所述当前场景图像对应的中间特征图；

基于所述中间特征图，生成位于所述车舱内的至少一个用户中每个用户的检测框信息；

基于所述中间特征图和所述至少一个用户中每个用户的检测框信息，确定每个用户的当前坐姿。如此，只需通过当前场景图像对应的中间特征图，以及每个用户的检测框信息，实现了快速确定每个用户的当前坐姿，同时因无中间参数使得确定出的每个用户的当前坐姿准确性高。

在一些实施例中，基于所述中间特征图，生成位于所述车舱内的至少一个用户中每个用户的检测框信息，包括：

对所述中间特征图进行至少一次第一卷积处理，生成所述中间特征图对应的通道特征图；

基于所述通道特征图中表征位置的目标通道特征图，生成位于所述车舱内的每个用户的检测框的中心点位置信息。如此，采用特征图处理的方式确定用户对应的检测框信息(包含中心点位置信息)，进而将检测框信息与当前场景图像对应的中间特征图进行比对，确定用户的当前位姿信息。

在一些实施例中，基于所述通道特征图中表征位置的目标通道特征图，生成位于所述车舱内的每个用户的检测框的中心点位置信息，包括：

利用激活函数对所述表征位置的目标通道特征图中每个特征值进行特征值转换处理，生成转换后的目标通道特征图；

按照预设的池化尺寸和池化步长，对转换后的目标通道特征图进行最大池化处理，得到多个池化值以及与多个池化值中的每个池化值对应的位置索引；所述位置索引用于标识所述池化值在所述转换后的目标通道特征图中的位置；

基于所述每个池化值以及池化阈值，从多个池化值中确定属于至少一个用户的检测框的中心点的目标池化值；

基于所述目标池化值对应的位置索引，生成位于所述车舱内的每个用户的检测框的中心点位置信息。如此，通过对目标通道特征图进行最大池化处理，能够较准确的从多个池化值中确定属于用户中心点的目标池化值，进而较精确的确定每个用户的检测框的中心点位置信息。

在一些实施例中，基于所述中间特征图和所述至少一个用户中每个用户的检测框信息，确定每个用户的当前坐姿，包括：

对所述中间特征图进行至少一次第二卷积处理，生成所述中间特征图对应的N通道的分类特征图；其中，所述分类特征图的通道数N与坐姿类别的数量一致，所述N通道的分类特征图中的每个通道特征图对应一种坐姿类别，N为大于1的正整数；

针对每个用户，基于所述用户的检测框信息指示的中心点位置信息，20从所述分类特征图中提取与所述中心点位置信息匹配的特征位置处的N个特征值；从N个特征值中选取最大特征值，将分类特征图中，与最大特征值对应的通道特征图的坐姿类别，确定为所述用户的当前坐姿。如此，通过对中间特征图进行至少一次第二卷积处理，生成分类特征图，再结合生成的每个用户的中心点位置信息，可以较准确的确定每个用户的当前坐姿。

以下装置、电子设备等的效果描述参见上述方法的说明，这里不再赘述。

本公开实施例提供了一种异常坐姿识别装置，包括：

获取模块，用于获取车舱内的当前场景图像；

识别模块，用于基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿；

确定模块，用于在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型包括存在安全风险的坐姿类型。

本公开实施例提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如上述第一方面或任一实施方式所述的异常坐姿识别方法的步骤。

本公开实施例提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述第一方面或任一实施方式所述的异常坐姿识别方法的步骤。

本公开实施例提供了一种计算机程序，所述计算机程序包括计算机可读代码，在所述计算机可读代码在计算机中运行的情况下，使得所述计算机执行上述任意一种异常坐姿识别方法。

本公开实施例提出的异常坐姿识别方法、装置、电子设备、存储介质及程序；首先，获取车舱内的当前场景图像；再基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿；最后在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型包括存在安全风险的坐姿类型；如此，通过对获取的车舱内的当前场景图像进行识别，确定车舱内包括的至少一个用户的当前坐姿，并进一步在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息，从而对处于异常坐姿的用户进行提示，提高用户乘车的安全性。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种异常坐姿识别方法的流程示意图；

图2示出了应用本公开实施例的异常坐姿识别方法的一种系统架构示意图；

图3示出了本公开实施例所提供的一种异常坐姿识别方法中，当前场景图像的示意图；

图4示出了本公开实施例所提供的一种异常坐姿识别装置400的架构示意图；

图5示出了本公开实施例所提供的一种电子设备500的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

在相对技术中，车舱智能化可以包括个性化服务、安全感知等方面。在安全感知方面，由于用户在车辆行驶过程中保持的坐姿与用户的安全程度相关，即不合适的坐姿会在车辆发生碰撞事件时增加用户受伤的概率，进而降低用户乘车的安全度。故为了解决上述问题，本公开实施例提供了一种异常坐姿识别方法。

为便于对本公开实施例进行理解，首先对本公开实施例所公开的一种异常坐姿识别方法进行详细介绍。

参见图1所示，为本公开实施例所提供的一种异常坐姿识别方法的流程示意图，该方法包括S101至S103，其中：

S101，获取车舱内的当前场景图像。

S102，基于当前场景图像，识别位于车舱内的至少一个用户的当前坐姿。

S103，在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，异常坐姿类型包括存在安全风险的坐姿类型。

上述方法中，通过对获取的车舱内的当前场景图像进行识别，确定位于车舱内的至少一个用户的当前坐姿，并进一步在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息，从而对处于异常坐姿的用户进行提示，提高用户乘车的安全性。

图2为可以应用本公开实施例的异常坐姿识别方法的一种系统架构示意图；如图2所示，该系统架构中包括：车辆终端201、网络202和异常坐姿识别端203。为实现支撑一个示例性应用，车辆终端201和异常坐姿识别端203可以通过网络202建立通信连接，车辆终端201通过网络202向异常坐姿识别端设备203上报车舱内的当前场景图像，异常坐姿识别端设备203响应于接收到的当前场景图像，基于当前场景图像，识别位于车舱内的至少一个用户的当前坐姿；在用户的当前坐姿属于异常坐姿类型的情况下，确定警示信息，最后，异常坐姿识别端203将该警示信息上传至网络202，并通过网络202发送给车辆终端201。

作为示例，车辆终端201可以包括车载图像采集设备，异常坐姿识别端203可以包括具有视觉信息处理能力的车载视觉处理设备或远程服务器。网络202可以采用有线连接或无线连接方式。其中，当异常坐姿识别端为车载视觉处理设备时，车辆终端可以通过有线连接的方式与车载视觉处理设备通信连接，例如通过总线进行数据通信；当异常坐姿识别端为远程服务器时，车辆终端可以通过无线网络与远程服务器进行数据交互。

或者，在一些场景中，车辆终端201可以是带有车载图像采集模组的车载视觉处理设备，具体实现为带有摄像头的车载主机。这时，本公开实施例的异常坐姿识别方法可以由车辆终端201执行，上述系统架构可以不包含网络202和异常坐姿识别端203。

针对S101：

这里，可以在车舱的顶部设置摄像设备，通过车舱内设置的摄像设备实时获取车舱内的当前场景图像。其中，该摄像设备的安装位置可以为能够拍摄到车舱内全部用户的位置。

针对S102：

在获取到当前场景图像之后，可以对当前场景图像进行识别，确定车舱内的每个用户对应的当前坐姿。其中，该当前坐姿可以为每个用户的坐姿类别。

一种可能的实施方式中，基于当前场景图像，识别位于车舱内的至少一个用户的当前坐姿，可以包括：

基于当前场景图像，确定当前场景图像中至少一个用户的关键点信息；

基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于车舱内的各个用户的当前坐姿。

这里，可以将当前场景图像输入至关键点检测神经网络，确定当前场景图像中至少一个用户的关键点信息；并可以针对车舱内的每个用户，基于该用户的关键点信息与设置的参考物之间的相对位置关系，确定该用户的当前坐姿。

一种可能的实施方式中，关键点信息包括头部关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于车舱内的各个用户的当前坐姿，可以包括：

若任一用户的头部关键点信息低于设置的方向盘下沿线，确定任一用户的当前坐姿为用户身体前倾的第一异常坐姿。

参见图3所示的一种异常坐姿识别方法中，当前场景图像的示意图，图中包括方向盘31、方向盘下沿线32、驾驶员33，方向盘下沿线32为在靠近驾驶员一侧的方向盘的边缘，得到的与行驶方向垂直的参考线。由图3可知，方向盘下沿线将当前场景图像划分为两个区域，即位于方向盘下沿线上方的第一区域34和位于方向盘下沿线下方的第二区域35。在检测到用户的头部关键点信息低于设置的方向盘下沿线，即检测到用户的头部关键点信息位于第二区域35内时，则确定该用户的当前坐姿为用户身体前倾的第一异常坐姿；在检测到用户的头部关键点信息高于设置的方向盘下沿线，即检测到用户的头部关键点信息位于第一区域34内时，则确定该用户的当前坐姿不属于用户身体前倾的第一异常坐姿；若用户的头部关键点信息位于方向盘下沿线上，则确定该用户的当前坐姿不属于用户身体前倾的第一异常坐姿。

一种可能的实施方式中，关键点信息包括左肩关键点信息和右肩关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于车舱内的各个用户的当前坐姿，包括：

若任一用户的左肩关键点与右肩关键点之间的连线、与设置的座椅参考面之间的角度大于设置的第一角度阈值，确定任一用户的当前坐姿为用户身体侧倾的第二异常坐姿。

这里，第一角度阈值可以根据实际需要进行设置，比如第一角度可以为45度；以及可以将用户背靠座椅的一面(即座椅的竖直面)设置为座椅参考面。进而可以确定检测到的左肩关键点与右肩关键点之间的连线、与设置的座椅参考面之间的角度，在该角度大于设置的第一角度阈值时，确定该用户的当前坐姿为用户身体侧倾的第二异常坐姿；在该角度小于或等于设置的第一角度阈值时，则确定该用户的当前坐姿不属于用户身体前倾的第二异常坐姿。

一种可能的实施方式中，关键点信息包括脖子关键点信息和胯部关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于车舱内的各个用户的当前坐姿，包括：

若任一用户的脖子关键点与胯部关键点之间的连线、与设置的水平参考面之间的角度小于设置的第二角度阈值，确定任一用户的当前坐姿为用户身体横躺的第三异常坐姿。

这里，设置的水平参考面可以为座椅水平面，以及第二角度阈值可以根据实际需要进行设置。可以确定脖子关键点与胯部关键点之间的连线与设置的水平参考面之间的角度，在该角度小于设置的第二角度阈值时，确定该用户的当前坐姿为用户身体横躺的第三异常坐姿；在该角度大于或等于设置的第二角度阈值时，确定该用户的当前坐姿不属于用户身体横躺的第三异常坐姿。

在具体实施时，还可以将当前场景图像输入至训练的神经网络中，确定该当前场景图像中包括的每个用户的当前坐姿。

作为一可选实施方式，基于当前场景图像，识别位于车舱内的至少一个用户的当前坐姿，可以包括：

步骤一，基于当前场景图像，生成当前场景图像对应的中间特征图；

步骤二，基于中间特征图，生成位于车舱内的至少一个用户中每个用户的检测框信息；

步骤三，基于中间特征图和至少一个用户中每个用户的检测框信息，确定每个用户的当前坐姿。

在步骤一中，可以将当前场景图像输入至训练后的神经网络中，该神经网络中的骨干网络对当前场景图像进行多次卷积处理，生成当前场景图像对应的中间特征图。

在步骤二中，可以利用中间特征图和神经网络中包括的检测框检测分支网络，生成位于车舱内的至少一个用户中每个用户的检测框信息。

一种可选实施方式中，基于中间特征图，生成位于车舱内的至少一个用户中每个用户的检测框信息，可以包括：

A1，对中间特征图进行至少一次第一卷积处理，生成中间特征图对应的通道特征图；

A2，基于通道特征图中表征位置的目标通道特征图，生成位于车舱内的每个用户的检测框的中心点位置信息。

这里，可以先对中间特征图进行至少一个第一卷积处理，生成中间特征图对应的通道特征图，该通道特征图对应的通道数可以为三通道。其中，该通道特征图中包括表征位置的第一通道特征图(该第一通道特征图即为目标通道特征图)、表征检测框长度信息的第二通道特征图、以及表征检测框宽度信息的第三通道特征图。

进而，可以基于通道特征图中表征位置的目标通道特征图，生成车舱内包括的每个用户的检测框的中心点位置信息，以及还可以基于通道特征图中的第二通道特征图和第三通道特征图，确定检测框的尺寸信息(长度和宽度)。

上述实施方式中，采用特征图处理的方式确定用户对应的检测框信息(包含中心点位置信息)，进而将检测框信息与当前场景图像对应的中间特征图进行比对，确定用户的当前位姿信息。

作为一可选实施方式，基于通道特征图中表征位置的目标通道特征图，生成位于车舱内的每个用户的检测框的中心点位置信息，可以包括：

B1，利用激活函数对表征位置的目标通道特征图中每个特征值进行特征值转换处理，生成转换后的目标通道特征图；

B2，按照预设的池化尺寸和池化步长，对转换后的目标通道特征图进行最大池化处理，得到多个池化值以及与多个池化值中的每个池化值对应的位置索引；位置索引用于标识池化值在转换后的目标通道特征图中的位置；

B3，基于每个池化值以及池化阈值，从多个池化值中确定属于至少一个用户的检测框的中心点的目标池化值；

B4，基于目标池化值对应的位置索引，生成位于车舱内的每个用户的检测框的中心点位置信息。

本公开实施例中，可以利用激活函数对目标特征图进行特征值转换处理，生成转换后的目标通道特征图，该目标通道特征图中每个特征值均为0-1之间的数值。其中，该激活函数可以为sigmoid函数。针对转换后的目标通道特征图中的任一特征点的特征值，若该特征值越趋向于1，则该特征值对应的特征点属于用户的检测框的中心点的概率也就越大。

接着，可以按照预设的池化尺寸和池化步长，对转换后的目标通道特征图进行最大池化处理，得到目标通道特征图中每个特征位置处对应的池化值和每个池化值对应的位置索引；位置索引可以用于标识池化值在转换后的目标通道特征图中的位置。然后可以将每个特征位置处对应的位置索引中，相同的位置索引进行合并处理，得到该目标通道特征图对应多个池化值和多个池化值中每个池化值对应的位置索引。其中，预设的池化尺寸和池化步长可以根据实际需要进行设置，比如，预设的池化尺寸可以为3×3，预设的池化步长可以为1。

进一步的，可以设置池化阈值，对得到的多个池化值进行筛选，得到多个池化值中大于池化阈值的至少一个目标池化值，并基于目标池化值对应的位置索引，生成车舱内包括的每个用户的检测框的中心点位置信息。示例性的，可以获取当前场景图像对应的摄像设备采集到的多帧样本图像，根据采集的多帧样本图像利用自适应算法，生成池化阈值。

示例性的，可以对目标通道特征图进行3×3，且步长为1的最大池化处理；在池化时，针对每3×3个特征点在目标通道特征图中的特征值，确定3×3个特征点的最大响应值(即池化值)及最大响应值在目标通道特征图上的位置索引。此时，最大响应值的数量与目标通道特征图的尺寸相关；例如若目标通道特征图的尺寸为80×60×3，则在对目标通道特征图进行最大池化处理后，得到的最大响应值共80×60个；且对于每个最大响应值，都可能存在至少一个其他最大响应值与其位置索引相同。

然后将位置索引相同的最大响应值合并，得到M个最大响应值，以及M个最大响应值中每个最大响应值对应的位置索引。

然后将M个最大响应值中的每个最大响应值与池化阈值进行比对；在某最大响应值大于该池化阈值时，将该最大响应值确定为目标池化值。目标池化值对应的位置索引，即用户的检测框的中心点位置信息。

这里，还可以直接对转换之前的目标通道特征图进行最大池化处理，得到每个用户的检测框的中心点位置信息。

示例性的，在得到用户的检测框的中心点位置信息之后，还可以基于该中心点位置信息，从第二通道特征图中选取与该中心点位置信息匹配的特征位置处的第二特征值，将选取的第二特征值确定为用户的检测框对应的长度，并从第三通道特征图中选取与该中心点位置信息匹配的特征位置处的第三特征值，将选取的第三特征值确定为用户的检测框对应的宽度，得到了用户的检测框的尺寸信息。

上述实施方式中，通过对目标通道特征图进行最大池化处理，能够较准确的从多个池化值中确定属于用户中心点的目标池化值，进而较精确的确定每个用户的检测框的中心点位置信息。

在步骤三中，可以基于中间特征图、至少一个用户中每个用户的检框信息、和训练后的神经网络中的姿态分类分支网络，确定每个用户的当前坐姿。

在一些实施例中，基于中间特征图和至少一个用户中每个用户的检测框信息，确定每个用户的当前坐姿，包括：

C1，对中间特征图进行至少一次第二卷积处理，生成中间特征图对应的N通道的分类特征图；其中，分类特征图的通道数N与坐姿类别的数量一致，N通道的分类特征图中的每个通道特征图对应一种坐姿类别，N为大于1的正整数；

C2，针对每个用户，基于用户的检测框信息指示的中心点位置信息，从分类特征图中提取与中心点位置信息匹配的特征位置处的N个特征值；从N个特征值中选取最大特征值，将分类特征图中，与最大特征值对应的通道特征图的坐姿类别，确定为用户的当前坐姿。

这里，可以对中间特征图进行至少一次第二卷积处理，生成中间特征图对应的分类特征图，该分类特征图的通道数为N，该N的值与坐姿类别的数量一致，且N通道的分类特征图中的每个通道特征图对应一种坐姿类别。比如，若坐姿类别包括：正常坐姿、身体前倾、身体后倾，则此时N的值为3；若坐姿类别包括：正常坐姿、身体前倾、身体后倾、和身体横卧，则此时N的值为4。其中，坐姿类别可以根据实际需要进行设置，此处仅为示例性说明。

进一步的，针对每个用户，可以基于用户的检框信息指示的中心点位置信息，从分类特征图中提取与中心点位置信息匹配的特征位置处的N个特征值，从N个特征值中选取最大特征值，将分类特征图中，与该最大特征值对应的通道特征图的坐姿类别，确定为该用户的当前坐姿。

比如，针对用户A，分类特征图为3通道的特征图，分类特征图中的第一通道特征图对应的坐姿类别可以为正常坐姿、第二通道特征图对应的坐姿类别可以为身体前倾、第三通道特征图对应的坐姿类别可以为身体侧倾，从分类特征图中提取得到3个特征值，即0.8、0.5、0.2，则将分类特征图中，与0.8对应的通道特征图(分类特征图中的第一通道特征图)的坐姿类别(正常坐姿)确定为用户A的当前坐姿。

这里，通过对中间特征图进行至少一次第二卷积处理，生成分类特征图，再结合生成的每个用户的中心点位置信息，可以较准确的确定每个用户的当前坐姿。

在一些实施例中，每个用户的当前坐姿为基于训练的神经网络确定的。可以通过下述步骤对神经网络进行训练：

D1，获取场景图像样本，其中，场景图像样本对应有标注数据；

D2，基于神经网络中的骨干网络、和场景图像样本，生成场景图像样本对应的样本特征图；

D3，基于神经网络中的多个分支网络、和样本特征图，生成场景图像样本对应的多种预测数据；其中，每个分支网络对应一种预测数据；

D4，基于多种预测数据、以及场景图像样本对应的标注数据，对神经网络进行训练。

上述方式中，通过设置多个分支网络对样本特征图进行处理，生成场景图像样本对应的多种预测数据，通过生成的多种预测数据对神经网络进行训练时，可以提高训练的神经网络的精准度。

这里，标注数据可以包括标注关键点位置信息、标注检测框信息、标注坐姿类别。

可以将场景图像样本输入至待训练的神经网络中，待训练的神经网络中的骨干网络对场景图像样本进行至少一次卷积处理，生成场景图像样本对应的样本特征图。

然后分别将样本特征图输入至待训练的神经网络中的多个分支网络中，生成场景图像样本对应的多种预测数据，其中，每个分支网络对应一种预测数据。

其中，预测数据可以包括预测检测框信息、预测关键位置点信息、预测坐姿类别。

在预测数据包括预测检测框信息时，则神经网络的分支网络中包括检测框检测分支网络，将样本特征图输入至神经网络中的检测框检测分支网络，生成场景图像样本中包括的至少一个用户的预测检测框信息。

在预测数据包括预测关键位置点信息时，则神经网络的分支网络中包括关键点检测分支网络，将样本特征图输入至神经网络中的关键点检测分支网络，生成场景图像样本中包括的每个用户的多个预测关键位置点信息。

在预测数据包括预测检测框信息和预测坐姿类别时，则神经网络的分支网络中包括检测框检测分支网络、和姿态分类分支网络，将样本特征图输入至神经网络中的关键点检测分支网络，得到分类特征图，并基于至少一个用户的预测检测框信息和该分类特征图，生成场景图像样本中包括的每个用户的预测坐姿类别。

上述实施方式下，通过设置多个分支网络对样本特征图进行处理，得到多种预测数据，通过多种预测数据对神经网络进行训练，使得训练后的神经网路的精准度较高。

在多种预测数据包括预测检测框信息、预测关键位置点信息、和预测坐姿类别时，可以基于预测检测框信息和标注检测框信息，生成第一损失值；基于预测关键位置点信息和标注关键位置点信息，生成第二损失值；基于预测坐姿类别和标注坐姿类别，生成第三损失值，基于第一损失值、第二损失值和第三损失值，对神经网络进行训练，得到训练后的神经网络。

针对S103：

在得到当前场景图像中的每个用户的当前坐姿之后，可以根据每个用户的当前坐姿，确定该用户的当前坐姿是否属于异常坐姿，异常坐姿类型是指存在安全风险的坐姿类型。在确定该用户的当前坐姿属于异常坐姿时，发出警示信息。

一种可选实施方式中，异常坐姿类型可以包括以下至少一种：用户身体前倾的第一异常坐姿、用户身体侧倾的第二异常坐姿和用户身体横躺的第三异常坐姿。其中，异常坐姿类型还可以包括其他存在安全风险的坐姿，此处仅为示例性说明。

示例性的，若用户的当前坐姿为正常坐姿，则确定该用户不属于异常坐姿；若用户的当前坐姿为身体前倾，则确定该用户属于异常坐姿。

在上述实施方式下，通过定义多种异常坐姿，使得异常坐姿类型较丰富，进而可以更全面的覆盖多种异常坐姿，保障用户的乘车的安全性。

这里，在确定了用户的当前坐姿属于异常坐姿类型时，可以基于用户当前坐姿所属的异常坐姿类型，生成警示信息，其中，该警示信息可以以语音的形式播放。比如用户A当前坐姿为身体前倾时，生成的警示信息可以为“危险，身体前倾，请调整坐姿”。

在具体实施时，还可以为车舱的每个位置进行标识，比如，车舱内的每个位置的标识可以为：副驾驶位置、左后位置、右后位置等，并基于当前场景图像确定每个用户对应的位置标识，并在确定用户当前坐姿属于异常坐姿类型的情况下，可以基于用户当前坐姿所属的异常坐姿类型、和坐姿标识，生成警示信息。比如，在用户A当前坐姿为身体前倾，该用户A对应的位置标识为副驾驶位置，则生成的警示信息可以为“副驾驶位置上的乘客身体前倾，请调整坐姿”。

这里，在确定了用户当前坐姿属于异常坐姿类型时，可以基于用户当前坐姿所属的异常坐姿类型，生成警示信息，以便对用户进行警示，降低用户发生危险的概率。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于相同的构思，本公开实施例还提供了一种异常坐姿识别装置400，参见图4所示，为本公开实施例提供的异常坐姿识别装置的架构示意图，包括获取模块401、识别模块402、确定模块403，具体的：

获取模块401，用于获取车舱内的当前场景图像；

识别模块402，用于基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿；

确定模块403，用于在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型是指存在安全风险的坐姿类型。

一种可能的实施方式中，所述异常坐姿类型包括以下至少一种：用户身体前倾的第一异常坐姿、用户身体侧倾的第二异常坐姿和用户身体横躺的第三异常坐姿。

一种可能的实施方式中，所述识别模块402，在基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿时，用于：

基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿。

一种可能的实施方式中，所述关键点信息包括头部关键点信息；所述识别模块402，在基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿时，用于：

若任一用户的所述头部关键点信息低于设置的方向盘下沿线，确定所述任一用户的当前坐姿为用户身体前倾的第一异常坐姿。

一种可能的实施方式中，所述关键点信息包括左肩关键点信息和右肩关键点信息；所述识别模块402，在基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿时，用于：

若任一用户的左肩关键点与右肩关键点之间的连线、与设置的座椅参考面之间的角度大于设置的第一角度阈值，确定所述任一用户的当前坐姿为用户身体侧倾的第二异常坐姿。

一种可能的实施方式中，所述关键点信息包括脖子关键点信息和胯部关键点信息；所述识别模块402，在基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿时，用于：

若任一用户的脖子关键点与胯部关键点之间的连线、与设置的水平参考面之间的角度小于设置的第二角度阈值，确定所述任一用户的当前坐姿为用户身体横躺的第三异常坐姿。

基于所述中间特征图和所述至少一个用户中每个用户的检测框信息，确定每个用户的当前坐姿。

一种可能的实施方式中，所述识别模块402，在基于所述中间特征图，生成位于所述车舱内的至少一个用户中每个用户的检测框信息时，用于：

基于所述通道特征图中表征位置的目标通道特征图，生成位于所述车舱内的每个用户的检测框的中心点位置信息。

一种可能的实施方式中，所述识别模块402，在基于所述通道特征图中表征位置的目标通道特征图，生成位于所述车舱内的每个用户的检测框的中心点位置信息时，用于：

基于所述目标池化值对应的位置索引，生成位于所述车舱内的每个用户的检测框的中心点位置信息。

一种可能的实施方式中，所述识别模块402，在基于所述中间特征图和所述至少一个用户中每个用户的检测框信息，确定每个用户的当前坐姿时，用于：

针对每个用户，基于所述用户的检测框信息指示的中心点位置信息，从所述分类特征图中提取与所述中心点位置信息匹配的特征位置处的N个特征值；从N个特征值中选取最大特征值，将分类特征图中，与最大特征值对应的通道特征图的坐姿类别，确定为所述用户的当前坐姿。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模板可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

基于同一技术构思，本公开实施例还提供了一种电子设备500。参照图5所示，为本公开实施例提供的电子设备500的结构示意图，包括处理器501、存储器502、和总线503。其中，存储器502用于存储执行指令，包括内存5021和外部存储器5022；这里的内存5021也称内存储器，用于暂时存放处理器501中的运算数据，以及与硬盘等外部存储器5022交换的数据，处理器501通过内存5021与外部存储器5022进行数据交换，当电子设备500运行时，处理器501与存储器502之间通过总线503通信，使得处理器501在执行以下指令：

获取车舱内的当前场景图像；

在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型是指存在安全风险的坐姿类型。

此外，本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的异常坐姿识别方法的步骤。

本公开实施例所提供的异常坐姿识别方法的计算机程序产品，用于存储计算机可读代码，计算机可读代码在电子设备中运行的情况下，电子设备的处理器执行用于实现如上述任一实施例提供的异常坐姿识别方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本公开所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

工业实用性

本公开提供了一种异常坐姿识别方法、装置、电子设备、存储介质及程序；其中，获取车舱内的当前场景图像；基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿；在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型包括存在安全风险的坐姿类型。

Claims

一种异常坐姿识别方法，包括：

获取车舱内的当前场景图像；

基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿；

在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型包括存在安全风险的坐姿类型。
根据权利要求1所述的方法，所述异常坐姿类型包括以下至少一种：

用户身体前倾的第一异常坐姿、用户身体侧倾的第二异常坐姿和用户身体横躺的第三异常坐姿。
根据权利要求2所述的方法，基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿：

基于所述当前场景图像，确定所述当前场景图像中至少一个用户的关键点信息；

基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿。
根据权利要求3所述的方法，所述关键点信息包括头部关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿，包括：

若任一用户的所述头部关键点信息低于设置的方向盘下沿线，确定所述任一用户的当前坐姿为用户身体前倾的第一异常坐姿。
根据权利要求3所述的方法，所述关键点信息包括左肩关键点信息和右肩关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿，包括：

若任一用户的左肩关键点与右肩关键点之间的连线、与设置的座椅参考面之间的角度大于设置的第一角度阈值，确定所述任一用户的当前坐姿为用户身体侧倾的第二异常坐姿。
根据权利要求3所述的方法，所述关键点信息包括脖子关键点信息和胯部关键点信息；基于各个用户的关键点信息与设置的参考物之间的相对位置关系，确定位于所述车舱内的各个用户的当前坐姿，包括：

若任一用户的脖子关键点与胯部关键点之间的连线、与设置的水平参考面之间的角度小于设置的第二角度阈值，确定所述任一用户的当前坐姿为用户身体横躺的第三异常坐姿。
根据权利要求1所述的方法，基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿，包括：

基于所述当前场景图像，生成所述当前场景图像对应的中间特征图；

基于所述中间特征图，生成位于所述车舱内的至少一个用户中每个用户的检测框信息：

基于所述中间特征图和所述至少一个用户中每个用户的检测框信息，确定每个用户的当前坐姿。
根据权利要求7所述的方法，基于所述中间特征图，生成位于所述车舱内的至少一个用户中每个用户的检测框信息，包括：

对所述中间特征图进行至少一次第一卷积处理，生成所述中间特征图对应的通道特征图；

基于所述通道特征图中表征位置的目标通道特征图，生成位于所述车舱内的每个用户的检测框的中心点位置信息。
根据权利要求8所述的方法，基于所述通道特征图中表征位置的目标通道特征图，生成位于所述车舱内的每个用户的检测框的中心点位置信息，包括：

利用激活函数对所述表征位置的目标通道特征图中每个特征值进行特征值转换处理，生成转换后的目标通道特征图；

按照预设的池化尺寸和池化步长，对转换后的目标通道特征图进行最大池化处理，得到多个池化值以及与多个池化值中的每个池化值对应的位置索引；所述位置索引用于标识所述池化值在所述转换后的目标通道特征图中的位置；

基于所述每个池化值以及池化阈值，从多个池化值中确定属于至少一个用户的检测框的中心点的目标池化值；

基于所述目标池化值对应的位置索引，生成位于所述车舱内的每个用户的检测框的中心点位置信息。
根据权利要求7所述的方法，基于所述中间特征图和所述至少一个用户中每个用户的检测框信息，确定每个用户的当前坐姿，包括：

对所述中间特征图进行至少一次第二卷积处理，生成所述中间特征图对应的N通道的分类特征图；其中，所述分类特征图的通道数N与坐姿类别的数量一致，所述N通道的分类特征图中的每个通道特征图对应一种坐姿类别，N为大于1的正整数；

针对每个用户，基于所述用户的检测框信息指示的中心点位置信息，从所述分类特征图中提取与所述中心点位置信息匹配的特征位置处的N个特征值；从N个特征值中选取最大特征值，将分类特征图中，与最大特征值对应的通道特征图的坐姿类别，确定为所述用户的当前坐姿。
一种异常坐姿识别装置，包括：

获取模块，用于获取车舱内的当前场景图像；

识别模块，用于基于所述当前场景图像，识别位于所述车舱内的至少一个用户的当前坐姿；

确定模块，用于在用户的当前坐姿属于异常坐姿类型的情况下，发出警示信息；其中，所述异常坐姿类型是指存在安全风险的坐姿类型。
一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至10任一所述的异常坐姿识别方法的步骤。
一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至10任一所述的异常坐姿识别方法的步骤。
一种计算机程序，所述计算机程序包括计算机可读代码，在所述计算机可读代码在电子设备中运行的情况下，所述电子设备的处理器执行用于实现如权利要求1至10任一项所述的异常坐姿识别方法。