WO2021047190A1

WO2021047190A1 - 基于残差网络的报警方法、装置、计算机设备和存储介质

Info

Publication number: WO2021047190A1
Application number: PCT/CN2020/088046
Authority: WO
Inventors: 杨灵
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-09-09
Filing date: 2020-04-30
Publication date: 2021-03-18
Also published as: CN110765850A

Abstract

本申请揭示了一种基于残差网络的报警方法、装置、计算机设备和存储介质，所述方法包括：获取第一摄像头采集的第一图像，并将所述第一图像输入行人再识别模型中，获得行人识别结果；若所述行人识别结果与嫌疑对象不相同，则获取第二图像；提取出第一对象的图像信息，得到微表情识别结果；若所述微表情识别结果不属于预设的恶意微表情列表，则采集声音信息，得到声纹识别结果；若声纹识别结果不为负面声纹，则从第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值；若干涉程度值不处于预设的干涉数值区间，则执行报警操作。从而提高了报警的准确性。

Description

基于残差网络的报警方法、装置、计算机设备和存储介质

本申请要求于2019年9月9日提交中国专利局、申请号为201910848452.8，发明名称为“基于残差网络的报警方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及到人工智能技术领域，特别是涉及到一种基于残差网络的报警方法、装置、计算机设备和存储介质。

背景技术

在一些场景中，例如在传销分子威胁被传销人员在银行网点进行转账的场景中，发明人意识到传统技术仅能通过识别进行转账操作人员的一些特征来判断是否存在被挟持的现象，而在这些场景中，被传销人员一般会被监视，并且同时被要求不能做出示警表情，因此无法做出明显地报警举动。而传统技术仅通过识别进行转账操作人员的一些特征的方法，识别出是否存在被挟持的现象的准确性不足。

技术问题

本申请的主要目的为提供一种基于残差网络的报警方法、装置、计算机设备和存储介质，旨在提高报警的准确性。

技术解决方案

为了实现上述发明目的，本申请提出一种基于残差网络的报警方法，包括以下步骤：

获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，从而获得行人识别结果，并判断所述行人识别结果是否与预设的嫌疑对象库中的嫌疑对象相同，其中所述行人识别结果为人体特征；

若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内；

从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，从而得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹；

若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度；

若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。

本申请提供一种基于关联对象的报警装置，包括：

行人识别结果判断单元，用于获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，从而获得行人识别结果，并判断所述行人识别结果是否与预设的嫌疑对象库中的嫌疑对象相同，其中所述行人识别结果为人体特征；

第二图像采集单元，用于若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内；

微表情识别单元，用于从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，从而得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

声纹识别单元，用于若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹；

干涉程度计算单元，用于若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度；

报警单元，用于若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。

本申请提供一种计算机设备，包括：一个或多个处理器；存储器；一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个计算机程序配置用于执行一种基于基于残差网络的报警方法，其中，所述基于残差网络的报警方法包括：

获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，获得人体特征，并判断所述行人识别结果与预设的嫌疑对象库中的嫌疑对象是否相同；

从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

本申请提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现基于残差网络的报警方法，其中，所述基于残差网络的报警方法包括以下步骤：

有益效果

本申请的基于残差网络的报警方法、装置、计算机设备和存储介质，以微表情识别加上声纹识别的方式提高报警的准确性；通过干涉程度计算模型计算得到干涉程度值，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度，从而确认是否存在第二对象对第一对象进行要挟的可能，若干涉程度高，则执行报警操作。从而借助关联(第二对象)对象判断是否需要报警，更进一步提高了报警准确性。

附图说明

图1为本申请一实施例的基于残差网络的报警方法的流程示意图；

图2为本申请一实施例的基于关联对象的报警装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本发明的最佳实施方式

参照图1，本申请实施例提供一种基于残差网络的报警方法，包括以下步骤：

S1、获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，从而获得行人识别结果，并判断所述行人识别结果是否与预设的嫌疑对象库中的嫌疑对象相同，其中所述行人识别结果为人体特征；

S2、若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内；

S3、从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，从而得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

S4、若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹；

S5、若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度；

S6、若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。

如上述步骤S1所述，获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，从而获得行人识别结果，并判断所述行人识别结果是否与预设的嫌疑对象库中的嫌疑对象相同，其中所述行人识别结果为人体特征。其中所述残差网络例如为resnet50、resnet101、resnet152，优选resnet50模型。其中残差网络包括第一至第五残差块，每个残差块均包括至少一层卷积层，并能输出对应的特征图像。行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术，据此在存在人的图像(可以不为正面)的情况下，识别出图像中的行人身份。再判断所述行人识别结果是否与预设的嫌疑对象库中的嫌疑对象相同。其中所述嫌疑对象例如为传销分子、犯罪人员或者被拉入传销的人员、被挟持的人员、失踪人员。从而分析出在当前场景中是否存在有前科的对象或者被挟持的对象，而若存在，那么当前场景中存在挟持的可能性更高。其中所述第一摄像头采集大范围的图像，例如覆盖银行营业网点大厅。

如上述步骤S2所述，若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内。所述第二图像用于鉴别所述第一对象是否正常，以及鉴别所述第二对象是否正常。其中，所述第一对象与所述第二对象之间的距离不大于预设距离的用意在于：当挟持对象与被挟持对象距离过大时，挟持对象无法进行有效监视，因此被挟持对象可以自主报警，因此当所述第一对象与所述第二对象之间的距离不大于预设距离，有可能存在挟持的现象。并且为了防止单一对象判断的不准确，本申请还对关联的第二对象进行分析，据此采集了包括第二对象的第二图像。

如上述步骤S3所述，从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，从而得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别。其中，从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中例如为：使用预设的人体轮廓提取方法，将所述第一对象的人体轮廓提取出来，并识别出所述人体轮廓中的面部区域，将所述面部区域的图像数据输入预设的微表情识别模型中。其中，所述微表情识别模型例如为基于神经网络模型训练完成的微表情识别模型，其中，所述微表情识别模型基于人脸图像，以及与所述人脸图像关联的微表情类别组成的样本数据训练而成。其中神经网络模型可以为任意模型，例如VGG16模型、VGG19模型、VGG-F模型、ResNet152模型、ResNet50模型、DPN131模型、IXception模型、AlexNet模型和DenseNet模型等，优选DPN模型。DPN(Dual Path Network)是神经网络结构，在ResNeXt的基础上引入了DenseNet的核心内容，使得模型对特征的利用更加充分。上述DPN、ResNeXt和DenseNet是现有的网络结构，在此不在赘述。其中识别出的微表情可以分为任意种类，优选分为54种微表情，进一步地将恐惧、紧张、被动、分心和不安的微表情记录入恶意微表情列表。

如上述步骤S4所述，若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹。为了进一步判断所述第一对象是否被挟持，本申请还采用声纹识别的方式进行判断。其中声纹识别的过程例如为：将所述声音信息输入预设的声纹识别模型中，并利用所述声纹识别模型解析所述声音信息，从而得到指定声音特征，其中所述指定声音特征至少包括最高语速、最低语速、重音数量和所述声音信息中所有单词数量；将所述指定声音特征映射为多维向量，其中所述多维向量的一个分向量为所述最高语速与最低语速的差值，另一个分向量为所述重音数量与所述声音信息中所有单词数量的比值；计算所述多维向量与预设的标准声纹库中的多个标准声纹对应的多维向量的距离，并将距离最小的标准声纹记为目标声纹(其中距离例如为欧氏距离，距离越小，表明两个向量越相似，以向量(111)和向量(111)举例，向量(111)和向量(111)的欧氏距离＝√[(1-1) ²+(1-1) ²+(1-1) ²]＝0，且欧氏距离的最小值为0，因此目标声纹与所述多维向量最为相近)；将所述目标声纹对应的声纹类别作为声纹识别结果进行输出，其中所述声纹类别包括负面声纹(在本申请中，已经过至少四个维度(至少包括最高语速、最低语速、重音数量和所述声音信息中所有单词数量)进行衡量，具体地衡量结果反应在标准声纹库中；当目标声纹为负面声纹，则输出结果为负面声纹)与非负面声纹。其中所述距离例如为欧氏距离等。其中，将目标声纹对应的声纹类别作为声纹识别结果的意义的目的在于，判断所述第一对象是否存在负面情绪(若所述第一对象存在被劫持等情况，那么会存在负面情绪)。其中，所述负面声纹代表负面情绪。

如上述步骤S5所述，若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度。其中所述干涉程度值的计算方法例如为，利用预设的人体图像提取方法，从所述第二图像中提取出所述第二对象的人体图像，并从所述人体图像中提取肢体特征；从所述肢体特征中筛选出指向所述第一对象的指定肢体特征；利用所述视频获取所述指定肢体特征存在的时间长度；将所述指定肢体特征和所述指定肢体特征存在的时间长度输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值。其中所述指向所述第一对象的指定肢体特征例如为：手指指向，手臂指向，手掌指向，下巴指向等。干涉程度计算模型可以为任意可行模型，例如采用神经网络模型，其计算过程例如为：从所述第二对象的图像信息中提取特征信息，从预设的权重参数表中获取所述特征信息对应的权重参数，利用预设的权重加和公式计算得到干涉程度值。

如上述步骤S6所述，若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。若所述干涉程度值不处于预设的干涉数值区间，表明所述第二对象对所述第一对象存在干涉现象，但干涉并非是明示的行为，因此不属于亲朋好友之类的干涉，也因此可能存在挟持的现象。据此执行报警操作。

在一个实施方式中，所述将所述第一图像输入预设的基于残差网络的行人再识别模型中，从而获得行人识别结果的步骤S1，包括：

S101、将所述第一图像输入预设的训练好的基于残差网络的行人再识别模型中计算，从而获取所述残差网络中的第四个残差块输出的特征图像，其中，所述行人再识别模型基于行人图像，以及与行人图像关联的识别结果的样本数据训练而成，所述残差网络共有五个残差块；

S102、将所述特征图像输入所述残差网络中的第五个残差块中计算，从而获得所述第五个残差块输出的主数据；以及并行地将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据；以及并行地将所述特征图像输入所述行人再识别模型中的预设的局部识别子网络中计算，从而获得所述局部识别子网络输出的局部子数据；

S103、将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果。

如上所述，实现了获得所述全连接层输出的行人再识别结果。本申请为了解决网络在经过层层处理之后，输入图像的细节特征会相应丢失的技术问题，还在行人再识别模型中设置了全局识别子网络和局部识别子网络，用以与第五个残差块一起并行接收第四个残差块输出的特征图像。而全局识别子网络和局部识别子网络能够将第四个残差块输出的特征图像的全局特征与局部特征选择性地保存下来，从而避免了有用数据的丢失，同时避免过多干扰数据的加入。所述行人再识别模型的输出层可为任意层，本申请优选全连接层，从而利用全连接层输出映射成一个固定长度的特征向量，再根据特征向量得到识别结果。其中所述第五个残差块对特征图像的过程，即是包括卷积在内的过程(也还可以包括池化、激活等过程)。所述行人再识别模型中预设的全局识别子网络对所述特征图像的过程，即是将所述特征图像的全局特征(整幅图像的特征)提取的过程，例如将特征图像的全局颜色进行提取、特征图像的全局轮廓进行提取。所述行人再识别模型中预设的局部识别子网络中计算对所述特征图像的过程，即是对所述特征图像中的局部区域(例如在整幅图像中选取头部区域)的特征进行提取的过程，例如将特征图像的局部颜色进行提取、特征图像的局部轮廓进行提取。其中所述全局识别子网络和所述局部识别子网络可以采用任意的神经网络构造，例如采用基于卷积神经网络构造而形成。据此，将为了避免细节丢失的所述全局子数据和所述局部子数据以及所述主数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果。从而提高识别结果的准确性。

在一个实施方式中，所述将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据的步骤S102,包括：

S1021、通过所述全局识别子网络在所述特征图像中提取指定数据，并判断所述指定数据的数值是否在预设的数值范围之内，其中所述指定数据至少包括人体轮廓、人体肤色或者衣着颜色；

S1022、若所述指定数据的数值不在预设的数值范围之内，则将所述指定数据作为全局子数据，并输出所述全局子数据。

如上所述，实现了获得所述全局识别子网络输出的全局子数据。为了防止图像细节丢失，本申请在第四个残差块输出的特征图像中提出全局子数据，其中所述全局子数据的数值不在预设的数值范围之内，以实现保留差别较大的数据，而避免无用数据的干扰。指定数据为能够体现行人特征的数据，例如包括人体轮廓、人体肤色或者衣着颜色。由于人体轮廓不均一致、肤色或者衣着颜色也很可能不相同，据此将其作为指定数据进行提取。若所述指定数据的数值不在预设的数值范围之内，表明所述指定数据可用，例如要在黄种人中识别出白人，则人体肤色的数据的颜色值不在预设的数值范围之内，则可以作为有效数据输出。进一步地，所述全局识别子网络选择多个指定数据进行采集，并将数值不在预设的数值范围之内的指定数据作为全局子数据，并输出。其中，指定数据的个数可设置为2-10个，优选6-8个。进一步地，所述全局识别子网络可包括任意层数的神经网络，例如包括6-8层神经网络。

进一步地，所述将所述特征图像输入所述行人再识别模型中的预设的局部识别子网络中计算，从而获得所述局部识别子网络输出的局部子数据,包括：通过所述局部识别子网络，采用预设的区块划分方法将所述特征图像划分为多个区块；在各个所述区块中分别提取指定数据，并判断所述指定数据的数值是否在预设的数值范围之内，其中所述指定数据至少包括局部轮廓、局部肤色、或者局部衣着颜色；若所述指定数据的数值不在预设的数值范围之内，则将所述指定数据作为局部子数据，并输出所述局部子数据。据此，实现了获得所述局部识别子网络输出的局部子数据。网络在经过层层处理之后，输入图像的细节特征会相应丢失，尤其是局部的图像数据会丢失。为了保留局部的有效数据，本申请通过所述局部识别子网络，采用预设的区块划分方法将所述特征图像划分为多个区块，并在各个所述区块中分别提取指定数据，若所述指定数据的数值不在预设的数值范围之内，则将所述指定数据作为局部子数据，并输出所述局部子数据。从而实现了保存有价值的局数子数据，并作为后续识别的依据之一。进一步地，所述局部识别子网络选择多个指定数据进行采集，并将数值不在预设的数值范围之内的指定数据作为全局子数据，并输出。其中，指定数据的个数可设置为2-10个，优选6-8个。进一步地，所述局部识别子网络可包括任意层数的神经网络，例如包括8-10层神经网络。进一步地，所述区块划分方法例如为：识别出所述特征图像中的特征形状，并将所述特征形状为中心的区域作为单个区块进行划分(例如识别出头部轮廓，则将头部轮廓作为头部区块进行划分)。

在一个实施方式中，所述将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果的步骤S103,包括：

S1031、采用预设的映射方法，通过所述全连接层将所述主数据、所述全局子数据和所述局部子数据映射为一个固定长度的特征向量；

S1032、根据预设的分向量与识别结果对应关系，输出所述特征向量中数值最大的分向量对应的识别结果。

如上所述，实现了综合利用所述主数据、所述全局子数据和所述局部子数据，从而获得所述全连接层输出的行人再识别结果。传统技术中的基于残差网络的模型，均是将第五个残差块的数据输入全连接层中，再由全连接层将数据映射为特征向量。而本申请还综合考虑了所述第五个残差块输出的主数据、所述全局识别子网络输出的全局子数据和所述局部识别子网络输出的局部子数据，从而利用全连接层将其映射为一个固定长度的特征向量，从而提高了识别准确度。其中预设的映射方法，与传统技术中全连接层的映射方法相似，在此不再赘述。其中全连接层输出的特征向量的各个分向量均代表了对应的识别结果，而数值最大的分向量对应的识别结果则是最可能的识别结果，因此将数值最大的分向量对应的识别结果作为最终输出的识别结果。

在一个实施方式中，所述从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，从而得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别的步骤S3之前，包括：

S21、获取指定数量的样本数据，并将样本数据分成训练集和测试集；其中，所述样本数据包括人脸图像，以及与所述人脸图像关联的微表情类别；

S22、将训练集的样本数据输入到预设的神经网络模型中进行训练，得到初始微表情识别模型，其中，训练的过程中采用随机梯度下降法；

S23、利用测试集的样本数据验证所述初始微表情识别模型；

S24、若验证通过，则将所述初始微表情识别模型记为所述微表情识别模型。

如上所述，实现了设置微表情识别模型。本实施方式基于神经网络模型以训练出微表情识别模型。其中神经网络模型可为VGG16模型、VGG19模型、VGG-F模型、ResNet152模型、ResNet50模型、DPN131模型、IXception模型、AlexNet模型和DenseNet模型等，优选DPN模型。其中，随机梯度下降法就是随机取样一些训练数据，替代整个训练集，如果样本量很大的情况(例如几十万)，那么可能只用其中几万条或者几千条的样本，就已经迭代到最优解了，可以提高训练速度。进一步地，训练的过程还可以采用反向传导法则更新所述神经网络模型各层的参数。其中反向传导法则(BP)建立在梯度下降法的基础上，BP网络的输入输出关系实质上是一种映射关系：一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性，有利于神经网络模型各层的参数的更新。从而获得初始微表情识别模型。再利用测试集的样本数据验证所述初始微表情识别模型，若验证通过，则将所述初始微表情识别模型记为所述微表情识别模型。

在一个实施方式中，所述将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果的步骤S4,包括：

S401、将所述声音信息输入预设的声纹识别模型中，并利用所述声纹识别模型解析所述声音信息，从而得到指定声音特征，其中所述指定声音特征至少包括最高语速、最低语速、重音数量和所述声音信息中所有单词数量；

S402、将所述指定声音特征映射为多维向量，其中所述多维向量的一个分向量为所述最高语速与最低语速的差值，另一个分向量为所述重音数量与所述声音信息中所有单词数量的比值；

S403、计算所述多维向量与预设的标准声纹库中的多个标准声纹对应的多维向量的距离，并将距离最小的标准声纹记为目标声纹；

S404、将所述目标声纹对应的声纹类别作为声纹识别结果进行输出，其中所述声纹类别包括负面声纹与非负面声纹。

如上所述，实现了得到声纹识别结果。声纹是用电声学仪器显示的携带言语信息的声波频谱，声纹不仅具有特定性，而且有相对稳定性的特点，因此在不同情绪下的声纹是有差异的，据此可以分析出第一对象的情绪状态。本申请采用解析所述声音信息，从而得到指定声音特征，其中所述指定声音特征至少包括最高语速、最低语速、重音数量和所述声音信息中所有单词数量，并将所述指定声音特征映射为多维向量，其中所述多维向量的一个分向量为所述最高语速与最低语速的差值，另一个分向量为所述重音数量与所述声音信息中所有单词数量的比值，从而将声音信息映射为多维向量，其中所述多维向量的其他维度的向量可以包括其他声音特征。再计算所述多维向量与预设的标准声纹库中的多个标准声纹对应的多维向量的距离，并将距离最小的标准声纹记为目标声纹，并且由于距离最小的标准声纹与所述声音信息对应的声纹最为相近，因此将距离最小的标准声纹记为目标声纹，并将所述目标声纹对应的声纹类别作为声纹识别结果进行输出。所述距离例如为欧氏距离、余弦相似度等等。其中所述标准声纹库中预存有不同情绪下的标准声纹以及所述标准声纹对应的多维向量。

在一个实施方式中，所述第二图像是所述第二摄像头采集的视频中的一帧图像，所述从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值的步骤S5，包括：

S501、利用预设的人体图像提取方法，从所述第二图像中提取出所述第二对象的人体图像，并从所述人体图像中提取肢体特征；

S502、从所述肢体特征中筛选出指向所述第一对象的指定肢体特征；

S503、利用所述视频获取所述指定肢体特征存在的时间长度；

S504、将所述指定肢体特征和所述指定肢体特征存在的时间长度输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值。

如上所述，实现了得到所述干涉程度计算模型输出的干涉程度值。本申请通过从图像中识别出指向所述第一对象的指定肢体特征，并且利用所述视频获取所述指定肢体特征存在的时间长度作为计算干涉程度值的基础。例如，当第二对象用手指指向所述第一对象并保持了一秒钟时间，即可以确定所述第二对象对所述第一对象存在较强的干涉。据此，将所述指定肢体特征和所述指定肢体特征存在的时间长度输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值。

本申请的基于残差网络的报警方法，以微表情识别加上声纹识别的方式提高报警的准确性；通过干涉程度计算模型计算得到干涉程度值，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度，从而确认是否存在第二对象对第一对象进行要挟的可能，若干涉程度高，则执行报警操作。从而借助关联(第二对象)对象判断是否需要报警，更进一步提高了报警准确性。

参照图2，本申请实施例提供一种基于关联对象的报警装置，包括：

行人识别结果判断单元10，用于获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，从而获得行人识别结果，并判断所述行人识别结果是否与预设的嫌疑对象库中的嫌疑对象相同，其中所述行人识别结果为人体特征；

第二图像采集单元20，用于若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内；

微表情识别单元30，用于从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，从而得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

声纹识别单元40，用于若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹；

干涉程度计算单元50，用于若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度；

报警单元60，用于若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。

其中上述单元分别用于执行的操作与前述实施方式的基于残差网络的报警方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述行人识别结果判断单元10，包括：

特征图像获取子单元，用于将所述第一图像输入预设的训练好的基于残差网络的行人再识别模型中计算，从而获取所述残差网络中的第四个残差块输出的特征图像，其中，所述行人再识别模型基于行人图像，以及与行人图像关联的识别结果的样本数据训练而成，所述残差网络共有五个残差块；

数据获取子单元，用于将所述特征图像输入所述残差网络中的第五个残差块中计算，从而获得所述第五个残差块输出的主数据；以及并行地将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据；以及并行地将所述特征图像输入所述行人再识别模型中的预设的局部识别子网络中计算，从而获得所述局部识别子网络输出的局部子数据；

行人再识别结果获取子单元，用于将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果。

其中上述子单元分别用于执行的操作与前述实施方式的基于残差网络的报警方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述数据获取子单元,包括：

指定数据获取模块，用于通过所述全局识别子网络在所述特征图像中提取指定数据，并判断所述指定数据的数值是否在预设的数值范围之内，其中所述指定数据至少包括人体轮廓、人体肤色或者衣着颜色；

全局子数据输出模块，用于若所述指定数据的数值不在预设的数值范围之内，则将所述指定数据作为全局子数据，并输出所述全局子数据。

其中上述模块分别用于执行的操作与前述实施方式的基于残差网络的报警方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述行人再识别结果获取子单元,包括：

映射模块，用于采用预设的映射方法，通过所述全连接层将所述主数据、所述全局子数据和所述局部子数据映射为一个固定长度的特征向量；

识别结果输出模块，用于根据预设的分向量与识别结果对应关系，输出所述特征向量中数值最大的分向量对应的识别结果。

在一个实施方式中，所述装置，包括：

样本数据获取单元，用于获取指定数量的样本数据，并将样本数据分成训练集和测试集；其中，所述样本数据包括人脸图像，以及与所述人脸图像关联的微表情类别；

训练单元，用于将训练集的样本数据输入到预设的神经网络模型中进行训练，得到初始微表情识别模型，其中，训练的过程中采用随机梯度下降法；

验证单元，用于利用测试集的样本数据验证所述初始微表情识别模型；

标记单元，用于若验证通过，则将所述初始微表情识别模型记为所述微表情识别模型。

在一个实施方式中，所述声纹识别单元40，包括：

声音信息输入子单元，用于将所述声音信息输入预设的声纹识别模型中，并利用所述声纹识别模型解析所述声音信息，从而得到指定声音特征，其中所述指定声音特征至少包括最高语速、最低语速、重音数量和所述声音信息中所有单词数量；

多维向量映射子单元，用于将所述指定声音特征映射为多维向量，其中所述多维向量的一个分向量为所述最高语速与最低语速的差值，另一个分向量为所述重音数量与所述声音信息中所有单词数量的比值；

距离计算子单元，用于计算所述多维向量与预设的标准声纹库中的多个标准声纹对应的多维向量的距离，并将距离最小的标准声纹记为目标声纹；

声纹识别结果输出子单元，用于将所述目标声纹对应的声纹类别作为声纹识别结果进行输出，其中所述声纹类别包括负面声纹与非负面声纹。

在一个实施方式中，所述干涉程度计算单元50，包括：

人体图像提取子单元，用于利用预设的人体图像提取方法，从所述第二图像中提取出所述第二对象的人体图像，并从所述人体图像中提取肢体特征；

指定肢体特征获取子单元，用于从所述肢体特征中筛选出指向所述第一对象的指定肢体特征；

时间长度获取子单元，用于利用所述视频获取所述指定肢体特征存在的时间长度；

干涉程度值输出子单元，用于将所述指定肢体特征和所述指定肢体特征存在的时间长度输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值。

本申请的基于关联对象的报警装置，以微表情识别加上声纹识别的方式提高报警的准确性；通过干涉程度计算模型计算得到干涉程度值，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度，从而确认是否存在第二对象对第一对象进行要挟的可能，若干涉程度高，则执行报警操作。从而借助关联(第二对象)对象判断是否需要报警，更进一步提高了报警准确性。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于残差网络的报警方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于残差网络的报警方法。

上述处理器执行上述基于残差网络的报警方法，其中所述方法包括的步骤分别与执行前述实施方式的基于残差网络的报警方法的步骤一一对应,在此不再赘述。

本申请的计算机设备，以微表情识别加上声纹识别的方式提高报警的准确性；通过干涉程度计算模型计算得到干涉程度值，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度，从而确认是否存在第二对象对第一对象进行要挟的可能，若干涉程度高，则执行报警操作。从而借助关联(第二对象)对象判断是否需要报警，更进一步提高了报警准确性。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现基于残差网络的报警方法，其中所述方法包括的步骤分别与执行前述实施方式的基于残差网络的报警方法的步骤一一对应,在此不再赘述。

本申请的计算机可读存储介质，以微表情识别加上声纹识别的方式提高报警的准确性；通过干涉程度计算模型计算得到干涉程度值，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度，从而确认是否存在第二对象对第一对象进行要挟的可能，若干涉程度高，则执行报警操作。从而借助关联(第二对象)对象判断是否需要报警，更进一步提高了报警准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

Claims

一种基于残差网络的报警方法，包括：

获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，获得人体特征，并判断所述行人识别结果与预设的嫌疑对象库中的嫌疑对象是否相同；

若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内；

从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹；

若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度；

若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。
根据权利要求1所述的基于残差网络的报警方法，所述将所述第一图像输入预设的基于残差网络的行人再识别模型中，获得行人识别结果的步骤，包括：

将所述第一图像输入预设的训练好的基于残差网络的行人再识别模型中计算，从而获取所述残差网络中的第四个残差块输出的特征图像，其中，所述行人再识别模型基于行人图像，以及与行人图像关联的识别结果的样本数据训练而成，所述残差网络共有五个残差块；

将所述特征图像输入所述残差网络中的第五个残差块中计算，从而获得所述第五个残差块输出的主数据；以及并行地将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据；以及并行地将所述特征图像输入所述行人再识别模型中的预设的局部识别子网络中计算，从而获得所述局部识别子网络输出的局部子数据；

将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果。
根据权利要求2所述的基于残差网络的报警方法，所述将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据的步骤,包括：

通过所述全局识别子网络在所述特征图像中提取指定数据，并判断所述指定数据的数值是否在预设的数值范围之内，其中所述指定数据至少包括人体轮廓、人体肤色或者衣着颜色；

若所述指定数据的数值不在预设的数值范围之内，则将所述指定数据作为全局子数据，并输出所述全局子数据。
根据权利要求2所述的基于残差网络的报警方法，所述将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果的步骤,包括：

采用预设的映射方法，通过所述全连接层将所述主数据、所述全局子数据和所述局部子数据映射为一个固定长度的特征向量；

根据预设的分向量与识别结果对应关系，输出所述特征向量中数值最大的分向量对应的识别结果。
根据权利要求1所述的基于残差网络的报警方法，所述从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别的步骤之前，包括：

获取指定数量的样本数据，并将样本数据分成训练集和测试集；其中，所述样本数据包括人脸图像，以及与所述人脸图像关联的微表情类别；

将训练集的样本数据输入到预设的神经网络模型中进行训练，得到初始微表情识别模型，其中，训练的过程中采用随机梯度下降法；

利用测试集的样本数据验证所述初始微表情识别模型；

若验证通过，则将所述初始微表情识别模型记为所述微表情识别模型。
根据权利要求1所述的基于残差网络的报警方法，所述将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果的步骤,包括：

将所述声音信息输入预设的声纹识别模型中，并利用所述声纹识别模型解析所述声音信息，从而得到指定声音特征，其中所述指定声音特征至少包括最高语速、最低语速、重音数量和所述声音信息中所有单词数量；

将所述指定声音特征映射为多维向量，其中所述多维向量的一个分向量为所述最高语速与最低语速的差值，另一个分向量为所述重音数量与所述声音信息中所有单词数量的比值；

计算所述多维向量与预设的标准声纹库中的多个标准声纹对应的多维向量的距离，并将距离最小的标准声纹记为目标声纹；

将所述目标声纹对应的声纹类别作为声纹识别结果进行输出，其中所述声纹类别包括负面声纹与非负面声纹。
根据权利要求1所述的基于残差网络的报警方法，所述第二图像是所述第二摄像头采集的视频中的一帧图像，所述从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值的步骤，包括：

利用预设的人体图像提取方法，从所述第二图像中提取出所述第二对象的人体图像，并从所述人体图像中提取肢体特征；

从所述肢体特征中筛选出指向所述第一对象的指定肢体特征；

利用所述视频获取所述指定肢体特征存在的时间长度；

将所述指定肢体特征和所述指定肢体特征存在的时间长度输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值。
一种基于关联对象的报警装置，包括：

行人识别结果判断单元，用于获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，从而获得行人识别结果，并判断所述行人识别结果是否与预设的嫌疑对象库中的嫌疑对象相同，其中所述行人识别结果为人体特征；

第二图像采集单元，用于若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内；

微表情识别单元，用于从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，从而得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

声纹识别单元，用于若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹；

干涉程度计算单元，用于若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度；

报警单元，用于若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。
一种计算机设备，包括：

一个或多个处理器；

存储器；

一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个计算机程序配置用于执行一种基于基于残差网络的报警方法，其中，所述基于残差网络的报警方法包括：

获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，获得人体特征，并判断所述行人识别结果与预设的嫌疑对象库中的嫌疑对象是否相同；

若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内；

从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹；

若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度；

若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。
根据权利要求9所述的计算机设备，所述将所述第一图像输入预设的基于残差网络的行人再识别模型中，获得行人识别结果的步骤，包括：

将所述第一图像输入预设的训练好的基于残差网络的行人再识别模型中计算，从而获取所述残差网络中的第四个残差块输出的特征图像，其中，所述行人再识别模型基于行人图像，以及与行人图像关联的识别结果的样本数据训练而成，所述残差网络共有五个残差块；

将所述特征图像输入所述残差网络中的第五个残差块中计算，从而获得所述第五个残差块输出的主数据；以及并行地将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据；以及并行地将所述特征图像输入所述行人再识别模型中的预设的局部识别子网络中计算，从而获得所述局部识别子网络输出的局部子数据；

将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果。
根据权利要求10所述的计算机设备，所述将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据的步骤,包括：

通过所述全局识别子网络在所述特征图像中提取指定数据，并判断所述指定数据的数值是否在预设的数值范围之内，其中所述指定数据至少包括人体轮廓、人体肤色或者衣着颜色；

若所述指定数据的数值不在预设的数值范围之内，则将所述指定数据作为全局子数据，并输出所述全局子数据。
根据权利要求10所述的计算机设备，所述将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果的步骤,包括：

采用预设的映射方法，通过所述全连接层将所述主数据、所述全局子数据和所述局部子数据映射为一个固定长度的特征向量；

根据预设的分向量与识别结果对应关系，输出所述特征向量中数值最大的分向量对应的识别结果。
根据权利要求9所述的计算机设备，所述从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别的步骤之前，包括：

获取指定数量的样本数据，并将样本数据分成训练集和测试集；其中，所述样本数据包括人脸图像，以及与所述人脸图像关联的微表情类别；

将训练集的样本数据输入到预设的神经网络模型中进行训练，得到初始微表情识别模型，其中，训练的过程中采用随机梯度下降法；

利用测试集的样本数据验证所述初始微表情识别模型；

若验证通过，则将所述初始微表情识别模型记为所述微表情识别模型。
根据权利要求9所述的计算机设备，所述将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果的步骤,包括：

将所述声音信息输入预设的声纹识别模型中，并利用所述声纹识别模型解析所述声音信息，从而得到指定声音特征，其中所述指定声音特征至少包括最高语速、最低语速、重音数量和所述声音信息中所有单词数量；

将所述指定声音特征映射为多维向量，其中所述多维向量的一个分向量为所述最高语速与最低语速的差值，另一个分向量为所述重音数量与所述声音信息中所有单词数量的比值；

计算所述多维向量与预设的标准声纹库中的多个标准声纹对应的多维向量的距离，并将距离最小的标准声纹记为目标声纹；

将所述目标声纹对应的声纹类别作为声纹识别结果进行输出，其中所述声纹类别包括负面声纹与非负面声纹。
根据权利要求9所述的计算机设备，所述第二图像是所述第二摄像头采集的视频中的一帧图像，所述从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值的步骤，包括：

利用预设的人体图像提取方法，从所述第二图像中提取出所述第二对象的人体图像，并从所述人体图像中提取肢体特征；

从所述肢体特征中筛选出指向所述第一对象的指定肢体特征；

利用所述视频获取所述指定肢体特征存在的时间长度；

将所述指定肢体特征和所述指定肢体特征存在的时间长度输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现基于残差网络的报警方法，其中，所述基于残差网络的报警方法包括以下步骤：

获取第一摄像头采集的第一图像，并将所述第一图像输入预设的基于残差网络的行人再识别模型中，获得人体特征，并判断所述行人识别结果与预设的嫌疑对象库中的嫌疑对象是否相同；

若所述行人识别结果与预设的嫌疑对象库中的嫌疑对象不相同，则获取第二摄像头采集的第二图像，其中所述第二图像至少包括第一对象与第二对象，所述第一对象与所述第二对象之间的距离不大于预设距离，所述第二摄像头的取景范围在所述第一摄像头的取景范围之内；

从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别；

若所述微表情识别结果不属于预设的恶意微表情列表，则通过预设的麦克风采集所述第一对象的声音信息，并将所述声音信息输入预设的声纹识别模型中，从而得到声纹识别结果，并判断所述声纹识别结果是否为负面声纹，其中所述声纹识别结果包括负面声纹与非负面声纹；

若所述声纹识别结果不为负面声纹，则从所述第二图像中提取出所述第二对象的图像信息，并输入预设的干涉程度计算模型中，从而得到所述干涉程度计算模型输出的干涉程度值，并判断所述干涉程度值是否处于预设的干涉数值区间，其中所述干涉数值用于衡量所述第二对象对所述第一对象的干涉程度；

若所述干涉程度值不处于预设的干涉数值区间，则执行报警操作。
根据权利要求16所述的计算机可读存储介质，所述将所述第一图像输入预设的基于残差网络的行人再识别模型中，获得行人识别结果的步骤，包括：

将所述第一图像输入预设的训练好的基于残差网络的行人再识别模型中计算，从而获取所述残差网络中的第四个残差块输出的特征图像，其中，所述行人再识别模型基于行人图像，以及与行人图像关联的识别结果的样本数据训练而成，所述残差网络共有五个残差块；

将所述特征图像输入所述残差网络中的第五个残差块中计算，从而获得所述第五个残差块输出的主数据；以及并行地将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据；以及并行地将所述特征图像输入所述行人再识别模型中的预设的局部识别子网络中计算，从而获得所述局部识别子网络输出的局部子数据；

将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果。
根据权利要求17所述的计算机可读存储介质，所述将所述特征图像输入所述行人再识别模型中预设的全局识别子网络中计算，从而获得所述全局识别子网络输出的全局子数据的步骤,包括：

通过所述全局识别子网络在所述特征图像中提取指定数据，并判断所述指定数据的数值是否在预设的数值范围之内，其中所述指定数据至少包括人体轮廓、人体肤色或者衣着颜色；

若所述指定数据的数值不在预设的数值范围之内，则将所述指定数据作为全局子数据，并输出所述全局子数据。
根据权利要求17所述的计算机可读存储介质，所述将所述主数据、所述全局子数据和所述局部子数据输入所述行人再识别模型中预设的全连接层中，从而获得所述全连接层输出的行人再识别结果的步骤,包括：

采用预设的映射方法，通过所述全连接层将所述主数据、所述全局子数据和所述局部子数据映射为一个固定长度的特征向量；

根据预设的分向量与识别结果对应关系，输出所述特征向量中数值最大的分向量对应的识别结果。
根据权利要求16所述的计算机可读存储介质，所述从所述第二图像中提取出所述第一对象的图像信息，并输入预设的微表情识别模型中，得到微表情识别结果，并判断所述微表情识别结果是否属于预设的恶意微表情列表，其中所述微表情识别结果为微表情类别的步骤之前，包括：

获取指定数量的样本数据，并将样本数据分成训练集和测试集；其中，所述样本数据包括人脸图像，以及与所述人脸图像关联的微表情类别；

将训练集的样本数据输入到预设的神经网络模型中进行训练，得到初始微表情识别模型，其中，训练的过程中采用随机梯度下降法；

利用测试集的样本数据验证所述初始微表情识别模型；

若验证通过，则将所述初始微表情识别模型记为所述微表情识别模型。