CN117094592A

CN117094592A - 一种基于多维检测的工单自动验收方法、装置及相关介质

Info

Publication number: CN117094592A
Application number: CN202311051085.1A
Authority: CN
Inventors: 张圻; 陈佳木; 袁戟; 张晓玥
Original assignee: Wuhan Wanrui Digital Operation Co ltd
Current assignee: Wuhan Wanrui Digital Operation Co ltd
Priority date: 2023-08-21
Filing date: 2023-08-21
Publication date: 2023-11-21

Abstract

本发明公开了一种基于多维检测的工单自动验收方法、装置及相关介质，该方法包括：获取待验收的工单；进行人脸识别以及计算相似度并结合人脸识别的和相似度计算结果生成现场验收结果；将时间戳与预设时间戳阈值对比并生成时间对比验收结果；通过奇偶法判断作业位置是否在工单计划作业范围内并生成位置对比验收结果；对工单作业描述进行语法合理性检测，生成语法合理性验收结果；对作业接单位置坐标、开始工作位置坐标和完工位置坐标进行两两坐标距离计算，并生成距离验收结果；基于现场验收、时间戳对比验收、位置对比验收、语法合理性验收和距离验收结果判断工单是否验收通过。本发明从多个维度对工单进行自动验收，提高了工单验收的效率和质量。

Description

一种基于多维检测的工单自动验收方法、装置及相关介质

技术领域

本发明涉及工单验收、质量检查技术领域，特别涉及一种基于多维检测的工单自动验收方法、装置及相关介质。

背景技术

劳动密集型是物业、家电维修、家政等服务行业的标签，现如今，服务行业的传统管理模式面临多层管理效率低、管理不透明、服务结果难量化、服务标准难持续等问题。而近年来，随着服务行业的数字化转型，智慧工单已经得到了广泛的应用，在服务行业为客户的资产和空间等领域提供统一报事、周期性维保任务、任务分配与调度等整体解决方案。

现有的工单验收方法普遍为人工验收方法，但由于需要验收的工单的体量较大，因此人工验收方法存在着普遍性的缺点，例如人工成本较高、验收标准不统一、验收时效长和验收准确率低等，这会导致大量已完成的工单堆积、难以及时地进行验收。因此，如何提高工单验收的效率和质量并降低工单验收成本，是本领域技术人员需要解决的问题。

发明内容

本发明实施例提供了一种基于多维检测的工单自动验收方法、装置、计算机设备及存储介质，旨在提高工单验收的效率和质量并降低工单验收成本。

第一方面，本发明实施例提供了一种基于多维检测的工单自动验收方法，包括：

获取作业人员上传的待验收的工单；所述工单包含有工单信息，所述工单信息包括现场标准作业程序照片和完工照片、所述现场标准作业程序照片和所述完工照片对应的时间戳、作业位置和工单计划作业范围、工单作业描述、作业接单位置坐标、开始工作位置坐标和完工位置坐标；所述现场标准作业程序照片和完工照片均包含作业人员的人脸图像；

分别对所述现场标准作业程序照片和所述完工照片进行人脸识别，以及基于Contrastive Networks深度学习模型计算所述现场标准作业程序照片和所述完工照片的相似度，并结合人脸识别的结果和相似度计算结果生成现场验收结果；

将所述时间戳与预设时间戳阈值进行对比，并根据对比结果生成时间对比验收结果；

通过奇偶法判断所述作业位置是否在所述工单计划作业范围内，并根据判断结果生成位置对比验收结果；

基于Transformer架构对所述工单作业描述进行语法合理性检测，并根据检测结果生成语法合理性验收结果；

对作业接单位置坐标、开始工作位置坐标和完工位置坐标进行两两坐标距离计算，并根据距离计算结果生成距离验收结果；

基于现场验收结果、时间戳对比验收结果、位置对比验收结果、语法合理性验收结果和距离验收结果判断所述工单是否验收通过。

第二方面，本发明实施例提供了一种基于多维检测的工单自动验收装置，包括：

工单获取单元，用于获取作业人员上传的待验收的工单；所述工单包含有工单信息，所述工单信息包括现场标准作业程序照片和完工照片、所述现场标准作业程序照片和所述完工照片对应的时间戳、作业位置和工单计划作业范围、工单作业描述、作业接单位置坐标、开始工作位置坐标和完工位置坐标；所述现场标准作业程序照片和完工照片均包含作业人员的人脸图像；

现场验收单元，用于分别对所述现场标准作业程序照片和所述完工照片进行人脸识别，以及基于Contrastive Networks深度学习模型计算所述现场标准作业程序照片和所述完工照片的相似度，并结合人脸识别的结果和相似度计算结果生成现场验收结果；

时间对比验收单元，用于将所述时间戳与预设时间戳阈值进行对比，并根据对比结果生成时间对比验收结果；

位置对比验收单元，用于通过奇偶法判断所述作业位置是否在所述工单计划作业范围内，并根据判断结果生成位置对比验收结果；

语法合理性验收单元，用于基于Transformer架构对所述工单作业描述进行语法合理性检测，并根据检测结果生成语法合理性验收结果；

距离验收单元，用于对作业接单位置坐标、开始工作位置坐标和完工位置坐标进行两两坐标距离计算，并根据距离计算结果生成距离验收结果；

工单验收单元，用于基于现场验收结果、时间戳对比验收结果、位置对比验收结果、语法合理性验收结果和距离验收结果判断所述工单是否验收通过。

第三方面，本发明实施例提供了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的基于多维检测的工单自动验收方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的基于多维检测的工单自动验收方法。

本发明公开了一种基于多维检测的工单自动验收方法、装置及相关介质，该方法包括：获取作业人员上传的待验收的工单；分别对所述现场标准作业程序照片和所述完工照片进行人脸识别，以及基于Contrastive Networks深度学习模型计算所述现场标准作业程序照片和所述完工照片的相似度，并结合人脸识别的结果和相似度的计算结果生成现场验收结果；将所述时间戳与预设时间戳阈值进行对比，并根据对比结果生成时间对比验收结果；通过奇偶法判断所述作业位置是否在所述工单计划作业范围内，并根据判断结果生成位置对比验收结果；基于Transformer架构对所述工单作业描述进行语法合理性检测，并根据检测结果生成语法合理性验收结果；对作业接单位置坐标、开始工作位置坐标和完工位置坐标进行两两坐标距离计算，并根据距离计算结果生成距离验收结果；基于现场验收结果、时间戳对比验收结果、位置对比验收结果、语法合理性验收结果和距离验收结果判断所述工单是否验收通过。本发明通过从多个维度对待验收的工单进行自动验收，有效降低了运营管理人员对于工单验收的资源投入，节约了成本；并且能够实现目标作业场景全量工单检测的覆盖，提高了工单验收的效率和质量；同时还能够防止人员替代作业问题，保证了工单作业的真实性，从而实现了对工单作业的有效管控。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于多维检测的工单自动验收方法的流程示意图；

图2为本发明实施例提供的一种基于多维检测的工单自动验收方法的子流程示意图；

图3为本发明实施例提供的一种基于多维检测的工单自动验收方法的示例图；

图4为本发明实施例提供的一种基于多维检测的工单自动验收方法中ERNIE模型的模型架构图；

图5为本发明实施例提供的一种基于多维检测的工单自动验收装置的示意性框图；

图6为本发明实施例提供的一种基于多维检测的工单自动验收装置的子示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

下面请参见图1，图1为本发明实施例提供的一种基于多维检测的工单自动验收方法的流程示意图，具体包括：步骤S101～S107。

S101、获取作业人员上传的待验收的工单；所述工单包含有工单信息，所述工单信息包括现场标准作业程序照片和完工照片、所述现场标准作业程序照片和所述完工照片对应的时间戳、作业位置和工单计划作业范围、工单作业描述、作业接单位置坐标、开始工作位置坐标和完工位置坐标；所述现场标准作业程序照片和完工照片均包含作业人员的人脸图像；

S102、分别对所述现场标准作业程序照片和所述完工照片进行人脸识别，以及基于Contrastive Networks深度学习模型计算所述现场标准作业程序照片和所述完工照片的相似度，并结合人脸识别的结果和相似度计算结果生成现场验收结果；

S103、将所述时间戳与预设时间戳阈值进行对比，并根据对比结果生成时间对比验收结果；

S104、通过奇偶法判断所述作业位置是否在所述工单计划作业范围内，并根据判断结果生成位置对比验收结果；

S105、基于Transformer架构对所述工单作业描述进行语法合理性检测，并根据检测结果生成语法合理性验收结果；

S106、对作业接单位置坐标、开始工作位置坐标和完工位置坐标进行两两坐标距离计算，并根据距离计算结果生成距离验收结果；

S107、基于现场验收结果、时间戳对比验收结果、位置对比验收结果、语法合理性验收结果和距离验收结果判断所述工单是否验收通过。

本发明实施例首先获取作业人员上传的待验收的工单，然后根据工单信息中的现场标准作业程序(SOP，Standard Operating Procedure)照片和所述完工照片从现场验收维度和时间戳维度进行验收，根据作业位置和工单计划作业范围从位置维度进行验收，根据工单作业描述从语法合理性维度进行验收，以及根据作业接单位置坐标、开始工作位置坐标和完工位置坐标从距离验收维度进行验收，从不同的五个维度出发，对待验收的工单进行检测，再基于五个维度的验收结果判断待验收的工单是否验收通过。

本发明实施例通过结合人脸识别和相似度计算生成现场验收结果，以及通过时间戳对比生成时间对比验收结果，确保了工单的作业真实性，还能够有效把控工单的作业效率；并通过奇偶法判断作业位置是否在工单计划作业范围内，从而生成位置对比验收结果，确保了工单的作业准确性；还通过对工单作业描述进行语法合理性检测，并生成语法合理性验收结果，确保了工单的作业完成的质量。从多个维度出发能够更全面的对工单的信息进行验收，能够实现对工单作业场景验收的全方面覆盖，不仅保证了工单验收的真实性和准确性，同时还确保了工单验收的质量和效率，并且还降低了工单验收的成本。

结合图3所示，在具体实施例中，工单验收的管理人员可以根据实际情况，结合多维度的验收结果判断工单验收是否通过，例如，可以设定只有当现场验收结果、时间戳对比验收结果、位置对比验收结果、语法合理性验收结果和距离验收结果均通过验收时，才判定工单验收通过，否则判定工单验收不通过，或者还可以设定只需要现场验收结果、时间戳对比验收结果、位置对比验收结果、语法合理性验收结果和距离验收结果中，有任意的三个结果通过验收时，判定工单验收通过。此外，还可以根据具体的工单类型或者作业类型对维度的数量进行调整，例如对于相对简单的作业，可以只从现场验收结果和位置对比验收结果出发对工单进行验收。

在一实施例中，所述步骤S102包括：

通过FaceNet神经网络对所述现场标准作业程序照片和完工照片分别进行人脸特征信息提取，得到第一人脸特征信息和第二人脸特征信息，并对所述第一人脸特征信息和第二人脸特征信息分别进行L2范数归一化处理，得到第一人脸检测结果和第二人脸检测结果；

获取所述第一人脸检测结果和所述第二人脸检测结果之间的人脸差值，并将所述人脸差值与预设人脸阈值进行比较；

当所述人脸差值小于或等于预设人脸阈值时，则判定所述现场标准作业程序照片和所述完工照片的人脸信息匹配；

当所述人脸差值大于小于预设人脸阈值时，则判定所述现场标准作业程序照片和所述完工照片的人脸信息不匹配；

将所述人脸差值与预设人脸阈值的比较结果作为人脸识别的结果。

在本实施例中，通过FaceNet神经网络进行人脸特征信息提取，得到现场标准作业程序照片对应的第一人脸特征信息和完工照片对应的第二人脸特征信息，FaceNet神经网络输出的第一人脸特征信息和第二人脸特征信息是128维超空间中的特征向量，因此需要对第一人脸特征信息和第一人脸特征信息进行L2范数归一化处理，将128维超空间中的点规范化到128维超球面上，得到第一人脸检测结果和第二人脸检测结果，从而能够计算第一人脸检测结果和第二人脸检测结果之间的人脸差值，并利用人脸差值与预设人脸阈值进行比较最终生成人脸识别的结果，如果人脸差值小于或等于预设人脸阈值，则将人脸信息匹配作为现场标准作业程序照片和所述完工照片的人脸信息判定结果；如果人脸差值大于小于预设人脸阈值，则将人脸信息不匹配作为现场标准作业程序照片和所述完工照片的人脸信息判定结果，最后将人脸信息判定结果作为人脸识别的结果。

在一具体实施例中，在FaceNet神经网络进行人脸特征信息提取之前，需要对现场标准作业程序照片和完工照片进行预处理，去除照片中无关的背景信息，切出人脸图像，并对切出的人脸图像进行对齐。

在另一具体实施例中，FaceNet神经网络采用Inception深度卷积神经网络，并且在FaceNet神经网络进行人脸特征信息提取之前，还需要对FaceNet神经网络进行训练，FaceNet神经网络的训练步骤包括：

首先获取用于训练的人脸训练照片并进行数据预处理，再将数据预处理后的人脸训练照片组成包含三张图片的三元组训练数据；三元组训练数据中的两张图片内的人脸相互匹配，且两张图片内的人脸均与剩余的一张图片内的人脸不匹配；其次将三元组训练数据输入FaceNet神经网络进行人脸特征信息提取训练；最后按照下式计算三元损失函数对FaceNet神经网络进行优化：

其中，L表示三元损失函数，N表示三元组训练数据的样本数量，i表示当前处理的样本编号，f表示FaceNet神经网络，x表示输入样本，a表示锚点，p表示正例样本，n表示负例样本，α表示阈值。当与/>之间的距离小于/>与/>之间的距离加α时，[]内的值大于零，就会产生损失。基于三元组训练数据计算得到的三元损失函数对FaceNet神经网络优化，使得与/>间的距离尽可能小，以及使得/>与/>之间的距离尽可能拉大，可以使得FaceNet神经网络能够更好地学习到不同人脸之间的差异，并加快FaceNet神经网络朝目标方向的优化速度，从而提高人脸识别任务的性能表现。

在一实施例中，所述步骤S102还包括：

通过ResNet卷积神经网络对所述现场标准作业程序照片和所述完工照片分别进行特征提取，得到第一特征和第二特征；

对所述第一特征和第二特征进行相似度计算，得到相似度计算结果；

将相似度计算结果与预设相似度阈值进行比较；

当相似度计算结果大于或等于预设相似度阈值时，判定所述现场标准作业程序照片和所述完工照片的现场信息匹配；

当相似度计算结果小于预设相似度阈值时，判定所述现场标准作业程序照片和所述完工照片的现场信息不匹配；

结合人脸识别的结果，若人脸信息匹配且现场信息匹配，则将现场验收通过作为所述现场验收结果；若人脸信息不匹配和/或现场信息不匹配，则将现场验收未通过作为所述现场验收结果。

在本实施例中，在基于Contrastive Networks深度学习模型计算现场标准作业程序照片和所述完工照片的相似度时，首先通过ResNet卷积神经网络对现场标准作业程序照片和完工照片分别进行特征提取，得到第一特征和第二特征，然后对第一特征和第二特征进行相似度计算，并根据相似度计算结果与预设相似度阈值进行比较判定现场信息是否匹配，最终结合人脸识别的结果和现场信息的判定结果生成现场验收结果。具体来说，如果人脸信息匹配并且现场信息匹配，则将现场验收通过作为现场验收结果；如果人脸信息和现场信息中任意一个不匹配，例如人脸信息匹配但现场信息不匹配，或者人脸信息不匹配但现场信息匹配，又或者人脸信息和现场信息均不匹配，则将现场验收未通过作为现场验收结果。在具体应用场景中，也可以只需要人脸信息和现场信息其中任一个匹配，则将现场验收通过作为现场验收结果，也即，只需要满足人脸信息匹配但现场信息不匹配、人脸信息不匹配但现场信息匹配、人脸信息匹配且现场信息匹配中的任一项，均可以判定现场验收通过并作为现场验收结果。Contr astive Networks是一种用于计算图像相似度的深度学习模型，其基本思想是将两张图片的特征向量进行比较，计算它们之间的相似度得分。

在一具体实施例中，ResNet卷积神经网络需要进行预训练，预训练首先需要准备一组有标签的图片对，图片对的标签用来表示图片对中的两张图片是相似或是不相似，其次利用图片对ResNet卷积神经网络进行训练，并按照下式计算ResNet卷积神经网络的损失函数：

L₁＝y·D²+(1-y)·max(0,m-D)²

其中，L₁表示第二损失函数，y表示标签，D表示所述训练数据组对应的两个特征向量之间的距离，m表示预设边界值。

计算得到ResNet卷积神经网络的损失函数后，利用损失函数对ResNet卷积神经网络进行优化，使ResNet卷积神经网络能够准确地区分相似和不相似的图片对。此外，在通过损失函数优化ResNet卷积神经网络时，还可以会采用随机梯度下降等方法，并设置一些超参数(如学习率、批大小等)以控制优化过程，通过多次迭代优化损失函数并更新ResNet卷积神经网络的参数，可以逐渐提高ResNet卷积神经网络在检索任务上的性能表现。

在一实施例中，所述步骤S103包括：

当所述时间戳大于或等于预设时间戳阈值时，判定时间检测通过并作为时间对比验收结果输出；

当所述时间戳小于预设时间戳阈值时，判定时间检测不通过并作为时间对比验收结果输出。

在本实施例中，通过将现场标准作业程序照片和完工照片对应的时间戳与预设时间戳阈值进行对比，并根据时间戳的对比结果生成时间对比验收结果，如果时间戳大于或等于预设时间戳阈值，则将时间检测通过作为时间判定结果，如果时间戳小于预设时间戳阈值，则将时间检测未通过作为时间判定结果，最后将时间判定结果作为时间对比验收结果输出。时间戳通常是一个整数，其表示从某个固定时间点(例如1970年1月1日00:00:00UTC)开始经过的秒数或毫秒数。

结合图2所示，在一实施例中，所述步骤S104包括步骤S201～S205。

S201、获取所述工单计划作业范围对应的区域多边形以及所述作业位置对应的作业点；

S202、以所述作业点为端点，生成一条朝向且穿过所述区域多边形的射线；

S203、获取所述区域多边形与所述射线相交的线段数量；

S204、当所述线段数量为奇数时，判定所述作业位置在所述工单计划作业范围内并作为位置对比验收结果输出；

S205、当所述线段数量为偶数时，判定所述作业位置未在所述工单计划作业范围内并作为位置对比验收结果输出。

在本实施例中，首先获取工单计划作业范围对应的区域多边形以及作业位置对应的作业点，其次根据奇偶法，以作业点为端点生成一条朝向且穿过区域多边形的射线，并获取区域多边形与射线相交的线段数量，最后根据线段数量判定作业位置是否在工单计划作业范围内，以此生成位置对比验收结果，如果实际作业位置在计划作业位置范围内，则将位置维度验收通过作为位置判定结果；如果实际作业位置不在计划作业位置范围内，则将位置维度验收通过作为位置判定结果，最后将位置判定结果作为位置对比验收结果输出。

奇偶法又称奇偶规则(Odd-even Rule)，奇偶法可以用来判断一个点是否位于一个区域内。在本实施例中，奇偶法是将工单计划作业范围所对应的区域用一个多顶点的多边形来进行表示，多边形所有顶点的连线就构成了工单计划作业范围所构成的区域。然后从作业位置对应的作业点发出一条朝向且穿过多边形的射线，并统计多边形与射线相交的线段数量，如果相交线段数量为奇数，则说明实际作业位置在计划作业位置范围内；如果相交线段数量为偶数，则说明实际作业位置不在计划作业位置范围内。

在一实施例中，所述步骤S105包括：

对所述工单作业描述进行预处理；其中，所述预处理包括文本分词、词性标注、命名实体识别；

将所述工单作业描述输入基于Transformer架构的ERNIE模型中的T-编码器模块，并输出得到所述工单作业描述的第一字符嵌入、分段嵌入和位置嵌入，然后将所述第一字符嵌入、分段嵌入和位置嵌入结合为输入嵌入；

将所述输入嵌入依次输入至所述T-编码器模块的第一多头注意力层和前馈网络层，并输出得到第一文本信息嵌入；

获取第一文本信息嵌入中的第一实体嵌入，并将所述第一文本信息嵌入输入至K-编码器模块的第二多头注意力层，以及将所述第一实体嵌入输入至K-编码器模块的第三多头注意力层；

对所述第二多头注意力层和第三多头注意力层的输出结果进行对齐，并输入所述K-编码器模块中的信息融合层，输出得到第二文本信息嵌入和第二实体嵌入；

将所述第二文本信息嵌入和第二实体嵌入结合作为深层表示输入至全连接层，然后通过所述ERNIE模型的输出层输出所述工单作业描述的语法合理性得分；

将所述语法合理性得分与预设得分阈值进行比较；

当所述语法合理性得分大于预设得分阈值时，判定所述工单作业描述的语法合理并作为语法合理性验收结果输出；

当所述语法合理性得分小于或等于预设得分阈值时，判定所述工单作业描述的语法不合理并作为语法合理性验收结果输出。

在本实施例中，首先将预处理后的工单作业描述输入T-编码器模块，由T-编码器模块输出第一字符嵌入、分段嵌入和位置嵌入并结合为输入嵌入，再经由第一多头注意力层和前馈网络层进行处理，并输出得到第一文本信息嵌入，其次将第一文本信息嵌入和其中的实体嵌入分别通过第二多头注意力层和第三多头注意力层处理，并将第二多头注意力层和第三多头注意力层的输出结果进行对齐后输入K-编码器模块，利用信息融合层输出得到第二文本信息嵌入和第二实体嵌入，再次，将第二文本信息嵌入和第二实体嵌入结合作为深层表示，再经过全连接层，然后通过输出层输出工单作业描述的语法合理性得分，最后利用语法合理性得分与预设得分阈值进行比较判断工单作业描述的语法是否合理，如果语法合理性得分大于预设得分阈值，则将语法合理作为工单作业描述的判定结果；如果语法合理性得分小于或等于预设得分阈值，则将语法不合理作为工单作业描述的判定结果，最后判将工单作业描述的判定结果作为语法合理性验收结果输出。预设得分阈值可以根据应用场景的实际需求进行设定，例如可以设定预设得分阈值为0.5，如果语法合理性得分大于或等于0.5，则判定所述工单作业描述的语法合理，如果语法合理性得分小于0.5，则判定所述工单作业描述的语法不合理。

工单作业描述的预处理工作可以使用一些中文自然语言处理工具库(如jieba、StanfordNLP等)来实现。其中，文本分词是将输入文本按照一定规则切分成一个个单独的词语；词性标注是对每个词语进行分类，例如判断它是名词、动词还是形容词等；命名实体识别则是对文本中的实体(如人名、地名、组织机构等)进行标注。此外，预处理工作还可以包括输入编码，输入编码是将文本转换为ERNIE模型可以接受的输入格式，在输入编码步骤中，需要将文本转换为一系列对应的字符，并添加特殊字符以标记句子开始和结束。

工单作业描述中的字符嵌入(Token embedding)表示每个字符在词汇表中的向量表示；分段嵌入(Segment embedding)表示每个字符所属的句子编号；位置嵌入(Positional embedding)表示每个字符在输入序列中的位置信息；由第一字符嵌入、分段嵌入和位置嵌入结合得到的输入嵌入(input embeddings)包含了词汇、位置和句子信息等多种信息，因此可以帮助ERNIE模型更好地理解工单作业描述中的文本信息，并提高ERNIE模型在各种自然语言处理任务上的性能表现。实体嵌入(Entity embeddings)中的实体是指文本信息中具有特定含义或者代表某种事物的词汇或短语。例如，在一篇新闻报道中出现的人名或地名就是实体。

结合图4所示，T-编码器模块中的多头注意力层(Multi-headAttention)是用于理解所述输入嵌入每个字符与其他字符的关系，捕捉所述输入嵌入每个字符的上下文信息；前馈网络层(FeedForward)是用于进行非线性变换，并处理从输入嵌入中提取的特征，将这些特征映射到预测语法合理性的得分中。K-编码器模块的多头注意力层用于将字符与其相关联的实体信息结合起来，以获取更全面的信息，使得ERNIE模型不仅可以理解单个字符的语义，还可以理解字符在上下文中的语义以及字符与实体之间的关系；信息融合层(Information Fusion)用于确定ERNIE模型在判断一个句子的语法合理性时，应该关注句子中的哪些部分，从而使ERNIE模型可以更好地理解句子的上下文，并做出更准确的预测。K-编码器模块输出的第二文本信息嵌入和第二实体嵌入在后续的步骤中被结合作为深层表示。

ERNIE模型的部分处理步骤可以用公式进行表示。例如在一具体实施例中，将第一文本信息嵌入输入至K-编码器模块的第二多头注意力层，以及将第一实体嵌入输入至K-编码器模块的第三多头注意力层，可以表示为：

其中，表示第一实体嵌入，MH-ATT表示多头注意力层(Multi-headAttention)，/>表示第一文本信息嵌入。

在信息融合层中，对于有对应实体的字符，按照下式计算隐藏层的状态：

其中，h_j表示隐藏层的状态，是信息融合层第i层的第j个字符嵌入，/>是信息融合层第i层的第k个实体嵌入。/>和/>是权重矩阵，用于加权字符和实体的信息。是偏置项。σ是一个非线性激活函数，例如ReLU或者tanh。

按照下式计算第j个字符嵌入

按照下式计算第k个实体嵌入

对于没有对应实体的字符，按照下式计算隐藏层的状态h_j：

按照下式计算第j个字符嵌入

其中W_t代表隐藏层中的权重。

隐藏层状态实际上在ERNIE模型的内部被用来处理和理解输入文本。隐藏层状态为ERNIE模型提供了词汇的多维表示，这些多维表示可以捕获单词(字符)的语法和语义信息，例如词的类别(名词、动词等)、词之间的关系(如主谓宾关系)，以及词在特定语境中的含义。信息融合层中每一层的隐藏状态可以看作是对输入信息融合层的文本信息的从低层(即表面形式)到高层(即深层语义)的理解。

在另一具体实施例中，按照下式表示全连接层中的处理过程：

L₂＝ReLU(W_l*H+b_l)

其中，L₂表示所述全连接层的处理结果，W_l表示全连接层的权重，b_l表示全连接层的偏置，ReLU表示非线性激活函数；

按照下式表示输出层中的处理过程：

S＝sigmoid(W_s*L₂+b_s)

其中，S表示所述语法合理性得分，W_s表示输出层的权重，b_s表示输出层的偏置。

在一实施例中，所述步骤S106包括：

分别计算所述作业接单位置的坐标与所述开始工作位置的坐标之间的第一距离、所述作业接单位置的坐标与所述完工位置的坐标之间的第二距离、所述开始工作位置的坐标与所述完工位置的坐标之间的第三距离；

将所述第一距离、第二距离、第三距离分别与预设距离阈值进行对比；

当所述第一距离、第二距离、第三距离中的至少一个大于或等于预设距离阈值时，判定距离验收通过并作为距离验收结果输出；

当所述第一距离、第二距离、第三距离均小于预设距离阈值时，判定距离验收未通过并作为距离验收结果输出。

在本实施例中，作业人员从作业接单到开始工作或完工应该处于不同的坐标位置，通过分别计算作业接单位置与开始工作位置之间的坐标距离、作业接单位置与完工位置之间的坐标距离、开始工作位置与完工位置之间的坐标距离，从而得到对应的得到第一距离、第二距离和第三距离，再将第一距离、第二距离和第三距离分别与预设距离阈值进行对比，最后根据对比结果生成距离验收结果，如果第一距离、第二距离、第三距离中的至少一个(任意一个)大于或等于预设距离阈值，则将距离验收通过作为距离判定结果，如果第一距离、第二距离、第三距离均小于预设距离阈值，则将距离验收未通过作为距离判定结果，最后将距离判定结果作为距离验收结果输出。此外，还可以根据实际需求调整距离验收通过的条件，例如，除了设定第一距离、第二距离和第三距离中至少一个大于或等于预设距离阈值时，判定距离验收通过外，还可以设定第一距离、第二距离和第三距离中至少两个大于或等于预设距离阈值时，判定距离验收通过，或者还可以设定只有当第一距离、第二距离和第三距离均大于预设距离阈值时，才判定距离验收通过。

在一具体实施例中，按照下式计算任两个坐标之间的距离：

其中，d表示两个坐标之间的距离，x₁表示第一个坐标的横坐标，y₁表示第一个坐标的纵坐标，x₂表示第二个坐标的横坐标，y₂表示第二个坐标的纵坐标。

在一具体实施例中，预设距离阈值可以根据作业位置的实际情况进行设定，例如可以设定预设距离阈值为20m，当第一距离、第二距离和第三距离中至少一个大于或等于20m时，判定距离验收通过并作为距离验收结果输出，任一个一条待验收工单符合上述自动验收五维检测模型中的一个或多个条件时，则判定为工单进行系统自动验收通过。

图5为本发明实施例提供的一种基于多维检测的工单自动验收装置500的示意性框图，该装置500包括：

工单获取单元501，用于获取作业人员上传的待验收的工单；所述工单包含有工单信息，所述工单信息包括现场标准作业程序照片和完工照片、所述现场标准作业程序照片和所述完工照片对应的时间戳、作业位置和工单计划作业范围、工单作业描述、作业接单位置坐标、开始工作位置坐标和完工位置坐标；所述现场标准作业程序照片和完工照片均包含作业人员的人脸图像；

现场验收单元502，用于分别对所述现场标准作业程序照片和所述完工照片进行人脸识别，以及基于Contrastive Networks深度学习模型计算所述现场标准作业程序照片和所述完工照片的相似度，并结合人脸识别的结果和相似度计算结果生成现场验收结果；

时间对比验收单元503，用于将所述时间戳与预设时间戳阈值进行对比，并根据对比结果生成时间对比验收结果；

位置对比验收单元504，用于通过奇偶法判断所述作业位置是否在所述工单计划作业范围内，并根据判断结果生成位置对比验收结果；

语法合理性验收单元505，用于基于Transformer架构对所述工单作业描述进行语法合理性检测，并根据检测结果生成语法合理性验收结果；

距离验收单元506，用于对作业接单位置坐标、开始工作位置坐标和完工位置坐标进行两两坐标距离计算，并根据距离计算结果生成距离验收结果；

工单验收单元507，用于基于现场验收结果、时间戳对比验收结果、位置对比验收结果、语法合理性验收结果和距离验收结果判断所述工单是否验收通过。

在一实施例中，所述现场验收单元502包括：

人脸检测单元，用于通过FaceNet神经网络对所述现场标准作业程序照片和完工照片分别进行人脸特征信息提取，得到第一人脸特征信息和第二人脸特征信息，并对所述第一人脸特征信息和第二人脸特征信息分别进行L2范数归一化处理，得到第一人脸检测结果和第二人脸检测结果；

人脸阈值比较单元，用于获取所述第一人脸检测结果和所述第二人脸检测结果之间的人脸差值，并将所述人脸差值与预设人脸阈值进行比较；

人脸匹配单元，用于当所述人脸差值小于或等于预设人脸阈值时，则判定所述现场标准作业程序照片和所述完工照片的人脸信息匹配；

人脸匹配不单元，用于当所述人脸差值大于小于预设人脸阈值时，则判定所述现场标准作业程序照片和所述完工照片的人脸信息不匹配；

人脸识别结果单元，用于将所述人脸差值与预设人脸阈值的比较结果作为人脸识别的结果。

在一实施例中，所述现场验收单元502还包括：

特征提取单元，用于通过ResNet卷积神经网络对所述现场标准作业程序照片和所述完工照片分别进行特征提取，得到第一特征和第二特征；

相似度计算单元，用于对所述第一特征和第二特征进行相似度计算，得到相似度计算结果；

相似度阈值比较单元，用于将相似度计算结果与预设相似度阈值进行比较；

现场信息匹配单元，用于当相似度计算结果大于或等于预设相似度阈值时，判定所述现场标准作业程序照片和所述完工照片的现场信息匹配；

现场信息不匹配单元，用于当相似度计算结果小于预设相似度阈值时，判定所述现场标准作业程序照片和所述完工照片的现场信息不匹配；

现场验收结果单元，用于结合人脸识别的结果，若人脸信息匹配且现场信息匹配，则将现场验收通过作为所述现场验收结果；若人脸信息不匹配和/或现场信息不匹配，则将现场验收未通过作为所述现场验收结果。

在一实施例中，所述时间对比验收单元503包括：

时间检测通过单元，用于当所述时间戳大于或等于预设时间戳阈值时，判定时间检测通过并作为时间对比验收结果输出；

时间检测不通过单元，用于当所述时间戳小于预设时间戳阈值时，判定时间检测不通过并作为时间对比验收结果输出。

在一实施例中，位置对比验收单元504包括：

位置获取单元601，用于获取所述工单计划作业范围对应的区域多边形以及所述作业位置对应的作业点；

射线生成单元602，用于以所述作业点为端点，生成一条朝向且穿过所述区域多边形的射线；

线段数量单元603，用于获取所述区域多边形与所述射线相交的线段数量；

线段奇数单元604，用于当所述线段数量为奇数时，判定所述作业位置在所述工单计划作业范围内并作为位置对比验收结果输出；

线段偶数单元605，用于当所述线段数量为偶数时，判定所述作业位置未在所述工单计划作业范围内并作为位置对比验收结果输出。

在一实施例中，所述语法合理性验收单元505包括：

预处理单元，用于对所述工单作业描述进行预处理；其中，所述预处理包括文本分词、词性标注、命名实体识别；

输入嵌入单元，用于将所述工单作业描述输入基于Transformer架构的ERNIE模型中的T-编码器模块，并输出得到所述工单作业描述的第一字符嵌入、分段嵌入和位置嵌入，然后将所述第一字符嵌入、分段嵌入和位置嵌入结合为输入嵌入；

第一文本信息嵌入单元，用于将所述输入嵌入依次输入至所述T-编码器模块的第一多头注意力层和前馈网络层，并输出得到第一文本信息嵌入；

文本信息及实体嵌入单元，用于获取第一文本信息嵌入中的第一实体嵌入，并将所述第一文本信息嵌入输入至K-编码器模块的第二多头注意力层，以及将所述第一实体嵌入输入至K-编码器模块的第三多头注意力层；

输出对齐单元，用于对所述第二多头注意力层和第三多头注意力层的输出结果进行对齐，并输入所述K-编码器模块中的信息融合层，输出得到第二文本信息嵌入和第二实体嵌入；

语法合理性得分单元，用于将所述第二文本信息嵌入和第二实体嵌入结合作为深层表示输入至全连接层，然后通过所述ERNIE模型的输出层输出所述工单作业描述的语法合理性得分；

得分阈值比较单元，用于将所述语法合理性得分与预设得分阈值进行比较；

语法合理单元，用于当所述语法合理性得分大于预设得分阈值时，判定所述工单作业描述的语法合理并作为语法合理性验收结果输出；

语法不合理单元，用于当所述语法合理性得分小于或等于预设得分阈值时，判定所述工单作业描述的语法不合理并作为语法合理性验收结果输出。

在一实施例中，所述距离验收单元506包括：

距离计算单元，用于分别计算所述作业接单位置的坐标与所述开始工作位置的坐标之间的第一距离、所述作业接单位置的坐标与所述完工位置的坐标之间的第二距离、所述开始工作位置的坐标与所述完工位置的坐标之间的第三距离；

距离阈值对比单元，用于将所述第一距离、第二距离、第三距离分别与预设距离阈值进行对比；

距离验收通过单元，用于当所述第一距离、第二距离、第三距离中的至少一个大于或等于预设距离阈值时，判定距离验收通过并作为距离验收结果输出；

距离验收不通过单元，用于当所述第一距离、第二距离、第三距离均小于预设距离阈值时，判定距离验收未通过并作为距离验收结果输出。

由于装置部分的实施例与方法部分的实施例相互对应，因此装置部分的实施例请参见方法部分的实施例的描述，这里暂不赘述。

本发明实施例还提供了一种计算机可读存储介质，其上存有计算机程序，该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例还提供了一种计算机设备，可以包括存储器和处理器，存储器中存有计算机程序，处理器调用存储器中的计算机程序时，可以实现上述实施例所提供的步骤。当然计算机设备还可以包括各种网络接口，电源等组件。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种基于多维检测的工单自动验收方法，其特征在于，包括：

2.根据权利要求1所述的基于多维检测的工单自动验收方法，其特征在于，所述分别对所述现场标准作业程序照片和所述完工照片进行人脸识别，包括：

3.根据权利要求2所述的基于多维检测的工单自动验收方法，其特征在于，所述基于Contrastive Networks深度学习模型计算所述现场标准作业程序照片和所述完工照片的相似度，并结合人脸识别的结果和相似度计算结果生成现场验收结果，包括：

将相似度计算结果与预设相似度阈值进行比较；

4.根据权利要求1所述的基于多维检测的工单自动验收方法，其特征在于，所述将所述时间戳与预设时间戳阈值进行对比，并根据对比结果生成时间对比验收结果，包括：

5.根据权利要求1所述的基于多维检测的工单自动验收方法，其特征在于，所述通过奇偶法判断所述作业位置是否在所述工单计划作业范围内，并根据判断结果生成位置对比验收结果，包括：

获取所述工单计划作业范围对应的区域多边形以及所述作业位置对应的作业点；

以所述作业点为端点，生成一条朝向且穿过所述区域多边形的射线；

获取所述区域多边形与所述射线相交的线段数量；

当所述线段数量为奇数时，判定所述作业位置在所述工单计划作业范围内并作为位置对比验收结果输出；

当所述线段数量为偶数时，判定所述作业位置未在所述工单计划作业范围内并作为位置对比验收结果输出。

6.根据权利要求1所述的基于多维检测的工单自动验收方法，其特征在于，所述基于Transformer架构对所述工单作业描述进行语法合理性检测，并根据检测结果生成语法合理性验收结果，包括：

将所述语法合理性得分与预设得分阈值进行比较；

7.根据权利要求1所述的基于多维检测的工单自动验收方法，其特征在于，所述对作业接单位置坐标、开始工作位置坐标和完工位置坐标进行两两坐标距离计算，并根据距离计算结果生成距离验收结果，包括：

8.一种基于多维检测的工单自动验收装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于多维检测的工单自动验收方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于多维检测的工单自动验收方法。