CN113963011A

CN113963011A - 图像识别方法、装置、电子设备及存储介质

Info

Publication number: CN113963011A
Application number: CN202111171849.1A
Authority: CN
Inventors: 李莹莹; 谭啸; 孙昊
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-10-08
Filing date: 2021-10-08
Publication date: 2022-01-21

Abstract

本公开提供了一种图像识别方法、装置、电子设备及存储介质，涉及人工智能领域，具体涉及计算机视觉和深度学习技术，具体可用于图像识别场景下。具体实现方案为：获取初始图像，初始图像具有对应的参考深度值，根据参考深度值，从初始图像中识别出多个分割区域，确定与多个分割区域分别对应的多个深度变化信息，以及根据多个深度变化信息对初始图像进行边缘分割处理，以得到初始图像的多个目标边缘信息。由此，能够结合图像的深度分布情况辅助对图像中的边缘信息进行识别，增强对图像中分割区域的识别能力，避免图像识别过程中丢失部分边缘信息，提升针对图像边缘信息的识别效率，有效提升获取边缘信息的识别准确性。

Description

图像识别方法、装置、电子设备及存储介质

技术领域

本公开涉及人工智能技术领域，具体涉及计算机视觉和深度学习技术，可用于图像识别场景下，尤其涉及一种图像识别方法、装置、电子设备及存储介质。

背景技术

人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术，以及机器学习、深度学习、大数据处理技术、知识图谱技术等几大方向。

相关技术中，对于图像执行语义分割任务时，通常使用降采样操作采样图像语义细节，而后，结合语义分割网络辅助识别图像中的边缘信息。

发明内容

本公开提供了一种图像识别的方法、装置、电子设备、存储介质及计算机程序产品。

根据本公开的第一方面，提供了一种图像识别方法，包括：获取初始图像，所述初始图像具有对应的参考深度值；根据所述参考深度值，从所述初始图像中识别出多个分割区域；确定与所述多个分割区域分别对应的多个深度变化信息；以及根据所述多个深度变化信息对所述初始图像进行边缘分割处理，以得到所述初始图像的多个目标边缘信息。

根据本公开的第二方面，提供了一种图像识别装置，包括：获取模块，用于获取初始图像，所述初始图像具有对应的参考深度值；识别模块，用于根据所述参考深度值，从所述初始图像中识别出多个分割区域；确定模块，用于确定与所述多个分割区域分别对应的多个深度变化信息；处理模块，用于根据所述多个深度变化信息对所述初始图像进行边缘分割处理，以得到所述初始图像的多个目标边缘信息。

根据本公开的第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本公开实施例的图像识别方法。

根据本公开的第四方面，提出了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行本公开实施例的图像识别方法。

根据本公开的第五方面，提出了一种计算机程序产品，包括计算机程序，当计算机程序由处理器执行时实现本公开实施例的图像识别方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开第一实施例的示意图；

图2是根据本公开第二实施例的示意图；

图3是根据本公开第二实施例的示意图；

图4是根据本公开第三实施例的示意图；

图5是根据本公开第四实施例的示意图；

图6是根据本公开第五实施例的示意图；

图7示出了可以用来实施本公开的实施例的图像识别方法的示例电子设备的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本公开第一实施例的示意图。

其中，需要说明的是，本实施例的图像识别方法的执行主体为图像识别装置，该装置可以由软件和/或硬件的方式实现，该装置可以配置在电子设备中，电子设备可以包括但不限于终端、服务器端等。

本公开实施例涉及人工智能技术领域，具体涉及计算机视觉和深度学习技术，可用于图像识别场景下。

其中，人工智能(Artificial Intelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

深度学习，是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。

计算机视觉，计算机视觉是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。

而图像识别场景，可以是应用图像识别技术的一些应用场景。图像识别技术，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是应用深度学习算法的一种实践应用。

当将本公开实施例提供的图像识别方法应用于图像识别场景时，能够有效地提升图像处理、分析和理解的应用效果。

如图1所示，该图像识别方法，包括：

S101：获取初始图像，初始图像具有对应的参考深度值。

其中，待进行边缘分割处理的图像可以被称为初始图像，初始图像具有对应的参考深度值。

其中，与初始图像对应的深度值，可以被称为参考深度值，而深度值，可以用于表征初始图像中的图像深度的分布情况(该图像深度的分布情况，可以被称为深度分布情况)，其中，数字化图像的每个像素是用一组二进制数进行描述，其中包含表示图像颜色的位，图中每个像素颜色所占的二进制位位数，称为图像深度。

本公开实施例中，在获取初始图像时，可以针对图像识别装置预先配置相应的图像采集装置，图像采集装置可以采集场景中的图像作为初始图像，或者也可以在图像处理装置上配置数据传输接口，经由该接口接收其他电子设备传输的图像作为初始图像，对此不做限制。

本公开实施例在获取初始图像后，可以采用图像像素点分析的方法，对初始图像中的像素点进行分析处理，或者，也可以采用飞行时间法(Time of flight，TOF)，计算得到与初始图像对应的参考深度值，对此不做限制。

S102：根据参考深度值，从初始图像中识别出多个分割区域。

其中，分割区域是初始图像中不同物体边缘的交界区域，例如，该分割区域可以是初始图像中树木与初始图像中的背景交界的轮廓区域。

如图2所示，图2是本公开实施例中分割区域示意图，物体A，物体B以及物体C边缘的交界区域即是分割区域，具体可以是物体A与物体C的分割区域21，物体A与物体B的分割区域22以及物体B与物体C的分割区域23。

可以理解的是，通常由于初始图像中不同物体区域的深度分布情况会存在差异性，则当不同物体边缘存在交界时，该边缘的交界区域也会具有深度分布情况的显著变化，从而本公开实施例中，在获取初始图像，并确定初始图像对应的参考深度值(该参考深度值，能够用于表征初始图像中的图像深度的分布情况)之后，可以根据参考深度值解析得到不同物体图像区域对应的深度分布情况，而后，根据不同物体图像区域的深度分布情况，确定出某一连通图像区域中深度分布情况差异较大的区域，并将该深度分布情况差异较大的连通图像区域作为分割区域，该分割区域通常为不同物体边缘的交界区域，对此不做限制。

一些实施例中，在根据参考深度值从初始图像中识别出多个分割区域时，可以对初始图像中的像素点进行解析处理，得到每个像素点的图像深度，而后根据物体图像区域包括的像素点的图像深度，计算得到各个物体图像区域的深度分布情况，根据各个物体图像区域的深度分布情况确定出深度分布情况差异较大的连通图像区域作为分割区域，对此不做限制。

另一些实施例中，也可以采用卷积神经网络对初始图像进行处理，根据参考深度值(该参考深度值，能够用于表征初始图像中的图像深度的分布情况)对初始图像中的像素点进行分类，将初始图像中的像素点分类至不同物体图像区域中，而后识别出不同物体图像区域之间边缘的交界区域，并作为分割区域，对此不做限制。

S103：确定与多个分割区域分别对应的多个深度变化信息。

其中，用于描述相应分割区域中深度分布情况变化的信息，可以被称为深度变化信息，由于初始图像中可能会包括多个分割区域，从而，上述在根据参考深度值，从初始图像中识别出多个分割区域之后，可以进一步地，确定与各个分割区域中深度分布情况变化的信息，并作为深度变化信息。

举例而言，深度变化信息，可以是分割区域中不同像素点之间的深度值的变化量，或者，深度变化信息，也可以是分割区域中不同像素点集合之间的深度值的变化量，像素点集合，可以是预先对分割区域中多个像素点进行分类得到的，像素点集合的深度值，可以例如该像素点集合中多个像素点深度值的平均值，对此不做限制。

本公开实施例中，在确定多个分割区域分别对应的多个深度变化信息时，可以分别取多个分割区域分别对应的基准像素点，分别计算多个分割区域中除基准像素点外的像素点与基准像素点的深度差值，该多个深度差值即可作为多个分割区域分别对应的多个深度变化信息，从而能够利用分割区域分别对应的基准像素点较为准确地确定出多个分割区域分别对应的多个深度变化信息，从而可以利用深度变化信息辅助提升图像处理效率。

举例而言，如图2所示，可以取分割区域23中的一个像素点作为基准像素点，分别计算分割区域23中除基准像素点外的像素点与基准像素点的多个深度差值，该多个深度差值即可作为分割区域21对应的多个深度变化信息。

S104：根据多个深度变化信息对初始图像进行边缘分割处理，以得到初始图像的多个目标边缘信息。

上述确定与多个分割区域分别对应的多个深度变化信息之后，可以根据多个深度变化信息对初始图像进行边缘分割处理，以得到初始图像的多个目标边缘信息。

其中，从初始图像中识别出的边缘信息，可以被称为目标边缘信息，目标边缘信息可以包括：初始图像边缘的信息，初始图像中相同物体边缘的信息，初始图像中不同物体边缘交界区域的信息，而边缘的信息，可以被用于描述相应边缘相关的一些信息，该信息可以具体例如，边缘对应于初始图像中的像素点的集合，该边缘涉及的物体的类别，该边缘对应图像区域的颜色、亮度、饱和度等图像特征，对此不做限制。

本公开实施例中，在根据多个深度变化信息对初始图像进行边缘分割处理时，可以将初始图像输入至边缘分割模型中，以得到边缘分割模型输出初始图像的多个目标边缘信息。

其中，边缘分割模型可以是人工智能模型，例如，神经网络模型或者是机器学习模型，该边缘分割模型可以具备边缘信息解析的能力，该边缘分割模型可以是预先训练得到的，在训练边缘分割模型时，可以采用迭代更新模型参数的方法对初始的边缘分割模型进行训练，可以对初始图像的数据集进行扩增操作，利用扩增后的数据集对初始的边缘分割模型进行多次训练，每次训练之后更新边缘分割模型的参数，直至该边缘分割模型收敛，确定边缘分割模型训练完成，在实际边缘信息识别时，可以将多个深度变化信息分别与初始图像一并输入至边缘分割模型之中，采用边缘分割模型，将各个深度变化信息匹配至初始图像之中，从初始图像之中解析出深度变化信息表征的局部的连通图像区域，而后，根据连通图像区域的深度变化信息，进行相应的运算处理，以得到连通图像区域对应的像素点的集合，物体的类别，该连通图像区域的颜色、亮度、饱和度等图像特征作为目标边缘信息，对此不做限制。

本实施例中，通过获取初始图像，初始图像具有对应的参考深度值，根据参考深度值，从初始图像中识别出多个分割区域，确定与多个分割区域分别对应的多个深度变化信息，以及根据多个深度变化信息对初始图像进行边缘分割处理，以得到初始图像的多个目标边缘信息，能够结合图像的深度分布情况辅助对图像中的边缘信息进行识别，增强对图像中分割区域的识别能力，避免图像识别过程中丢失部分边缘信息，提升针对图像边缘信息的识别效率，有效提升获取边缘信息的识别准确性。

图3是根据本公开第二实施例的示意图。

如图3所示，该图像识别方法，包括：

S301：获取初始图像，初始图像具有对应的参考深度值。

S301的描述说明可以具体参见上述实施例，在此不再赘述。

S302：对初始图像进行划分，以得到多个候选区域。

在上述获取初始图像之后，可以对初始图像进行划分，以得到多个候选区域，而后可以根据设定条件从候选区域从选取满足设定条件的候选区域作为分割区域，具体可见后续实施例。

本公开实施例中，在初始图像进行划分时，可以利用像素分析法确定出初始图像中每个像素的深度值，将该深度值作为深度标签，根据深度标签将初始图像划分为多个K*K(K代表像素点的数量，例如可以为20)大小的图像块，则该多个图像块即可作为多个候选区域。

S303：根据参考深度值，判断候选区域是否满足设定条件。

其中，设定条件可以是针对候选区域中不同像素点之间的深度差值设置的检验条件，该检验条件例如可以被设置为候选区域中不同像素点之间的深度差值小于数值阈值。

在上述对初始图像进行划分得到多个候选区域之后，可以触发根据参考深度值针对设定条件对候选区域进行检测，例如可以分别确定候选区域中不同像素点参考深度值之间的深度差值，如果候选区域中不同像素点参考深度值的深度差值小于数值阈值，则表明候选区域满足设定条件。

可选地，一些实施例中，在根据参考深度值，判断候选区域是否满足设定条件时，可以确定候选区域中的基准像素点，对参考深度值进行解析处理，以得到基准像素点的基准深度值，和与多个参考像素点分别对应的多个参考深度值，其中，参考像素点是候选区域中除基准像素点之外的像素点，根据基准深度值和多个参考深度值，判断相应候选区域是否满足设定条件，由于是确定出候选区域的基准像素点，计算出候选区域中的参考像素点与基准像素点的深度值，将基准像素点的基准深度值与参考像素点对应的参考像素值作为设定条件对候选区域进行判断，有效提升选取候选区域的准确性，从而较大程度地辅助提升确定分割区域的准确性，提升分割区域的确定效率。

其中，基准像素点用于确定候选区域中的像素点与候选基准点之间的深度差值，候选区域中除基准像素点之外的像素点，可以被称为参考像素点。

本公开实施例中，在选取候选区域中的基准像素点时，可以将候选区域划分为K*K(K代表像素点的数量，例如可以为20)大小的正方形图像块，选取候选区域对角线交点的中心像素点作为基准像素点，候选区域中除中心像素点外的像素点作为参考像素点。

上述确定候选区域中的基准像素点，确定候选区域中除基准像素点外的点作为参考像素点之后，可以利用像素分析法对基准像素点的参考深度值进行解析处理，以得到基准像素点的基准深度值，利用像素分析法对多个参考像素点进行解析处理，以得到多个参考像素点对应的参考深度值，而后可以取多个参考像素点与基准像素点之间的深度差值，将该深度差值作为设定条件，而后判断相应候选区域是否满足设定条件，满足设定条件的候选区域可以被选取作为分割区域，具体可见后续实施例。

可选地，一些实施例中，在根据基准深度值和多个参考深度值，判断相应候选区域是否满足设定条件时，可以确定基准深度值分别与多个参考深度值之间的多个深度差值，统计大于深度差阈值的深度差值的数量，与多个深度差值的总数量之间的比例值，如果比例值大于或者等于比例阈值，则判定相应候选区域满足设定条件，如果比例值小于比例阈值，则判定相应候选区域不满足设定条件，由于是根据大于深度差阈值的深度差值的数量与多个深度差值的总数量之间的比例值来实现候选区域的判断，从而能够较为准确地从候选区域中确定出分割区域，实现将图像的深度分布情况有效地融合至对图像的分割区域进行识别的过程中，从而能够有效地提升分割区域判定的准确性，有效地提升分割区域识别的完整性和全面性，从而可以辅助进行后续的图像处理。

上述确定出基准像素点的基准深度值，和与多个参考像素点分别对应的多个参考深度值之后，可以确定出基准深度值分别与多个参考深度值之间的多个深度差值，而后统计大于深度差阈值的深度差值的数量。

其中，深度差阈值可以是针对基准像素点与参考像素点深度差值预先设置的阈值，该阈值例如可以被配置为10，或者设置为其他任意合理的数值，对此不做限制。

本公开实施例中，在统计大于深度差阈值的深度差值的数量之后，可以计算大于深度差阈值的深度差值的数量与多个深度差值的总数量之间的比例值，将设定条件配置为比例值大于或者等于比例阈值，而后可以根据该设定条件对候选区域进行判断。

其中，比例阈值可以是针对比例值预先设置的数值，例如可以设置为60％，或者可以设置为其他任意合理的数值，对此不做限制。

本公开实施例中，计算大于深度差阈值的深度差值的数量与多个深度差值的总数量之间的比例值之后，可以触发根据比例阈值对比例值进行判断，如果比例值大于或者等于比例阈值，则判断相应候选区域满足设定条件，如果比例值小于比例阈值，则判定相应候选区域不满足设定条件，满足设定条件的候选区域即可作为分割区域。

S304：如果候选区域满足设定条件，则将候选区域作为分割区域。

上述对初始图像进行划分得到多个候选区域之后，可以触发对候选区域根据设定条件进行检验，如果判断候选区域参考像素点与基准像素点的深度差值大于深度差阈值的数量与多个深度差值的总数量之间的比例值大于或者等于比例阈值，则判定相应候选区域满足设定条件，并将该候选区域作为分割区域。

本实施例中，通过对初始图像进行划分，以得到多个候选区域，根据参考深度值，判断候选区域是否满足设定条件，并将满足设定条件的候选区域作为分割区域，从而能够根据设定条件较为准确地从初始图像的候选区域中确定出分割区域，提升分割区域选取效率，从而可以辅助进行后续的图像处理。

S305：对分割区域进行区块划分，以得到多个边缘区和多个非边缘区，其中，多个边缘区包括：第一边缘区和第二边缘区。

上述根据设定条件判定相应的候选区域作为分隔区域后，可以对分隔区域进行划分，将分割区域分割为多个图像块，以得到多个边缘区和多个非边缘区。

其中，边缘区是分割区域中包含物体图像边缘的区域，非边缘区是分割区域中不包含物体图像边缘的区域。

本公开实施例中，在对分割区域进行区块划分以得到多个边缘区和多个非边缘区之后，可以将边缘区进一步地细分为第一边缘区和第二边缘区。

其中，第一边缘区是指与中心像素点的深度值差值较大的像素点的集合，第二边缘区是指与中心像素点的深度值差值较小的像素点的集合。

举例而言，可以参考将边缘区域均匀分为正方形图像块的方式对边缘区进行细分，判断各图像块内的像素点与图像块的中心像素点之间的深度差值，以得到第一边缘区和第二边缘区，或者，也可以获取边缘区域对应的多个像素点的深度值，利用深度标签对边缘区域进行划分，对此不做限制。

S306：确定第一边缘区的第一深度变化值，其中，第一深度变化值大于或者等于变化阈值，第一深度变化值，是第一边缘区中不同像素点之间的深度变化值。

其中，变化阈值可以是预先针对深度变化值设置的数值阈值，第一边缘区的第一深度变化值大于或者等于变化阈值。

本公开实施例中，在确定第一边缘区的第一深度变化值时，可以选取第一边缘区的中心像素点作为基准像素点，第一边缘区中除基准像素点外的像素点作为参考像素点，而后可以利用像素分析法对第一边缘区中的基准像素点进行解析处理，以得到基准像素点的基准深度值，利用像素分析法对第一边缘区中的多个参考像素点进行解析处理，得到多个参考像素点分别对应的多个参考深度值，而后根据多个参考深度值与基准像素值确定出多个参考深度值与基准像素值之间的深度差值，该深度差值即可作为第一深度变化值。

S307：确定第二边缘区的第二深度变化值，其中，第二深度变化值小于变化阈值，第二深度变化值，是第二边缘区中不同像素点之间的深度变化值。

其中，变化阈值可以是预先针对深度变化值设置的数值阈值，第二边缘区的第二深度变化值小于变化阈值。

本公开实施例中，在确定第二边缘区的第二深度变化值时，可以选取第二边缘区的中心像素点作为基准像素点，第二边缘区中除基准像素点外的像素点作为参考像素点，而后可以利用像素分析法对第二边缘区中的基准像素点进行解析处理，以得到基准像素点的基准深度值，利用像素分析法对第二边缘区中的多个参考像素点进行解析处理，得到多个参考像素点分别对应的多个参考深度值，而后根据多个参考深度值与基准像素值确定出多个参考深度值与基准像素值之间的深度差值，该深度差值即可作为第二深度变化值。

S308：确定非边缘区的第三深度变化值，其中，第三深度变化值，是非边缘区中不同像素点之间的深度变化值。

本公开实施例中，在确定非边缘区的第三深度变化值时，可以选取非边缘区的中心像素点作为基准像素点，非边缘区中除基准像素点外的像素点作为参考像素点，而后可以利用像素分析法对非边缘区中的基准像素点进行解析处理，以得到基准像素点的基准深度值，利用像素分析法对非边缘区中的多个参考像素点进行解析处理，得到多个参考像素点分别对应的多个参考深度值，而后根据多个参考深度值与基准像素值确定出多个参考深度值与基准像素值之间的深度差值，该深度差值即可作为第三深度变化值。

S309：将第一深度变化值、第二深度变化值，以及第三深度变化值共同作为多个深度变化信息。

在上述确定了第一深度变化值、第二深度变化值，以及第三深度变化值之后，可以将第一深度变化值、第二深度变化值，以及第三深度变化值共同作为多个深度变化信息，深度变化信息可以用于对初始图像进行边缘分割处理，具体可见后续实施例。

本实施例中，通过对分割区域进行区块划分，以得到多个边缘区和多个非边缘区，其中，多个边缘区包括：第一边缘区和第二边缘区，确定第一边缘区的第一深度变化值，确定第二边缘区的第二深度变化值，确定非边缘区的第三深度变化值，并将第一深度变化值、第二深度变化值，以及第三深度变化值共同作为多个深度变化信息，从而能够有效地根据深度变化值对边缘区域进行进一步细分处理，实现利用深度变化值将边缘区域中较为接近物体图像边缘的边缘区域确定出来，从而有效地提升对分割区域进一步处理的效果，提升图像边缘识别效果。

S310：根据多个深度变化信息对初始图像进行边缘分割处理，以得到初始图像的多个目标边缘信息。

S310的描述说明可以具体参见上述实施例，在此不再赘述。

本实施例中，通过获取初始图像，对初始图像进行划分，以得到多个候选区域，根据参考深度值，判断候选区域是否满足设定条件，并将满足设定条件的候选区域作为分割区域，从而能够根据设定条件较为准确地从初始图像的候选区域中确定出分割区域，提升分割区域选取效率，从而可以辅助进行后续的图像处理，通过对分割区域进行区块划分，以得到多个边缘区和多个非边缘区，其中，多个边缘区包括：第一边缘区和第二边缘区，确定第一边缘区的第一深度变化值，确定第二边缘区的第二深度变化值，确定非边缘区的第三深度变化值，并将第一深度变化值、第二深度变化值，以及第三深度变化值共同作为多个深度变化信息，从而能够有效地根据深度变化值对边缘区域进行进一步细分处理，实现利用深度变化值将边缘区域中较为接近物体图像边缘的边缘区域确定出来，从而有效地提升对分割区域进一步处理的效果，提升图像边缘识别效果。

图4是根据本公开第三实施例的示意图。

如图4所示，该图像识别方法，包括：

S401：获取初始图像，初始图像具有对应的参考深度值。

S402：根据参考深度值，从初始图像中识别出多个分割区域。

S403：确定与多个分割区域分别对应的多个深度变化信息。

S401-S403的描述说明可以具体参见上述实施例，在此不再赘述。

S404：将初始图像输入至边缘分割模型中，以得到边缘分割模型输出的多个初始边缘信息。

其中，边缘分割模型用于根据多个分割区域分别对应的多个深度变化信息对初始图像进行处理。

本公开实施例中，在根据多个深度变化信息对初始图像进行边缘分割处理时，可以将初始图像输入至边缘分割模型中，利用边缘分割模型对初始图像进行处理，以得到边缘分割模型的输出作为多个初始边缘信息。

其中，该边缘分割模型可以是神经网络模型或者是机器学习模型，该边缘分割模型可以具备边缘信息解析的能力，该边缘分割模型可以是预先训练得到的，在训练边缘分割模型时，可以采用迭代更新模型参数的方法对初始的边缘分割模型进行训练，可以利用多个深度变化信息对边缘分割模型进行训练，每次迭代训练后更新边缘分割模型的参数，直至该边缘分割模型收敛，而后将初始图像输入至边缘分割模型中，利用边缘分割模型对初始图像进行处理，以得到边缘分割模型的输出作为多个初始边缘信息。

S405：根据多个初始边缘信息、第一深度变化值、第二深度变化值，以及第三深度变化值确定模型损失值。

上述将初始图像输入至边缘分割模型中，以得到边缘分割模型输出的多个初始边缘信息之后，可以根据多个初始边缘信息、第一深度变化值、第二深度变化值，以及第三深度变化值确定模型损失值。

本公开实施例中，在根据多个初始边缘信息、第一深度变化值、第二深度变化值，以及第三深度变化值确定模型损失值时，可以将初始边缘信息、第一深度变化值、第二深度变化值，以及第三深度变化值作为损失函数的输入，输入至损失函数中，以计算得到损失函数的输出，该输出可以作为模型损失值。

可选地，一些实施例中，在根据多个初始边缘信息、第一深度变化值、第二深度变化值，以及第三深度变化值确定模型损失值时，可以确定与多个初始边缘信息分别对应的多个边缘权重，根据第一深度变化值，确定第一边缘区中不同像素点之间的第一欧式距离值，根据第二深度变化值，确定第二边缘区中不同像素点之间的第二欧式距离值，根据第三深度变化值，确定非边缘区中不同像素点之间的第三欧式距离值，根据多个边缘权重、第一欧式距离值、第二欧式距离值，以及第三欧式距离值生成模型损失值，从而可以根据多个边缘信息与深度变化值确定出模型损失值，提升边缘识别模型的识别性能，根据深度变化值确定边缘区中不同像素点之间的欧式距离值，从而利用欧氏距离判断出不同像素点之间的相似度，从而可以更为准确地提取目标边缘信息，参考多个边缘权重与欧氏距离值，实现较大程度地提升模型损失值的获取效率，模型损失值可以用于判定初始边缘信息是否可以作为目标边缘信息，从而可以辅助提升边缘识别的准确性，提升图像处理效率。

其中，欧式距离用于确定空间中两个像素点之间的距离，可以用于度量两个像素点之间的相似度，可以利用欧式距离算法确定出空间中两个像素点的欧式距离。

上述确定出第一边缘区的第一深度变化值、第二边缘区的第二深度变化值，以及非边缘区的第三深度变化值之后，可以根据边缘区的深度变化值确定出多个边缘区中对应的不同像素点之间的欧式距离值。

本公开实施例中，在根据边缘区的深度变化值确定出多个边缘区中对应的不同像素点之间的欧式距离值时，可以利用欧式距离算法分别计算出第一边缘区中不同像素点之间的欧式距离值作为第一欧式距离值，第二边缘区中不同像素点之间的欧式距离值作为第二欧式距离值，以及非边缘区中不同像素点之间的欧式距离值作为第三欧式距离值。

本公开实施例中，在确定多个初始边缘信息分别对应的多个边缘权重时，可以初始化一个权重矩阵，可以对边缘权重进行设置，例如可以将边缘权重设置为大于1的值，非边缘区的权重设置为1，将设置好的权重矩阵与原权重矩阵相乘以得到与多个初始边缘信息分别对应的多个边缘权重。

在上述确定了与多个初始边缘信息分别对应的多个边缘权重，第一欧式距离，第二欧式距离值，以及第三欧式距离值之后，可以多个边缘权重、第一欧式距离值、第二欧式距离值，以及第三欧式距离值生成模型损失值，可以将多个边缘权重、第一欧式距离值、第二欧式距离值，以及第三欧式距离值输入至特征识别模型中，根据特征识别模型生成边缘分割的模型损失值。

S406：如果模型损失值小于损失阈值，则将多个初始边缘信息分别作为多个目标边缘信息。

其中，损失阈值可以是预先针对模型损失值设置的检测条件，在上述根据多个边缘权重、第一欧式距离值、第二欧式距离值，以及第三欧式距离值生成模型损失值之后，可以触发对模型损失值进行检验，如果模型损失值小于损失阈值，表明模型损失值满足检测条件，则将多个初始边缘信息分别作为多个目标边缘信息。

本实施例中，通过将初始图像输入至边缘分割模型中，以得到边缘分割模型输出的多个初始边缘信息，根据多个初始边缘信息、第一深度变化值、第二深度变化值，以及第三深度变化值确定模型损失值，并在模型损失值小于损失阈值时，将多个初始边缘信息分别作为多个目标边缘信息，从而可以利用模型损失值对获取得到的初始边缘信息进行判断，选取满足模型损失值小于损失阈值的初始边缘信息作为目标边缘信息，可以有效地提升目标边缘信息获取的准确性，从而可以辅助提升针对图像边缘信息的识别效率，有效提升获取边缘信息的识别准确性。

本实施例中，通过获取初始图像，初始图像具有对应的参考深度值，根据参考深度值，将初始图像输入至边缘分割模型中，以得到边缘分割模型输出的多个初始边缘信息，根据多个初始边缘信息、第一深度变化值、第二深度变化值，以及第三深度变化值确定模型损失值，并在模型损失值小于损失阈值时，将多个初始边缘信息分别作为多个目标边缘信息，从而可以利用模型损失值对获取得到的初始边缘信息进行判断，选取满足模型损失值小于损失阈值的初始边缘信息作为目标边缘信息，可以有效地提升目标边缘信息获取的准确性，从而可以辅助提升针对图像边缘信息的识别效率，有效提升获取边缘信息的识别准确性。。

图5是根据本公开第四实施例的示意图。

如图5所示，该图像识别装置50，包括：

获取模块501，用于获取初始图像，初始图像具有对应的参考深度值；

识别模块502，用于根据参考深度值，从初始图像中识别出多个分割区域；

确定模块503，用于确定与多个分割区域分别对应的多个深度变化信息；

处理模块504，用于根据多个深度变化信息对初始图像进行边缘分割处理，以得到初始图像的多个目标边缘信息。

在本公开的一些实施例中，如图6所示，图6是根据本公开第五实施例的示意图，该图像识别装置60，包括：获取模块601，识别模块602，确定模块603，处理模块604，其中，识别模块602，包括：

划分子模块6021，用于对初始图像进行划分，以得到多个候选区域；

判断子模块6022，用于根据参考深度值，判断候选区域是否满足设定条件；

确定子模块6023，用于如果候选区域满足设定条件，则将候选区域作为分割区域。

在本公开的一些实施例中，其中，判断子模块6022，具体用于：

确定候选区域中的基准像素点；

对参考深度值进行解析处理，以得到基准像素点的基准深度值，和与多个参考像素点分别对应的多个参考深度值，其中，参考像素点是候选区域中除基准像素点之外的像素点；

根据基准深度值和多个参考深度值，判断相应候选区域是否满足设定条件。

在本公开的一些实施例中，其中，判断子模块6022，还用于：

确定基准深度值分别与多个参考深度值之间的多个深度差值；

统计大于深度差阈值的深度差值的数量，与多个深度差值的总数量之间的比例值；

如果比例值大于或者等于比例阈值，则判定相应候选区域满足设定条件；

如果比例值小于比例阈值，则判定相应候选区域不满足设定条件。

在本公开的一些实施例中，其中，确定模块603，具体用于：

对分割区域进行区块划分，以得到多个边缘区和多个非边缘区，其中，多个边缘区包括：第一边缘区和第二边缘区；

确定第一边缘区的第一深度变化值，其中，第一深度变化值大于或者等于变化阈值，第一深度变化值，是第一边缘区中不同像素点之间的深度变化值；

确定第二边缘区的第二深度变化值，其中，第二深度变化值小于变化阈值，第二深度变化值，是第二边缘区中不同像素点之间的深度变化值；

确定非边缘区的第三深度变化值，其中，第三深度变化值，是非边缘区中不同像素点之间的深度变化值；

将第一深度变化值、第二深度变化值，以及第三深度变化值共同作为多个深度变化信息。

在本公开的一些实施例中，其中，处理模块604，具体用于：

将初始图像输入至边缘分割模型中，以得到边缘分割模型输出的多个初始边缘信息；

根据多个初始边缘信息、第一深度变化值、第二深度变化值，以及第三深度变化值确定模型损失值；

如果模型损失值小于损失阈值，则将多个初始边缘信息分别作为多个目标边缘信息。

在本公开的一些实施例中，其中，处理模块604，还用于：

确定与多个初始边缘信息分别对应的多个边缘权重；

根据第一深度变化值，确定第一边缘区中不同像素点之间的第一欧式距离值；

根据第二深度变化值，确定第二边缘区中不同像素点之间的第二欧式距离值；

根据第三深度变化值，确定非边缘区中不同像素点之间的第三欧式距离值；

根据多个边缘权重、第一欧式距离值、第二欧式距离值，以及第三欧式距离值生成模型损失值。

可以理解的是，本实施例附图6中的图像识别装置60与上述实施例中的图像识别装置50，获取模块601与上述实施例中的获取模块501，识别模块602与上述实施例中的识别模块502，确定获取模块603与上述实施例中的确定获取模块503，处理模块604与上述实施例中的处理模块504可以具有相同的功能和结构。

需要说明的是，前述对图像识别方法的解释说明也适用于本实施例的图像识别装置，在此不再赘述。

本实施例中，通过获取初始图像，初始图像具有对应的参考深度值，根据参考深度值，从初始图像中识别出多个分割区域，确定与多个分割区域分别对应的多个深度变化信息，以及根据多个深度变化信息对初始图像进行边缘分割处理，以得到初始图像的多个目标边缘信息。由此，能够根据多个深度变化信息确定出目标边缘信息，增强对边缘区域的判别能力，避免图像处理过程中丢失部分边缘信息，提升图像处理效率和获取目标边缘信息的准确性。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如图像识别方法。例如，在一些实施例中，图像识别方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的图像识别方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像识别方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网及区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种图像识别方法，包括：

获取初始图像，所述初始图像具有对应的参考深度值；

根据所述参考深度值，从所述初始图像中识别出多个分割区域；

确定与所述多个分割区域分别对应的多个深度变化信息；以及

根据所述多个深度变化信息对所述初始图像进行边缘分割处理，以得到所述初始图像的多个目标边缘信息。

2.根据权利要求1所述的方法，其中，所述根据所述参考深度值，从所述初始图像中识别出多个分割区域，包括：

对所述初始图像进行划分，以得到多个候选区域；

根据所述参考深度值，判断所述候选区域是否满足设定条件；

如果所述候选区域满足所述设定条件，则将所述候选区域作为所述分割区域。

3.根据权利要求2所述的方法，其中，所述根据所述参考深度值，判断所述候选区域是否满足设定条件，包括：

确定所述候选区域中的基准像素点；

对所述参考深度值进行解析处理，以得到所述基准像素点的基准深度值，和与多个参考像素点分别对应的多个参考深度值，其中，所述参考像素点是所述候选区域中除所述基准像素点之外的像素点；

根据所述基准深度值和所述多个参考深度值，判断相应所述候选区域是否满足所述设定条件。

4.根据权利要求3所述的方法，其中，所述根据所述基准深度值和所述多个参考深度值，判断相应所述候选区域是否满足所述设定条件，包括：

确定所述基准深度值分别与所述多个参考深度值之间的多个深度差值；

统计大于深度差阈值的所述深度差值的数量，与所述多个深度差值的总数量之间的比例值；

如果所述比例值大于或者等于比例阈值，则判定相应所述候选区域满足所述设定条件；

如果所述比例值小于所述比例阈值，则判定相应所述候选区域不满足所述设定条件。

5.根据权利要求1所述的方法，其中，所述确定与所述多个分割区域分别对应的多个深度变化信息，包括：

对所述分割区域进行区块划分，以得到多个边缘区和多个非边缘区，其中，所述多个边缘区包括：第一边缘区和第二边缘区；

确定所述第一边缘区的第一深度变化值，其中，所述第一深度变化值大于或者等于变化阈值，所述第一深度变化值，是所述第一边缘区中不同像素点之间的深度变化值；

确定所述第二边缘区的第二深度变化值，其中，所述第二深度变化值小于所述变化阈值，所述第二深度变化值，是所述第二边缘区中不同像素点之间的深度变化值；

确定所述非边缘区的第三深度变化值，其中，所述第三深度变化值，是所述非边缘区中不同像素点之间的深度变化值；

将所述第一深度变化值、所述第二深度变化值，以及所述第三深度变化值共同作为所述多个深度变化信息。

6.根据权利要求5所述的方法，其中，所述根据所述多个深度变化信息对所述初始图像进行边缘分割处理，以得到所述初始图像的多个目标边缘信息，包括：

将所述初始图像输入至边缘分割模型中，以得到所述边缘分割模型输出的多个初始边缘信息；

根据所述多个初始边缘信息、所述第一深度变化值、所述第二深度变化值，以及所述第三深度变化值确定模型损失值；

如果所述模型损失值小于损失阈值，则将所述多个初始边缘信息分别作为所述多个目标边缘信息。

7.根据权利要求6所述的方法，其中，所述根据所述多个初始边缘信息、所述第一深度变化值、所述第二深度变化值，以及所述第三深度变化值确定模型损失值，包括：

确定与所述多个初始边缘信息分别对应的多个边缘权重；

根据所述第一深度变化值，确定所述第一边缘区中不同所述像素点之间的第一欧式距离值；

根据所述第二深度变化值，确定所述第二边缘区中不同所述像素点之间的第二欧式距离值；

根据所述第三深度变化值，确定所述非边缘区中不同所述像素点之间的第三欧式距离值；

根据所述多个边缘权重、所述第一欧式距离值、所述第二欧式距离值，以及所述第三欧式距离值生成所述模型损失值。

8.一种图像识别装置，包括：

获取模块，用于获取初始图像，所述初始图像具有对应的参考深度值；

识别模块，用于根据所述参考深度值，从所述初始图像中识别出多个分割区域；

确定模块，用于确定与所述多个分割区域分别对应的多个深度变化信息；

处理模块，用于根据所述多个深度变化信息对所述初始图像进行边缘分割处理，以得到所述初始图像的多个目标边缘信息。

9.根据权利要求8所述的装置，其中，所述识别模块，包括：

划分子模块，用于对所述初始图像进行划分，以得到多个候选区域；

判断子模块，用于根据所述参考深度值，判断所述候选区域是否满足设定条件；

确定子模块，用于如果所述候选区域满足所述设定条件，则将所述候选区域作为所述分割区域。

10.根据权利要求9所述的装置，其中，所述判断子模块，具体用于：

确定所述候选区域中的基准像素点；

11.根据权利要求10所述的装置，其中，所述判断子模块，还用于：

12.根据权利要求8所述的装置，其中，所述确定模块，具体用于：

13.根据权利要求12所述的装置，其中，所述处理模块，具体用于：

14.根据权利要求13所述的装置，其中，所述处理模块，还用于：

确定与所述多个初始边缘信息分别对应的多个边缘权重；

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述方法的步骤。