WO2022142783A1

WO2022142783A1 - 一种图像处理方法以及相关设备

Info

Publication number: WO2022142783A1
Application number: PCT/CN2021/130651
Authority: WO
Inventors: 姜华杰; 刘昊淼; 金鑫; 涂丹丹
Original assignee: 华为云计算技术有限公司
Priority date: 2020-12-29
Filing date: 2021-11-15
Publication date: 2022-07-07
Also published as: CN114757250A

Abstract

一种图像的处理方法，用于准确地标注样本图像，以根据样本图像的标注结果训练得到目标模型，通过目标模型准确地推理图像中物体的旋转角度。该方法包括：接收用户基于参考模板图像，对样本图像中的待标注物体进行标注所得的样本关键点的信息；根据样本关键点的信息和参考关键点的信息，确定样本旋转角度，样本旋转角度为待标注物体相对于参考物体的旋转角度。

Description

一种图像处理方法以及相关设备

本申请要求于2020年12月29日提交中国专利局、申请号为202011598644.7、发明名称为“一种图像处理方法以及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及数据处理领域，尤其涉及一种图像处理方法以及相关设备。

背景技术

人工智能(artificial intelligence，AI)技术是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策功能的一种技术。通过AI技术，可以实现对待测物体的角度的确定。

在一种方案中，人工标注样本图像中待标注物体的角度，根据人工标注的角度和样本图像，训练角度度量模型。然后，根据训练好的角度度量模型确定待测物体的角度。

由于待标注物体的角度依据人的主观认知标注，导致标注的结果混乱。依据该标注结果训练角度度量模型，训练难度高，根据训练得到的模型，确定出的待测物体的角度也不准确。

发明内容

本申请实施例提供了一种图像处理方法以及相关设备，用于准确的确定图像中物体的旋转角度。

本申请实施例第一方面提供了一种图像处理方法，该方法包括：

向用户提供样本图像和参考模板图像，样本图像中包括待标注物体，参考模板图像中包括与待标注物体对应的参考物体，参考模板图像中标注有参考物体的参考关键点，参考关键点的数量大于或等于2。接收样本关键点的信息，样本关键点的信息为用户基于参考模板图像，对样本图像中的待标注物体进行标注所得。根据样本关键点的信息和参考关键点的信息，确定样本旋转角度，样本旋转角度为待标注物体相对于参考物体的旋转角度。其中，将参考模板图像中的参考物体作为衡量物体旋转角度的基准，即旋转角度都是相对于参考物体的角度，因此参考物体相对于参考模板图像的旋转角度为0°。

在本申请实施例中，样本旋转角度是基于样本关键点确定的，样本关键点是基于参考图像中的参考物体所标注的，即，参考物体是确定样本旋转角度的标准。因此样本旋转角度具有统一的标准，依据样本旋转角度训练角度度量模型，训练的难度降低。并且，根据训练得到的目标角度度量模型，可以准确地确定待测图像中待测物体的旋转角度。

对于用户来说，只需要标注与参考关键点对应的样本关键点，不需要再标注样本的角度和样本标注框，减少了用户的劳动量，提升了标注的效率。

结合第一方面，本申请实施例第一方面的第一种实施方式中，参考关键点和样本关键点的数量均为2，确定样本旋转角度，具体可以包括：根据参考关键线与样本关键线之间的夹角，确定样本旋转角度，参考关键线为2个参考关键点的连线，样本关键线为2个样本关键点的连线。

在本申请实施例中，通过样本关键线和参考关键线之间的夹角确定样本旋转角度，由于样本关键线来源于样本关键点，样本关键点的标注来源于标注有参考关键点的参考物体，因此样本旋转角度的确定都是基于参考关键点这一特征，即样本旋转角度的确定都是基于参考关键点这一统一的基准。根据基于统一基准得到的数据训练角度度量模型，训练的难度降低，通过训练得到的目标角度度量模型，可以准确地确定待测图像中待测物体的旋转角度。

结合第一方面或第一方面的第一种实施方式，本申请实施例第一方面的第二种实施方式中，接收用户标注的样本关键点的信息之后，还可以包括：获取参考模板图像的参考标注框，参考标注框表示参考物体在参考模板图像中的位置。根据参考标注框，确定样本标注框，样本标注框表示待标注物体在样本图像中的位置。

在本申请实施例中，样本标注框表示待标注物体在样本图像中的位置，对样本标注框的信息进行运算处理，也就是对带标注物体的位置信息进行运算处理，也就可以根据待标注物体的位置获取相关信息，提升了方案的灵活性。

结合第一方面的第二种实施方式，本申请实施例第一方面的第三种实施方式中，根据参考标注框确定样本标注框，具体可以包括：根据参考标注框、参考关键点的信息和样本关键点的信息确定样本标注框，参考关键点与参考标注框之间具有参考位置关系，样本关键点与样本标注框之间具有该参考位置关系。

在本申请实施例中，参考关键点与参考标注框之间具有参考位置关系，样本关键点与样本标注框之间的位置关系为该参考位置关系，即，样本标注框是基于参考位置关系这一统一基准确定的，因此通过该样本标注框训练模型，训练得到的目标模型可以基于参考位置关系这一统一标准，对待测图像进行推理，得到的结果是基于统一标准得到的，提高了推理的准确度。

结合第一方面的第二种或第三种实施方式，本申请实施例第一方面的第四种实施方式中，还可以训练旋转物体检测模型确定图像中物体的位置框的能力，具体的：将样本图像和样本标注框的信息输入初始旋转物体检测模型，以通过初始旋转物体检测模型对待标注物体进行位置回归，得到样本回归位置框的信息。根据样本回归位置框的信息、样本标注框的信息和位置回归损失函数，训练初始旋转物体检测模型，得到目标旋转物体检测模型，目标物体检测模型用于确定待测图像中待测物体的位置。具体的，对初始旋转物体检测模型的训练过程，可以包括：根据样本回归位置框的信息、样本标注框的信息和位置回归损失函数，对初始旋转物体检测模型进行迭代训练，直至满足预设条件。

在本申请实施例中，样本标注框是基于参考位置关系这一统一基准确定的，对样本标注框进行位置回归的过程，具体可以通过寻找与参考位置关系相关的特征，确定准确的回归位置框，因此训练过程更简单。

结合第一方面的第四种实施方式，本申请实施例第一方面的第五种实施方式中，还可以训练旋转物体检测模型对图像中物体分类的能力，具体的：接收样本类别，样本类别为用户对样本图像中待标注物体标注的类别。将样本类别输入初始旋转物体检测模型，以通过初始旋转物体检测模型对待标注物体进行分类，得到预测样本类别。根据预测样本类别、样本类别和分类损失函数，训练初始旋转物体检测模型，得到目标旋转物体检测模型。目标旋转物体检测模型用于确定待测图像中待测物体的类别。待测物体的类别，用于确定待测物体相对于参考物体的预测旋转角度。具体的，对初始旋转物体检测模型的训练过程，可以包括：根据预测样本类别、样本类别和分类损失函数，对初始旋转物体检测模型进行迭代训练，直至满足预设条件。

在本申请实施例中，训练了旋转物体检测模型对图像中物体进行分类的能力，在推理过程中，可以根据目标旋转物体检测模型得到待测物体的类别，简化确定预测旋转角度的过程。

结合第一方面的第五种实施方式，本申请实施例第一方面的第六种实施方式中，预测类别包括待测物体的正面信息和反面信息中的至少一项。

在本申请实施例中，可以区分正面的待测物体与反面的待测物体，可以针对正面的待测物体或反面的待测物体进行不同的操作，提高了方案的灵活性。

结合第一方面的第二种实施方式或第三种实施方式，本申请实施例第一方面的第七种实施方式中，还可以训练角度度量模型确定同类图像对和异类图像对的能力，具体的：可以根据样本标注框截取样本图像，得到截取样本图像。再根据n个第一旋转角度旋转截取样本图像，得到n个旋转样本图像，n个第一旋转角度为根据样本旋转角度获取，n个第一旋转角度与n个旋转样本图像一一对应，n为大于或等于2的整数。将n个旋转样本图像输入角度训练图库。在角度训练图库中确定同类样本图像对和异类样本图像对，同类样本图像对中的物体具有相同的角度和类别，异类样本图像对中的物体具有不同的角度或类别。根据同类样本图像对和异类样本图像对训练初始角度度量模型，得到目标角度度量模型。

在本申请实施例中，训练了角度度量模型确定同类图像对和异类图像对的能力，同类图像对中的物体具有相同的类别和角度，即同类图像对中的图像具有相同或近似的形状。也就是说，本申请实施例训练了角度度量模型确定相同或近似形状的能力，相较于现有技术中针对混乱的标注结果进行角度分类，本申请实施例中角度度量模型的训练过程更具有针对性，训练过程更简单精确。

结合第一方面的第七种实施方式，本申请实施例第一方面的第八种实施方式中，可以根据样本类别训练角度度量模型，具体的：可以接收样本类别，样本类别为用户对样本图像中的待标注物体标注的类别。在角度训练图库中确定同类样本图像对和异类样本图像对这一步骤，具体可以包括：根据样本类别，在角度训练图库中确定同类样本图像对和异类样本图像对。

结合第一方面的第四种实施方式，本申请实施例第一方面的第九种实施方式中，可以通过目标旋转物体检测模型推理待测图像中待测物体的回归位置框，具体的：可以将待测图像输入目标旋转物体检测模型，以通过目标旋转物体检测模型对待测图像中的待测物体进行位置回归，得到待测物体的回归位置框，回归位置框表示待测物体在待测图像中的位置，回归位置框用于确定预测旋转角度，预测旋转角度为对待测物体相对于参考物体的旋转角度的预测值。

在本申请实施例中，通过前述第一方面的第四种实施方式中训练得到的目标旋转物体检测模型，对待测图像中的待测物体进行位置回归，由于目标旋转物体检测模型是基于参考物体这一统一基准训练得到的，本实施方式中位置回归得到的回归位置框，也是基于参考物体这一统一基准得到的，确定出的回归位置框更加准确。

结合第一方面的第七种实施方式或第八种实施方式，本申请实施例第一方面的第十种实施方式中，可以通过目标角度度量模型推理待测图像中待测物体的旋转角度，具体的：可以将待测图像输入目标旋转物体检测模型，以通过目标旋转物体检测模型对待测图像中的待测物体进行位置回归，得到待测物体的回归位置框，回归位置框表示待测物体在待测图像中的位置。再根据回归位置框截取待测图像，得到截取图像。还可以根据回归位置框确定m个第二旋转角度，其中，m为大于或等于2的整数。再根据m个第二旋转角度旋转截取图像，得到m个旋转图像，m个第二旋转角度与m个旋转图像一一对应。通过目标角度度量模型，确定m个旋转图像中的目标图像。其中，目标图像中的物体，与参考模板图像中的参考物体，具有相同的类别和角度。于是就可以在m个第二旋转角中确定与目标图像对应的预测旋转角度。

结合第一方面的第十种实施方式，本申请实施例第一方面的第十一种实施方式中，可以根据回归位置框确定m个第二旋转角度，具体可以包括：根据回归位置框确定边框旋转角度。其中，边框旋转角度为回归位置框相对于水平框的旋转角度，水平框具有水平边。并且，边框旋转角度大于或等于0°且小于或等于90°。再根据边框旋转角度确定m个第二旋转角度。

结合第一方面的第十种实施方式或第十一种实施方式，本申请实施例第一方面的第十二种实施方式中，通过目标角度度量模型确定m个旋转图像中的目标图像，具体可以包括：通过m个旋转图像中的每一个图像，和模板图像库中的图像，构建图像对。再通过目标角度度量模型，在图像对中确定同类图像对。其中，同类图像对中的物体具有相同的角度和类别。然后就可以确定同类图像对中的目标图像。其中，目标图像就包含于前述m个旋转图像。

结合第一方面的第十二种实施方式，本申请实施例第一方面的第十三种实施方式中，还可以根据物体的类别确定物体的旋转角度，具体的：可以接收样本类别，样本类别为用户对样本图像中待标注物体标注的类别。然后将样本类别输入初始旋转物体检测模型，以通过初始旋转物体检测模型对待标注物体进行分类，得到预测样本类别。再根据预测样本类别、样本类别和分类损失函数，训练初始旋转物体检测模型，得到目标旋转物体检测模型。具体的，对初始旋转物体检测模型的训练过程，可以包括：根据预测样本类别、样本类别和分类损失函数，对初始旋转物体检测模型进行迭代训练，直至满足预设条件。

获取目标旋转物体检测模型后，就可以通过目标旋转物体检测模型对待测物体进行类别预测，得到预测类别。然后根据预测类别确定参考模板图像，参考模板图像中的参考物体具有该预测类别。

构建图像对的步骤，具体可以包括：通过n个旋转图像中的每一个图像，和根据预测类别确定出的参考模板图像，构建图像对。其中，参考模板图像包含于参考模板库中的图像。

在本申请实施例中，根据预测类别在模板图像库中确定参考模板图像，大大减少了构建的图像对的数量，也就大大减少了装置在图像对中确定同类图像对的工作量，节省了装置的运算资源和存储资源。同时提升了确定目标图像的效率，也就提升了确定预测旋转角度的效率。

结合第一方面或第一方面的第一种实施方式，本申请实施例第一方面的第十四种实施方式中，可以训练关键点检测模型确定图像中物体的关键点的能力，具体的：可以将样本图像和样本关键点的信息输入初始关键点检测模型，以通过初始关键点检测模型对样本图像中的点进行位置回归，得到回归样本关键点的信息。再根据回归样本关键点的信息，样本关键点的信息，以及关键点位置回归损失函数，训练初始关键点检测模型，得到目标关键点检测模型，目标关键点检测模型用于确定待测图像中待测物体的预测关键点。其中，对初始关键点检测模型的训练过程，具体可以包括：根据回归样本关键点的信息，样本关键点的信息，以及关键点位置回归损失函数，对初始关键点检测模型进行迭代训练，直至满足预设条件。

结合第一方面、第一方面的第一种实施方式或第二种实施方式，本申请实施例第一方面的第十五种实施方式中，还可以训练关键点检测模型对图像中物体关键点分类的能力，具体的：可以接收样本关键点类别，关键点类别为用户对样本图像中待标注物体标注的类别。然后将样本图像和样本关键点类别输入初始关键点检测模型，通过初始关键点检测模型，对样本图像中的样本关键点进行分类，得到预测样本关键点类别。再根据预测样本关键点类别、样本关键点类别和关键点分类损失函数，训练初始关键点检测模型，得到目标关键点检测模型，目标关键点检测模型用于确定待测图像中待测物体的类别。其中，对初始关键点检测模型的训练过程，具体可以包括：根据预测样本关键点类别、样本关键点类别和关键点分类损失函数，对初始关键点检测模型进行迭代训练，直至满足预设条件。

结合第一方面的第十五种实施方式，本申请实施例第一方面的第十六种实施方式中，样本关键点类别可以包括样本物体的正面信息和反面信息中的至少一项。

结合第一方面、第一方面的第一种实施方式、第十四种实施方式至第十六种实施方式中的任一种，本申请实施例第一方面的第十七种实施方式中，可以通过目标关键点检测模型确定待测图像中待测物体的预测关键点，具体的：可以将待测图像输入目标关键点检测模型，以通过目标关键点检测模型对待测图像中的点进行位置回归，得到待测物体的预测关键点，预测关键点用于确定预测旋转角度。

结合第一方面的第十七种实施方式，本申请实施例第一方面的第十八种实施方式中，可以通过目标关键点检测模型确定待测图像中待测物体的类别，即预测关键点类别，具体的：可以通过目标关键点检测模型对预测关键点进行分类，得到预测关键点类别，预测关键点类别用于确定预测旋转角度。

结合第一方面的第十八种实施方式，本申请实施例第一方面的第十九种实施方式中，预测关键点和参考关键点的数量均为2，可以通过预测关键点和预测关键点类别确定预测旋转角度，具体的：可以通过预测关键点类别确定参考模板图像。其中，参考模板图像中的参考物体的类别，与预测关键点类别相同。然后就可以确定预测关键线相对于参考关键线的旋转角度，该旋转角度即为预测旋转角度。其中，预测关键线由2个预测关键点组成，参考关键线由2个参考关键点组成，2个预测关键点与2个参考关键点一一对应。

结合第一方面的第十八种实施方式，本申请实施例第一方面的第二十种实施方式中，可以通过二维平面上的图像，预测图像中三维物体的姿态。具体的，可以根据二维图像上的特征形状，确定该特征形状所对应的三维物体的预测旋转角度。进一步可以表示为：可以通过k个预测关键点确定特征形状。通过预测关键点类别确定参考模板图像。其中，参考模板图像中的参考物体的类别与预测关键点类别相同。再通过参考模板图像中与k个预测关键点对应的k个参考关键点，确定参考形状。将特征形状输入目标模型，以通过目标模型确定特征形状相对于参考形状的形状差异，并根据该形状差异确定特征形状所对应的待测物体，相对于参考形状所对应的参考物体的三维旋转角度。通过参考物体的姿态和该三维旋转角度，就可以反映待测物体的姿态。其中，k为大于或等于2的整数。

在本申请实施例中，通过目标模型，实现了基于二维图像，对二维图像中物体的三维姿态的预测。该方法不用构建三维模型，简化了确定三维姿态的过程，节省了装置确定物体的三维姿态所消耗的运算、存储等资源。

本申请实施例第二方面提供了一种图像处理装置，该装置包括：交互单元和处理单元。

交互单元用于，向用户提供样本图像和参考模板图像。其中，样本图像中包括待标注物体，参考模板图像中包括与待标注物体对应的参考物体，参考模板图像中标注有参考物体的参考关键点，参考关键点的数量大于或等于2。其中，将参考模板图像中的参考物体作为衡量物体旋转角度的基准，即旋转角度都是相对于参考物体的角度，因此参考物体相对于参考模板图像的旋转角度为0°。

交互单元还用于，接收样本关键点的信息，样本关键点的信息为用户基于参考模板图像，对样本图像中的待标注物体进行标注所得。

处理单元用于，根据样本图像中待标注物体的样本关键点的信息和参考模板图像中参考物体的参考关键点的信息，确定样本旋转角度，样本旋转角度为待标注物体相对于参考物体的旋转角度。

该图像处理装置用于执行前述第一方面的方法。

由于第二方面的图像装置用于执行第一方面的方法，所以第二方面的有益效果参见第一方面，此处不再赘述。

本申请实施例第三方面提供了一种计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面所述的图像处理方法。

本申请实施例第四方面提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行上述第一方面所述的图像处理方法。

本申请实施例第五方面提供了一种图像处理装置，包括处理器和存储器，处理器与存储器耦合。存储器用于存储程序。处理器用于执行存储器中的程序，使得处理器执行如前述第一方面所述的图像处理方法。

本申请实施例第六方面提供了一种芯片系统，该芯片系统包括至少一个处理器和通信接口，通信接口和至少一个处理器通过线路互联，至少一个处理器用于运行计算机程序或指令，以进行第一方面任一种可能的实施方式中任一项所描述的图像处理方法。

其中，芯片中的通信接口可以为输入/输出接口、管脚或电路等。

在一种可能的实现中，本申请中上述描述的芯片系统还包括至少一个存储器，该至少一个存储器中存储有指令。该存储器可以为芯片内部的存储单元，例如，寄存器、缓存等，也可以是该芯片的存储单元(例如，只读存储器、随机存取存储器等)。

附图说明

图1为一种模型训练的流程示意图；

图2a为本申请实施例提供的一种系统架构示意图；

图2b为本申请实施例提供的一种旋转物体位姿检测系统的结构示意图；

图3为本申请实施例提供的一种图像处理装置的结构示意图；

图4为本申请实施例提供的一种图像处理方法的流程示意图；

图5a为本申请实施例提供的一种标注方法示意图；

图5b为本申请实施例提供的另一标注方法示意图；

图6为本申请实施例提供的另一图像处理方法的流程示意图；

图7为本申请实施例提供的一种旋转物体检测模型的训练方法的示意图；

图8为本申请实施例提供的另一图像处理方法的流程示意图；

图9为本申请实施例提供的一种角度度量模型的训练方法的示意图；

图10为本申请实施例提供的另一图像处理装置的结构示意图；

图11为本申请实施例提供的另一图像处理方法的流程示意图；

图12为本申请实施例提供的一种模型推理过程的方法示意图；

图13为本申请实施例提供的另一图像处理装置的结构示意图；

图14为本申请实施例提供的另一图像处理方法的流程示意图；

图15为本申请实施例提供的另一图像处理装置的结构示意图；

图16为本申请实施例提供的另一图像处理方法的流程示意图；

图17为本申请实施例提供的另一图像处理装置的结构示意图；

图18为本申请实施例提供的另一图像处理装置的结构示意图。

具体实施方式

本申请实施例提供了一种图像处理方法，用于准确地标注样本图像，以根据该样本图像训练模型，通过训练出的模型实现对旋转物体位姿的准确预测。

位姿表示物体的位置和姿态，位姿预测包括对位置的预测和对姿态的预测。

在本申请实施例中，推理表示对待测图像中待测物体的某一元素的预测，例如对待测物体位置的推理，就表示对待测物体位置的预测。

为了实现对图像中物体位姿的预测，需要训练模型，通过训练得到的目标模型预测图像中物体的位姿。如图1所示，图1为模型训练的流程示意图。通过人工对样本图像进行标注，得到待标注物体的角度。该角度表示样本图像中待标注物体的方位指向。再通过样本图像和待标注物体的角度，训练初始模型，得到目标模型。使目标模型具备对待测图像中的待测物体进行姿态预测的能力。

由于人对图像进行的角度标注，是依据主观认知完成的，主观认知因人而异，就算是一个人，也无法保证主观认知的前后一致性，因此人工标注会导致标注结果混乱，影响模型训练，进一步影响目标模型对待测图像中待测物体姿态预测的准确性。

针对上述缺陷，本申请实施例提供了一种图像处理方法和图像处理装置，基于统一的标准对样本图像进行标注，确保了标注结果的一致性与准确性。根据该标注结果对模型进行训练，可以提升模型对待测图像中待测物体角度预测的准确性，同时也可以降低模型训练的难度。

本申请实施例中，通过关键点的标注，保证标注结果的一致性与准确性。接下来将对如何进行关键点标注和如何应用标注结果进行说明。

本申请实施例提供了一种推理图像中物体姿态的方法，具体阐述了关键点标注和对标注结果的应用过程。接下来将会用两种实施方式举例，对该方法进行详细说明。值得注意的是，该两种实施方式仅是对关键点标注和对标注结果的应用过程的示例。任何基于关键点标注实现对图像中物体姿态的预测的方法，都属于本申请实施例所说明的范围，此处不作限定。

接下来对本申请实施例提供的一种推理图像中物体姿态的方法进行描述。

一、根据位置框推理图像中物体的位姿。

本申请实施例提供的一种图像处理方法中，通过确定图像中物体的位置框，确定物体的旋转角度。接下来对实现该方法的系统及具体流程进行详细描述。

1、图像处理系统。

1.1、系统架构。

以本申请实施例中图像处理场景为例进行说明，如图2a所示，本申请实施例提供了一种系统架构。在图2a所示的实施例中，系统架构包括执行设备210，训练设备220，数据库230，终端设备240和数据存储系统250和数据采集设备260，其中执行设备210包括计算模块211。其中，数据采集设备260用于获取样本数据，以及训练产生的损失值，并将其存入数据库230，训练设备220基于数据库230中维护的样本数据，以及训练产生的损失值，生成目标模型/规则213。下面将更详细地描述训练设备220如何基于样本数据以及训练产生的损失值得到目标模型/规则213。目标模型/规则213能够自适应的调整损失值对应的权重参数，同时在训练过程中利用并行计算优势探索权重的有效性以及继承优秀的网络参数和权重，从而实现在一个训练时间内得到最优训练模型。

可选的，数据库230中可以存有参考模板图像。训练设备220用于生成模型，并利用数据库230中的参考模板图像对该模型进行迭代训练，从而得到目标模型。执行设备210根据目标模型确定图像中物体的旋转角度之后，可以将该旋转角度发送给不同的设备，可以发送给终端设备240，也可以发送给数据存储系统250，具体此处不做限定。

可选的，终端设备240和执行设备210可以分别为独立的设备，也可以为一个整体，具体此处不做限定。执行设备210配置有通信接口212，用于与终端设备240进行数据交互，在模型训练阶段，用户可以通过终端设备240获取参考模板图像及相关信息，用户可以通过终端设备240向通信接口212输入样本图像中物体的关键点或类别，执行设备210可以根据样本关键点和类别训练初始模型，得到目标模型；在模型预测阶段，用户可以通过终端设备240向通信接口212输入待测图像，执行设备210可以根据待测图像和目标模型，确定待测图像中待测物体的预测旋转角度，执行设备210可以通过通信接口212将预测旋转角度发送给客户设备240，提供给用户。

需要注意的是，图3仅是本申请实施例提供的系统架构示意图，图中所示的设备、器件之间的位置关系并不构成任何限制。在本申请实施例的模型预测阶段中，用户也可以为除了人以外的其他主体，例如还可以是工业机器人、智能系统等，只要是可以使用该系统的实体即可，此处不作限定。

1.2系统结构。

请参阅图2b，图2b为本申请实施例提供的一种旋转物体位姿检测系统的结构示意图。本申请实施例提供的旋转物体位姿检测系统，包括旋转物体位姿标注模块201和级联型旋转物体位姿检测模块202。

级联型旋转物体位姿检测模块202包括两个子模块，即级联型旋转物体位姿检测训练子模块2021，和级联型旋转物体位姿检测子模块2022。

在本申请实施例中，对旋转物体位姿检测系统的应用包括两个阶段，即模型训练阶段和模型推理阶段。

1.21、模型训练阶段。

模型训练阶段由旋转物体位姿标注模块201和级联型旋转物体位姿检测训练子模块2021实现。

旋转物体位姿标注模块201主要包括但不限于以下功能：

1、基于参考模板图像中参考物体的参考关键点，获取样本图像中待标注物体的样本关键点的信息。

2、基于样本关键点的信息，确定样本图像中的待标注物体相对于参考物体的样本旋转角度。

3、基于参考模板图像中参考物体的关键点和参考标注框，确定样本图像中待标注物体的样本标注框。

4、获取样本图像中待标注物体的类别。

在本申请实施例中，待标注物体的类别也称为样本类别。

在本申请实施例中，旋转物体位姿标注模块201也称为基于关键点的自适应旋转物体位姿标注模块。“基于关键点”表示，该模块对样本关键点和样本标注框的标注，是基于参考关键点实现的。“自适应”表示，该模块对样本标注框和样本旋转角度的确定过程是自动实现的，不需要人为标注样本标注框和样本旋转角度。

级联型旋转物体位姿检测训练子模块2021用于，对初始模型进行训练，得到目标模型。在本申请实施例中，“级联型”表示需要两个模型配合实现位姿检测。因此在模型训练阶段需要训练这两个模型，即旋转物体检测模型和角度度量模型。

对旋转物体检测模型的训练过程如下：将来自旋转物体位姿标注模块201的样本标注框的信息，以及样本图像输入初始旋转物体检测模型，以训练旋转物体检测模型对图像中物体进行位置回归的能力，得到具有该能力的目标旋转物体检测模型。

可选的，也可将来自旋转物体位姿标注模块201的样本类别输入旋转物体检测模型，用于训练旋转物体检测模型确定图像中物体的类别的能力。

对角度度量模型的训练过程如下：将来自旋转物体位姿标注模块201的样本标注框的信息、样本旋转角度、样本类别，以及样本图像输入角度度量模型，以训练角度度量模型确定同类图像对的能力，得到具有该能力的目标角度度量模型。其中，同类图像对中的物体，具有相同的角度和类别。

1.22、模型推理阶段。

模型推理阶段由级联型旋转物体位姿检测子模块2022实现。

“级联型”表示，在推理阶段，需要通过两级模型配合，实现对待测物体旋转角度的预测。在本申请实施例中，两级表示两个阶段，即阶段1：旋转物体检测阶段，和阶段2：角度度量阶段。旋转物体检测阶段，通过目标旋转物体检测模型对待测图像中的待测物体进行位置回归，得到回归位置框，回归位置框用于表示待测物体在待测图像中的位置。角度度量阶段，通过目标角度度量模型和旋转物体检测阶段得到的回归位置框，确定待测物体的旋转角度。

可选的，旋转物体检测阶段还可以确定待测物体的类别，用于角度度量阶段对待测物体旋转角度的确定。

接下来将对模型训练的过程进行详细的描述。

2、模型训练阶段。

请参阅图3，图3为本申请实施例提供的一种图像处理装置的结构示意图。该图像处理装置用于实现对样本标注框和样本旋转角度的标注、对旋转物体检测模型的训练以及对角度度量模型的训练，即图2b所示实施例中的模型训练阶段。本申请实施例提供的样本图像处理装置300包括标注模块301、第一训练模块302和第二训练模块303。

标注模块301，对应于图2b所示实施例中的旋转物体位姿标注模块201；第一训练模块302和第二训练模块303，对应于图2b所示实施例中的级联型旋转物体位姿检测训练子模块2021。

标注模块301用于，向用户提供参考模板图像和样本图像。其中，参考模板图像中包括参考物体的影像，样本图像中包括待标注物体的影像。参考模板图像中标注有参考物体的参考关键点，参考关键点的数量大于或等于2。

标注模块301还用于，接收样本关键点的信息，样本关键点的信息为用户基于参考模板图像和参考关键点，对样本图像中的待标注物体进行标注所得的信息。并依据样本关键点的信息和参考关键点的信息，确定样本旋转角度。其中，样本旋转角度为样本图像中的待标注物体相对于参考物体的旋转角度。

标注模块301还用于，依据用户标注的样本关键点，以及参考关键点和参考标注框，对样本图像进行标注，得到样本标注框。其中，样本标注框表示待标注物体在样本图像中的位置，参考标注框表示参考物体在参考模板图像中的位置。参考物体在参考模板图像中的影像与参考标注框之间具有参考位置关系，待标注物体在样本图像中的影像与样本标注框之间，也具有该参考位置关系。因此，对样本标注框的标注，具有统一的标准，该标准即为参考位置关系。对参考位置关系的具体描述，参见图5所示实施例的说明。

标注模块301还用于，将上述样本标注框和样本图像，传输给第一训练模块302，以训练初始旋转物体检测模型，得到目标旋转物体检测模型，使得目标旋转物体检测模型，具有对图像中物体进行位置框回归的能力。

可选的，标注模块301还可以用于，接收用户对样本图像中待标注物体类别标注的样本类别，并将样本类别传输给第一训练模块302，以训练初始旋转物体检测模型，得到目标旋转物体检测模型，使得目标旋转物体检测模型，具有对图像中的物体进行分类的能力。

第一训练模块302用于训练旋转物体检测模型，因此也可称为旋转物体检测训练模块，该模块的具体用途如下所述：

第一训练模块302用于，通过初始旋转物体检测模型，对样本图像中的样本标注框进行位置回归，并依据回归得到的样本回归位置框，与样本标注框，训练初始旋转物体检测模型，得到目标旋转物体检测模型。目标旋转物体检测模型用于确定回归位置框，回归位置框用于表示待测物体在待测图像中的位置。

可选的，第一训练模块302还可以用于，通过初始旋转物体检测模型，对样本图像中的待标注物体进行分类，并依据分类结果与样本类别，对初始旋转物体检测模型进行迭代训练，得到目标旋转物体检测模型。此处的目标旋转物体检测模型，用于对图像中的物体进行分类，以依据分类结果确定预测旋转角度。

标注模块301还可以用于，将上述样本图像、样本旋转角度、样本标注框的信息和样本类别，传输给第二训练模块303，以训练初始角度度量模型，得到目标角度度量模型。目标角度度量模型，用于确定待测图像中待测物体相对于参考物体的预测旋转角度。

第二训练模块303用于训练角度度量模型，因此也可称为角度度量训练模块，该模块的具体用途如下所述：

第二训练模块303用于，根据样本标注框截取样本图像，得到截取样本图像，并根据n个第一旋转角度旋转该截取样本图像，得到n个旋转样本图像。其中，n个第一旋转角度为根据样本旋转角度获取。然后将n个旋转样本图像输入角度训练图库，并在角度训练图库中确定同类样本图像对和异类样本图像对。其中，同类样本图像对中的样本图像具有相同的类别和角度，异类样本图像对中的样本图像具有不同的类别或角度。再根据同类样本图像对和异类样本图像对，训练初始角度度量模型，得到目标角度度量模型。目标角度度量模型用于确定预测旋转角，预测旋转角为对待测物体相对于参考物体的旋转角度的预测值。

接下来详细描述样本图像处理装置300对样本图像的处理流程，主要分为三个阶段：对样本图像的标注、对旋转物体检测模型的训练和对角度度量模型的训练。

接下来描述样本图像的标注阶段。

2.1、对样本图像的标注。

基于图3所示的图像处理装置，本申请实施例提供了一种图像处理方法。请参阅图4，图4为本申请实施例提供的一种图像处理方法的流程示意图，其流程包括：

401、标注模块301获取样本图像和参考模板图像。

标注模块301可以获取参考模板图像，参考模板图像中包括参考物体。参考模板图像作为后续模型训练和预测过程衡量角度的标准。

在本申请实施例中，图像中包括物体，其具体含义为图像中包括物体的影像，例如参考模板图像中包括参考物体，其含义就是参考模板图像中包括参考物体的影像。同理，图像中的物体，其含义为图像中所包括的，物体的影像。

具体的，参考模板图像可以从参考图像库中获取，参考模板图像还可以通过其他方式获取，例如对参考物体拍摄获取等，此处不作限定。参考图像库中包括多张参考模板图像，除了特别说明的情况，本申请实施例中的参考模板图像，表示步骤401中获取的参考模板图像。

在本申请实施例中，将参考模板图像中的参考物体作为衡量物体旋转角度的基准，即旋转角度都是相对于参考物体的角度，因此参考物体的旋转角度为0°。

标注模块301还可以获取样本图像。样本图像中包括待标注物体，待标注物体与参考物体相对应。此处的相对应指的是，待标注物体与参考物体具有相同的类别，待标注物体的方位指向与参考物体的方位指向，可以相同也可以不同。

具体的，样本图像可以从样本图像库中获取，样本图像还可以通过其他方式获取，例如对待标注物体拍摄获取等，此处不作限定。

402、标注模块301获取参考关键点的信息。

标注模块301还可以获取参考模板图像中参考物体的参考关键点的信息，参考关键点的信息可以作为参考模板图像和参考物体的标识，用于作为参考模板图像与样本图像之间的对比依据。除了作为两图像之间的对比依据，参考关键点的信息还可以有其他用途，例如用于确定参考物体与待标注物体之间的关系，示例地，该关系可以为两者之间的夹角等，此处不作限定。

具体的，标注模块301可以向用户提供参考模板图像，并接收用户对参考模板图像中参考物体所标注的参考关键点的信息。

除了用户标注，标注模块301还可以通过其他方式获取参考关键点的信息，例如由样本图像处理装置300对参考模板图像进行标注获取；或者，也可以在步骤401中，从参考图像库中获取参考模板图像的同时获取，此处的参考模板图像中就已经标注有参考关键点；此处不作限定。

具体的，参考关键点可以是参考图像中参考物体的影像上距离最远的两个点。参考关键点也可以是其他的点，例如，用户自定义的两个点；或者在参考物体的影像中，与其他点具有明显不同特征的两个点等，此处不做限定。

在本申请实施例中，参考关键点的数量除了是2个，也可以为大于2的任一整数，例如3个或4个，此处不做限定。本申请实施例仅以2个参考关键点为例，并不造成对参考关键点数量的限定。

403、标注模块301向用户提供样本图像和标注有参考关键点的参考模板图像。

标注模块301向用户提供样本图像和参考模板图像。其中，参考模板图像中标注有参考物体的2个参考关键点，参考模板图像作为用户标注关键点的参考与依据。

404、标注模块301接收用户标注的样本关键点的信息。

用户可以根据参考模板图像中参考物体的影像的位置，与2个参考关键点，实现对样本图像中待标注物体的样本关键点的标注。

具体的，用户对样本关键点的标注过程如下：由于参考物体与待标注物体具有相同的类别，两者就具有相似或相同的形状。也就是说，参考模板图像中参考物体的影像，与样本图像中待标注物体的影像，具有相似或相同的形状。参考关键点是参考模板图像中该形状上的点，用户可以根据参考关键点与参考模板图像中该形状的位置关系，匹配出样本关键点在样本图像中该形状的位置。即，用户可以根据参考模板图像中参考关键点的位置，在样本图像中匹配出相应的样本关键点，从而实现对样本关键点的标注。

为了更加直观地描述标注过程，结合图5a，对标注过程进行示例说明。图5a为本申请实施例提供的一种标注方法示意图。如图5a所示，用户可以根据参考模板图像中的两个参考关键点K1和K2，在样本图像中，对待标注物体的图像标注对应的样本关键点K1’和K2’。其中，样本关键点K1’对应于参考关键点K1，样本关键点K2’对应于参考关键点K2。

在本申请实施例中，待标注物体也称为待测物体，用户确定样本关键点的过程也称为训练样本标注。

405、标注模块301根据样本关键点的信息和参考关键点的信息确定样本旋转角度。

标注模块301可以根据参考关键点的信息和样本关键点的信息确定待标注物体相对于参考物体的旋转角度。在本申请实施例中，该旋转角度也称为样本旋转角度。

可选的，可以通过关键线确定样本旋转角度。关键线包括参考关键线、样本关键线和预测关键线，预测关键线会在推理过程中出现，此处不做详细解释。2个参考关键点的连线称为参考关键线，2个样本关键点的连线称为样本关键线。使参考关键线与样本关键线中一对对应的点重合，可以得到参考关键线与样本关键线之间的夹角，据此就可确定两个关键线之间的角度大小，两个关键线之间的角度大小反映了待标注物体与参考物体之间的角度大小。

可选的，除了角度大小，根据两个关键线之间的夹角，还可以确定待标注物体相对于参考物体的旋转方向，即样本关键线相对于参考关键线的旋转方向，具体可以为顺时针或逆时针。

例如，如图5a所示，可以使参考模板图像中的参考关键点K1，与样本图像中的样本关键点K1’重合，得到两关键线之间的夹角a，夹角a的大小为a度，夹角a的方向，即为逆时针方向。因此就可以确定待标注物体相对于参考物体，逆时针旋转了a度。此时样本旋转角度即为a度，且方向为逆时针。

在本申请实施例中，除了通过将关键点重合的方法确定样本旋转角度，也可以通过其他方法确定，例如根据关键线的矢量信息确定等，此处不做限定。

406、获取参考模板图像的参考标注框。

标注模块301获取参考模板图像中参考物体的参考标注框，参考标注框用于表示参考物体在参考模板图像中的位置，即参考物体的影像在参考模板图像中的位置。

具体的，标注模块301以向用户提供参考模板图像，并接收用户对参考模板图像中参考物体所标注的参考标注框。

除了用户标注，标注模块301可以通过其他方式获取参考标注框，例如由样本图像处理装置300对参考模板图像进行标注获取；或者，也可以在步骤401中，从参考图像库中获取参考模板图像的同时获取，此处的参考模板图像中就已经标注有参考标注框；此处不作限定。

在本申请实施例中，参考标注框可以为矩形框，且参考标注框具有水平边。

值得注意的是，在本申请实施例中，除了矩形框，参考标注框也可以是其他形状，例如三角形框、梯形框等，此处不作限定；除了水平边，参考标注框的边也可以与水平边之间具有一定夹角，例如90°或10°的夹角等，此处不作限定。

在本申请实施例中，步骤402中，样本图像处理装置300获取参考关键点的信息的过程，以及步骤406中获取参考标注框的过程，也称为参考物体标注。

407、标注模块301根据参考标注框，确定样本标注框。

标注模块301可以根据参考标注框，在样本图像中确定样本标注框。

具体的，标注模块可以根据参考标注框，参考关键点的信息和样本关键点的信息，确定样本标注框，其过程如下：

根据参考位置关系匹配样本标注框。在本申请实施例中，参考位置关系表示参考关键点与参考标注框之间的位置关系。标注模块301可以根据参考位置关系与样本关键点，在与样本关键点具有参考位置关系的地方，标注样本标注框。样本关键点与样本标注框之间就具有参考位置关系。

示例地，如图5a所示，参考标注框具有点A和点C，点A和参考关键点K1具有相对位置关系一，点A和参考关键点K2具有相对位置关系二，可以根据样本关键点K1’、样本关键点K2’、相对位置关系一和相对位置关系二，确定点A’。同理，也可以根据其他的样本关键点和与样本关键点相对应的相对位置关系，确定样本标注框的其他点B’、C’和D’，此处不做赘述。

值得注意的是，本申请实施例中出现的关键点A、B、A’、B’等，均是对参考关键点或样本关键点的举例，并不造成对前述关键点的限定。

在本申请实施例中，相对位置关系一和相对位置关系二属于相对位置关系。相对位置关系表示参考关键点与参考标注框上的点的位置关系，同时反映了与参考关键点对应的样本关键点，与样本标注框上的点的位置关系。相对位置关系可以是向量，除了向量，还可以是其他未知关系，例如距离、夹角、坐标系等，此处不做限定。

在本申请实施例中，除了通过确定各个样本关键点的位置，还可以通过其他方法确定样本标注框，例如根据参考位置关系、样本旋转角度和样本关键点的位置，匹配样本标注框等，此处不作限定。

值得注意的是，步骤406和步骤407，也可以在步骤405之前执行，只要在步骤404之后执行即可，此处不作限定。

在本实施例中，步骤405中确定样本旋转角度的过程也称为自适应姿态标注，步骤407中确定样本标注框的过程也称为自适应位置标注；因此，步骤405和步骤407可以合称为自适应位姿标注。

408、标注模块301获取样本类别。

可选的，标注模块301还可以获取样本图像中待标注物体的类别，在本申请实施例中，待标注物体的类别也称为样本类别。

具体的，标注模块301可以接收用户对样本图像中待标注物体所标注的样本类别。

除了用户标注，标注模块301还可以通过其他方式获取样本类别，例如在步骤401中，从样本图像库中获取样本图像的同时获取，此处的样本图像中就已经标注有样本类别；此处不作限定。

409、标注模块301向第一训练模块302发送样本图像和样本标注框的信息。

在步骤407确定样本标注框之后，标注模块301可以将样本图像和样本标注框的信息发送给第一训练模块302，用于训练旋转物体检测模型。

在本申请实施例中，步骤409也可以在步骤408之前执行，只要在步骤407之后执行即可，此处不做限定。

可选的，在步骤408之后，标注模块301也可以将样本类别发送给第一训练模块302，用于训练旋转物体检测模型。

410、标注模块301向第二训练模块303发送样本图像、样本类别、样本旋转角度和样本标注框的信息。

在步骤405确定样本旋转角度、步骤407确定样本标注框以及步骤408确定样本类别之后，标注模块301可以将样本图像、样本类别、样本旋转角度和样本标注框的信息发送给第二训练模块303，用于训练角度度量模型。

为了更清楚地说明对样本图像的标注过程，下面将结合图5b，对标注过程进行描述。图5b为本申请实施例提供的一种标注方法示意图。

为了实现对样本图像的标注，需要经过三个阶段，1、参考模板图像标注；2、大量样本图像的样本关键点标注；3、样本位置框自动获取。

阶段1、参考模板图像标注。

用户对参考模板图像中的参考物体，进行物体类别、关键点以及矩形框的标注。可选的，物体类别可以包括物体的正面信息和反面信息，除了正面信息和反面信息，物体类别还可以包括其他信息，例如材质、用途、目的地等信息，此处不做限定。

可选的，对矩形框的标注可以包括对矩形框顶点的标注。在本申请实施例中，此处的矩形框也称为参考标注框。参考位置框的形状与位置特征如图4所示实施例的步骤406所述，此处不再赘述。

在本申请实施例中，对参考模板图像中参考物体的标注，除了用户，也可以由其他主体实现，例如由标注模块301实现等，只要标注模块301能获取标注结果即可，此处不做限定。

阶段2、大量样本图像的样本关键点标注。

对参考模板图像的标注结果用于样本标注，标注模块301向用户提供参考模板图像和的样本图像，用户根据样本图像选择与其对应的参考模板图像。该过程称为模板选择。用户再根据参考模板图像，确定并标注样本图像中样本物体的物体类别和关键点。在本实施例中，该过程也称为样本标注。

阶段3、样本位置框自动获取。

模板选择和样本标注之后，标注模块301可以根据参考模板图像中参考物体的参考标注框和参考关键点、以及标注出的样本关键点，确定样本位置框。在本申请实施例中，样本位置框也称为样本标注框。该过程参见图4所示实施例的步骤407，此处不再赘述。在本实施例中，该过程也称为位置框生成。

在本申请实施例中，还可以实现对不同尺度图片的标注、训练和推理。

例如，在接收用户标注的样本关键点的信息后，可以根据样本关键点的信息与参考关键点的信息，确定样本图像相对于参考模板图像的大小比例。并将样本图像根据该比例缩放，得到与参考模板图像同尺度的样本图像，再通过缩放后的样本图像确定标注框、训练模型等。或者也可以对参考模板图像进行缩放，根据缩放后的参考模板图像进行标注或训练等，此处不做限定。

例如，在模型推理过程中，可以对待测图像进行缩放，对缩放后的待测图像进行推理。或者，也可以使用多尺度模型对待测图像进行推理等，此处不作限定。其中，多尺度模型为根据缩放后的样本图像或缩放后的参考模板图像训练得到的模型。

在图4所示实施例的步骤409之后，第一训练模块302就可以根据接收到的样本图像以及样本标注框的信息，训练旋转物体检测模型，接下来描述旋转物体检测模型的训练阶段。

2.2、对旋转物体检测模型的训练。

请参阅图6，图6为本申请实施例提供的一种图像处理方法的流程示意图，基于图3所示的图像处理装置，本申请实施例提供的一种图像处理方法，其流程包括：

601、第一训练模块302接收来自标注模块301的样本图像和样本标注框的信息。

602、第一训练模块302对样本图像中的待标注物体进行位置回归，得到样本回归位置框。

为了更加清楚地描述旋转物体检测模型的训练过程，接下来将结合图7进行说明，图7为本申请实施例提供的一种旋转物体检测模型的训练方法的示意图。

将样本图像和样本标注框的信息输入初始旋转物体检测模型，通过初始旋转物体检测模型，对样本图像进行样本标注框的位置回归，得到并输出样本回归位置框的信息。

603、第一训练模块302根据样本回归位置框的信息、样本标注框的信息和位置回归损失函数，训练旋转物体检测模型。

第一训练模块302可以根据样本回归位置框的信息、样本标注框的信息和位置回归损失函数，对初始旋转物体检测模型进行迭代训练，直至满足预设条件，得到目标旋转物体检测模型。

具体的，通过位置回归损失函数可以确定样本回归位置框与样本标注框之间的误差值，预设条件可以为该误差值小于某一阈值。如图7所示，该误差值可以是位置回归损失Lreg。值得注意的是，Lreg是位置回归损失的符号，仅是位置回归损失的示例，并不造成对位置回归损失的限定。

除了上述条件，也可以通过位置回归损失函数确定其他信息，并将该信息对应的条件作为预设条件，例如对旋转物体检测模型进行迭代训练的次数达到某一阈值等，此处不做限定。

通过上述训练过程，可以训练目标旋转物体检测模型对图像中的物体标注回归位置框的能力。除了标注回归位置框的能力，在图4所示实施例的方法中包括步骤408的情况下，还可以训练目标旋转物体检测模型对图像中物体进行分类的能力，具体的训练过程如下所示：

604、第一训练模块302接收来自标注模块301的样本类别。

可选的，获取待标注物体的类别之后，标注模块301可以将该类别传输给第一训练模块302。

具体的，步骤604也可以在步骤601、602或步骤603之前执行，此处不作限定。

605、第一训练模块302对待标注物体进行分类，得到预测样本类别。

第一训练模块302可以将样本图像输入初始旋转物体检测模型，通过初始旋转物体检测模型，对样本图像中的待标注物体进行分类，得到并输出预测样本类别。

606、第一训练模块302根据预测样本类别、样本类别和分类损失函数，训练旋转物体检测模型。

第一训练模块302可以根据预测样本类别、样本类别和分类损失函数，对初始旋转物体检测模型进行迭代训练，直至满足预设条件，得到目标旋转物体检测模型。

具体的，通过分类损失函数可以确定预测样本类别与样本类别之间的误差值，预设条件可以为该误差值小于某一阈值。如图7所示，该误差值可以是分类损失Lcls。值得注意的是，Lcls是分类损失的符号，仅是分类损失的示例，并不造成对分类损失的限定。

除了上述条件，也可以通过分类损失函数确定其他的信息，并将该信息所对应的条件作为预设条件，例如对旋转物体检测模型进行迭代训练的次数达到某一阈值等，此处不做限定。

通过上述训练过程，可以训练目标旋转物体检测模型对图像中的物体分类的能力。

值得注意的是，步骤605和606也可以在步骤601、602或603之前执行，只要在步骤604之后执行即可。

值得注意的是，步骤604-606为非必选项，当图4所实施示例中不获取样本类别时，也可以不训练旋转物体检测模型对图像中物体分类的能力。即，图6所示的方法中也可以不包括步骤604、605和606。

图6所示实施例训练出的目标旋转物体检测模型，可以用于确定图像中物体的回归位置框。其中，回归位置框为根据参考模板图像，匹配参考位置关系确定的。即对于相同类别的待标注物体来说，通过目标旋转物体检测模型确定的回归位置框，都具有统一的标准，该标准即为参考位置关系。因此后续基于回归位置框进行的操作，都是基于参考位置关系这一统一标准进行的。由于参考位置关系是根据参考模板图像中的参考物体确定的，归根结底来说，后续基于回归位置框进行的操作，都是基于参考物体这一统一标准进行的。因此根据回归位置框预测得到的旋转角度，也是基于参考物体这一统一基准确定的，预测的结果更加准确。

在图4所实施示例的步骤410之后，第二训练模块303可以根据接收到的样本图像等信息训练角度度量模型，接下来描述角度度量模型的训练阶段。

2.3、对角度度量模型的训练。

请参阅图8，图8为本申请实施例提供的一种图像处理方法的流程示意图，基于图3所示的图像处理装置，本申请实施例提供的一种图像处理方法，其流程包括：

801、第二训练模块303接收来自标注模块301的样本图像、样本类别、样本旋转角度和样本标注框的信息。

802、第二训练模块303根据样本标注框截取样本图像。

第二训练模块303可以根据样本标注框在样本图像中的位置，截取样本图像中在样本标注框内部的图像，得到截取样本图像。

在本申请实施例中，截取样本图像的过程，也称为抠图。

803、第二训练模块303根据样本旋转角度，确定4个第一旋转角度。

步骤801中获取了样本旋转角度，第二训练模块303就可以根据样本旋转角度，确定4个第一旋转角度。为了更加清楚地描述角度度量模型的训练过程，接下来将结合图9进行示例说明，图9为本申请实施例提供的一种角度度量模型的训练方法的示意图。如图9所示，若样本旋转角度为a度，可以确定第一旋转角度为-a度、-a-90度、-a-180度和-a-270度。

在本申请实施例中，第一旋转角度的数量为n个，n也可以是除4以外的其他整数，例如5个、8个等，只要n大于或等于2即可，此处不作限定。第一旋转角度与样本旋转角之间的关系，可以是具有某一差值，例如本实施例中，该差值即为x与90°的乘积，其中x为0至n-1的任一整数。在本申请实施例中，差值的大小也可以遵循其他规律，例如y与某一角度的乘积，其中y为任一整数，或差值为任意角度大小等，此处不作限定。

值得注意的是，在本申请实施例中，步骤803也可以在步骤802之前执行，只要在步骤801之后执行即可，此处不作限定。

804、第二训练模块303旋转截取样本图像，得到4个旋转样本图像。

第二训练模块303根据4个第一旋转角度，旋转截取样本图像，得到4个旋转样本图像。例如，如图9所示，在第一旋转角度为-a度、-a-90度、-a-180度和-a-270度的情况下，旋转得到的4个旋转样本图像都具有水平的边框。在本申请实施例中，与前述第一旋转角度相对应，旋转样本图像的数量也为n个，此处不再赘述。

值得注意的是，步骤803中确定n个第一旋转角度的动作，除了由第二训练模块303实现，也可以由其他模块实现，例如可以由标注模块301或其他模块实现，只要第二训练模块303可以获取n个第一旋转角度即可，此处不做限定。

805、第二训练模块303将4个旋转样本图像输入角度训练图库。

获取4个旋转样本图像之后，第二训练模块303可以将4个旋转样本图像输入角度训练图库。此时，角度训练图库中除了包括步骤805输入的4个图像，也可以包括根据其他样本图像旋转得到的旋转样本图像。其他的样本图像中包括的待标注物体，与本实施例中样本图像中包括的待标注物体之间，可以具有相同的类别，也可以具有不同的类别；可以具有相同的方位指向，也可以具有不同的方位指向，此处不做限定。

具体在图9所实施示例中，由于n为4，所示角度训练图库也称为四角度训练图库，当n为其他数值时，图库的名称也可做出相应的改变，此处不做限定。

806、第二训练模块303在角度训练图库中确定同类样本图像对和异类样本图像对。

第二训练模块303可以根据样本的类别，在角度训练图库中确定同类样本图像对和异类样本图像对。同类样本图像对中的物体，具有相同的类别和相同的角度；异类样本图像对中的物体，具有不同的类别或不同的角度。

807、第二训练模块303根据同类样本图像对和异类样本图像对训练初始角度度量模型，得到目标角度度量模型。

第二训练模块303将同类样本图像对和异类样本图像对输入初始角度度量模型，通过初始角度度量模型对同类样本图像对和异类样本图像对进行编码，得到同类样本图像对中图像的编码结果之间的距离D _same，以及异类样本图像对中图像的编码结果之间的距离D _diff，训练的目标是使得D _same小于D _diff。

例如图9所示虚线框中包括多个图形，多个图形表示对多个图像对中图像的编码结果。其中图形的形状表示类别，图形的线条粗细表示角度。同类别同角度图像的编码结果之间的距离，小于非同类别或非同角度图像的编码结果之间的距离，如图中两个粗线圆形之间的距离，就比其他不具备同类别同角度的编码结果之间的距离小。

第二训练模块303根据D _same、D _diff和距离损失函数，对初始角度度量模型进行迭代训练，直至满足预设条件，得到目标角度度量模型。

具体的，第二训练模块303可以通过距离损失函数，确定对同类样本图像对和异类样本图像对的编码结果的误差值，预设条件可以为该误差值小于某一阈值。例如，距离损失函数可以是L＝max(0，D _same-D _diff+margin)，其中D _same表示相同类别相同角度图像的编码结果之间的距离，D _diff表示不同类别或不同角度图像的编码结果之间的距离，margin表示距离间隔，L为误差值。在本申请实施例中，编码结果也称为编码得到的特征，或称为特征。

除了上述条件，也可以通过距离损失函数确定其他的信息，并将该信息所对应的条件作为预设条件，例如，预设条件也可以是对角度度量模型进行迭代训练的次数达到某一阈值等，此处不做限定。

角度度量模型训练完成后，对相同类别相同角度的图像编码得到的特征距离近，对不同角度或不同类别图像编码得到的特征距离远。因此，可以通过对比两个特征之间的距离确定它们是否属于同类别同角度，即属于同类图像对。

通过上述训练过程，可以训练目标角度度量模型确定同类图像对的能力。同类图像对中的物体，具有相同的类别和角度。目标角度度量模型对图像的处理不依赖于类别，其泛化能力比传统的分类模型更强。

经过图4、图6以及图8所示实施例训练出的目标旋转物体检测模型和目标角度度量模型，具体还用于对图像中的物体进行位置和姿态的推理，接下来就对实现该推理功能的图像处理装置进行描述。

3、模型推理阶段。

接下来描述模型推理过程所要用到的装置，请参阅图10，图10为本申请实施例提供的一种图像处理装置的结构示意图，将图4、图6以及图8所示流程训练得到的目标旋转物体检测模型和目标角度度量模型，应用于该装置中。本申请实施例提供的图像处理装置1000包括旋转物体检测模块1001和角度度量模块1002。

旋转物体检测模块1001用于，通过目标旋转物体检测模型，确定待测图像中待测物体的回归位置框，并将回归位置框传输给角度度量模块1002。

角度度量模块1002用于，根据来自旋转物体检测模块1001的回归位置框，截取待测图像，得到截取图像；以及根据回归位置框确定m个第二旋转角度，并根据m个第二旋转角度旋转截取图像，得到m个旋转图像。然后确定m个旋转图像中的目标图像。其中，目标图像与参考模板图像为同类图像对。根据目标图像对应的第二旋转角度，确定待测物体相对于参考物体的预测旋转角度。其中，m为大于或等于2的整数。

可选的，旋转物体检测模块1001还用于，通过目标旋转物体检测模型，确定待测图像中待测物体的类别，并将待测物体的类别传输给角度度量模块1002。角度度量模块1002还用于，根据来自旋转物体检测模块1001的待测物体的类别，确定与待测物体同类别的参考模板图像，并根据参考模板图像确定同类图像对。

接下来详细描述图像处理装置1000对待测图像的处理流程，即对待测图像中待测物体位姿的推理过程。

请参阅图11，图11为本申请实施例提供的一种图像处理方法的流程示意图，基于图10所示的图像处理装置，本申请实施例提供的一种图像处理方法，其流程包括：

1101、旋转物体检测模块1001获取待测图像。

1102、旋转物体检测模块1001对待测图像中的待测物体进行位置回归，得到回归位置框。

旋转物体检测模块1001可以通过目标旋转物体检测模型，对待测图像进行位置回归，得到回归位置框，回归位置框表示待测物体在待测图像中的位置。

1103、旋转物体检测模块1001将待测图像和回归位置框的信息传输给角度度量模块1002。

1104、角度度量模块1002根据回归位置框的信息确定边框旋转角度。

角度度量模块1002可以确定回归位置框的边与水平边的夹角的角度。在本申请实施例中，该角度称为边框旋转角度。边框旋转角度为回归位置框的任一条边，与水平边或与竖直边之间的夹角的角度。用于确定边框旋转角的回归位置框的边，可以是随机选取的，也可以通过其他方式确定，例如选取回归位置框中较长的边等，此处不做限定。

在本申请实施例中，水平边指水平方向的边，竖直边指竖直方向的边。水平边与竖直边都属于基准边，基准边用于衡量边框旋转角。除了水平或竖直，基准边还可以有其他的方位特征，例如与水平边呈一定夹角等，此处不做限定。

1105、角度度量模块1002根据边框旋转角度确定4个第二旋转角度。

角度度量模块1002可以根据边框旋转角度，确定4个第二旋转角度。

为了更清楚地说明模型推理，接下来将结合图12进行说明，图12为本申请实施例提供的一种模型推理过程的方法示意图。如图12所示，若边框旋转角度为a度，则可以确定第二旋转角度为-a度、-a-90度、-a-180度和-a-270度。

在本申请实施例中，第二旋转角度的数量为m，m也可以是除4以外的其他大于或等于2的整数，例如5个、8个等，此处不作限定。第二旋转角度与边框旋转角之间的关系，可以是具有某一差值，例如本实施例中，该差值即为x与90°的乘积，其中x为0至3的任一整数。在本申请实施例中，差值的大小也可以遵循其他规律，例如y与某一角度的乘积，其中y为任一整数，或差值为任意角度大小等，此处不作限定。

值得注意的是，步骤1104中确定边框旋转角度的动作，或步骤1105中确定m个第二旋转角度的动作，除了由角度度量模块1002实现，也可以由其他模块实现，例如由旋转物体检测模块1001或其他模块实现，只要角度度量模块1003可以获取m个第二旋转角度即可，此处不做限定。

1106、角度度量模块1002根据回归位置框截取待测图像，得到截取图像。

获取待测图像和回归位置框的信息之后，角度度量模块1002可以根据回归位置框在待测图像中的位置，截取待测图像中在回归位置框内部的图像，得到截取图像。

值得注意的是，在本申请实施例中，步骤1106也可以在步骤1104或步骤1105之前执行，只要在步骤1103之后执行即可，此处不作限定。

1107、角度度量模块1002根据4个第二旋转角度旋转截取图像，得到4个旋转图像。

角度度量模块1002根据4个第二旋转角度，旋转截取图像，得到4个旋转图像。

如图12所示，在第二旋转角度为-a度、-a-90度、-a-180度和-a-270度的情况下，旋转得到的4个旋转图像都具有水平的边框。在本申请实施例中，与前述第二旋转角度相对应，旋转图像的数量也为m个，此处不再赘述。

1108、角度度量模块1002通过目标角度度量模型，确定4个旋转图像中的目标图像。

得到4个旋转图像后，角度度量模块1002可以通过4张旋转图像中的每一张，与模板图像库中的图像，构建图像对。具体的，图像对中的一张图像为4张旋转图像中的任一张；图像对中的另一张图像，为模板图像库中的图像。模板图像库中包括多张参考模板图像，该多张参考模板中的物体，可以具有不同的类别。

由于图6所示实施例中，已经训练了目标角度度量模型确定同类图像对的能力。因此，可以通过目标角度度量模型，在构建出的图像对中确定同类图像对。由于同类图像对中两张图像所包括的两个物体，具有相同的类别和角度，因此就能在4个旋转图像中，确定出与参考模板图像同类别同角度的图像。在本申请实施例中，两张图像同类别同角度，表示两张图像中所包括的两个物体具有相同的类别与角度。与参考模板图像同类别同角度的图像，称为目标图像。

1109、角度度量模块1002根据目标图像确定预测旋转角度。

角度度量模块1002确定出4张旋转图像中的目标图像后，就可以确定目标图像是根据多大的角度旋转截取图像所得的，即，可以确定目标图像所对应的第二旋转角度，该旋转角度即为预测旋转角度。

可选的，在图4所实施示例包括步骤408、图6所实施示例包括步骤604至步骤606的情况下，即训练了旋转物体检测模型对图像中物体分类的能力的情况下，图11所示实施例还可以通过待测物体的类别确定预测旋转角度。具体包括以下步骤：

1110、旋转物体检测模块1001对待测图像中的待测物体进行类别预测，得到预测类别。

此时的目标旋转物体检测模型具备对图像中物体进行分类的能力。旋转物体检测模型1001可以通过目标旋转物体检测模型，对待测图像中的待测物体进行分类，确定待测物体的类别。在本申请实施例中，待测物体的类别也称为预测类别。

1111、旋转物体检测模块1001将预测类别传输给角度度量模块1002。

1112、角度度量模块1002根据预测类别确定参考模板图像。

角度度量模块1002可以根据预测类别，从模板图像库中，确定包括与待测物体同类别的参考物体的参考模板图像。

步骤1110至步骤1112，可以在步骤1102至步骤1107中的任一步之前执行，只要在步骤1101之后执行即可，此处不作限定。

在存在步骤1110至步骤1112的情况下，步骤1108中对目标图像的确定，可以通过以下方式：

分别通过4张旋转图像，与步骤1112中确定出的参考模板图像构建图像对。

通过目标角度度量模型，在构建出的图像对中，确定同类图像对。

在同类图像对中确定目标图像。

根据待测物体的类别确定参考模板图像，可以从模板图像库中的多个参考模板图像中确定出要用到的一张，可以大大减少角度度量模块1002构建图像对的数量，从而减少对运算资源和存储资源的消耗。减少了图像对的数量，也能大大减少目标角度度量模块确定同类图像对所需的时间和算力等消耗，提升效率。

值得注意的是，步骤1110至步骤1112在本申请实施例中并不是必须的，当不存在步骤1110至步骤1112时，步骤1108也可实现对目标图像的确定。

接下来对本申请实施例提供的推理图像中物体姿态的另一种方法进行描述。

二、根据关键点推理图像中物体的姿态。

本申请实施例提供了一种图像处理方法和图像处理装置，用于标注样本图像中待标注物体的样本关键点，样本关键点用于训练关键点检测模型，以通过训练得到的目标关键点检测模型，实现对图像中关键点的确定，并根据确定出的关键点确定图像中物体的旋转角度。

1、模型训练阶段。

接下来描述模型训练过程所要用到的装置，请参阅图13，图13为本申请实施例提供的一种图像处理装置的结构示意图。本申请实施例提供的图像处理装置1300包括关键点标注模块1301和第三训练模块1302。

关键点标注模块1301用于，向用户提供参考模板图像和样本图像，参考模板图像中包括参考物体，样本图像中包括待标注物体。参考模板图像中标注有参考物体的参考关键点，参考关键点的数量大于或等于2。

在本申请实施例中，图像中包括物体，其含义为图像中包括物体的影像，例如参考模板图像中包括参考物体，即表示参考模板图像中包括参考物体的影像。同理，图像中的物体，表示图像中所包含的，物体的影像。

关键点标注模块1301还用于，接收用户基于参考模板图像和参考关键点，以及对样本图像中的待标注物体标注的样本关键点的信息。并依据样本关键点的信息和参考关键点的信息，确定样本旋转角度。样本旋转角度为样本图像中的待标注物体相对于参考物体的旋转角度。

关键点标注模块1301还用于，接收用户对样本图像中待标注物体类别标注的样本关键点类别。并将上述样本图像、样本关键点的信息和样本关键点类别，传输给第三训练模块1302，以训练初始关键点检测模型，得到目标关键点检测模型。

在本申请实施例中，样本关键点类别表示包括该关键点的样本图像中，样本关键点所对应的样本物体的类别。

第三训练模块1302，用于根据样本关键点的信息和样本图像，训练初始关键点检测模型，得到目标关键点检测模型。因此，在本申请实施例中，第三训练模块1302也可称为关键点检测训练模块。

接下来详细描述图像处理装置1300对样本图像的处理流程，即对关键点检测模型的训练过程。

请参阅图14，图14为本申请实施例提供的一种图像处理方法的流程示意图，基于图13所示的图像处理装置，本申请实施例提供的一种图像处理方法，其流程包括：

1401、关键点标注模块1301获取样本图像和参考模板图像。

1402、关键点标注模块1301获取参考关键点的信息。

1403、关键点标注模块1301向用户提供样本图像和标注有参考关键点的参考模板图像。

1404、关键点标注模块1301接收用户标注的样本关键点的信息。

步骤1401至步骤1404参见图4所实施例的步骤401至步骤404，其区别在于动作的执行主体由图4所实施示例的标注模块301，变为图14所实施例的关键点标注模块1301，此处不再赘述。

1405、关键点标注模块1301将样本图像和样本关键点的信息传输给第三训练模块1302。

1406、第三训练模块1302对样本图像中的待标注物体进行关键点检测，得到预测样本关键点。

第三训练模块1302获取样本图像和样本关键点的信息后，可以通过初始关键点检测模型，对样本图像中样本物体的点进行位置回归，得到回归样本关键点。

1407、关键点标注模块1301获取样本关键点类别。

关键点标注模块1301还可以获取样本图像中样本关键点的类别。在本申请实施例中，样本关键点的类别也称为样本关键点类别，表示包括该样本关键点的样本图像中，与样本关键点所对应的样本物体的类别。

具体的，样本关键点类别可以是用户对样本图像中的样本关键点标注所得，样本关键点类别也可以通过其他途径获取，例如在步骤1401中获取样本图像时从样本图像库中获取等，此处不做限定。

1408、关键点标注模块1301将样本关键点类别传输给第三训练模块1302。

值得注意的是，步骤1407和1408可以在步骤1402至1406中的任一步之前执行，只要在步骤1401之后执行即可，此处不作限定。

1409、第三训练模块1302对样本关键点进行分类，得到预测样本关键点类别。

第三训练模块1302将样本图像和样本关键点类别输入初始关键点检测模型，通过初始关键点检测模型，对样本图像中的样本关键点进行类别预测，得到并输出预测样本关键点类别。

值得注意的是，步骤1409可以在步骤1405至1408中的任一步之前执行，只要在步骤1404之后执行即可，此处不作限定。

1410、第三训练模块1302训练初始关键点检测模型，得到目标关键点检测模型。

第三训练模块1302可以根据回归样本关键点的信息，样本关键点的信息，以及关键点位置回归损失函数，对初始关键点检测模型进行迭代训练。

第三训练模块1302还可以根据预测样本关键点类别、样本关键点类别和关键点分类损失函数，对初始关键点检测模型进行迭代训练。

当上述迭代训练的结果满足预设条件，就可以得到目标关键点检测模型。目标关键点检测模型可以准确地确定图像中物体的关键点，并确定该关键点所对应的物体的类别。

经过图14所示实施例训练出的目标关键点检测模型，具体用于对图像中的物体进行姿态的推理，接下来就对实现该推理功能的图像处理装置进行描述。

2、模型推理阶段。

接下来描述模型推理过程所要用到的装置，请参阅图15，图15为本申请实施例提供的一种图像处理装置的结构示意图，将图14所示流程训练得到的目标关键点检测模型，应用于该装置中。本申请实施例提供的图像处理装置1500包括关键点检测模块1501和角度计算模块1502。

关键点检测模块1501用于，通过目标关键点检测模型，确定待测图像中待测物体的预测关键点，并将预测关键点的信息传输给角度计算模块1502。

角度计算模块1502用于，根据来自关键点检测模块1501的预测关键点的信息，确定待测物体相对于参考物体的旋转角度。在本申请实施例中，该角度也称为预测旋转角度。

关键点检测模块1501还用于，通过目标关键点检测模型，确定预测关键点类别，并将预测关键点类别传输给角度计算模块1502。

角度计算模块1502还用于，根据来自关键点检测模块1501的预测关键点类别，确定与待测物体同类别的参考模板图像，并根据参考模板图像确定预测旋转角度。在本申请实施例中，预测关键点类别表示包括预测关键点的待测图像中，与预测关键点所对应的待测物体的类别。

接下来描述模型推理过程的方法，请参阅图16，图16为本申请实施例提供的一种图像处理方法的流程示意图，基于图15所示的图像处理装置，本申请实施例提供的一种图像处理方法，其流程包括：

1601、关键点检测模块1501获取待测图像。

1602、关键点检测模块1501确定待测图像中的预测关键点。

关键点检测模块1501可以通过目标关键点检测模型，对待测图像中待测物体的点进行位置回归，得到预测关键点。

1603、关键点检测模块1501将预测关键点的信息传输给角度计算模块1502。

1604、关键点检测模块1501确定预测关键点类别。

此时的目标关键点检测模型具备对关键点进行分类的能力。步骤1602确定了预测关键点，此时关键点检测模型1501就可以通过目标关键点检测模型，确定预测关键点类别。预测关键点类别表示待测图像中待测物体的类别。

1605、关键点检测模块1501将预测关键点类别传输给角度计算模块1502。

步骤1604和步骤1605，可以与步骤1602同时进行，也可以在步骤1603之前或之后实施，此处不作限定。

1606、角度计算模块1502确定预测旋转角度。

步骤1604中获取了预测关键点类别，角度计算模块1502可以根据预测关键点类别，确定具有该类别的参考关键点，或者说，根据预测关键点类别，确定具有该类别的参考物体或包含该参考物体的参考模板图像。

角度计算模块1502确定预测关键线与参考关键线之间的夹角角度。此处的参考关键线，为根据预测关键点确定出的参考关键点的连线。预测关键点与参考关键点具有相同的类别，表示待测物体与参考物体具有相同的类别。

将预测关键线的方向，与参考关键线方向进行对比，得到预测关键线相对于参考关键线的夹角角度，该夹角角度即体现了预测图像中的待测物体，相对于参考物体的旋转角度。在本申请实施例中，该角度也称为预测旋转角度。

本申请实施例中，通过确定预测关键点确定待测图像中待测物体相对于参考物体的预测旋转角度，不用确定待测物体的位置框，确定预测旋转角度的过程更加简洁，实现该过程的装置结构更加简单，同时还能节省确定位置框以及对位置框进行操作所需的运算和存储等资源。

在本申请实施例中，还可以通过二维的图像，实现对三维物体的姿态预测。

二维图像反映三维物体在二维平面上的投影，也就可以真实反映三维物体的姿态。在本申请实施例中，可以通过二维图像中关键点的信息，确定特征形状。根据与关键点对应的参考关键点的信息，确定参考形状。并根据特征形状与参考形状之间的形状差异，确定二维图像所呈现的三维物体，相对于参考物体的旋转角度，从而就能确定二维图像所呈现的三维物体的姿态。其中，参考关键点为参考物体在二维平面上的投影中，与关键点对应的点。

可选的，可以训练模型根据对应的二维图像之间的形状差异，确定二维图像所对应的三维物体之间的旋转角度的能力，从而通过训练得到的目标模型，实现通过二维图像确定三维旋转角度的功能。

特征形状与参考形状是对应的，特征形状由n个样本关键点或n个预测关键点组成，则参考形状也由n个参考关键点组成，其中，n为大于或等于2的整数。

下面对本申请实施例中的样本图像处理装置进行描述，请参阅图17，图17为本申请实施例提供的一种图像处理装置的结构示意图，样本图像处理装置的一种结构包括：交互单元1701和处理单元1702。

交互单元1701，用于向用户提供样本图像和参考模板图像，样本图像中包括待标注物体，参考模板图像中包括与待标注物体对应的参考物体，参考物体相对于参考模板图像的旋转角度为零，参考模板图像中标注有参考物体的参考关键点，参考关键点的数量大于或等于2。

交互单元1701还用于，接收样本关键点的信息，样本关键点的信息为用户基于参考模板图像，对样本图像中的待标注物体进行标注所得。

处理单元1702，用于根据样本图像中待标注物体的样本关键点的信息和参考模板图像中参考物体的参考关键点的信息，确定样本旋转角度，样本旋转角度为待标注物体相对于参考物体的旋转角度。

可选的，在一种实现方式中，参考关键点和样本关键点的数量均为2，处理单元1702具体用于：根据参考关键线与样本关键线之间的夹角，确定样本旋转角度，参考关键线为2个参考关键点的连线，样本关键线为2个样本关键点的连线。

可选的，在一种实现方式中，图像处理装置还包括获取单元1703，获取单元1703用于：获取参考模板图像的参考标注框，参考标注框表示参考物体在参考模板图像中的位置。

处理单元1702还用于：根据参考标注框，确定样本标注框，样本标注框表示待标注物体在样本图像中的位置。

可选的，在一种实现方式中，处理单元1702具体用于：根据参考标注框、参考关键点的信息和样本关键点的信息确定样本标注框，参考关键点与参考标注框之间具有参考位置关系，样本关键点与样本标注框之间具有参考位置关系。

可选的，在一种实现方式中，处理单元1702还用于：将样本图像和样本标注框的信息输入初始旋转物体检测模型，以通过初始旋转物体检测模型对待标注物体进行位置回归，得到样本回归位置框的信息。根据样本回归位置框的信息、样本标注框的信息和位置回归损失函数，对初始旋转物体检测模型进行迭代训练，直至满足预设条件，得到目标旋转物体检测模型，目标物体检测模型用于确定待测图像中待测物体的位置。

可选的，在一种实现方式中，交互单元1701还用于：接收样本类别，样本类别为用户对样本图像中待标注物体标注的类别。

处理单元1702还用于：将样本类别输入初始旋转物体检测模型，以通过初始旋转物体检测模型对待标注物体进行分类，得到预测样本类别。根据预测样本类别、样本类别和分类损失函数，对初始旋转物体检测模型进行迭代训练，直至满足预设条件，得到目标旋转物体检测模型。

可选的，在一种实现方式中，预测类别包括待测物体的正面信息和反面信息中的至少一项。

可选的，在一种实现方式中，处理单元1702还用于：根据样本标注框截取样本图像，得到截取样本图像。根据n个第一旋转角度旋转截取样本图像，得到n个旋转样本图像，n个第一旋转角度为根据样本旋转角度获取，n个第一旋转角度与n个旋转样本图像一一对应，n为大于或等于2的整数。将n个旋转样本图像输入角度训练图库。在角度训练图库中确定同类样本图像对和异类样本图像对，同类样本图像对中的物体具有相同的角度和类别，异类样本图像对中的物体具有不同的角度或类别。根据同类样本图像对和异类样本图像对训练初始角度度量模型，得到目标角度度量模型。

处理单元1702具体用于：根据样本类别，在角度训练图库中确定同类样本图像对和异类样本图像对。

可选的，在一种实现方式中，处理单元1702还用于：将待测图像输入目标旋转物体检测模型，以通过目标旋转物体检测模型对待测图像中的待测物体进行位置回归，得到待测物体的回归位置框，回归位置框表示待测物体在待测图像中的位置，回归位置框用于确定预测旋转角度。

可选的，在一种实现方式中，处理单元1702还用于：将待测图像输入目标旋转物体检测模型，以通过目标旋转物体检测模型对待测图像中的待测物体进行位置回归，得到待测物体的回归位置框，回归位置框表示待测物体在待测图像中的位置。根据回归位置框截取待测图像，得到截取图像。根据回归位置框确定m个第二旋转角度，m为大于或等于2的整数。根据m个第二旋转角度旋转截取图像，得到m个旋转图像，m个第二旋转角度与m个旋转图像一一对应。通过目标角度度量模型，确定m个旋转图像中的目标图像，目标图像中的物体，与参考模板图像中的参考物体，具有相同的类别和角度。在n个第二旋转角中确定与目标图像对应的预测旋转角。

可选的，在一种实现方式中，处理单元1702具体用于：根据回归位置框确定边框旋转角度，边框旋转角度为回归位置框相对于水平框的旋转角度，水平框具有水平边，边框旋转角度大于或等于0°且小于或等于90°。根据边框旋转角度确定m个第二旋转角度。

可选的，在一种实现方式中，处理单元1702具体用于：通过m个旋转图像中的每一个图像，和模板图像库中的图像，构建图像对。通过目标角度度量模型，在图像对中确定同类图像对，同类图像对中的物体具有相同的角度和类别。确定同类图像对中的目标图像，目标图像包含于m个旋转图像。

可选的，在一种实现方式中，交互单元1701还用于：接收样本类别，样本类别为用户对样本图像中待标注物体标注的类别；

处理单元1702还用于：将样本类别输入初始旋转物体检测模型，以通过初始旋转物体检测模型对待标注物体进行分类，得到预测样本类别。根据预测样本类别、样本类别和分类损失函数，对初始旋转物体检测模型进行迭代训练，直至满足预设条件，得到目标旋转物体检测模型。通过目标旋转物体检测模型对待测物体进行类别预测，得到预测类别。根据预测类别确定参考模板图像，参考模板图像中的参考物体具有预测类别。通过n个旋转图像中的每一个图像，和参考模板图像，构建图像对，参考模板图像包含于参考模板库中的图像。

图17所示样本图像处理装置用于执行前述图4至图12所示实施例中的方法，处理单元1702用于执行前述实施例所示方法中的标注模块301、第一训练模块302、第二训练模块303、旋转物体检测模块1001、角度度量模块1002所执行的不需要与用户交互的动作；交互单元1701用于执行前述实施例所示方法中标注模块301所执行的需要与用户交互的动作；获取单元1703用于执行前述实施例所示方法中获取参考标注框或参考关键点等与参考模板图像相关的信息的动作。获取单元1703可以独立于交互单元1701存在，也可以是交互单元1701的一部分，此处不作限定。

图18是本申请实施例提供的一种图像处理装置的结构示意图，该图像处理装置1800可以包括一个或一个以上中央处理器(central processing units，CPU)1801和存储器1805，该存储器1805中存储有一个或一个以上的应用程序或数据。

其中，存储器1805可以是易失性存储或持久存储。存储在存储器1805的程序可以包括一个或一个以上模块，每个模块可以包括对图像处理装置中的一系列指令操作。更进一步地，中央处理器1801可以设置为与存储器1805通信，在图像处理装置1800上执行存储器1805中的一系列指令操作。

图像处理装置1800还可以包括一个或一个以上通信接口1803，和/或，一个或一个以上操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等。

可选的,图像处理装置1800还可以包括一个或一个以上电源1802。

该图像处理装置1800可以执行前述图4至图12所示实施例中图像处理装置所执行的操作，具体此处不再赘述。

本申请实施例中还提供一种计算机程序产品，当其在计算机上运行时，使得计算机执行如前述图4至图12所示实施例描述的方法中图像处理装置所执行的步骤。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有用于进行信号处理的程序，当其在计算机上运行时，使得计算机执行如前述图4至图12所示实施例描述的方法中图像处理装置所执行的步骤。

本申请实施例提供的图像处理装置具体可以为芯片，芯片包括：处理单元和通信单元，处理单元例如可以是处理器，通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令，以使训练设备内的芯片执行上述图4至图12所示实施例描述的方法中图像处理装置所执行的步骤。可选地，存储单元可以为芯片内的存储单元，如寄存器、缓存等，存储单元还可以是无线接入设备端内的位于芯片外部的存储单元，如只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

一种图像处理方法，其特征在于，所述方法包括：

向用户提供样本图像和参考模板图像，其中，所述样本图像中包括待标注物体，所述参考模板图像中包括与所述待标注物体对应的参考物体，所述参考物体相对于所述参考模板图像的旋转角度为零，所述参考模板图像中标注有所述参考物体的参考关键点，所述参考关键点的数量大于或等于2；

接收样本关键点的信息，所述样本关键点的信息为所述用户基于所述参考模板图像，对所述样本图像中的所述待标注物体进行标注所得；

根据所述样本关键点的信息和所述参考关键点的信息，确定样本旋转角度，所述样本旋转角度为所述待标注物体相对于所述参考物体的旋转角度。
根据权利要求1所述的方法，其特征在于，所述参考关键点和所述样本关键点的数量均为2，所述确定样本旋转角度，包括：

根据参考关键线与样本关键线之间的夹角，确定所述样本旋转角度，所述参考关键线为2个参考关键点的连线，所述样本关键线为2个样本关键点的连线。
根据权利要求1或2所述的方法，其特征在于，在所述接收样本关键点的信息之后，所述方法还包括：

获取所述参考模板图像的参考标注框，所述参考标注框表示所述参考物体在所述参考模板图像中的位置；

根据所述参考标注框，确定样本标注框，所述样本标注框表示所述待标注物体在所述样本图像中的位置。
根据权利要求3所述的方法，其特征在于，所述根据所述参考标注框，确定样本标注框，包括：

根据所述参考标注框、所述参考关键点的信息和所述样本关键点的信息确定所述样本标注框，所述参考关键点与所述参考标注框之间具有参考位置关系，所述样本关键点与所述样本标注框之间具有所述参考位置关系。
根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

将所述样本图像和所述样本标注框的信息输入初始旋转物体检测模型，以通过所述初始旋转物体检测模型对所述待标注物体进行位置回归，得到样本回归位置框的信息；

根据所述样本回归位置框的信息、所述样本标注框的信息和位置回归损失函数，训练所述初始旋转物体检测模型，得到目标旋转物体检测模型，所述目标旋转物体检测模型用于确定待测图像中待测物体的位置。
根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

根据所述样本标注框截取所述样本图像，得到截取样本图像；

根据n个第一旋转角度旋转所述截取样本图像，得到n个旋转样本图像，所述n个第一旋转角度为根据所述样本旋转角度获取，所述n个第一旋转角度与所述n个旋转样本图像一一对应，所述n为大于或等于2的整数；

将所述n个旋转样本图像输入角度训练图库；

在所述角度训练图库中确定同类样本图像对和异类样本图像对，所述同类样本图像对中的物体具有相同的角度和类别，所述异类样本图像对中的物体具有不同的角度或类别；

根据所述同类样本图像对和所述异类样本图像对训练初始角度度量模型，得到目标角度度量模型。
根据权利要求6所述的方法，其特征在于，所述方法还包括：

接收样本类别，所述样本类别为所述用户对所述样本图像中所述待标注物体标注的类别；

所述在所述角度训练图库中确定同类样本图像对和异类样本图像对，包括：

根据所述样本类别，在所述角度训练图库中确定所述同类样本图像对和所述异类样本图像对。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

将所述待测图像输入所述目标旋转物体检测模型，以通过所述目标旋转物体检测模型对所述待测图像中的待测物体进行位置回归，得到所述待测物体的回归位置框，所述回归位置框表示所述待测物体在所述待测图像中的位置，所述回归位置框用于确定所述预测旋转角度。
根据权利要求6或7所述的方法，其特征在于，所述方法还包括：

将所述待测图像输入所述目标旋转物体检测模型，以通过所述目标旋转物体检测模型对所述待测图像中的所述待测物体进行位置回归，得到所述待测物体的所述回归位置框，所述回归位置框表示所述待测物体在所述待测图像中的位置；

根据所述回归位置框截取所述待测图像，得到截取图像；

根据所述回归位置框确定m个第二旋转角度，所述m为大于或等于2的整数；

根据所述m个第二旋转角度旋转所述截取图像，得到m个旋转图像，所述m个第二旋转角度与所述m个旋转图像一一对应；

通过所述目标角度度量模型，确定所述m个旋转图像中的目标图像，所述目标图像中的物体，与所述参考模板图像中的参考物体，具有相同的类别和角度；

在所述m个第二旋转角中确定与所述目标图像对应的所述预测旋转角。
根据权利要求9所述的方法，其特征在于，所述根据所述回归位置框确定m个第二旋转角度，包括：

根据所述回归位置框确定边框旋转角度，所述边框旋转角度为所述回归位置框相对于水平框的旋转角度，所述水平框具有水平边，所述边框旋转角度大于或等于0°且小于或等于90°；

根据所述边框旋转角度确定所述m个第二旋转角度。
一种图像处理装置，其特征在于，所述装置包括：

交互单元，用于：

向用户提供样本图像和参考模板图像，所述样本图像中包括待标注物体，所述参考模板图像中包括与所述待标注物体对应的参考物体，所述参考物体相对于所述参考模板图像的旋转角度为零，所述参考模板图像中标注有所述参考物体的参考关键点，所述参考关键点的数量大于或等于2；

接收样本关键点的信息，所述样本关键点的信息为所述用户基于所述参考模板图像，对所述样本图像中的所述待标注物体进行标注所得；

处理单元，用于根据所述样本关键点的信息和所述参考关键点的信息，确定样本旋转角度，所述样本旋转角度为所述待标注物体相对于所述参考物体的旋转角度。
根据权利要求11所述的装置，其特征在于，所述参考关键点和所述样本关键点的数量均为2，所述处理单元具体用于：

根据参考关键线与样本关键线之间的夹角，确定所述样本旋转角度，所述参考关键线为2个参考关键点的连线，所述样本关键线为2个样本关键点的连线。
根据权利要求11或12所述的装置，其特征在于，所述装置还包括获取单元，所述获取单元用于：获取所述参考模板图像的参考标注框，所述参考标注框表示所述参考物体在所述参考模板图像中的位置；

所述处理单元还用于：根据所述参考标注框，确定样本标注框，所述样本标注框表示所述待标注物体在所述样本图像中的位置。
根据权利要求13所述的装置，其特征在于，所述处理单元具体用于：

根据所述参考标注框、所述参考关键点的信息和所述样本关键点的信息确定所述样本标注框，所述参考关键点与所述参考标注框之间具有参考位置关系，所述样本关键点与所述样本标注框之间具有所述参考位置关系。
根据权利要求13或14所述的装置，其特征在于，所述处理单元还用于：

将所述样本图像和所述样本标注框的信息输入初始旋转物体检测模型，以通过所述初始旋转物体检测模型对所述待标注物体进行位置回归，得到样本回归位置框的信息；

根据所述样本回归位置框的信息、所述样本标注框的信息和位置回归损失函数，训练所述初始旋转物体检测模型，得到目标旋转物体检测模型，所述目标旋转物体检测模型用于确定待测图像中待测物体的位置。
根据权利要求13或14所述的装置，其特征在于，所述处理单元还用于：

根据所述样本标注框截取所述样本图像，得到截取样本图像；

根据n个第一旋转角度旋转所述截取样本图像，得到n个旋转样本图像，所述n个第一旋转角度为根据所述样本旋转角度获取，所述n个第一旋转角度与所述n个旋转样本图像一一对应，所述n为大于或等于2的整数；

将所述n个旋转样本图像输入角度训练图库；

在所述角度训练图库中确定同类样本图像对和异类样本图像对，所述同类样本图像对中的物体具有相同的角度和类别，所述异类样本图像对中的物体具有不同的角度或类别；

根据所述同类样本图像对和所述异类样本图像对训练初始角度度量模型，得到目标角度度量模型。
根据权利要求16所述的装置，其特征在于，所述交互单元还用于：接收样本类别，所述样本类别为所述用户对所述样本图像中所述待标注物体标注的类别；

所述处理单元具体用于：根据所述样本类别，在所述角度训练图库中确定所述同类样本图像对和所述异类样本图像对。
根据权利要求15所述的装置，其特征在于，所述处理单元还用于：

将所述待测图像输入所述目标旋转物体检测模型，以通过所述目标旋转物体检测模型对所述待测图像中的待测物体进行位置回归，得到所述待测物体的回归位置框，所述回归位置框表示所述待测物体在所述待测图像中的位置，所述回归位置框用于确定所述预测旋转角度。
根据权利要求16或17所述的装置，其特征在于，所述处理单元还用于：

将所述待测图像输入所述目标旋转物体检测模型，以通过所述目标旋转物体检测模型对所述待测图像中的所述待测物体进行位置回归，得到所述待测物体的所述回归位置框，所述回归位置框表示所述待测物体在所述待测图像中的位置；

根据所述回归位置框截取所述待测图像，得到截取图像；

根据所述回归位置框确定m个第二旋转角度，所述m为大于或等于2的整数；

根据所述m个第二旋转角度旋转所述截取图像，得到m个旋转图像，所述m个第二旋转角度与所述m个旋转图像一一对应；

通过所述目标角度度量模型，确定所述m个旋转图像中的目标图像，所述目标图像中的物体，与所述参考模板图像中的参考物体，具有相同的类别和角度；

在所述n个第二旋转角中确定与所述目标图像对应的所述预测旋转角。
根据权利要求19所述的装置，其特征在于，所述处理单元具体用于：

根据所述回归位置框确定边框旋转角度，所述边框旋转角度为所述回归位置框相对于水平框的旋转角度，所述水平框具有水平边，所述边框旋转角度大于或等于0°且小于或等于90°；

根据所述边框旋转角度确定所述m个第二旋转角度。
一种计算机程序产品，其特征在于，当其在计算机上运行时，使得计算机执行如权利要求1至10中任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括程序，当其在计算机上运行时，使得计算机执行如权利要求1至10中任一项所述的方法。
一种图像处理装置，其特征在于，包括处理器和存储器，所述处理器与所述存储器耦合；

所述存储器，用于存储程序；

所述处理器，用于执行所述存储器中的程序，使得所述处理器执行如权利要求1至10中任一项所述的方法。