CN113627456B - 生成基准数据的方法和装置 - Google Patents

生成基准数据的方法和装置 Download PDF

Info

Publication number
CN113627456B
CN113627456B CN202010388108.8A CN202010388108A CN113627456B CN 113627456 B CN113627456 B CN 113627456B CN 202010388108 A CN202010388108 A CN 202010388108A CN 113627456 B CN113627456 B CN 113627456B
Authority
CN
China
Prior art keywords
image
target
point
polygon
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010388108.8A
Other languages
English (en)
Other versions
CN113627456A (zh
Inventor
张景
陈杰
陈益伟
任李金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN202010388108.8A priority Critical patent/CN113627456B/zh
Priority to EP21803513.7A priority patent/EP4148621A4/en
Priority to PCT/CN2021/092433 priority patent/WO2021227995A1/zh
Publication of CN113627456A publication Critical patent/CN113627456A/zh
Application granted granted Critical
Publication of CN113627456B publication Critical patent/CN113627456B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/945User interactive design; Environments; Toolboxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)

Abstract

本申请公开了一种生成基准数据的方法和装置,属于图像处理领域。方法包括:获取样本图像,其中,所述样本图像中包括有目标物体;获取对所述目标物体进行标注的各标注点在样本图像中的坐标值,其中,以所述各标注点为顶点的多边形图像中包括所述目标物体的图像;基于所述各标注点在样本图像中的坐标值,生成所述样本图像对应的基准数据。采用本申请,通过获取在样本图像中用于标注目标物体的标注点对应的坐标值,根据标注点对应的坐标值自动生成样本图像对应的基准数据,简化了获取基准数据的操作,能够提高获取基准数据的效率。

Description

生成基准数据的方法和装置
技术领域
本申请涉及图像处理领域,特别涉及一种生成基准数据的方法和装置。
背景技术
随着人工智能的发展,图像识别、文字识别等技术的应用也越来越广泛。图像识别、文字识别等技术可通过对应的机器学习模型实现,但是使用这些机器学习模型之前,需要获取大量的样本图像和对应的基准数据对机器学习模型进行训练,即将样本图像输入到机器学习模型后,得到机器学习模型的输出值,再通过输出值与输入的样本图像的差异值对机器学习模型中的参数进行调整。例如,用于训练物体识别模型的样本图像可以是包含目标物体的样本图像,基准数据可以是需要人工在样本图像中的标出目标,以获取基准数据。
在实现本申请的过程中,发明人发现现有技术至少存在以下问题:
机器学习模型的训练需要大量的样本图像和对应的基准数据,而在现有技术中获取样本图像对应的基准数据操作过于繁琐,导致获取基准数据的效率低下。
发明内容
本申请实施例提供了一种生成基准数据的方法和装置,能够提高获取基准数据的效率。所述技术方案如下:
一方面,提供了一种生成基准数据的方法,所述方法包括:
获取样本图像,其中,所述样本图像中包括有目标物体;
获取对所述目标物体进行标注的各标注点在样本图像中的坐标值,其中,以所述各标注点为顶点的多边形图像中包括所述目标物体的图像;
基于所述各标注点在样本图像中的坐标值,生成所述样本图像对应的基准数据。
可选的,所述基于所述各标注点在样本图像中的坐标值,生成所述样本图像对应的基准数据,包括:
将所述各标注点在样本图像中的坐标值,按照标注点的标注顺序排列,组成所述样本图像对应的基准数据。
可选的,所述基于所述各标注点在样本图像中的坐标值,生成所述样本图像对应的基准数据,包括:
基于所述各标注点在样本图像中的坐标值,在所述样本图像中截取基于以所述各标注点为顶点的多边形图像;
分别将所述多边形图像的各边作为水平底边,对所述多边形图像进行旋转,得到多个旋转后的多边形图像;
显示所述多个旋转后的多边形图像;
当接收到对应的所述多个旋转后的多边形图像中的目标多边形图像的选取指令时,基于预设的坐标值排列方式信息,对所述目标多边形图像中的各标注点在所述样本图像中的坐标值进行排列,组成所述样本图像对应的基准数据,其中,所述坐标值排列方式信息用于指示如何对所述目标多边形图像中不同方位的标注点的坐标值进行排列。
可选的,所述坐标值排列方式信息包括起始方位信息和方位排列信息,所述起始方位信息用于指示排在第一位的坐标值对应的目标标注点在所述目标多边形图像中的方位信息,所述方位排列信息用于指示第一位之后的每一位的坐标值对应的标注点在所述目标多边形图像中的排列方式信息,所述方位排列信息包括顺时针或逆时针。
可选的,所述基于预设的坐标值排列方式信息,对所述目标多边形图像中的各标注点在所述样本图像中的坐标值进行排列,组成所述样本图像对应的基准数据,包括:
基于所述起始方位信息,在所述目标多边形图像中的各标注点中确定目标标注点;
在所述目标多边形图像中,以所述目标标注点为起点,按照所述方位排列信息,逐个获取各标注点的坐标值,将坐标值按照获取顺序排列,组成所述样本图像对应的基准数据。
可选的,所述基于所述起始方位信息,在所述目标多边形图像中的各标注点中确定目标标注点,包括:
确定所述目标多边形图像的各标注点中位于最左侧的标注点;
如果存在一个位于最左侧的标注点,则将位于最左侧的标注点确定为起始标注点;
如果存在多个位于最左侧的标注点,则将多个位于最左侧的标注点中最上方的标注点确定为起始标注点。
可选的,所述坐标值排列方式信息包括排在每一位的坐标值对应的标注点在所述目标多边形图像中的方位。
另一方面,提供了一种生成基准数据的装置,所述装置包括:
第一获取模块,被配置为获取样本图像,其中,所述样本图像中包括有目标物体;
第二获取模块,被配置为获取对所述目标物体进行标注的各标注点在样本图像中的坐标值,其中,以所述各标注点为顶点的多边形图像中包括所述目标物体的图像;
生成模块,被配置为基于所述各标注点在样本图像中的坐标值,生成所述样本图像对应的基准数据。
可选的,所述生成模块,被配置为:
将所述各标注点在样本图像中的坐标值,按照标注点的标注顺序排列,组成所述样本图像对应的基准数据。
可选的,所述生成模块,被配置为:
基于所述各标注点在样本图像中的坐标值,在所述样本图像中截取基于以所述各标注点为顶点的多边形图像;
分别将所述多边形图像的各边作为水平底边,对所述多边形图像进行旋转,得到多个旋转后的多边形图像;
显示所述多个旋转后的多边形图像;
当接收到对应的所述多个旋转后的多边形图像中的目标多边形图像的选取指令时,基于预设的坐标值排列方式信息,对所述目标多边形图像中的各标注点在所述样本图像中的坐标值进行排列,组成所述样本图像对应的基准数据,其中,所述坐标值排列方式信息用于指示如何对所述目标多边形图像中不同方位的标注点的坐标值进行排列。
可选的,所述坐标值排列方式信息包括起始方位信息和方位排列信息,所述起始方位信息用于指示排在第一位的坐标值对应的目标标注点在所述目标多边形图像中的方位信息,所述方位排列信息用于指示第一位之后的每一位的坐标值对应的标注点在所述目标多边形图像中的排列方式信息,所述方位排列信息包括顺时针或逆时针。
可选的,所述生成模块,被配置为:
基于所述起始方位信息,在所述目标多边形图像中的各标注点中确定目标标注点;
在所述目标多边形图像中,以所述目标标注点为起点,按照所述方位排列信息,逐个获取各标注点的坐标值,将坐标值按照获取顺序排列,组成所述样本图像对应的基准数据。
可选的,所述生成模块,被配置为:
确定所述目标多边形图像的各标注点中位于最左侧的标注点;
如果存在一个位于最左侧的标注点,则将位于最左侧的标注点确定为起始标注点;
如果存在多个位于最左侧的标注点,则将多个位于最左侧的标注点中最上方的标注点确定为起始标注点。
可选的,所述坐标值排列方式信息包括排在每一位的坐标值对应的标注点在所述目标多边形图像中的方位。
再一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上所述的生成基准数据的方法所执行的操作。
再一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上所述的生成基准数据的方法所执行的操作。
本申请实施例提供的技术方案带来的有益效果是:
通过获取在样本图像中用于标注目标物体的标注点对应的坐标值,根据标注点对应的坐标值自动生成样本图像对应的基准数据。采用本申请,只需要技术人员在样本图像中标注目标物体对应的标注点,便可得到样本图像对应的基准数据,简化了获取基准数据的操作,能够提高获取基准数据的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的生成基准数据的方法流程图;
图2是本申请实施例提供的生成基准数据的方法流程图;
图3是本申请实施例提供的生成基准数据的方法示意图;
图4是本申请实施例提供的生成基准数据的方法示意图;
图5是本申请实施例提供的生成基准数据的方法示意图;
图6是本申请实施例提供的生成基准数据的方法示意图;
图7是本申请实施例提供的生成基准数据的装置结构示意图;
图8是本申请实施例提供的终端结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请提供的生成基准数据的方法可以由终端实现。终端中可运行有进行图像处理的应用程序,如图像标注应用程序。终端具备有显示屏幕,能进行图像显示,并且具有处理器和存储器,能对图像等数据进行处理显示。
在对文字识别模型、图像识别模型等机器学习模型训练之前,需要获取大量的样本图像和对应的基准数据,基准数据为样本图像中目标物体或是目标文字段的多边形包围框对应的标注点信息,标注点为多边形包围框各个顶点,标注点信息为多边形包围框各个顶点在样本图像对应的坐标系中的坐标值。技术人员可以借助图像标注应用程序对样本图像中的目标物体进行人工标注,得到样本图像对应的标注点信息。即技术人员需要先在图像标注应用程序中导入样本图像,图像标注应用程序可对导入的样本图像进行显示,然后计算人员可在样本图像中的目标物体周围进行点击,其中,技术人员在样本图像中点击的每个点即为标注点,以多个标注点为顶点围成的多边形可将样本图像中的目标物体包围,例如,人、汽车、动物等,图像标注应用程序获取每个标注点在样本图像对应的坐标系中的坐标值,然后输出样本图像对应的标注点的坐标值,即为基准数据。本申请提供的生成基准数据的方法可对输出样本图像对应的标注点的坐标值进行自动排序,按照预设的顺序将标注点的坐标值组成用于训练机器学习模型的基准数据。
图1是本申请实施例提供的一种生成基准数据的流程图。参见图1,该实施例包括:
步骤101、获取样本图像。
其中,样本图像中包括有目标物体。样本图像可以是由技术人员通过网络收集的大量的包含有目标物体的图像。目标物体的图像可以是人、汽车、动物等真实的物体的图像,也可以是文字、符号等图形的图像。当技术人员根据实际需求确定对应的目标物体,例如,如果技术人员需要获取对文字识别模型进行训练的基准数据,则对应的目标物体可以为文字、符号等,如果技术人员需要对物体分类模型进行训练,则对应的目标物体为人、汽车、动物等。
步骤102、获取对目标物体进行标注的各标注点在样本图像中的坐标值。
其中,以各标注点为顶点的多边形图像中包括目标物体的图像。
在实施中,技术人员可以将样本图像导入图像标注应用程序中,可以对样本图像中目标物体进行标注,即在样本图像中目标物体周围进行点击得到标注点,以多个标注点为顶点围成的多边形可将样本图像中的目标物体包围。图像标注应用程序可获取标注点在样本图像坐标系中的坐标值,其中,样本图像坐标系可以是以样本图像的左上角为原点建立的坐标系。
步骤103、基于各标注点在样本图像中的坐标值,生成样本图像对应的基准数据。
在实施中,当技术人员完成对样本图像的目标物体标注之后,图像标注应用程序可以将获取的技术人员标注的各个点的坐标值组成样本图像的对应的基准数据。在机器学习模型实际的训练过程中,基准数据中坐标值具有统一的排列顺序可以提高训练之后机器学习模型识别精准度。例如,技术人员可以通过在样本图像中标注四个标注点将目标物体包围,而四个标注点可组成的排列顺序可以有二十四种,技术人员可以通过将每个样本图像中的标注点按照统一的排列顺序组成对应的基准数据,如按照标注点在样本图像中的方位左上、右上、右下、左下进行排列组成基准数据。
在另一种可行的方案中,还可以按照每个标注点被标注的顺序进行排列,得到对应的基准数据,相应的处理如下:将各标注点在样本图像中的坐标值,按照标注点的标注顺序排列,组成样本图像对应的基准数据。
在实施中,技术人员在样本图像中进行标注时,可以按照统一的标注顺序进行标注,例如按照顺时针的方向对样本图像中的目标物体进行标注。图像标注应用程序可以记录每个标注点的标注顺序,例如可以通过每个标注点对应的标注时间确定每个标注点的标注顺序,然后根据每个标注点的标注顺序组成样本图像对应的基准数据。
在另一种可行的方案中,可以根据每个标注点相对于目标物体的方位,确定对应的基准数据。如图2是本申请实施例提供的一种生成基准数据的流程图。
参见图2,该实施例包括:
步骤201、基于各标注点在样本图像中的坐标值,在样本图像中截取基于以各标注点为顶点的多边形图像。
在实施中,图像标注应用程序可获取标注点在样本图像坐标系中的坐标值之后,可以根据各标注点对应的坐标值,从样本图像中截取以多个标注点为顶点围成的多边形图像。如图3所示,技术人员对样本图像中的文字进行标注之后,从样本图像中截取的包围样本图像中文字的多边形图像。
步骤202、分别将多边形图像的各边作为水平底边,对多边形图像进行旋转,得到多个旋转后的多边形图像。
在实施中,当图像标注应用程序在样本图像中截取出以多个标注点为顶点围成多边形图像之后,可选定多边形图像的每个边都作为一次水平底边,对多边形图像进行旋转,使选定的边位于多边形图像下方,且处于水平状态。如此,可得到多个旋转之后的多边形图像。例如,多边形图像有五个边,将每个边都分别作为一次水平底边,则可得到五个旋转角度不同的多边形图像。
步骤203、显示多个旋转后的多边形图像。
在实施中,图像标注应用程序可将旋转角度不同的多个多边形图像进行显示。如图4所示,图4为图像标注应用程序显示的包围样本图像中文字的多边形图像。
步骤204、当接收到对应的多个旋转后的多边形图像中的目标多边形图像的选取指令时,基于预设的坐标值排列方式信息,对目标多边形图像中的各标注点在样本图像中的坐标值进行排列,组成样本图像对应的基准数据。
其中,坐标值排列方式信息用于指示如何对目标多边形图像中不同方位的标注点的坐标值进行排列。
在实施中,技术人员可在图像标注应用程序中显示的多个多边形图像中选择目标多边形图像,其中,目标多边形图像中包括的目标物体的为水平显示。目标多边形图像可如图5所示,图5为图4中多个多边形图像中的目标多边形图像。例如,可以点击目标多边形图像完成对目标多边形图像的选择。当技术人员选择目标多边形图像之后,图像标注应用程序接收到携带有目标多边形图像对应标识的选取指令时,可以根据预设的坐标值排列方式信息对目标多边形图像中的标注点的坐标值进行排序。其中,目标多边形图像中的标注点即为目标多边形图像各个顶点,对应的坐标值为目标多边形图像的各个顶点在样本图像坐标系下的坐标值。
在一种实现的方式中,坐标值排列方式信息包括排在每一位的坐标值对应的标注点在目标多边形图像中的方位。
在实施中,坐标值排列方式信息中包括目标多边形图像各个方位的标注点的排列顺序,基准数据中的坐标值的顺序对应的目标多边形图像各个方位的标注点的排列顺序。即基准数据中第一个坐标值为目标多边形图像第一方位对应的标注点的坐标值,然后以此类推,基准数据中每一位的坐标值为目标多边形图像对应的方位的标注点的坐标值。
技术人员可预先设定在样本图像中标注点的个数,再根据预设的坐标值排列方式信息对标注点对应的坐标值进行排序,相应的处理如下:基于预设的标注点的数目和坐标值排列方式信息,确定样本图像中目标物体的标注点的数目对应的目标坐标值排列方式信息;基于目标坐标值排列方式信息,对目标多边形图像中的各标注点在样本图像中的坐标值进行排列,组成样本图像对应的基准数据。
在实施中,技术人员可以设定需要在样本图像中标注点的个数,坐标值排列方式信息可以为预存的各个标注点的方位顺序信息,在技术人员确定标注点之后,可根据预存的各个标注点的方位顺序信息确定目标多边形图像各个方位的标注点的排列顺序。例如,在样本图像中标注的标注点为四个,对应的多边形图像为矩形,坐标值排列方式信息包含的方位顺序为左上、右上、右下、左下,则将对应的目标多边形图像的中左上角的标注点的坐标值作为第一个坐标值,依次按照坐标值排列方式信息中的方位顺序对目标多边形图像中的标注点的坐标值进行排序,将排序之后的坐标值作为样本图像对应的基准数据。另外,坐标值排列方式信息可以为方位顺序计算信息,例如,可以根据多个标注点的坐标值,计算目标多边形图像的几何中心对应的坐标值,然后在多边形图像的几何中心的水平方向的左边,开始按着顺时针顺序对各个标注点对应的坐标值进行排序,将排序之后的坐标值作为样本图像对应的基准数据。另外,目标多边形图像各个的标注点的排列顺序还可以通过预设的排序算法完成,例如,获取目标目标多边形图像中的标注点的坐标值,然后根据预设的排序算法,对各个标注点的坐标值进行顺时针或逆时针排序,将排序之后的各个标注点的坐标值确定为样本图像对应的基准数据。
在另一种实现的方式中,坐标值排列方式信息包括起始方位信息和方位排列信息,起始方位信息用于指示排在第一位的坐标值对应的目标标注点在目标多边形图像中的方位信息,方位排列信息用于指示第一位之后的每一位的坐标值对应的标注点在目标多边形图像中的排列方式信息,方位排列信息包括顺时针或逆时针。
在实施中,以样本图像中的标注点组成的多边形图像可能不是等边多边形,仅靠方位顺序并不能完成对多边形图像对应的多个标注点的坐标值进行排序。所以坐标值排列方式信息还可以包括起始方位信息和方位排列信息,图像标注应用程序可根据起始方位信息,在多边形图像各个标注点的坐标值中确定排在基准数据第一位的坐标值。然后在确定排在基准数据第一位的坐标值之后,可以根据方位排列信息,在多边形图像各个标注点的坐标值中确定在第一位之后的每一位的坐标值。例如,可以在多边形图像中按照顺时针或逆时针的方向确定每个标注点对应的坐标值。
可选的,可以在目标多边形图像中的各标注点的坐标值中,确定排在基准数据中第一位的坐标值,然后按照坐标值排列方式信息,确定基准数据。相应的处理如下:基于起始方位信息,在目标多边形图像中的各标注点中确定目标标注点;在目标多边形图像中,以目标标注点为起点,按照方位排列信息,逐个获取各标注点的坐标值,将坐标值按照获取顺序排列,组成样本图像对应的基准数据。
在实施中,图像标注应用程序可根据起始方位信息,在目标多边形图像中的多个标注点中确定目标标注点,其中,目标标注点对应的坐标值为排在基准数据第一位的坐标值。然后可以在目标多边形图像中以目标标注点为起点,按照顺时针或是逆时针的方向获取每个标注点在样本图像中的坐标值,在按照获取的标注点的坐标值的顺序,对目标多边形图像中标注点的坐标值进行排序,将排序之后的坐标值组成样本图像对应的基准数据。
可选的,确定目标多边形图像的各标注点中位于最左侧的标注点;如果存在一个位于最左侧的标注点,则将位于最左侧的标注点确定为起始标注点;如果存在多个位于最左侧的标注点,则将多个位于最左侧的标注点中最上方的标注点确定为起始标注点。
在实施中,可根据目标多边形图像的水平底边为横坐标轴,并以右为正方向建立坐标系,可如图6所示。则横坐标值最小的标注点即为目标多边形图像中位于最左侧的标注点,横坐标值最小的标注点为只有一个时,则可以将横坐标值最小的标注点作为目标标注点。当横坐标值最小的标注点为多个时,则可以分别确定多个横坐标值最小的标注点中,确定与横坐标轴距离最远的标注点,则将距离横坐标轴距离最远的标注点作为目标标注点。
本申请实施例,通过获取在样本图像中用于标注目标物体的标注点对应的坐标值,根据标注点对应的坐标值自动生成样本图像对应的基准数据,简化了获取基准数据的操作,能够提高获取基准数据的效率。另外,采用本申请还可以通过在样本图像中截取以各标注点为顶点的多边形图像,对多边形图像进行旋转显示,在旋转之后的多个多边形图像中选择目标多边形图像,然后根据目标多边形图像中各个标注点的方位,对标注点对应的坐标值进行排序,能够得到按照统一排列顺序组成的基准数据,从而可以提高训练之后机器学习模型的精确度。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图7是本申请实施例提供的一种生成基准数据的装置,该装置可以是上述实施例中的终端。如图7所示,该装置包括:
第一获取模块710,被配置为获取样本图像,其中,所述样本图像中包括有目标物体;
第二获取模块720,被配置为获取对所述目标物体进行标注的各标注点在样本图像中的坐标值,其中,以所述各标注点为顶点的多边形图像中包括所述目标物体的图像;
生成模块730,被配置为基于所述各标注点在样本图像中的坐标值,生成所述样本图像对应的基准数据。
可选的,所述生成模块730,被配置为:
将所述各标注点在样本图像中的坐标值,按照标注点的标注顺序排列,组成所述样本图像对应的基准数据。
可选的,所述生成模块730,被配置为:
基于所述各标注点在样本图像中的坐标值,在所述样本图像中截取基于以所述各标注点为顶点的多边形图像;
分别将所述多边形图像的各边作为水平底边,对所述多边形图像进行旋转,得到多个旋转后的多边形图像;
显示所述多个旋转后的多边形图像;
当接收到对应的所述多个旋转后的多边形图像中的目标多边形图像的选取指令时,基于预设的坐标值排列方式信息,对所述目标多边形图像中的各标注点在所述样本图像中的坐标值进行排列,组成所述样本图像对应的基准数据,其中,所述坐标值排列方式信息用于指示如何对所述目标多边形图像中不同方位的标注点的坐标值进行排列。
可选的,所述坐标值排列方式信息包括起始方位信息和方位排列信息,所述起始方位信息用于指示排在第一位的坐标值对应的目标标注点在所述目标多边形图像中的方位信息,所述方位排列信息用于指示第一位之后的每一位的坐标值对应的标注点在所述目标多边形图像中的排列方式信息,所述方位排列信息包括顺时针或逆时针。
可选的,所述生成模块730,被配置为:
基于所述起始方位信息,在所述目标多边形图像中的各标注点中确定目标标注点;
在所述目标多边形图像中,以所述目标标注点为起点,按照所述方位排列信息,逐个获取各标注点的坐标值,将坐标值按照获取顺序排列,组成所述样本图像对应的基准数据。
可选的,所述生成模块730,被配置为:
确定所述目标多边形图像的各标注点中位于最左侧的标注点;
如果存在一个位于最左侧的标注点,则将位于最左侧的标注点确定为起始标注点;
如果存在多个位于最左侧的标注点,则将多个位于最左侧的标注点中最上方的标注点确定为起始标注点。
可选的,所述坐标值排列方式信息包括排在每一位的坐标值对应的标注点在所述目标多边形图像中的方位。
需要说明的是:上述实施例提供的生成基准数据的装置在生成基准数据时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的生成基准数据的装置与生成基准数据的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图8示出了本申请一个示例性实施例提供的终端800的结构框图。该终端800可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端800包括有:处理器801和存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的生成基准数据的方法。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中生成基准数据的方法。该计算机可读存储介质可以是非暂态的。例如,所述计算机可读存储介质可以是ROM(Read-OnlyMemory,只读存储器,)、RAM(Random Access Memory,随机存取存储器)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种生成基准数据的方法,其特征在于,所述方法包括:
获取样本图像,其中,所述样本图像中包括有目标物体;
获取对所述目标物体进行标注的各标注点在样本图像中的坐标值,其中,以所述各标注点为顶点的多边形图像中包括所述目标物体的图像;
基于所述各标注点在所述样本图像中的坐标值,在所述样本图像中截取基于以所述各标注点为顶点的多边形图像;
分别将所述多边形图像的各边作为水平底边,对所述多边形图像进行旋转,得到多个旋转后的多边形图像;
显示所述多个旋转后的多边形图像;
当接收到对应的所述多个旋转后的多边形图像中的目标多边形图像的选取指令时,基于预设的坐标值排列方式信息,对所述目标多边形图像中的各标注点在所述样本图像中的坐标值进行排列,组成所述样本图像对应的基准数据,其中,所述坐标值排列方式信息用于指示如何对所述目标多边形图像中不同方位的标注点的坐标值进行排列。
2.根据权利要求1所述的方法,其特征在于,所述坐标值排列方式信息包括起始方位信息和方位排列信息,所述起始方位信息用于指示排在第一位的坐标值对应的目标标注点在所述目标多边形图像中的方位信息,所述方位排列信息用于指示第一位之后的每一位的坐标值对应的标注点在所述目标多边形图像中的排列方式信息,所述方位排列信息包括顺时针或逆时针。
3.根据权利要求2所述的方法,其特征在于,所述基于预设的坐标值排列方式信息,对所述目标多边形图像中的各标注点在所述样本图像中的坐标值进行排列,组成所述样本图像对应的基准数据,包括:
基于所述起始方位信息,在所述目标多边形图像中的各标注点中确定目标标注点;
在所述目标多边形图像中,以所述目标标注点为起点,按照所述方位排列信息,逐个获取各标注点的坐标值,将坐标值按照获取顺序排列,组成所述样本图像对应的基准数据。
4.根据权利要求3所述的方法,其特征在于,所述基于所述起始方位信息,在所述目标多边形图像中的各标注点中确定目标标注点,包括:
确定所述目标多边形图像的各标注点中位于最左侧的标注点;
如果存在一个位于最左侧的标注点,则将位于最左侧的标注点确定为目标标注点;
如果存在多个位于最左侧的标注点,则将多个位于最左侧的标注点中最上方的标注点确定为目标标注点。
5.根据权利要求1所述的方法,其特征在于,所述坐标值排列方式信息包括排在每一位的坐标值对应的标注点在所述目标多边形图像中的方位。
6.一种生成基准数据的装置,其特征在于,所述装置包括:
第一获取模块,被配置为获取样本图像,其中,所述样本图像中包括有目标物体;
第二获取模块,被配置为获取对所述目标物体进行标注的各标注点在样本图像中的坐标值,其中,以所述各标注点为顶点的多边形图像中包括所述目标物体的图像;
生成模块,被配置为基于所述各标注点在所述样本图像中的坐标值,在所述样本图像中截取基于以所述各标注点为顶点的多边形图像;分别将所述多边形图像的各边作为水平底边,对所述多边形图像进行旋转,得到多个旋转后的多边形图像;显示所述多个旋转后的多边形图像;当接收到对应的所述多个旋转后的多边形图像中的目标多边形图像的选取指令时,基于预设的坐标值排列方式信息,对所述目标多边形图像中的各标注点在所述样本图像中的坐标值进行排列,组成所述样本图像对应的基准数据,其中,所述坐标值排列方式信息用于指示如何对所述目标多边形图像中不同方位的标注点的坐标值进行排列。
7.根据权利要求6所述的装置,其特征在于,所述坐标值排列方式信息包括起始方位信息和方位排列信息,所述起始方位信息用于指示排在第一位的坐标值对应的目标标注点在所述目标多边形图像中的方位信息,所述方位排列信息用于指示第一位之后的每一位的坐标值对应的标注点在所述目标多边形图像中的排列方式信息,所述方位排列信息包括顺时针或逆时针。
8.根据权利要求7所述的装置,其特征在于,所述生成模块,被配置为:
基于所述起始方位信息,在所述目标多边形图像中的各标注点中确定目标标注点;
在所述目标多边形图像中,以所述目标标注点为起点,按照所述方位排列信息,逐个获取各标注点的坐标值,将坐标值按照获取顺序排列,组成所述样本图像对应的基准数据。
9.根据权利要求8所述的装置,其特征在于,所述生成模块,被配置为:
确定所述目标多边形图像的各标注点中位于最左侧的标注点;
如果存在一个位于最左侧的标注点,则将位于最左侧的标注点确定为起始标注点;
如果存在多个位于最左侧的标注点,则将多个位于最左侧的标注点中最上方的标注点确定为起始标注点。
10.根据权利要求6所述的装置,其特征在于,所述坐标值排列方式信息包括排在每一位的坐标值对应的标注点在所述目标多边形图像中的方位。
CN202010388108.8A 2020-05-09 2020-05-09 生成基准数据的方法和装置 Active CN113627456B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010388108.8A CN113627456B (zh) 2020-05-09 2020-05-09 生成基准数据的方法和装置
EP21803513.7A EP4148621A4 (en) 2020-05-09 2021-05-08 METHOD AND APPARATUS FOR GENERATING REFERENCE DATA
PCT/CN2021/092433 WO2021227995A1 (zh) 2020-05-09 2021-05-08 生成基准数据的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010388108.8A CN113627456B (zh) 2020-05-09 2020-05-09 生成基准数据的方法和装置

Publications (2)

Publication Number Publication Date
CN113627456A CN113627456A (zh) 2021-11-09
CN113627456B true CN113627456B (zh) 2024-03-19

Family

ID=78377594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010388108.8A Active CN113627456B (zh) 2020-05-09 2020-05-09 生成基准数据的方法和装置

Country Status (3)

Country Link
EP (1) EP4148621A4 (zh)
CN (1) CN113627456B (zh)
WO (1) WO2021227995A1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4783829A (en) * 1983-02-23 1988-11-08 Hitachi, Ltd. Pattern recognition apparatus
US6304270B1 (en) * 1994-10-14 2001-10-16 Compaq Computer Corporation Method and apparatus for determining simple convex polygons
CN111079632A (zh) * 2019-12-12 2020-04-28 上海眼控科技股份有限公司 文本检测模型的训练方法、装置、计算机设备和存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2573217C (en) * 2004-08-09 2013-04-09 Bracco Research Sa An image registration method and apparatus for medical imaging based on mulptiple masks
WO2007099562A2 (en) * 2006-03-02 2007-09-07 Softjin Technologies Private Limited Method and system for representing geometrical layout design data in electronic design systems
US9530231B2 (en) * 2015-03-05 2016-12-27 Novatek Microelectronics Corp. Method for generating masking image using general polygonal mask
CN106682664A (zh) * 2016-12-07 2017-05-17 华南理工大学 基于全卷积递归神经网络的水表圆盘区域检测方法
CN108255995A (zh) * 2017-12-29 2018-07-06 北京奇虎科技有限公司 一种输出图像的方法及装置
CN108460413A (zh) * 2018-02-12 2018-08-28 北京市商汤科技开发有限公司 图像处理方法、神经网络的训练方法、装置以及设备
US10445908B1 (en) * 2018-03-20 2019-10-15 Electronic Arts Inc Computer handling of polygons
CN108830288A (zh) * 2018-04-25 2018-11-16 北京市商汤科技开发有限公司 图像处理方法、神经网络的训练方法、装置、设备及介质
US11100366B2 (en) * 2018-04-26 2021-08-24 Volvo Car Corporation Methods and systems for semi-automated image segmentation and annotation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4783829A (en) * 1983-02-23 1988-11-08 Hitachi, Ltd. Pattern recognition apparatus
US6304270B1 (en) * 1994-10-14 2001-10-16 Compaq Computer Corporation Method and apparatus for determining simple convex polygons
CN111079632A (zh) * 2019-12-12 2020-04-28 上海眼控科技股份有限公司 文本检测模型的训练方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
WO2021227995A1 (zh) 2021-11-18
CN113627456A (zh) 2021-11-09
EP4148621A4 (en) 2023-08-09
EP4148621A1 (en) 2023-03-15

Similar Documents

Publication Publication Date Title
CN114155543B (zh) 神经网络训练方法、文档图像理解方法、装置和设备
US20110173553A1 (en) Relevance oriented graphical representation of discussion messages
CN103678631A (zh) 页面渲染方法及装置
CN111091167B (zh) 标志识别训练数据合成方法、装置、电子设备及存储介质
US20230007989A1 (en) Methods and devices for generating training sample, training model and recognizing character
CN110647596B (zh) 地图数据处理方法和装置
JP2020187736A (ja) 地域的特徴を有する分類器学習のための学習データ生成方法およびそのシステム
US20210200971A1 (en) Image processing method and apparatus
CN112329777B (zh) 基于方向检测的文字识别方法、装置、设备及介质
CN109472852B (zh) 点云图像的显示方法及装置、设备及存储介质
CN112241565A (zh) 建模方法及相关装置
CN112100742B (zh) 基于船体结构三维模型的出图处理方法、装置及存储介质
CN111950056A (zh) 建筑信息化模型bim展示方法及相关设备
US6897863B2 (en) System and method for hidden object removal
CN114049674A (zh) 一种三维人脸重建方法、装置及存储介质
CN112308069A (zh) 一种软件界面的点击测试方法、装置、设备及存储介质
KR20170009917A (ko) 규약에 대한 애플리케이션으로부터의 그래픽 출력 데이터의 순응성 검출
CN113283432A (zh) 图像识别、文字排序方法及设备
CN111177812A (zh) 一种含有封闭空间的web地图构建方法和装置
CN112580213B (zh) 电场线的显示图像的生成方法和装置、存储介质
CN112149745B (zh) 确定难例样本的方法、装置、设备及存储介质
US20210097773A1 (en) Method, apparatus, electronic device, and storage medium for displaying 3d shape in expanded manner
CN113627456B (zh) 生成基准数据的方法和装置
CN111597336A (zh) 训练文本的处理方法、装置、电子设备及可读存储介质
CN114885202A (zh) 字符串显示处理方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant