CN113297930B - 图像中物体真实大小的表示与标注方法和装置 - Google Patents

图像中物体真实大小的表示与标注方法和装置 Download PDF

Info

Publication number
CN113297930B
CN113297930B CN202110506291.1A CN202110506291A CN113297930B CN 113297930 B CN113297930 B CN 113297930B CN 202110506291 A CN202110506291 A CN 202110506291A CN 113297930 B CN113297930 B CN 113297930B
Authority
CN
China
Prior art keywords
image
shot
objects
size
imaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110506291.1A
Other languages
English (en)
Other versions
CN113297930A (zh
Inventor
戴琼海
李晓飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110506291.1A priority Critical patent/CN113297930B/zh
Publication of CN113297930A publication Critical patent/CN113297930A/zh
Application granted granted Critical
Publication of CN113297930B publication Critical patent/CN113297930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本申请提出一种图像中物体真实大小的表示与标注方法,涉及计算机视觉领域标注物体真实大小的图像数据集的制作技术领域,其中,该方法包括:根据待拍摄物体与相机之间的拍摄距离确定待拍摄物体在成像图像中的大小,待拍摄物体在成像图像中的大小通过待拍摄物体在图像中的高度和宽度表示;根据预设的标注策略,选择拍摄距离和/或待拍摄物体在成像图像中的大小以生成标注数据;获取成像图像的名称,将标注数据添加至成像图像的名称中的预设位置,以生成表示物体真实大小的图像名称;在显示界面上显示成像图像和与成像图像对应的表示物体真实大小的图像名称。本发明用于计算机视觉的基于物体真实大小的图像识别方法,提高了图像识别的准确率和速度。

Description

图像中物体真实大小的表示与标注方法和装置
技术领域
本申请涉及计算机视觉领域标注物体真实大小的图像数据集的制作技术领域,尤其涉及一种图像中物体真实大小的表示与标注方法和计算机设备。
背景技术
目前计算机视觉领域所使用的图像识别算法主要基于待识别物体的物体特征,并没有基于物体真实大小,因此目前还没有关于图像中物体真实大小的表示与标注方法以及标注物体真实大小的图像数据集的制作方法的相关报道。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种图像中物体真实大小的表示与标注方法,解决了现有计算机视觉领域所使用的图像识别算法主要基于待识别物体的物体特征,没有关于图像中物体真实大小的表示与标注方法的技术问题,实现了将物体真实大小这个信息使用一些方法表示出来,并标注于物体的图片中的目的。
本申请的第二个目的在于提出一种图像数据集的制作方法。
本申请的第三个目的在于提出一种计算机设备。
本申请的第四个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种图像中物体真实大小的表示与标注方法,包括:获取待拍摄物体,根据待拍摄物体与相机之间的拍摄距离确定待拍摄物体在成像图像中的大小,待拍摄物体在成像图像中的大小通过待拍摄物体在图像中的高度和宽度表示;根据预设的标注策略,选择拍摄距离和/或待拍摄物体在成像图像中的大小以生成标注数据;获取成像图像的名称,将标注数据添加至成像图像的名称中的预设位置,以生成表示物体真实大小的图像名称;在显示界面上显示成像图像和与成像图像对应的表示物体真实大小的图像名称。
可选地,在本申请的一个实施例中,若待拍摄物体为n个待拍摄物体,n为大于1的整数,n个待拍摄物体与相机之间的拍摄距离不同,分别为d1-dn,n个待拍摄物体在成像图像中的高度分别为h1-hn,n个待拍摄物体在成像图像中的宽度分别为w1-wn,则标注数据包括拍摄距离和待拍摄物体在成像图像中的大小,标注数据表示为(d1,h1,w1)、(d2,h2,w2)…(dn,hn,wn)。
可选地,在本申请的一个实施例中,若待拍摄物体为n个待拍摄物体,n为大于1的整数,n个待拍摄物体与相机之间的拍摄距离不同,分别为d1-dn,且n个待拍摄物体在成像图像中的大小相同,则标注数据包括拍摄距离,标注数据表示为d1、d2…dn。
可选地,在本申请的一个实施例中,若待拍摄物体为n个待拍摄物体,n为大于1的整数,n个待拍摄物体与相机之间的拍摄距离相同,且n个待拍摄物体在成像图像中的大小不同,n个待拍摄物体在成像图像中的高度分别为h1-hn,n个待拍摄物体在成像图像中的宽度分别为w1-wn,则标注数据包括待拍摄物体在成像图像中的大小,标注数据表示为(h1,w1)、(h2,w2)…(hn,wn)。
可选地,在本申请的一个实施例中,待拍摄物体在图像中的高度通过待拍摄物体在成像图像中的高度与成像图像的高度的比值表示,待拍摄物体在图像中的宽度通过待拍摄物体在成像图像中的宽度与成像图像的宽度的比值表示。
为达上述目的,本发明第二方面实施例提出了一种图像数据集的制作方法,包括以下步骤:
获取待拍摄图像的类别信息;
根据类别信息,对根据本发明第一方面实施例的的图像中物体真实大小的表示与标注方法中生成的标注数据进行分类;
根据同一分类下的标注数据生成对应的类型标签,以及与类型标签对应的待拍摄物体与相机之间的拍摄距离和待拍摄物体在成像图像中的大小的取值范围;
根据类别信息、类别标签和取值范围生成图像数据集。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述施例的图像中物体真实大小的表示与标注方法以及图像数据集的制作方法。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,能够执行图像中物体真实大小的表示与标注方法以及图像数据集的制作方法。
本申请实施例的图像中物体真实大小的表示与标注方法、图像数据集的制作方法、计算机设备以及非临时性计算机可读存储介质,通过将物体真实大小这个信息使用一些方法表示出来,并标注于物体的图片中,实现了计算机视觉的基于物体真实大小的图像识别方法,提高图像识别的准确率和速度。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例一所提供的一种图像中物体真实大小的表示与标注方法的流程图;
图2为本申请实施例的图像中物体真实大小的表示与标注方法的示意图;
图3a为本申请实施例的图像中物体真实大小的表示方法的示意图一;
图3b为本申请实施例的图像中物体真实大小的表示方法的示意图二;
图3c为本申请实施例的图像中物体真实大小的表示方法的示意图三;
图4a为本申请实施例的图像中物体真实大小的标注方法的示意图一;
图4b为本申请实施例的图像中物体真实大小的标注方法的示意图二;
图4c为本申请实施例的图像中物体真实大小的标注方法的示意图三;
图5为本申请实施例的图像数据集的制作方法的流程图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的图像中物体真实大小的表示与标注方法和图像数据集的制作方法。
图1为本申请实施例一所提供的一种图像中物体真实大小的表示与标注方法的流程图。
如图1所示,该图像中物体真实大小的表示与标注方法,包括以下步骤:
步骤101,获取待拍摄物体,根据待拍摄物体与相机之间的拍摄距离确定待拍摄物体在成像图像中的大小,待拍摄物体在成像图像中的大小通过待拍摄物体在图像中的高度和宽度表示;
步骤102,根据预设的标注策略,选择拍摄距离和/或待拍摄物体在成像图像中的大小以生成标注数据;
步骤103,获取成像图像的名称,将标注数据添加至成像图像的名称中的预设位置,以生成表示物体真实大小的图像名称;
步骤104,在显示界面上显示成像图像和与成像图像对应的表示物体真实大小的图像名称。
本申请实施例的图像中物体真实大小的表示与标注方法,通过获取待拍摄物体,根据待拍摄物体与相机之间的拍摄距离确定待拍摄物体在成像图像中的大小,待拍摄物体在成像图像中的大小通过待拍摄物体在图像中的高度和宽度表示;根据预设的标注策略,选择拍摄距离和/或待拍摄物体在成像图像中的大小以生成标注数据;获取成像图像的名称,将标注数据添加至成像图像的名称中的预设位置,以生成表示物体真实大小的图像名称;在显示界面上显示成像图像和与成像图像对应的表示物体真实大小的图像名称。由此,能够解决现有计算机视觉领域所使用的图像识别算法主要基于待识别物体的物体特征,没有关于图像中物体真实大小的表示与标注方法的技术问题,将物体真实大小这个信息使用一些方法表示出来,并标注于物体的图片中,实现了计算机视觉的基于物体真实大小的图像识别方法,提高图像识别的准确率和速度。
进一步地,在本申请实施例中,若待拍摄物体为n个待拍摄物体,n为大于1的整数,n个待拍摄物体与相机之间的拍摄距离不同,分别为d1-dn,n个待拍摄物体在成像图像中的高度分别为h1-hn,n个待拍摄物体在成像图像中的宽度分别为w1-wn,则标注数据包括拍摄距离和待拍摄物体在成像图像中的大小,标注数据表示为(d1,h1,w1)、(d2,h2,w2)…(dn,hn,wn)。
使用物体的拍摄距离和物体在图片中大小共同对物体真实大小进行表示和标注,理论上物体的拍摄距离可以选择任意值,但考虑到当拍摄距离较近时无法拍摄物体全貌,拍摄距离很远时物体在图片中大小会非常小,这些将影响图像识别算法对图片中物体的识别。因此本发明建议在保证物体全貌包含在图片中的前提下和图像识别算法的要求下选择合适的物体拍摄距离。
进一步地,在本申请实施例中,若待拍摄物体为n个待拍摄物体,n为大于1的整数,n个待拍摄物体与相机之间的拍摄距离不同,分别为d1-dn,且n个待拍摄物体在成像图像中的大小相同,则标注数据包括拍摄距离,标注数据表示为d1、d2…dn。
为了让使用物体的拍摄距离和物体在图片中大小共同对物体真实大小进行表示和标注的方式更简单,用于图像识别算法时计算量更小,固定每张图片中的物体在图片中大小相等,使用物体的拍摄距离,即可实现对物体真实大小的表示和标注。固定的物体在图片中大小理论上可以选择任意值。考虑到图像识别算法对图片中物体大小和清晰度的要求,建议选择合适的固定的物体在图片中大小。采用在保证物体全貌包含在图片中的前提下,将物体的高度或者宽度固定到和图片的高度或者宽度几乎相等的数值,然后将物体的拍摄距离计算并标注出来。
进一步地,在本申请实施例中,若待拍摄物体为n个待拍摄物体,n为大于1的整数,n个待拍摄物体与相机之间的拍摄距离相同,且n个待拍摄物体在成像图像中的大小不同,n个待拍摄物体在成像图像中的高度分别为h1-hn,n个待拍摄物体在成像图像中的宽度分别为w1-wn,则标注数据包括待拍摄物体在成像图像中的大小,标注数据表示为(h1,w1)、(h2,w2)…(hn,wn)。
为了使得物体真实大小表示和标注简单方便,用于图像识别算法时计算量更小,固定每张图片中物体的拍摄距离相等,使用物体在图片中大小,实现对物体真实大小的表示和标注。固定的物体拍摄距离理论上可以选择任意值,考虑到真实物理世界中的各物体的大小差距非常巨大,大的物体要保证拍摄物体全貌就需要很远的拍摄距离,小的物体在这个很远的拍摄距离下得到的物体在图片中大小却非常渺小,无法用于图像识别算法;要保证小的物体拍摄清晰且在图片中大小符合图像识别算法应用要求,拍摄距离就会比较近,这个距离下就会拍不全大的物体的全貌,也影响图像识别算法对物体的识别。建议根据图像识别算法对物体在图片中大小的要求,将真实大小相差不是很大的物体进行分组,每一组选取一个合适的固定拍摄距离,再进行物体在图片中大小的计算和标注。
进一步地,在本申请实施例中,待拍摄物体在图像中的高度通过待拍摄物体在成像图像中的高度与成像图像的高度的比值表示,待拍摄物体在图像中的宽度通过待拍摄物体在成像图像中的宽度与成像图像的宽度的比值表示。
物体的拍摄距离和物体在图片中大小的数值表示在图片名称中“.jpg”的前面和下划线“_”的后面,这种表示方法可以使图像识别算法通过提取图片名称中“.jpg”前面和下划线“_”后面的数值,获得对应图片中物体的拍摄距离或物体在图片中大小。使用图片中物体的高度和宽度与图片的高度和宽度的比值(以百分数的形式表示)来表示物体在图片中大小,物体在图片中大小的表示方法不局限于提出的比值或者百分比的方法。
图2为本申请实施例的图像中物体真实大小的表示与标注方法的示意图。
如图2所示,图像中物体真实大小的表示与标注方法的示意图,根据相机成像原理,假设真实物理世界中物体的高度为a,拍摄距离为L,相机底片距离相机镜头的距离为f,相机底片上的物体(即像)的高度为b,那么根据几何关系,a=bL/f,即真实物理世界中物体的高度a可以通过拍摄距离L、物体在相机底片上的高度b和相机底片距离相机镜头的距离为f求得,物体的宽度可同理求得。由于相机的f已知,因此真实物理世界中物体的大小可以通过拍摄距离、物体在图片中(相机底片上)大小表示。
图3a为本申请实施例的图像中物体真实大小的表示方法的示意图一。
如图3a所示,图像中物体真实大小的表示方法一,物体1、物体2和物体3的物体拍摄距离和物体在图片中大小(高度和宽度)分别为(d1,h1,w1)、(d2,h2,w2)和(d3,h3,w3)。
图3b为本申请实施例的图像中物体真实大小的表示方法的示意图二。
如图3b所示,图像中物体真实大小的表示方法二,采用在保证物体全貌包含在图片中的前提下,将物体的高度或者宽度固定到和图片的高度或者宽度几乎相等的数值,然后将物体的拍摄距离计算并标注出来,可见物体真实大小与物体拍摄距离成正比,即物体真实大小为物体3>物体2>物体1时,对应的物体拍摄距离为d3>d2>d1。
图3c为本申请实施例的图像中物体真实大小的表示方法的示意图三。
如图3c所示,图像中物体真实大小的表示方法三,假设所采用的图像识别算法要求物体在图片中的大小不得小于图片大小的10%,那么将固定拍摄距离为d时物体在图片上大小为10%-100%的各物体分为一组,当选定高度或者宽度作为物体在图片中大小的衡量标准时,组内物体真实大小与物体在图片中大小成正比,即当物体真实大小为物体1>物体2>物体3时,对应的各物体在图片中大小(高度或宽度)为h1>h2>h3或者w1>w2>w3。
图4a为本申请实施例的图像中物体真实大小的标注方法的示意图一。
如图4a所示,图像中物体真实大小的标注方法一,人、老虎玩具和汽车所对应的物体的拍摄距离和物体在图片中大小(高度和宽度)分别为(3,78%,21%)、(5,14%,17%)、(10,36%,57%),括号内的三个数值分别对应物体的拍摄距离(单位为米)、物体在图片中高度与图片高度的比值、物体在图片中宽度与图片宽度的比值。
图4b为本申请实施例的图像中物体真实大小的标注方法的示意图二。
如图4b所示,图像中物体真实大小的标注方法二,在固定每张图片中的物体在图片中大小(高度和宽度)相等的情况下,各图片中物体的高度或者宽度固定为与图片的高度或者宽度相等,汽车玩具、老虎和汽车所对应的拍摄距离分别为0.2米、2米和5.5米,各物体的拍摄距离表示在各对应图片的名称里,即“.jpg”前面和下划线“_”后面的数字。
图4c为本申请实施例的图像中物体真实大小的标注方法的示意图三。
如图4c所示,图像中物体真实大小的标注方法三,在每张图片中物体的拍摄距离相等的情况下,各图片中物体的固定拍摄距离为5米,老虎玩具、成人和汽车所对应的物体在图片中大小(即高度和宽度)分别为(14%,17%)、(57%,20%)、(42%,94%)。
图5为本申请实施例二所提供的一种图像数据集的制作方法的流程图。
如图5所示,该图像数据集的制作方法,包括以下步骤:
步骤201,获取待拍摄图像的类别信息;
步骤202,根据类别信息,对根据本发明第一方面实施例的图像中物体真实大小的表示与标注方法中生成的标注数据进行分类;
步骤203,根据同一分类下的标注数据生成对应的类型标签,以及与类型标签对应的待拍摄物体与相机之间的拍摄距离和待拍摄物体在成像图像中的大小的取值范围;
步骤204,根据类别信息、类别标签和取值范围生成图像数据集。
由于随着物体拍摄距离的变化,物体在图片中大小也会变化,因此各类别标签所对应的物体拍摄距离和物体在图片中大小(高度和宽度)均不是一个确定的数,而是一个范围。根据图像识别算法要求,物体在图片中高度和宽度范围的最大值为100%,最小值为满足图像识别的最小值。表一为图像识别算法要求物体在图片中大小不能小于10%的要求下,汽车这个类别的物体拍摄距离范围为3米到60米,物体在图片中高度和宽度的范围分别为(3%,100%)和(10%,100%)。
Figure BDA0003058574620000071
表一
由于真实物理世界中每个类别所包含的各个物体的大小不是完全相等的,是有一定的差异的,因此图像数据集中各类别标签所对应的物体拍摄距离不是一个确定的数,而是一个范围。表二在固定物体的高度或者宽度与相机底片的高度或者宽度基本相等的情况下,汽车这个类别的物体拍摄距离范围为3米到8米。
Figure BDA0003058574620000072
表二
由于真实物理世界中每个类别所包含的各个物体的高度或者宽度不完全相等,而且同一个物体在不同的拍摄角度下得到的高度或者宽度也不完全相等,因此图像数据集中各类别标签所对应的物体在图片中大小,即高度和宽度,均不是一个确定的数,而都是一个范围。表三在固定物体的拍摄距离为5米的情况下,汽车这个类别标签的物体在图片中高度和宽度的范围分别为(30%,60%)和(40%,100%)。
Figure BDA0003058574620000081
表三
为了实现上述实施例,本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述施例所述的图像中物体真实大小的表示与标注方法以及图像数据集的制作方法。
为了实现上述目的,本发明还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述施例所述的图像中物体真实大小的表示与标注方法以及图像数据集的制作方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (4)

1.一种图像数据集的制作方法,其特征在于,包括以下步骤:
获取待拍摄物体,根据所述待拍摄物体与相机之间的拍摄距离确定所述待拍摄物体在成像图像中的大小,所述待拍摄物体在成像图像中的大小通过所述待拍摄物体在图像中的高度和宽度表示;
获取待拍摄图像的类别信息;
根据预设的标注策略,选择所述拍摄距离和/或所述待拍摄物体在成像图像中的大小以生成标注数据;
获取所述成像图像的名称,将所述标注数据添加至所述成像图像的名称中的预设位置,以生成表示物体真实大小的图像名称;
在显示界面上显示所述成像图像和与所述成像图像对应的所述表示物体真实大小的图像名称;
根据所述类别信息,对图像中物体真实大小的表示与生成的标注数据进行分类;
根据同一分类下的所述标注数据生成对应的类型标签,以及与所述类型标签对应的所述待拍摄物体与相机之间的拍摄距离和所述待拍摄物体在成像图像中的大小的取值范围;
根据所述类别信息、所述类别标签和所述取值范围生成图像数据集;
其中,若所述待拍摄物体为n个待拍摄物体,n为大于1的整数,所述n个待拍摄物体与所述相机之间的拍摄距离不同,分别为d1-dn,所述n个待拍摄物体在成像图像中的高度分别为h1-hn,所述n个待拍摄物体在成像图像中的宽度分别为w1-wn,则所述标注数据包括所述拍摄距离和所述待拍摄物体在成像图像中的大小,所述标注数据表示为(d1,h1,w1)、(d2,h2,w2)…(dn,hn,wn);或者
若所述待拍摄物体为n个待拍摄物体,n为大于1的整数,所述n个待拍摄物体与所述相机之间的拍摄距离不同,分别为d1-dn,且所述n个待拍摄物体在成像图像中的大小相同,则所述标注数据包括所述拍摄距离,所述标注数据表示为d1、d2…dn;或者
若所述待拍摄物体为n个待拍摄物体,n为大于1的整数,所述n个待拍摄物体与所述相机之间的拍摄距离相同,且所述n个待拍摄物体在成像图像中的大小不同,所述n个待拍摄物体在成像图像中的高度分别为h1-hn,所述n个待拍摄物体在成像图像中的宽度分别为w1-wn,则所述标注数据包括所述待拍摄物体在成像图像中的大小,所述标注数据表示为(h1,w1)、(h2,w2)…(hn,wn)。
2.如权利要求1所述的方法,其特征在于,所述待拍摄物体在图像中的高度通过所述待拍摄物体在成像图像中的高度与成像图像的高度的比值表示,所述待拍摄物体在图像中的宽度通过所述待拍摄物体在成像图像中的宽度与成像图像的宽度的比值表示。
3.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1中所述的图像数据集的制作方法。
4.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1中所述的图像数据集的制作方法。
CN202110506291.1A 2021-05-10 2021-05-10 图像中物体真实大小的表示与标注方法和装置 Active CN113297930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110506291.1A CN113297930B (zh) 2021-05-10 2021-05-10 图像中物体真实大小的表示与标注方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110506291.1A CN113297930B (zh) 2021-05-10 2021-05-10 图像中物体真实大小的表示与标注方法和装置

Publications (2)

Publication Number Publication Date
CN113297930A CN113297930A (zh) 2021-08-24
CN113297930B true CN113297930B (zh) 2022-08-09

Family

ID=77321197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110506291.1A Active CN113297930B (zh) 2021-05-10 2021-05-10 图像中物体真实大小的表示与标注方法和装置

Country Status (1)

Country Link
CN (1) CN113297930B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05314390A (ja) * 1992-05-07 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> 識別票位置をキーとする物品種別認識装置
JP2002199358A (ja) * 2000-12-27 2002-07-12 Sony Corp 画像情報送信装置及び方法、画素情報受信装置及び方法、並びに画像送受信システム
CN101183206A (zh) * 2006-11-13 2008-05-21 华晶科技股份有限公司 计算被拍摄物体的距离及其实际尺寸的方法
CN104284155A (zh) * 2014-10-16 2015-01-14 浙江宇视科技有限公司 视频图像信息标注方法及装置
CN107465868A (zh) * 2017-06-21 2017-12-12 珠海格力电器股份有限公司 基于终端的物体识别方法、装置及电子设备
CN109712177A (zh) * 2018-12-25 2019-05-03 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备和计算机可读存储介质
CN110490955A (zh) * 2019-08-26 2019-11-22 成都步科智能有限公司 一种标注图像获取方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05314390A (ja) * 1992-05-07 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> 識別票位置をキーとする物品種別認識装置
JP2002199358A (ja) * 2000-12-27 2002-07-12 Sony Corp 画像情報送信装置及び方法、画素情報受信装置及び方法、並びに画像送受信システム
CN101183206A (zh) * 2006-11-13 2008-05-21 华晶科技股份有限公司 计算被拍摄物体的距离及其实际尺寸的方法
CN104284155A (zh) * 2014-10-16 2015-01-14 浙江宇视科技有限公司 视频图像信息标注方法及装置
CN107465868A (zh) * 2017-06-21 2017-12-12 珠海格力电器股份有限公司 基于终端的物体识别方法、装置及电子设备
CN109712177A (zh) * 2018-12-25 2019-05-03 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备和计算机可读存储介质
CN110490955A (zh) * 2019-08-26 2019-11-22 成都步科智能有限公司 一种标注图像获取方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Stereo vision images processing for real-time object distance and size measurements;Yasir M Mustafah等;《 2012 International Conference on Computer and Communication Engineering (ICCCE)》;20120820;全文 *
基于序列图像的几何参数测量方法研究;刘鹏等;《应用光学》;20110315(第02期);全文 *

Also Published As

Publication number Publication date
CN113297930A (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN109145931B (zh) 物体检测方法、装置及存储介质
CN109816704A (zh) 物体的三维信息获取方法和装置
US10304206B2 (en) Selecting feature patterns and corresponding layout positions for viewpoint measurement
US9330336B2 (en) Systems, methods, and media for on-line boosting of a classifier
CN108509891A (zh) 图像标注方法、装置、存储介质及电子设备
CN110544268B (zh) 一种基于结构光及SiamMask网络的多目标跟踪方法
CN111126393A (zh) 车辆外观改装判断方法、装置、计算机设备及存储介质
JP7279848B2 (ja) 画像処理装置、画像処理方法、およびプログラム
CN109858310A (zh) 车辆和交通标志检测方法
CN109934873A (zh) 标注图像获取方法、装置及设备
CN115661767A (zh) 一种基于卷积神经网络的图像前方车辆目标识别方法
CN115100616A (zh) 点云目标检测方法、装置、电子设备及存储介质
CN112989877A (zh) 点云数据中标注对象的方法及装置
CN109859489A (zh) 一种车距估计方法、装置、车载设备及存储介质
CN113297930B (zh) 图像中物体真实大小的表示与标注方法和装置
CN111951271B (zh) 一种识别病理图像中癌细胞的方法及装置
CN115578441B (zh) 基于深度学习的车辆侧面图像拼接和车辆尺寸测量方法
CN114140671A (zh) 基于多尺度融合的高分辨率芯片图像的分类方法和装置
CN111754474A (zh) 一种基于图像清晰度的能见度识别的方法及设备
US20200226385A1 (en) Visual object insertion classification for videos
CN110689112A (zh) 数据处理的方法及装置
CN113066165B (zh) 多阶段无监督学习的三维重建方法、装置和电子设备
TW201040847A (en) Method of identifying objects in image
JP7338902B2 (ja) :診断補助情報の提供方法およびそれの実行する装置
CN112712499B (zh) 一种物体检测方法、装置以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant