CN113672143A - 图像标注方法、系统、设备和存储介质 - Google Patents
图像标注方法、系统、设备和存储介质 Download PDFInfo
- Publication number
- CN113672143A CN113672143A CN202110996374.3A CN202110996374A CN113672143A CN 113672143 A CN113672143 A CN 113672143A CN 202110996374 A CN202110996374 A CN 202110996374A CN 113672143 A CN113672143 A CN 113672143A
- Authority
- CN
- China
- Prior art keywords
- image
- annotation
- result
- displaying
- labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000002372 labelling Methods 0.000 claims abstract description 83
- 230000004044 response Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000003709 image segmentation Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04817—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04845—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例公开了一种图像标注方法、系统、设备和存储介质,该方法包括:显示包含第一图像的图像标注界面,响应于对所述第一图像的第一标注操作,得到第一标注结果;接收帧数选择操作,显示所述帧数选择操作选择的第二图像;将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。本方案实现了对多帧图像的追踪标注,减少了用户的标注操作,显著提高了图像标注效率。
Description
技术领域
本申请实施例涉及图像处理技术领域,尤其涉及一种图像标注方法、系统、设备和存储介质。
背景技术
在计算机视觉领域,图像分割是指将图像细分为多个图像子区域的过程,通常用于定位图像中的物体和边界,在人脸识别、医学图像分析、机器视觉等领域都有重要作用。图像分割可以说是为图像的每个像素添加标签的过程,例如人脸识别中需要识别图像中人脸各部分的子区域,这一过程赋予了相同标签的像素某种共同的视觉特性。近些年来,由于深度学习在计算机视觉领域的成功应用,有大量算法工作人员致力于利用深度学习模型研究视频/图像分割的方法。视频追踪分割,可以看做将视频分为多个图像帧后,对所有图像帧进行图像分割的过程。深度学习模型的训练依赖大量的分割标注数据,通过提高标注效率,降低数据获取成本,将有利于推进机器学习的进步。
现有技术中,在进行图像标注时,大多采用对单帧图像进行边界框标注的方式,缺乏一种合理高效的对多帧图像进行图像标注的方法,其标注灵活性差、标注效率低。
发明内容
本发明实施例提供了一种图像标注方法、系统、设备和存储介质,解决了现有技术中图像标注效率低、灵活性差的问题,实现了对多帧图像的追踪标注,显著提高了图像标注效率。
第一方面,本发明实施例提供了一种图像标注方法,该方法包括:
显示包含第一图像的图像标注界面,响应于对所述第一图像的第一标注操作,得到第一标注结果;
接收帧数选择操作,显示所述帧数选择操作选择的第二图像;
将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。
第二方面,本发明实施例还提供了一种图像标注系统,包括:
显示单元,用于显示包含第一图像的图像标注界面;
标注处理单元,用于响应于对所述第一图像的第一标注操作,得到第一标注结果;
指令接收单元,用于接收帧数选择操作,所述显示单元用于显示所述帧数选择操作选择的第二图像;
所述标注单元,用于将所述第一标注结果导入至所述第二图像中进行显示,所述指令接收单元用于接收对所述第二图像的第二标注操作,所述标注处理单元用于根据所述第二标注操作得到包含所述第一标注结果的第二标注结果。
第三方面,本发明实施例还提供了一种图像标注设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所述的图像标注方法。
第四方面,本发明实施例还提供了一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本发明实施例所述的图像标注方法。
本发明实施例中,通过显示包含第一图像的图像标注界面,响应于对第一图像的第一标注操作,得到第一标注结果,接收帧数选择操作,显示帧数选择操作选择的第二图像,将第一标注结果导入至第二图像中进行显示,接收对第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。本方案实现了对多帧图像的追踪标注,显著提高了图像标注效率。
附图说明
图1为本发明实施例提供的一种图像标注方法的流程图;
图2为本发明实施例提供的另一种图像标注方法的流程图;
图3为本发明实施例提供的另一种图像标注方法的流程图;
图4为本发明实施例提供的另一种图像标注方法的流程图;
图5为本发明实施例提供的另一种图像标注方法的流程图;
图6为本发明实施例提供的一种图像标注系统的结构框图;
图7为本发明实施例提供的一种图像标注设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明实施例的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的部分而非全部结构。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明实施例提供的一种图像标注方法的流程图,可应用于对图像进行标注,该方法可以由计算设备如台式机、笔记本、后台服务器、平板电脑和手机终端等设备来执行,具体包括如下步骤:
步骤S101、显示包含第一图像的图像标注界面,响应于对所述第一图像的第一标注操作,得到第一标注结果。
其中,该第一图像为需要进行标注的图像,也即当前图像标注界面中显示的图像。图像标注界面为显示设备如电脑显示屏显示的用于进行图像标注的界面。示例性的,可以是打开图像标注系统后生成的界面,在一个实施例中,该图像标注界面包括图像显示区和标注操作区,该图像显示区用于进行图像和标注结果的显示,如在图像显示区中显示第一图像;标注操作区包括多个用于实现标注的图形控件,如按钮、选择框、工具栏列表等。
其中,第一标注操作可以是用户通过点击操作标注区的图形控件后,在第一图像中进行标注的操作。如在标注操作区选择笔刷选项,此时鼠标图标相应变换为笔刷图标,用户可通过鼠标图标在第一图像中进行点选以对第一图像进行标注,该点选的操作即为第一标注操作。
其中,系统对该第一标注操作进行响应,以得到相应的第一标注结果。在一个实施例中,该第一标注结果可以是第一图像中被点选的像素点的标签记录结果。如第一图像中包含人脸图像,用户通过第一标注操作对第一图像中的人脸图像部分进行标注,该第一标注结果为用户标注的人脸部分在第一图像中所处像素点的标签信息。
在一个实施例中,针对第一图像进行第一标注操作后得到的第一标注结果可以以矩阵的形式进行存储。以第一图像分辨率为a*b为例,构建a*b的矩阵,矩阵中每个元素指代表对应像素点的标签。示例性的,如人脸对应标签值记为1,头发对应标签值记为2,肢体对应标签值记为3等。
步骤S102、接收帧数选择操作,显示所述帧数选择操作选择的第二图像。
其中,帧数选择操作用于实现对不同帧数图像的选择。示例性的,系统导入15帧图像,当前图像标注界面显示的第一图像为第5帧,通过该帧数选择操作以选择15帧图像中的其它帧图像,如选择第7帧图像。此时,响应于该帧数选择操作,在图像标注界面显示第7帧图像,此处记为第二图像。
在一个实施例中,在图像标注界面中显示有帧数选择控件,用户通过点击该控件以进行帧数选择,实现图像标注界面中显示图像的跳转,以进行对其它图像的标注。
步骤S103、将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。
在一个实施例中,第一图像和第二图像为一段视频中的连续的或临近帧的帧图像,在图像标注界面显示第二图像时,将对第一图像进行标注得到的第一标注结果导入至第二图像中进行显示。可选的,进行显示的方式可以是在第二图像中以预设颜色显示该第一标注结果。示例性的,在第一图像中的标注结果可以是对第一图像中人脸区域进行标注的结果,将该标注结果导入至第二图像中,即在第二图像中对应的人脸区域采用预设颜色(如蓝色)进行标注显示。
在一个实施例中,在将第一标注结果导入至第二图像中进行显示后,接收对第二图像的第二标注操作,即用户可以对第二图像继续进行标注工作,如对第二图像中包含的人的头发区域进行标注,以得到第二标注结果。其中,该第二标注结果包括在显示第二图像时根据用户的第二标注操作得到的标注结果,以及导入的第一图像的第一标注结果。其中,第二标注结果包含的第一图像的第一标注结果可以是全部的第一标注结果,也可以是部分的第一标注结果。如在导入第一标注结果在第二界面进行显示时,用户可以对该第一标注结果进行调整,如删除部分标注结果,此时得到的第二标注结果包含部分第一标注结果。
由上述方案可知,通过显示第一图像对其进行标注后,根据帧数选择操作直接跳转至第二图像,在显示第二图像时显示对第一图像的标注结果,实现了多帧图像的追踪标注,显著提升了图像标注效率,节省了大量的图像标注时间。
图2为本发明实施例提供的另一种图像标注方法的流程图,给出了一种进行图像导入的方法。如图2所示,技术方案具体如下:
步骤S201、获取输入的视频数据,将所述视频数据转换为多个图像帧,确定所述视频数据的元信息,以及所述多个图像帧中的第一图像,根据所述第一图像以及所述元信息生成初始标注结果。
在一个实施例中,针对输入的视频数据将其转换为多个图像帧,以用于后续对每帧图像进行标注。其中,视频数据的元信息表征对视频数据进行描述的信息,如该段视频数据的时长、初始标注内容等。
可选的,在将视频数据转换为多个图像帧开始进行图像标注时,在多个图像帧中确定第一图像进行显示。其中,确定方式可以是以该视频数据转换后的多帧图像中,按照时间先后顺序进行排序,将排序第一即开始时间最早的图像确定为第一图像;也可以是根据用户的选择确定第一图像;还可以是选取多帧图像中的中间帧图像作为第一图像。
在一个实施例中,元信息包括通过神经网络模型进行初步识别得到的标注内容,在视频数据转换为多个图像帧时,根据该标注内容对应的生成每个图像的初始标注结果;在另一个实施例中,如果元信息不包含标注内容,则初始标注结果可以为空。
步骤S202、显示包含第一图像以及所述初始标注结果的图像标注界面,响应于对所述第一图像的第一标注操作,得到第一标注结果。
其中,针对存在初始标注结果的图像帧,在显示时同步显示该初始标注结果,如在图像标注界面显示第一图像时,相应的在第一图像中显示对应的初始标注结果。
步骤S203、接收帧数选择操作,显示所述帧数选择操作选择的第二图像。
步骤S204、将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。
由上述方案可知,在进行图像标注过程中,可针对输入的视频数据自动转换为多帧图像,并进行初始标注,便于用户进行参考,进一步提高了图像标注效率,其适用场景更广泛。
图3为本发明实施例提供的另一种图像标注方法的流程图,给出了具体的进行第一标注操作的方法。如图3所示,技术方案具体如下:
步骤S301、显示包含第一图像的图像标注界面,响应于对所述第一图像的第一标注操作,得到待识别标注结果,如果所述待识别标注结果满足预设的标注规则,则将所述待识别标注结果确定为第一标注结果。
其中,待识别标注结果为非确定的待进行验证的标注结果,如果验证成功,即待识别标注结果满足预设的标注规则,则相应的将待识别标注结果确定为第一标注结果。否则,可以给出提示信息,如“标注错误,请重新标注”等。
其中,标注规则可以是系统中针对不同的应用场景预先导入的规则。具体的,该标注规则可以包括标注操作约束、标注合法性验证信息等。其中,标注操作约束定义有用户可以执行的操作,如单位时间标注区域面积大小、标注速度等;标注合法性验证信息包括对标注内容是否合理的验证,如是否使用不同的标注标签重复标注同一图像区域等,如果是,则判定其不符合标注规则。
步骤S302、接收帧数选择操作,显示所述帧数选择操作选择的第二图像。
步骤S303、将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。
由上述方案可知,在进行图像标注过程中,对标注结果进行预先验证,对符合预设的标注规则待识别标注结果进行确认,以得到合理的标注结果,提高了图像标注准确性,也可以使标注人员第一时间发现不合理的标注内容。
在上述技术方案的基础上,所述第一标注操作包括多边形填充标注操作和笔刷标注操作,其中,不同的标注操作对应不同的标注级别。具体的,针对粗放型无需高精度的标注,可采用多边形填充标注操作,如对图像中人体所在区域的标注。针对需要细粒度的精细的标注,采用笔刷标注操作,如对图像中人的头发的标注。在一个实施例中,在图像标注界面显示有标注工具栏,标注工具栏中有多种标注工具以供用户针对不同的标注需求进行选择,如标注工具栏中显示有多边形填充标注操作按钮和笔刷标注操作按钮,以供用户选择。
图4为本发明实施例提供的另一种图像标注方法的流程图,给出了一种在图像标注过程中进行信息比对的方法。如图4所示,技术方案具体如下:
步骤S401、显示包含第一图像的图像标注界面,响应于对所述第一图像的第一标注操作,得到第一标注结果。
步骤S402、接收帧数选择操作,显示所述帧数选择操作选择的第二图像。
步骤S403、将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。
步骤S404、根据接收到的图像比对操作,确定第三图像,所述第三图像对应有第三标注结果,根据所述第二标注结果以及所述第三标注结果确定对比显示区域,在所述第二图像中以预设显示模式对所述对比显示区域进行显示。
其中,该图像比对操作用于实现图像标注结果的比对。如用户点击图像比对操作按钮后,将第二图像前一帧或后一帧确定为第三图像。其中,该第三图像对应有第三标注结果,根据当前第二图像的第二标注结果以及该第三标注结果确定对比显示区域后,在第二图像中进行展示,以供图像标注用户参考。
具体的,以第二标注结果和第三标注结果为对应图像中每个像素点的标签信息为例,确定对比显示区域的过程为:针对相同的像素点位置坐标,根据第二图像中每个像素点的标签信息和第三图像中每个像素点的标签信息确定多个对比显示区域,对每个对比显示区域采用不同的显示模式进行显示。
可选的,对第二图像中像素点标签与第三图像中像素点标签相同的像素点采用第一显示模式进行显示,如采用蓝色显示;对第二图像中存在像素点标签,第三图像中不存在像素点标签的像素点采用第二显示模式进行显示,如采用红色显示;对第二图像中不存在像素点标签,第三图像中存在像素点标签的像素点采用第三显示模式进行显示,如采用黄色显示;对第二图像中和第三图像中均不存在像素点标签的像素点采用第四显示模式进行显示,如采用透明显示。
由上述方案可知,在进行图像标注过程中,可针对不同的图像的标注结果进行对比显示,以便于图像标注人员确定当前图像与其它图像的标注结果的差异性部分,为用户进行图像标注提供了极大便利,用户体验更佳。
图5为本发明实施例提供的另一种图像标注方法的流程图,给出了一种对标注结果进行保存的方法。如图5所示,技术方案具体如下:
步骤S501、显示包含第一图像的图像标注界面,响应于对所述第一图像的第一标注操作,得到第一标注结果。
步骤S502、接收帧数选择操作,显示所述帧数选择操作选择的第二图像。
步骤S503、将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。
步骤S504、确定所述第二图像所处的子进度记录,所述子进度记录包括目录信息以及多个图像帧结果序列,将所述子进度记录中的对应图像的标注结果更新为第二标注结果。
本方案中,由于图像标注工作量较大,工作时长可能长达数天,故需要提供标注结果保存功能,方便标注人员保存及恢复工作进度。为了保证图像标注人员可以快速的获取、比对各个图像的标注结果,需要对每个标注后的图像进行结果保存。考虑到保存多帧序列时,需要对每一帧都执行序列化、压缩操作,其计算量相对较大,本方案中的整体保存记录中包括子进度记录以及当前图像标注结果记录,其中,子进度记录包括目录信息以及多个图像帧结果序列,在对当前图像进行标注得到标注结果后,可根据该目录信息确定该第二图像所处的子进度记录,将该子进度记录中的对应该图像的标注结果进行更新。
由上述方案可知,在对图像标注的标注结果进行保存时,通过设置子进度记录的方式实现单帧图像标注结果的更新,无需同时进行多帧图像标注结果的处理,在保证长周期工作的情况下,显著提升了数据保存效率。
在上述技术方案的基础上,在恢复对图像的标注进度时,相应的对记录的各图像帧结果序列结果进行反序列化,为了提升反序列化效率,只反序列化当前需要处理的图像所处的子进度记录所保存的内容。同时,可采用多线程运算反序列化其它子进度记录,在不影响渲染进度的前提下,保证高效的标注进度的恢复。
图6为本发明实施例提供的一种图像标注系统的结构框图,该系统用于执行上述实施例提供的图像标注方法,具备执行方法相应的功能模块和有益效果。如图6所示,该系统具体包括:显示单元101、指令接收单元102和标注处理单元103,其中,
显示单元101,用于显示包含第一图像的图像标注界面;
指令接收单元102,用于接收对所述第一图像的第一标注操作,以及帧数选择操作,所述显示单元101用于显示所述帧数选择操作选择的第二图像;
标注处理单元103,用于响应于对所述第一图像的第一标注操作,得到第一标注结果,以及将所述第一标注结果导入至所述第二图像中进行显示,;
所述指令接收单元103,用于接收对所述第二图像的第二标注操作,所述标注处理单元102用于根据所述第二标注操作得到包含所述第一标注结果的第二标注结果。
由上述方案可知,通过显示包含第一图像的图像标注界面,响应于对第一图像的第一标注操作,得到第一标注结果,接收帧数选择操作,显示帧数选择操作选择的第二图像,将第一标注结果导入至第二图像中进行显示,接收对第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。本方案实现了对多帧图像的追踪标注,显著提高了图像标注效率。
在一个可能的实施例中,该系统还包括:
图像输入单元104,用于在显示包含第一图像的图像标注界面之前,获取输入的视频数据,将所述视频数据转换为多个图像帧,确定所述视频数据的元信息,以及所述多个图像帧中的第一图像,根据所述第一图像以及所述元信息生成初始标注结果;
所述显示单元101具体用于:
显示包含第一图像以及所述初始标注结果的图像标注界面。
在一个可能的实施例中,所述标注处理单元103具体用于:
响应于对所述第一图像的第一标注操作,得到待识别标注结果;
如果所述待识别标注结果满足预设的标注规则,则将所述待识别标注结果确定为第一标注结果。
在一个可能的实施例中,所述第一标注操作包括多边形填充标注操作和笔刷标注操作,其中,不同的标注操作对应不同的标注级别。
在一个可能的实施例中,所述指令接收单元102还用于:
在得到包含所述第一标注结果的第二标注结果之后,根据接收到的图像比对操作,确定第三图像,所述第三图像对应有第三标注结果;
所述标注处理单元103具体用于:
根据所述第二标注结果以及所述第三标注结果确定对比显示区域;
所述显示单元101具体用于:在所述第二图像中以预设显示模式对所述对比显示区域进行显示。
在一个可能的实施例中,所述第二标注结果和所述第三标注结果包括对应图像中每个像素点的标签信息,所述标注处理单元103具体用于:
针对相同的像素点位置坐标,根据第二图像中每个像素点的标签信息和所述第三图像中每个像素点的标签信息确定多个对比显示区域,对每个对比显示区域采用不同的显示模式进行显示。
在一个可能的实施例中,所述显示单元101具体用于:
对第二图像中像素点标签与第三图像中像素点标签相同的像素点采用第一显示模式进行显示;
对第二图像中存在像素点标签,第三图像中不存在像素点标签的像素点采用第二显示模式进行显示;
对第二图像中不存在像素点标签,第三图像中存在像素点标签的像素点采用第三显示模式进行显示;
对第二图像中和第三图像中均不存在像素点标签的像素点采用第四显示模式进行显示。
在一个可能的实施例中,该系统还包括:
标注结果保存单元105,用于在得到包含所述第一标注结果的第二标注结果之后,确定所述第二图像所处的子进度记录,所述子进度记录包括目录信息以及多个图像帧结果序列;
将所述子进度记录中的对应图像的标注结果更新为第二标注结果。
图7为本发明实施例提供的一种图像标注设备的结构示意图,如图7所示,该设备包括处理器201、存储器202、输入装置203和输出装置204;设备中处理器201的数量可以是一个或多个,图7中以一个处理器201为例;设备中的处理器201、存储器202、输入装置203和输出装置204可以通过总线或其他方式连接,图7中以通过总线连接为例。存储器202作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的图像标注方法对应的程序指令/模块。处理器201通过运行存储在存储器202中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的图像标注方法。输入装置203可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置204可包括显示屏等显示设备。
本发明实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种上述实施例描述的图像标注方法,具体包括:
显示包含第一图像的图像标注界面,响应于对所述第一图像的第一标注操作,得到第一标注结果;
接收帧数选择操作,显示所述帧数选择操作选择的第二图像;
将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。
值得注意的是,上述图像标注系统的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
注意,上述仅为本发明实施例的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明实施例不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明实施例的保护范围。因此,虽然通过以上实施例对本发明实施例进行了较为详细的说明,但是本发明实施例不仅仅限于以上实施例,在不脱离本发明实施例构思的情况下,还可以包括更多其他等效实施例,而本发明实施例的范围由所附的权利要求范围决定。
Claims (11)
1.图像标注方法,其特征在于,包括:
显示包含第一图像的图像标注界面,响应于对所述第一图像的第一标注操作,得到第一标注结果;
接收帧数选择操作,显示所述帧数选择操作选择的第二图像;
将所述第一标注结果导入至所述第二图像中进行显示,接收对所述第二图像的第二标注操作,得到包含所述第一标注结果的第二标注结果。
2.根据权利要求1所述的图像标注方法,其特征在于,在显示包含第一图像的图像标注界面之前,还包括:
获取输入的视频数据,将所述视频数据转换为多个图像帧,确定所述视频数据的元信息,以及所述多个图像帧中的第一图像,根据所述第一图像以及所述元信息生成初始标注结果;
所述显示包含第一图像的图像标注界面,包括:
显示包含第一图像以及所述初始标注结果的图像标注界面。
3.根据权利要求1所述的图像标注方法,其特征在于,所述响应于对所述第一图像的第一标注操作,得到第一标注结果,包括:
响应于对所述第一图像的第一标注操作,得到待识别标注结果;
如果所述待识别标注结果满足预设的标注规则,则将所述待识别标注结果确定为第一标注结果。
4.根据权利要求1所述的图像标注方法,其特征在于,所述第一标注操作包括多边形填充标注操作和笔刷标注操作,其中,不同的标注操作对应不同的标注级别。
5.根据权利要求1所述的图像标注方法,其特征在于,在得到包含所述第一标注结果的第二标注结果之后,还包括:
根据接收到的图像比对操作,确定第三图像,所述第三图像对应有第三标注结果;
根据所述第二标注结果以及所述第三标注结果确定对比显示区域;
在所述第二图像中以预设显示模式对所述对比显示区域进行显示。
6.根据权利要求5所述的图像标注方法,其特征在于,所述第二标注结果和所述第三标注结果包括对应图像中每个像素点的标签信息,所述根据所述第二标注结果以及所述第三标注结果确定对比显示区域,包括:
针对相同的像素点位置坐标,根据第二图像中每个像素点的标签信息和所述第三图像中每个像素点的标签信息确定多个对比显示区域,对每个对比显示区域采用不同的显示模式进行显示。
7.根据权利要求6所述的图像标注方法,其特征在于,所述对每个对比显示区域采用不同的显示模式进行显示,包括:
对第二图像中像素点标签与第三图像中像素点标签相同的像素点采用第一显示模式进行显示;
对第二图像中存在像素点标签,第三图像中不存在像素点标签的像素点采用第二显示模式进行显示;
对第二图像中不存在像素点标签,第三图像中存在像素点标签的像素点采用第三显示模式进行显示;
对第二图像中和第三图像中均不存在像素点标签的像素点采用第四显示模式进行显示。
8.根据权利要求1-6中任一项所述的图像标注方法,其特征在于,在得到包含所述第一标注结果的第二标注结果之后,还包括:
确定所述第二图像所处的子进度记录,所述子进度记录包括目录信息以及多个图像帧结果序列;
将所述子进度记录中的对应图像的标注结果更新为第二标注结果。
9.图像标注系统,其特征在于,包括:
显示单元,用于显示包含第一图像的图像标注界面;
指令接收单元,用于接收对所述第一图像的第一标注操作,以及帧数选择操作,所述显示单元用于显示所述帧数选择操作选择的第二图像;
标注处理单元,用于响应于对所述第一图像的第一标注操作,得到第一标注结果,以及将所述第一标注结果导入至所述第二图像中进行显示,;
所述指令接收单元,用于接收对所述第二图像的第二标注操作,所述标注处理单元用于根据所述第二标注操作得到包含所述第一标注结果的第二标注结果。
10.一种图像标注设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一项所述的图像标注方法。
11.一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-8中任一项所述的图像标注方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110996374.3A CN113672143A (zh) | 2021-08-27 | 2021-08-27 | 图像标注方法、系统、设备和存储介质 |
PCT/CN2022/112641 WO2023024959A1 (zh) | 2021-08-27 | 2022-08-16 | 图像标注方法、系统、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110996374.3A CN113672143A (zh) | 2021-08-27 | 2021-08-27 | 图像标注方法、系统、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113672143A true CN113672143A (zh) | 2021-11-19 |
Family
ID=78547036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110996374.3A Pending CN113672143A (zh) | 2021-08-27 | 2021-08-27 | 图像标注方法、系统、设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113672143A (zh) |
WO (1) | WO2023024959A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023024959A1 (zh) * | 2021-08-27 | 2023-03-02 | 广州市网星信息技术有限公司 | 图像标注方法、系统、设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503074A (zh) * | 2019-08-29 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 视频帧的信息标注方法、装置、设备及存储介质 |
CN112257659A (zh) * | 2020-11-11 | 2021-01-22 | 四川云从天府人工智能科技有限公司 | 检测跟踪方法、装置以及介质 |
CN112800255A (zh) * | 2019-11-14 | 2021-05-14 | 阿里巴巴集团控股有限公司 | 数据标注、对象跟踪方法、装置、设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10956747B2 (en) * | 2018-12-31 | 2021-03-23 | International Business Machines Corporation | Creating sparsely labeled video annotations |
CN110189333B (zh) * | 2019-05-22 | 2022-03-15 | 湖北亿咖通科技有限公司 | 一种图片语义分割半自动标注方法及装置 |
CN110991491A (zh) * | 2019-11-12 | 2020-04-10 | 苏州智加科技有限公司 | 图像标注方法、装置、设备及存储介质 |
CN114443900A (zh) * | 2020-11-06 | 2022-05-06 | 上海哔哩哔哩科技有限公司 | 视频标注方法、客户端、服务器及系统 |
CN113672143A (zh) * | 2021-08-27 | 2021-11-19 | 广州市网星信息技术有限公司 | 图像标注方法、系统、设备和存储介质 |
-
2021
- 2021-08-27 CN CN202110996374.3A patent/CN113672143A/zh active Pending
-
2022
- 2022-08-16 WO PCT/CN2022/112641 patent/WO2023024959A1/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503074A (zh) * | 2019-08-29 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 视频帧的信息标注方法、装置、设备及存储介质 |
CN112800255A (zh) * | 2019-11-14 | 2021-05-14 | 阿里巴巴集团控股有限公司 | 数据标注、对象跟踪方法、装置、设备和存储介质 |
CN112257659A (zh) * | 2020-11-11 | 2021-01-22 | 四川云从天府人工智能科技有限公司 | 检测跟踪方法、装置以及介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023024959A1 (zh) * | 2021-08-27 | 2023-03-02 | 广州市网星信息技术有限公司 | 图像标注方法、系统、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023024959A1 (zh) | 2023-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111832449A (zh) | 工程图纸的显示方法及相关装置 | |
CN111273772B (zh) | 基于slam测绘方法的增强现实交互方法、装置 | |
CN108492349B (zh) | 书写笔画的处理方法、装置、设备和存储介质 | |
CN112637541A (zh) | 一种音视频标注方法、装置、计算机设备及存储介质 | |
CN111739136B (zh) | 渲染方法、计算机设备和存储介质 | |
CN114003160A (zh) | 数据可视化展示方法、装置、计算机设备和存储介质 | |
CN110867243B (zh) | 一种图像标注方法、装置、计算机系统及可读存储介质 | |
CN113672143A (zh) | 图像标注方法、系统、设备和存储介质 | |
CN113283347B (zh) | 装配作业指导方法、装置、系统、服务器及可读存储介质 | |
CN114169303A (zh) | 基于vue.js的表格编辑方法、装置、设备及介质 | |
CN115858049A (zh) | Rpa流程组件化编排方法、装置、设备和介质 | |
CN110909261A (zh) | 一种时间轴处理方法、装置、设备和存储介质 | |
CN114724170A (zh) | 一种bom的生成方法、装置、电子设备及存储介质 | |
CN114245193A (zh) | 显示控制方法、装置和电子设备 | |
CN110298229B (zh) | 视频图像处理方法及装置 | |
CN114387290A (zh) | 图像处理方法、图像处理装置、计算机设备和存储介质 | |
CN109471525A (zh) | 业务办理方法、装置、计算机设备和存储介质 | |
CN113821144B (zh) | 一种数据标注方法、装置、系统和介质 | |
CN114758339B (zh) | 字符识别模型的获取方法、装置、计算机设备和存储介质 | |
CN113487698A (zh) | 基于双通道神经网络模型的表单生成方法及装置 | |
CN114898419A (zh) | 图像序列中关键图像的提取方法、装置、介质和计算设备 | |
CN116797904A (zh) | 一种图像识别不确定性知识蒸馏方法与系统 | |
CN107295357B (zh) | 影像文件资料录入方法、云服务器及终端 | |
CN114281041A (zh) | 流程图创建方法、模型的训练方法、装置、设备及介质 | |
CN117252942A (zh) | 图像生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |