CN110865756A - 图像标注方法、装置、设备及存储介质 - Google Patents

图像标注方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110865756A
CN110865756A CN201911100285.5A CN201911100285A CN110865756A CN 110865756 A CN110865756 A CN 110865756A CN 201911100285 A CN201911100285 A CN 201911100285A CN 110865756 A CN110865756 A CN 110865756A
Authority
CN
China
Prior art keywords
image
target
label
shortcut key
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911100285.5A
Other languages
English (en)
Other versions
CN110865756B (zh
Inventor
戈洋洋
方啸
侯广大
刘晨楠
林辰
堵明明
蒋子赟
黄淋淋
朱峻林
李景才
王秀峰
Original Assignee
Suzhou Zhijia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Zhijia Technology Co Ltd filed Critical Suzhou Zhijia Technology Co Ltd
Priority to CN201911100285.5A priority Critical patent/CN110865756B/zh
Publication of CN110865756A publication Critical patent/CN110865756A/zh
Application granted granted Critical
Publication of CN110865756B publication Critical patent/CN110865756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04886Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0489Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using dedicated keyboard keys or combinations thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Abstract

本申请公开了一种图像标注方法、装置、设备及存储介质,属于人工智能技术领域。本申请提供了一种实现快捷标注的方法,通过将图像的各种标签与对应的快捷键绑定起来,在图像标注过程中,用户对快捷键触发操作,电子设备利用快捷键与标签之间的映射关系,即可确定出图像对应的标签,从而为图像添加标签。通过这种方式,免去了打字输入标签的繁琐过程,使得图像标注更加快捷和方便,从而提高标注的速度。尤其是,能够将指定的某一按键作为用来标注的快捷键,那么通过对单个按键触发操作,电子设备就会向图像添加上对应的标签,从而实现标注图像的功能,因此能够达到一键标定的效果,从而极大地节省了图像标注的时间,提高了图像的标注效率。

Description

图像标注方法、装置、设备及存储介质
技术领域
本申请涉及人工智能技术领域,特别涉及一种图像标注方法、装置、设备及存储介质。
背景技术
在人工智能技术以及机器学习技术中,为了通过模型来识别出图像的类别,通常会预先对图像集中的图像进行标注,利用已标注的图像集,对模型进行训练,以使模型在训练的过程中,通过图像和图像的标签,学习出如何预测一张未知图像的类别。由此可见,图像标注的过程对于人工智能技术而言是至关重要的。
目前,图像标注的方法通常是:电脑在屏幕中显示待标注的图像以及输入框,用户查看图像,依据经验,确定图像的标签,通过鼠标对输入框触发点击操作,使得屏幕中的光标移动至输入框内;然后,用户对电脑配置的物理键盘触发按压操作,以打字的方式,来逐字输入图像的标签。终端检测到对物理键盘的按压操作后,会根据用户按压的按键,获取用户输入的内容,将用户输入的内容作为图像的标签,向图像添加该标签。
采用上述方法进行标注时,标注操作较为繁琐,造成图像标注带来的时间成本较大,因此导致图像的标注效率低下。
发明内容
本申请实施例提供了一种图像标注方法、装置、设备及存储介质,能够解决相关技术中标注操作繁琐、标注效率低下的问题。所述技术方案如下:
一方面,提供了一种图像标注方法,所述方法包括:显示待标注的图像;检测到对目标快捷键的触发操作,所述目标快捷键用于触发图像标注功能;查询快捷键与标签之间的映射关系,得到所述目标快捷键对应的目标标签;向所述图像添加所述目标标签。
可选地,所述向所述图像添加所述目标标签,包括:检测到对所述图像中从第一位置至第二位置的拖拽操作,根据所述第一位置和所述第二位置,确定第一标注框,向所述图像中落入所述第一标注框的图像区域,添加所述目标标签,所述第一标注框的边界点包括所述第一位置和所述第二位置;或者,检测到对所述图像中第三位置的点击操作,在预设时长内,检测到对所述图像中第四位置的点击操作,根据所述第三位置和所述第四位置,确定第二标注框,向所述图像中落入所述第二标注框的图像区域,添加所述目标标签,所述第二标注框的边界点包括所述第三位置和所述第四位置。
可选地,所述显示待标注的图像之后,所述方法还包括:当检测到对所述图像触发的操作时,在所述图像中显示目标辅助线,所述目标辅助线用于辅助用户绘制标注框。
可选地,所述在所述图像中显示目标辅助线,包括:识别所述图像中物体的边缘,在所述图像中所述物体的边缘,显示形状与所述边缘匹配的目标辅助线;或者,在所述图像中,显示预设形状的目标辅助线。
可选地,所述查询快捷键与标签之间的映射关系,得到所述目标快捷键对应的目标标签之前,所述方法还包括:显示配置界面,所述配置界面包括快捷键选项以及标签选项;检测对所述快捷键选项触发的第一操作,检测对所述标签选项触发的第二操作;根据所述第一操作对应的快捷键与所述第二操作对应的标签,建立所述快捷键与标签之间的映射关系。
可选地,所述检测到对目标快捷键的触发操作,包括:检测到对单个按键的触发操作;或者,检测到对按键组合的触发操作;或者,检测到对物理键盘上的按键的触发操作;或者,检测到对触摸屏中显示的虚拟键盘上的按键的触发操作。
可选地,所述向所述图像添加所述目标标签,包括:检测对所述目标快捷键的操作时长,当所述操作时长达到时长阈值时,向所述图像添加所述目标标签;或者,检测对所述目标快捷键的操作力度,当所述操作力度达到力度阈值时,向所述图像添加所述目标标签;或者,检测对所述目标快捷键的操作次数,当所述操作次数达到次数阈值时,向所述图像添加所述目标标签。
另一方面,提供了一种图像标注装置,所述装置包括:
显示模块,用于显示待标注的图像;检测模块,用于检测到对目标快捷键的触发操作,所述目标快捷键用于触发图像标注功能;查询模块,用于查询快捷键与标签之间的映射关系,得到所述目标快捷键对应的目标标签;添加模块,用于向所述图像添加所述目标标签。
可选地,所述检测模块,还用于检测到对所述图像中从第一位置至第二位置的拖拽操作;所述装置还包括:确定模块,用于根据所述第一位置和所述第二位置,确定第一标注框。可选地,所述添加模块,用于向所述图像中落入所述第一标注框的图像区域,添加所述目标标签,所述第一标注框的边界点包括所述第一位置和所述第二位置,
可选地,所述检测模块,还用于检测到对所述图像中第三位置的点击操作,在预设时长内,检测到对所述图像中第四位置的点击操作;所述装置还包括:确定模块,用于根据所述第三位置和所述第四位置,确定第二标注框。
可选地,所述添加模块,用于向所述图像中落入所述第二标注框的图像区域,添加所述目标标签,所述第二标注框的边界点包括所述第三位置和所述第四位置。
可选地,所述显示模块,还用于当检测到对所述图像触发的操作时,在所述图像中显示目标辅助线,所述目标辅助线用于辅助用户绘制标注框。
可选地,所述装置还包括:识别模块,用于识别所述图像中物体的边缘;所述显示模块,还用于在所述图像中所述物体的边缘,显示形状与所述边缘匹配的目标辅助线。
可选地,所述显示模块,用于在所述图像中,显示预设形状的目标辅助线。
可选地,所述显示模块,还用于显示配置界面,所述配置界面包括快捷键选项以及标签选项;所述检测模块,还用于检测对所述快捷键选项触发的第一操作,检测对所述标签选项触发的第二操作;所述装置还包括:建立模块,用于根据所述第一操作对应的快捷键与所述第二操作对应的标签,建立所述快捷键与标签之间的映射关系。
可选地,所述检测模块,用于检测到对单个按键的触发操作。
可选地,所述检测模块,用于检测到对按键组合的触发操作。
可选地,所述检测模块,用于检测到对物理键盘上的按键的触发操作。
可选地,所述检测模块,用于检测到对触摸屏中显示的虚拟键盘上的按键的触发操作。
可选地,所述检测模块,还用于检测对所述目标快捷键的操作时长;所述添加模块,用于当所述操作时长达到时长阈值时,向所述图像添加所述目标标签。
可选地,所述检测模块,还用于检测对所述目标快捷键的操作力度;所述添加模块,用于当所述操作力度达到力度阈值时,向所述图像添加所述目标标签。
可选地,所述检测模块,还用于检测对所述目标快捷键的操作次数;所述添加模块,用于当所述操作次数达到次数阈值时,向所述图像添加所述目标标签。
另一方面,提供了一种电子设备,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器加载并执行以实现上述图像标注方法所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行以实现上述图像标注方法所执行的操作。
本申请实施例提供的技术方案带来的有益效果至少包括:
本实施例提供了一种实现快捷标注的方法,通过将图像的各种标签与对应的快捷键绑定起来,在图像标注过程中,用户对快捷键触发操作,电子设备利用快捷键与标签之间的映射关系,即可确定出图像对应的标签,从而为图像添加标签。通过这种方式,免去了打字输入标签的繁琐过程,使得图像标注更加快捷和方便,从而提高标注的速度。尤其是,能够将指定的某一按键作为用来标注的快捷键,那么通过对单个按键触发操作,电子设备就会向图像添加上对应的标签,从而实现标注图像的功能,因此能够达到一键标定的效果,从而极大地节省了图像标注的时间,提高了图像的标注效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图像标注系统的架构图;
图2是本申请实施例提供的一种图像标注方法的流程图;
图3是本申请实施例提供的一种图像标注方法的流程图;
图4是本申请实施例提供的一种图像标注方法的流程图;
图5是本申请实施例提供的一种图像标注装置的结构示意图;
图6是本申请实施例提供的一种终端的结构示意图;
图7是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本申请中的字符“/”,一般表示前后关联对象是一种“或”的关系。
本申请中术语“多个”的含义是指两个或两个以上,例如,多个数据包是指两个或两个以上的数据包。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
以下,示例性介绍本申请的应用场景。
在自动驾驶领域,汽车在驾驶过程中,汽车要准确识别出车身周围的场景和物体,以便根据周围的场景和物体,对驾驶动作进行精准的控制。因此,汽车通常会携带各类传感器和摄像头,以便利用携带的传感器和摄像头,实时采集各类图像,将图像发送给控制系统,控制系统可以利用图像来进行实时处理和决策,从而实现自动驾驶的功能。有鉴于此,图像的识别能力,是自动驾驶领域极为重要的研究内容。
图像的识别能力通常是利用已标注的图像集训练得到的。具体地,在汽车驾驶过程中,可以实时采集到图像,通过预先对采集的图像进行标注,比如标注该图像是道路、障碍物还是行人等,使用已标注的图像训练模型后,能够让控制系统在实际驾驶过程中,当采集到未知的图像时,能够利用已训练的模型,从图像中识别出所处的场景以及周围的物体。
以下,示例性介绍本申请的系统架构。
图1是本申请实施例提供的一种图像标注系统的系统架构图。该图像标注系统包括:终端110和图像标注平台120。终端110通过无线网络或有线网络与图像标注平台120相连。
终端110可以是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器或MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器和膝上型便携计算机中的至少一种。终端110安装和运行有支持图像标注的应用程序。该应用程序可以是图像标注工具,该应用程序可以具有专用的客户端,也可以通过浏览器在网页中运行。示例性的,终端110是用户使用的终端,终端110中运行的应用程序内登录有用户账号。
图像标注平台120包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。图像标注平台120用于为支持图像标注的应用程序提供后台服务。可选地,图像标注平台120承担主要标注工作,终端110承担次要标注工作;或者,图像标注平台120承担次要标注工作,终端110承担主要标注工作;或者,图像标注平台120或终端110分别可以单独承担标注工作。
可选地,图像标注平台120包括:图像标注服务器1201和数据库1202。图像标注服务器1201用于提供图像标注有关的后台服务。图像标注服务器1201可以是一台或多台。当图像标注服务器1201是多台时,存在至少两台图像标注服务器1201用于提供不同的服务,和/或,存在至少两台图像标注服务器1201用于提供相同的服务,比如以负载均衡方式提供同一种服务,本申请实施例对此不加以限定。图像标注服务器1201中可以设置有图像标注模型。数据库1202可以用于存储未标注的图像集或已标注的图像集,当终端110发起请求时,图像标注服务器1201可以访问数据库1202,得到终端110请求的图像集,返回给终端110。
终端110可以泛指多个终端中的一个,本实施例仅以终端110来举例说明。
本领域技术人员可以知晓,上述终端110以及图像标注服务器1201的数量可以更多或更少。比如上述终端110以及图像标注服务器1201可以仅为一个,或者上述终端110以及图像标注服务器1201为几十个或几百个,或者更多数量,此时上述图像标注系统还包括其他终端以及其他图像标注服务器。本申请实施例对终端和图像标注服务器的数量和设备类型均不加以限定。
图2是本申请实施例提供的一种图像标注方法的流程图。该发明实施例的执行主体为电子设备,参见图2,该方法包括:
201、显示待标注的图像。
202、检测到对目标快捷键的触发操作,目标快捷键用于触发图像标注功能。
203、查询快捷键与标签之间的映射关系,得到目标快捷键对应的目标标签。
204、向图像添加目标标签。
本实施例提供了一种实现快捷标注的方法,通过将图像的各种标签与对应的快捷键绑定起来,在图像标注过程中,用户对快捷键触发操作,电子设备利用快捷键与标签之间的映射关系,即可确定出图像对应的标签,从而为图像添加标签。通过这种方式,免去了打字输入标签的繁琐过程,使得图像标注更加快捷和方便,从而提高标注的速度。尤其是,能够将指定的某一按键作为用来标注的快捷键,那么通过对单个按键触发操作,电子设备就会向图像添加上对应的标签,从而实现标注图像的功能,因此能够达到一键标定的效果,从而极大地节省了图像标注的时间,提高了图像的标注效率。
可选地,向图像添加目标标签,包括:检测到对该图像中从第一位置至第二位置的拖拽操作,根据该第一位置和该第二位置,确定第一标注框,向该图像中落入该第一标注框的图像区域,添加该目标标签,该第一标注框的边界点包括该第一位置和该第二位置;或者,检测到对该图像中第三位置的点击操作,在预设时长内,检测到对该图像中第四位置的点击操作,根据该第三位置和该第四位置,确定第二标注框,向该图像中落入该第二标注框的图像区域,添加该目标标签,该第二标注框的边界点包括该第三位置和该第四位置。
可选地,显示待标注的图像之后,该方法还包括:当检测到对图像触发的操作时,在图像中显示目标辅助线,目标辅助线用于辅助用户绘制标注框。
可选地,在该图像中显示目标辅助线,包括:识别该图像中物体的边缘,在该图像中该物体的边缘,显示形状与该边缘匹配的目标辅助线;或者,在该图像中,显示预设形状的目标辅助线。
可选地,该查询快捷键与标签之间的映射关系,得到该目标快捷键对应的目标标签之前,该方法还包括:显示配置界面,该配置界面包括快捷键选项以及标签选项;检测对该快捷键选项触发的第一操作,检测对该标签选项触发的第二操作;根据该第一操作对应的快捷键与该第二操作对应的标签,建立该快捷键与标签之间的映射关系。
可选地,检测到对目标快捷键的触发操作,包括:检测到对单个按键的触发操作;或,检测到对按键组合的触发操作;或,检测到对物理键盘上的按键的触发操作;或,检测到对触摸屏中显示的虚拟键盘上的按键的触发操作。
可选地,向图像添加目标标签,包括:检测对目标快捷键的操作时长,当操作时长达到时长阈值时,向图像添加目标标签;或,检测对目标快捷键的操作力度,当操作力度达到力度阈值时,向图像添加目标标签;或,检测对目标快捷键的操作次数,当操作次数达到次数阈值时,向图像添加目标标签。
图3是本申请实施例提供的一种图像标注方法的流程图。该实施例的执行主体为电子设备,参见图3,该方法包括:
301、电子设备存储快捷键与标签之间的映射关系。
快捷键用于触发图像标注功能。快捷键的可能实现方式可以包括多种。
例如,快捷键可以是单个按键,比如说,可以将按键“enter”配置为触发图像标注功能的快捷键。
快捷键也可以是按键组合,包括多个按键,例如,可以将按键“ctrl”和按键“s”配置为触发图像标注功能的快捷键。其中,如果快捷键包括多个按键,可以通过对多个按键同时触发操作来实现快捷键,例如,通过对按键“ctrl”和按键“s”同时触发按压操作来实现快捷键;当然,也可以按照预设顺序对多个按键依次触发操作来实现快捷键,例如通过先对按键“ctrl”触发按压操作,后对按键“s”触发按压操作来实现快捷键。
此外,快捷键还可以根据电子设备的硬件配置的不同而产生差异。
例如,如果电子设备配置了物理键盘,快捷键可以是物理键盘上的按键。
又如,如果电子设备是触控设备,快捷键也可以是触摸屏中显示的虚拟键盘上的按键,甚至可以是音量控制键、指纹按键等。
标签用于指示图像的类别,例如,标签可以是车辆、行人、自行车、建筑、道路、天气、交通等。
快捷键与标签之间的映射关系用于指明每个快捷键对应的标签。该映射关系可以包括至少一个快捷键的标识以及至少一个标签。快捷键的标识用于唯一标识对应的快捷键,例如可以是快捷键的身份标识号码(identification,ID)。示例性地,快捷键与标签之间的映射关系可以如下表1所示:
表1
快捷键ID 具体按键 标签
快捷键1 enter 行人
快捷键2 ctrl+s 道路
快捷键3 shift 自行车
快捷键4 alt 红绿灯
电子设备获取映射关系的方式可以包括多种,以下通过实现方式一至实现方式二进行举例说明:
实现方式一、电子设备预先存储默认的快捷键与标签之间的映射关系。
实现方式二、通过用户自定义配置快捷键与标签之间的映射关系。
在一些实施例中,实现方式二可以包括以下步骤一至步骤四:
步骤一、电子设备显示配置界面。
配置界面用于配置快捷键与标签之间的映射关系,该配置界面包括快捷键选项以及标签选项。快捷键选项用于选择快捷键,快捷键选项可以是输入选项,也可以是选择选项。例如,快捷键选项可以是下拉选项,当点击快捷键选项后,可以显示多个可配置为快捷键的按键。标签选项用于选择标签。标签选项可以是输入选项,也可以是选择选项。
步骤二、电子设备检测对该快捷键选项触发的第一操作。
第一操作是指对快捷键触发的操作,电子设备检测到第一操作后,可以根据第一操作来获取对应的快捷键。
步骤三、检测对该标签选项触发的第二操作。
第二操作是指对标签选项触发的操作,电子设备检测到第二操作后,可以根据第一操作来获取对应的标签。
步骤四、电子设备根据该第一操作对应的快捷键与该第二操作对应的标签,建立该快捷键与标签之间的映射关系。
通过上述步骤一至步骤四提供的实现方式,用户可以通过对配置界面触发操作,来指定哪个快捷键与哪个标签相互绑定,从而实现自定义配置快捷键的功能,灵活性高。此外,用户可以将自己习惯使用的按键配置为快捷键,从而满足用户了个人偏好,不同用户可以配置不同的快捷键,更加个性化。尤其是,可以根据实际的业务需求,来适应性地设置和调制每个快捷键对应的标签,比如如果应用在自动驾驶场景,可以将每个快捷键分别与“车辆”、“道路”、“行人”等标签绑定起来,如果应用在人脸识别场景,可以将每个快捷键分别与“女性”、“高颜值”、“长发”、“微笑”等标签绑定起来,从而提高了灵活性,扩展性强,应用范围广。
302、电子设备显示待标注的图像。
电子设备可以获取待标注的图像集,从图像集中获取待标注的图像,在屏幕中显示标注界面,该标注界面包括待标注的图像。
图像集可以包括一个或多个待标注的图像。图像可以包括人、物品、动物、场景等。例如,应用在自动驾驶的场景,图像集可以是车辆图像集、行人图像集、环境图像集、建筑图像集、道路图像集、天气图像集或者交通图像集中的至少一种,通过对这些图像集进行标注,后续利用已标注的图像集进行模型训练后,车辆利用模型,能够在驾驶过程中,通过实时采集的图像,精确地识别出旁边的车辆、附近的行人、所处的环境、周围的建筑、行驶的道路、当前的天气或者实时交通情况,从而感知周围的环境,以便根据环境,自动确定出驾驶策略。
在一些实施例中,车辆在驾驶过程中可以采集图像,可以将车辆采集的每个图像存储至图像库,该图像库可以包括海量的图像,该图像库可以存储在服务器上;可以采用自动或人工的方式,对图像库进行分割,得到至少一个图像包,每个图像包用于以package(包)的形式承载标注任务,一个package大约包含100~200张图片,便于标注。电子设备可以从该至少一个图像包,选择目标图像包,该目标图像包是指包括该待标注的图像集的图像包,电子设备可以从服务器下载该目标图像包,从而得到待标注的图像集。
303、当检测到对图像触发的操作时,电子设备在图像中显示目标辅助线。
在显示待标注的图像的过程中,用户可以通过对图像触发操作,来对图像进行标注,比如通过在图像上触发拖拽操作或点击操作,来绘制图像中的标注框。当电子设备检测到对图像触发的操作时,可以生成目标辅助线,在图像中的任一位置显示目标辅助线,比如,可以确定图像中检测到操作的位置,在该位置显示目标辅助线,或者,在该位置左右的预设范围内显示目标辅助线。在一个示例性场景中,当用户通过鼠标,在图像中拖拽来绘制标注框时,可以实时显示目标辅助线。
该目标辅助线用于辅助用户绘制标注框。通过在标注过程中,显示目标辅助线,用户可以根据目标辅助线来确定标注框的位置、形状和/或大小,避免标注框的位置由于操作的误差而产生偏移,帮助用户在更加精确的范围内绘制标注框,使得标注框的位置更为精确,同时提高了标注的速度。其中,如果电子设备检测到对图像持续触发的操作,可以保持显示目标辅助线。
可选地,如果电子设备超过预设时长未检测到对图像持续触发的操作,可以取消显示目标辅助线。
目标辅助线的显示过程可以包括多种实现方式,以下通过实现方式一和实现方式二进行举例说明。
实现方式一、电子设备识别该图像中物体的边缘,电子设备在该图像中该物体的边缘,显示形状与该边缘匹配的目标辅助线。
例如,电子设备可以对图像进行边缘提取,得到图像中物体的边缘。实现方式一中,目标辅助线的形状可以与物体的边缘吻合,也可以和物体的边缘存在关联关系,比如如果图像中包含人脸,人脸的边缘大致是椭圆形,则显示椭圆形的目标辅助线。
通过实现方式一,可以通过显示目标辅助线,来向标注者提示物体的边缘的形状,以便帮助标注者画出与物体边缘的形状匹配的标注框,从而让标注框的形状更加精确。尤其是,应用在语义分割领域,可以方便标注者标注图像中物体的轮廓,免去标注者人工分辨图像中每个物体的边界带来的人力成本。
实现方式二、电子设备在该图像中,显示预设形状的目标辅助线。
预设形状可以是矩形、方形、圆形等,或者根据需求被配置为其他形状。
304、电子设备检测到对目标快捷键的触发操作。
目标快捷键为当前被触发的快捷键,目标快捷键用于触发图像标注功能。目标快捷键可以通过多种触发操作来触发,下通过实现方式一至实现方式四进行举例说明。
实现方式一、电子设备检测到对单个按键的触发操作。
通过这种方式,用户对单个按键触发操作,即可为图像标注上对应的标签,达到一键标定的效果,从而极大地节省了图像标注的时间,提高了图像的标注效率。
实现方式二、电子设备检测到对按键组合的触发操作。
实现方式三、电子设备检测到对物理键盘上的按键的触发操作。
实现方式四、电子设备检测到对触摸屏中显示的虚拟键盘上的按键的触发操作。
305、电子设备查询快捷键与标签之间的映射关系,得到该目标快捷键对应的目标标签。
示例性地,参见上表1,如果用户对“enter”触发了操作,电子设备查询表1所示的映射关系,可以得到目标标签为行人。
306、电子设备向图像添加目标标签。
电子设备可以将目标标签作为图像的标注结果,自动保存目标标签,将目标标签附加到对应的图片上。
需要说明的一点是,步骤306包括向之前未添加标签的图像添加目标目标标签的情况,也包括向已经添加过标签的图像重新添加目标标签的情况。具体地,如果历史向图像标注了初始标签,可以将图像的标签从初始标签更新为目标标签。例如,图像的初始标签是“变道”,而用户对图像触发的快捷键操作对应于标签“超车”,则电子设备可以将图像的标签从“变道”修改为“超车”
通过这种方式,可以利用本实施例提出的用于图像标注的快捷键,来快捷地改变图像原有的标签,方便标注者灵活地调整标签。
在一些实施例中,本实施例可以支持快捷绘制标注框的功能,以下通过实现方式一和实现方式二进行举例说明。
实现方式一、拖拽出标注框
具体而言,如果用户从图像中的第一位置拖拽至第二位置,电子设备可以检测到对图像中从第一位置至第二位置的拖拽操作,电子设备可以根据该第一位置和该第二位置,确定第一标注框。
其中,第一位置可以是图像中的任一位置,第二位置可以是图像中与第一位置不同的任一位置。第一标注框为拖拽出的标注框,第一标注框的边界点包括该第一位置和该第二位置。例如,第一标注框的左上顶点是第一位置,第一标注框的右下顶点是第二位置。
可选地,用户可以通过鼠标,来触发从第一位置至第二位置的拖拽操作。在一个示例性场景中,如果用户通过鼠标,从图像中的点A拖拽至点B,电子设备可以确定点A的坐标和点B的坐标,确定以点A为左上顶点,以点B为右下顶点的矩形AB,将矩形AB作为标注框。
通过实现方式一,用户点击一个位置,拖拽至另一个位置后松手,这样通过两次操作即可完成一张图像的标注,可见标注方式十分快捷。
在一些实施例中,当拖拽出第一标注框后,电子设备可以向该图像中落入该第一标注框的图像区域,添加该目标标签。比如说,如果用户对“enter”触发了操作,并从图像中的点A拖拽至点B,电子设备可以向落入矩形AB中的图像区域添加标签“行人”。
实现方式二、双击出标注框
具体而言,如果用户对图像中的第三位置触发了点击操作,此后不久,又对图像中的第四位置触发了点击操作,则电子设备会检测到对该图像中第三位置的点击操作,在预设时长内,电子设备检测到对该图像中第四位置的点击操作,电子设备根据该第三位置和该第四位置,确定第二标注框。
其中,第三位置可以是图像中的任一位置,第四位置可以是图像中与第三位置不同的任一位置。第二标注框为拖拽出的标注框,第二标注框的边界点包括该第三位置和该第四位置。例如,第二标注框的左上顶点是第三位置,第二标注框的右下顶点是第四位置。
可选地,用户可以通过鼠标,来触发对第一位置和第二位置的点击操作。在一个示例性场景中,如果用户通过鼠标,先点击了图像中的点A,再点击了图像中的点B,电子设备可以确定点A的坐标和点B的坐标,确定以点A为左上顶点,以点B为右下顶点的矩形AB,将矩形AB作为标注框。
通过实现方式一,用户对图像先后点击两下,这样通过两次操作即可完成一张图像的标注,可见标注方式十分快捷。
在一些实施例中,当拖拽出第二注框后,电子设备向该图像中落入该第二标注框的图像区域,添加该目标标签。比如说,如果用户对“enter”触发了操作,并对图像中的点A和点B分别触发了点击操作,电子设备可以向落入矩形AB中的图像区域添加标签“行人”。
可选地,本实施例可以实现避免误操作的功能,以下通过实现方式一、实现方式二和实现方式三进行举例说明。
实现方式一、电子设备检测对目标快捷键的操作时长,判断操作时长是否达到时长阈值,当该操作时长达到时长阈值时,电子设备向该图像添加目标标签,当操作时长未达到时长阈值时,取消添加目标标签。
实现方式二、电子设备检测对目标快捷键的操作力度,判断操作力度是否达到力度阈值,当该操作力度达到力度阈值时,电子设备向该图像添加目标标签,当操作力度未达到力度阈值时,取消添加目标标签。
实现方式三、电子设备检测对目标快捷键的操作次数,判断操作次数是否达到次数阈值,当操作次数达到次数阈值时,电子设备向图像添加目标标签,当操作次数未达到次数阈值时,取消添加目标标签。
通过上述方式,如果用户误触碰了快捷键,当操作时长未达到时长阈值、操作力度未达到力度阈值或者操作次数未达到次数阈值时,可以避免触发添加标签的功能。
参见图4,其示出了一种标注系统的工作流程图。通过为图像标注引入快捷键,可以通过快捷键,来快捷地设置图像的标签,以及快捷地更新图像的标签。
本实施例提供了一种实现快捷标注的方法,通过将图像的各种标签与对应的快捷键绑定起来,在图像标注过程中,用户对快捷键触发操作,电子设备利用快捷键与标签之间的映射关系,即可确定出图像对应的标签,从而为图像添加标签。通过这种方式,免去了打字输入标签的繁琐过程,使得图像标注更加快捷和方便,从而提高标注的速度。尤其是,能够将指定的某一按键作为用来标注的快捷键,那么通过对单个按键触发操作,电子设备就会向图像添加上对应的标签,从而实现标注图像的功能,因此能够达到一键标定的效果,从而极大地节省了图像标注的时间,提高了图像的标注效率。
图5是本申请实施例提供的一种图像标注装置的结构示意图。参见图5,该装置包括:
显示模块501,用于显示待标注的图像;
检测模块502,用于检测到对目标快捷键的触发操作,该目标快捷键用于触发图像标注功能;
查询模块503,用于查询快捷键与标签之间的映射关系,得到该目标快捷键对应的目标标签;
添加模块504,用于向该图像添加该目标标签。
本实施例提供了一种实现快捷标注的装置,通过将图像的各种标签与对应的快捷键绑定起来,在图像标注过程中,用户对快捷键触发操作,电子设备利用快捷键与标签之间的映射关系,即可确定出图像对应的标签,从而为图像添加标签。通过这种方式,免去了打字输入标签的繁琐过程,使得图像标注更加快捷和方便,从而提高标注的速度。尤其是,能够将指定的某一按键作为用来标注的快捷键,那么通过对单个按键触发操作,电子设备就会向图像添加上对应的标签,从而实现标注图像的功能,因此能够达到一键标定的效果,从而极大地节省了图像标注的时间,提高了图像的标注效率。
可选地,该检测模块502,还用于检测到对该图像中从第一位置至第二位置的拖拽操作;
该装置还包括:确定模块,用于根据该第一位置和该第二位置,确定第一标注框。
可选地,该添加模块504,用于向该图像中落入该第一标注框的图像区域,添加该目标标签,该第一标注框的边界点包括该第一位置和该第二位置,
可选地,该检测模块502,还用于检测到对该图像中第三位置的点击操作,在预设时长内,检测到对该图像中第四位置的点击操作;
该装置还包括:确定模块,用于根据该第三位置和该第四位置,确定第二标注框。
可选地,该添加模块504,用于向该图像中落入该第二标注框的图像区域,添加该目标标签,该第二标注框的边界点包括该第三位置和该第四位置。
可选地,该显示模块501,还用于当检测到对该图像触发的操作时,在该图像中显示目标辅助线,该目标辅助线用于辅助用户绘制标注框。
可选地,该装置还包括:识别模块,用于识别该图像中物体的边缘;
该显示模块501,还用于在该图像中该物体的边缘,显示形状与该边缘匹配的目标辅助线。
可选地,该显示模块501,用于在该图像中,显示预设形状的目标辅助线。
可选地,该显示模块501,还用于显示配置界面,该配置界面包括快捷键选项以及标签选项;
该检测模块502,还用于检测对该快捷键选项触发的第一操作,检测对该标签选项触发的第二操作;
该装置还包括:建立模块,用于根据该第一操作对应的快捷键与该第二操作对应的标签,建立该快捷键与标签之间的映射关系。
可选地,该检测模块502,用于检测到对单个按键的触发操作。
可选地,该检测模块502,用于检测到对按键组合的触发操作。
可选地,该检测模块502,用于检测到对物理键盘上的按键的触发操作。
可选地,该检测模块502,用于检测到对触摸屏中显示的虚拟键盘上的按键的触发操作。
可选地,检测模块502,还用于检测对目标快捷键的操作时长;添加模块504,用于当操作时长达到时长阈值时,向该图像添加目标标签。
可选地,检测模块502,还用于检测对目标快捷键的操作力度;添加模块504,用于当操作力度达到力度阈值时,向图像添加目标标签。
可选地,检测模块502,还用于检测对目标快捷键的操作次数;添加模块504,用于当操作次数达到次数阈值时,向图像添加目标标签。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的图像标注装置在标注图像时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将图像标注装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像标注装置与图像标注的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述方法实施例中的电子设备可以实现为终端,例如,图6示出了本申请一个示例性实施例提供的终端600的结构框图。该终端600可以是:智能手机、平板电脑、MP3(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端600还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端600包括有:一个或多个处理器601和一个或多个存储器602。
处理器601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器601可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个程序代码,该至少一个程序代码用于被处理器601所执行以实现本申请中方法实施例提供的图像标注方法。
在一些实施例中,终端600还可选包括有:外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地,外围设备包括:射频电路604、触摸显示屏605、摄像头组件606、音频电路607、定位组件608和电源609中的至少一种。
外围设备接口603可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中,处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上;在一些其他实施例中,处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路604用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路604包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路604还可以包括NFC(Near FieldCommunication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏605用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时,显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时,显示屏605还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏605可以为一个,设置终端600的前面板;在另一些实施例中,显示屏605可以为至少两个,分别设置在终端600的不同表面或呈折叠设计;在再一些实施例中,显示屏605可以是柔性显示屏,设置在终端600的弯曲表面上或折叠面上。甚至,显示屏605还可以设置成非矩形的不规则图形,也即异形屏。显示屏605可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(OrganicLight-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件606用于采集图像或视频。可选地,摄像头组件606包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器601进行处理,或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路607还可以包括耳机插孔。
定位组件608用于定位终端600的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件608可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源609用于为终端600中的各个组件进行供电。电源609可以是交流电、直流电、一次性电池或可充电电池。当电源609包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端600还包括有一个或多个传感器610。该一个或多个传感器610包括但不限于:加速度传感器611、陀螺仪传感器612、压力传感器613、指纹传感器614、光学传感器615以及接近传感器616。
加速度传感器611可以检测以终端600建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器611可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器611采集的重力加速度信号,控制触摸显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器611还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器612可以检测终端600的机体方向及转动角度,陀螺仪传感器612可以与加速度传感器611协同采集用户对终端600的3D动作。处理器601根据陀螺仪传感器612采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器613可以设置在终端600的侧边框和/或触摸显示屏605的下层。当压力传感器613设置在终端600的侧边框时,可以检测用户对终端600的握持信号,由处理器601根据压力传感器613采集的握持信号进行左右手识别或快捷操作。当压力传感器613设置在触摸显示屏605的下层时,由处理器601根据用户对触摸显示屏605的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器614用于采集用户的指纹,由处理器601根据指纹传感器614采集到的指纹识别用户的身份,或者,由指纹传感器614根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器601授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器614可以被设置终端600的正面、背面或侧面。当终端600上设置有物理按键或厂商Logo时,指纹传感器614可以与物理按键或厂商Logo集成在一起。
光学传感器615用于采集环境光强度。在一个实施例中,处理器601可以根据光学传感器615采集的环境光强度,控制触摸显示屏605的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏605的显示亮度;当环境光强度较低时,调低触摸显示屏605的显示亮度。在另一个实施例中,处理器601还可以根据光学传感器615采集的环境光强度,动态调整摄像头组件606的拍摄参数。
接近传感器616,也称距离传感器,通常设置在终端600的前面板。接近传感器616用于采集用户与终端600的正面之间的距离。在一个实施例中,当接近传感器616检测到用户与终端600的正面之间的距离逐渐变小时,由处理器601控制触摸显示屏605从亮屏状态切换为息屏状态;当接近传感器616检测到用户与终端600的正面之间的距离逐渐变大时,由处理器601控制触摸显示屏605从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图6中示出的结构并不构成对终端600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
上述方法实施例中的电子设备可以实现为服务器,例如,图7是本申请实施例提供的一种服务器的结构示意图,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)701和一个或一个以上的存储器702,其中,该存储器702中存储有至少一条程序代码,该至少一条程序代码由该处理器701加载并执行以实现上述各个方法实施例提供的图像标注方法。当然,该服务器还可以具有有线或无线网络接口以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括程序代码的存储器,上述程序代码可由处理器执行以完成上述实施例中的图像标注方法。例如,计算机可读存储介质可以是只读存储器(Read-Only Memory,简称:ROM)、随机存取存储器(RandomAccess Memory,简称:RAM)、只读光盘(Compact Disc Read-Only Memory,简称:CD-ROM)、磁带、软盘和光数据存储设备等。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种图像标注方法,其特征在于,所述方法包括:
显示待标注的图像;
检测到对目标快捷键的触发操作,所述目标快捷键用于触发图像标注功能;
查询快捷键与标签之间的映射关系,得到所述目标快捷键对应的目标标签;
向所述图像添加所述目标标签。
2.根据权利要求1所述的方法,其特征在于,所述向所述图像添加所述目标标签,包括:
检测到对所述图像中从第一位置至第二位置的拖拽操作,根据所述第一位置和所述第二位置,确定第一标注框,向所述图像中落入所述第一标注框的图像区域,添加所述目标标签,所述第一标注框的边界点包括所述第一位置和所述第二位置;或者,
检测到对所述图像中第三位置的点击操作,在预设时长内,检测到对所述图像中第四位置的点击操作,根据所述第三位置和所述第四位置,确定第二标注框,向所述图像中落入所述第二标注框的图像区域,添加所述目标标签,所述第二标注框的边界点包括所述第三位置和所述第四位置。
3.根据权利要求1所述的方法,其特征在于,所述显示待标注的图像之后,所述方法还包括:
当检测到对所述图像触发的操作时,在所述图像中显示目标辅助线,所述目标辅助线用于辅助用户绘制标注框。
4.根据权利要求3所述的方法,其特征在于,所述在所述图像中显示目标辅助线,包括:
识别所述图像中物体的边缘,在所述图像中所述物体的边缘,显示形状与所述边缘匹配的目标辅助线;或者,
在所述图像中,显示预设形状的目标辅助线。
5.根据权利要求1所述的方法,其特征在于,所述查询快捷键与标签之间的映射关系,得到所述目标快捷键对应的目标标签之前,所述方法还包括:
显示配置界面,所述配置界面包括快捷键选项以及标签选项;
检测对所述快捷键选项触发的第一操作,检测对所述标签选项触发的第二操作;
根据所述第一操作对应的快捷键与所述第二操作对应的标签,建立所述快捷键与标签之间的映射关系。
6.根据权利要求1所述的方法,其特征在于,所述检测到对目标快捷键的触发操作,包括:
检测到对单个按键的触发操作;或者,
检测到对按键组合的触发操作;或者,
检测到对物理键盘上的按键的触发操作;或者,
检测到对触摸屏中显示的虚拟键盘上的按键的触发操作。
7.根据权利要求1所述的方法,其特征在于,所述向所述图像添加所述目标标签,包括:
检测对所述目标快捷键的操作时长,当所述操作时长达到时长阈值时,向所述图像添加所述目标标签;或者,
检测对所述目标快捷键的操作力度,当所述操作力度达到力度阈值时,向所述图像添加所述目标标签;或者,
检测对所述目标快捷键的操作次数,当所述操作次数达到次数阈值时,向所述图像添加所述目标标签。
8.一种图像标注装置,其特征在于,所述装置包括:
显示模块,用于显示待标注的图像;
检测模块,用于检测到对目标快捷键的触发操作,所述目标快捷键用于触发图像标注功能;
查询模块,用于查询快捷键与标签之间的映射关系,得到所述目标快捷键对应的目标标签;
添加模块,用于向所述图像添加所述目标标签。
9.一种电子设备,其特征在于,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求7任一项所述的图像标注方法所执行的操作。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的图像标注方法所执行的操作。
CN201911100285.5A 2019-11-12 2019-11-12 图像标注方法、装置、设备及存储介质 Active CN110865756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911100285.5A CN110865756B (zh) 2019-11-12 2019-11-12 图像标注方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911100285.5A CN110865756B (zh) 2019-11-12 2019-11-12 图像标注方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110865756A true CN110865756A (zh) 2020-03-06
CN110865756B CN110865756B (zh) 2022-07-15

Family

ID=69654383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911100285.5A Active CN110865756B (zh) 2019-11-12 2019-11-12 图像标注方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110865756B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639705A (zh) * 2020-05-29 2020-09-08 江苏云从曦和人工智能有限公司 一种批量图片标注方法、系统、机器可读介质及设备
CN111753922A (zh) * 2020-06-30 2020-10-09 北京联想软件有限公司 一种模型训练标签的处理方法、装置及电子设备
CN112967359A (zh) * 2021-03-30 2021-06-15 深圳市优必选科技股份有限公司 数据标注方法、装置、终端设备及存储介质
CN113420753A (zh) * 2021-07-13 2021-09-21 杭州海康威视数字技术股份有限公司 目标对象框选区域的生成方法及装置
CN113556596A (zh) * 2021-07-01 2021-10-26 深圳创维-Rgb电子有限公司 快捷键控制方法、装置、设备及存储介质
CN114092709A (zh) * 2021-11-23 2022-02-25 北京百度网讯科技有限公司 一种识别图像中目标轮廓的方法、装置、设备及存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065300A (zh) * 2012-12-24 2013-04-24 安科智慧城市技术(中国)有限公司 一种视频标注方法和装置
KR20150020448A (ko) * 2013-08-14 2015-02-26 (주)웅진씽크빅 콘텐츠 제공 시스템 및 방법
CN104780194A (zh) * 2014-01-13 2015-07-15 广达电脑股份有限公司 互动系统和互动方法
CN105205827A (zh) * 2015-10-16 2015-12-30 中科院成都信息技术股份有限公司 用于统计形状模型的特征点辅助标注方法
CN106796609A (zh) * 2014-12-19 2017-05-31 三星电子株式会社 提供内容的方法及执行该方法的电子装置
US20170323312A1 (en) * 2011-07-20 2017-11-09 ReadyPulse, Inc. System and method for brand management using social networks
CN108182443A (zh) * 2016-12-08 2018-06-19 广东精点数据科技股份有限公司 一种基于决策树的图像自动标注方法和装置
KR20180092455A (ko) * 2017-02-09 2018-08-20 한국기술교육대학교 산학협력단 딥 러닝을 이용한 카드번호 인식방법
CN109033394A (zh) * 2018-08-01 2018-12-18 浙江深眸科技有限公司 用于图片视频标注数据的客户端
CN109241907A (zh) * 2018-09-03 2019-01-18 北京旷视科技有限公司 标注方法、装置及电子设备
JP2019109715A (ja) * 2017-12-18 2019-07-04 株式会社プリマジェスト 情報処理装置及び情報処理方法
CN110020279A (zh) * 2017-09-08 2019-07-16 腾讯科技(深圳)有限公司 页面数据处理方法、装置及存储介质
CN110136273A (zh) * 2019-03-29 2019-08-16 初速度(苏州)科技有限公司 一种用于机器学习中的样本数据标注方法及装置
CN110176078A (zh) * 2019-05-26 2019-08-27 初速度(苏州)科技有限公司 一种训练集数据的标注方法及装置
CN110390240A (zh) * 2018-04-18 2019-10-29 百度(美国)有限责任公司 自动驾驶车辆中的车道后处理

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170323312A1 (en) * 2011-07-20 2017-11-09 ReadyPulse, Inc. System and method for brand management using social networks
CN103065300A (zh) * 2012-12-24 2013-04-24 安科智慧城市技术(中国)有限公司 一种视频标注方法和装置
KR20150020448A (ko) * 2013-08-14 2015-02-26 (주)웅진씽크빅 콘텐츠 제공 시스템 및 방법
CN104780194A (zh) * 2014-01-13 2015-07-15 广达电脑股份有限公司 互动系统和互动方法
CN106796609A (zh) * 2014-12-19 2017-05-31 三星电子株式会社 提供内容的方法及执行该方法的电子装置
CN105205827A (zh) * 2015-10-16 2015-12-30 中科院成都信息技术股份有限公司 用于统计形状模型的特征点辅助标注方法
CN108182443A (zh) * 2016-12-08 2018-06-19 广东精点数据科技股份有限公司 一种基于决策树的图像自动标注方法和装置
KR20180092455A (ko) * 2017-02-09 2018-08-20 한국기술교육대학교 산학협력단 딥 러닝을 이용한 카드번호 인식방법
CN110020279A (zh) * 2017-09-08 2019-07-16 腾讯科技(深圳)有限公司 页面数据处理方法、装置及存储介质
JP2019109715A (ja) * 2017-12-18 2019-07-04 株式会社プリマジェスト 情報処理装置及び情報処理方法
CN110390240A (zh) * 2018-04-18 2019-10-29 百度(美国)有限责任公司 自动驾驶车辆中的车道后处理
CN109033394A (zh) * 2018-08-01 2018-12-18 浙江深眸科技有限公司 用于图片视频标注数据的客户端
CN109241907A (zh) * 2018-09-03 2019-01-18 北京旷视科技有限公司 标注方法、装置及电子设备
CN110136273A (zh) * 2019-03-29 2019-08-16 初速度(苏州)科技有限公司 一种用于机器学习中的样本数据标注方法及装置
CN110176078A (zh) * 2019-05-26 2019-08-27 初速度(苏州)科技有限公司 一种训练集数据的标注方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FUZONGJIAN: "LabelPicture", 《GITHUB, HTTPS://GITHUB.COM/FUZONGJIAN/LABELPICTURE》 *
徐勇 等: "图像自动标注方法研究综述", 《现代情报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639705A (zh) * 2020-05-29 2020-09-08 江苏云从曦和人工智能有限公司 一种批量图片标注方法、系统、机器可读介质及设备
CN111639705B (zh) * 2020-05-29 2021-06-29 江苏云从曦和人工智能有限公司 一种批量图片标注方法、系统、机器可读介质及设备
CN111753922A (zh) * 2020-06-30 2020-10-09 北京联想软件有限公司 一种模型训练标签的处理方法、装置及电子设备
CN112967359A (zh) * 2021-03-30 2021-06-15 深圳市优必选科技股份有限公司 数据标注方法、装置、终端设备及存储介质
CN112967359B (zh) * 2021-03-30 2023-12-19 深圳市优必选科技股份有限公司 数据标注方法、装置、终端设备及存储介质
CN113556596A (zh) * 2021-07-01 2021-10-26 深圳创维-Rgb电子有限公司 快捷键控制方法、装置、设备及存储介质
CN113420753A (zh) * 2021-07-13 2021-09-21 杭州海康威视数字技术股份有限公司 目标对象框选区域的生成方法及装置
CN113420753B (zh) * 2021-07-13 2024-01-05 杭州海康威视数字技术股份有限公司 目标对象框选区域的生成方法及装置
CN114092709A (zh) * 2021-11-23 2022-02-25 北京百度网讯科技有限公司 一种识别图像中目标轮廓的方法、装置、设备及存储介质
CN114092709B (zh) * 2021-11-23 2023-10-31 北京百度网讯科技有限公司 一种识别图像中目标轮廓的方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110865756B (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
CN110865756B (zh) 图像标注方法、装置、设备及存储介质
CN110490179B (zh) 车牌识别方法、装置及存储介质
CN110991491A (zh) 图像标注方法、装置、设备及存储介质
CN111125442B (zh) 数据标注方法及装置
CN110908784B (zh) 图像标注方法、装置、设备及存储介质
CN108958634A (zh) 快递信息获取方法、装置、移动终端以及存储介质
CN111311155A (zh) 修改配送位置的方法、装置、系统、设备以及存储介质
CN110991260B (zh) 场景标注方法、装置、设备及存储介质
CN112749362A (zh) 控件创建方法、装置、设备及存储介质
CN113205515B (zh) 目标检测方法、装置、及计算机存储介质
CN111754564B (zh) 视频展示方法、装置、设备及存储介质
CN112053360A (zh) 图像分割方法、装置、计算机设备及存储介质
CN111275607A (zh) 界面显示方法、装置、计算机设备及存储介质
CN113204302B (zh) 基于虚拟机器人的操作方法、装置、设备及存储介质
CN113378705B (zh) 车道线检测方法、装置、设备及存储介质
CN113051485B (zh) 群组搜索方法、装置、终端及存储介质
CN113343709B (zh) 意图识别模型的训练方法、意图识别方法、装置及设备
CN114329292A (zh) 资源信息的配置方法、装置、电子设备以及存储介质
CN114283395A (zh) 车道线检测的方法、装置、设备及计算机可读存储介质
CN112699906B (zh) 获取训练数据的方法、装置及存储介质
CN114118236A (zh) 训练智能模型的方法及装置
CN111429106A (zh) 资源转移凭证的处理方法、服务器、电子设备及存储介质
CN112990424A (zh) 神经网络模型训练的方法和装置
CN110458289B (zh) 多媒体分类模型的构建方法、多媒体分类方法及装置
CN112804481B (zh) 监控点位置的确定方法、装置及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200612

Address after: 215100 16 / F, Lingyu Business Plaza, 66 qinglonggang Road, high speed rail new town, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant after: SUZHOU ZHIJIA TECHNOLOGY Co.,Ltd.

Applicant after: Zhijia (Cayman) Co.

Applicant after: Zhijia (USA)

Address before: 215100 16 / F, Lingyu Business Plaza, 66 qinglonggang Road, high speed rail new town, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant before: SUZHOU ZHIJIA TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210309

Address after: 16 / F, Lingyu Business Plaza, 66 qinglonggang Road, high speed rail new town, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant after: SUZHOU ZHIJIA TECHNOLOGY Co.,Ltd.

Applicant after: Zhijia (USA)

Address before: 215100 16 / F, Lingyu Business Plaza, 66 qinglonggang Road, high speed rail new town, Xiangcheng District, Suzhou City, Jiangsu Province

Applicant before: SUZHOU ZHIJIA TECHNOLOGY Co.,Ltd.

Applicant before: Zhijia (Cayman) Co.

Applicant before: Zhijia (USA)

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant