CN111914672A - 图像标注方法和装置及存储介质 - Google Patents

图像标注方法和装置及存储介质 Download PDF

Info

Publication number
CN111914672A
CN111914672A CN202010653158.4A CN202010653158A CN111914672A CN 111914672 A CN111914672 A CN 111914672A CN 202010653158 A CN202010653158 A CN 202010653158A CN 111914672 A CN111914672 A CN 111914672A
Authority
CN
China
Prior art keywords
image
target
type
information
infrared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010653158.4A
Other languages
English (en)
Other versions
CN111914672B (zh
Inventor
袁雷
魏乃科
潘华东
殷俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202010653158.4A priority Critical patent/CN111914672B/zh
Publication of CN111914672A publication Critical patent/CN111914672A/zh
Application granted granted Critical
Publication of CN111914672B publication Critical patent/CN111914672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明公开了一种图像标注方法和装置及存储介质。其中,该方法包括:获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像;根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置。本发明解决了图像标注的效率较低的技术问题。

Description

图像标注方法和装置及存储介质
技术领域
本发明涉及电子硬件领域,具体而言,涉及一种图像标注方法和装置及存储介质。
背景技术
近年来图像分析技术领域中的图像处理技术,应用越发广泛,例如图像处理技术中的人体关键点检测技术,用于准确地估计出图片或视频中的人体n个主要关键点,如左右手肘、左右手腕、左右肩膀、头、脖子、左右脚踝、左右膝盖、左右臀和脚掌等,进而判断人体的状态,人体的姿势等。但现有技术中的人体关键点标注技术多通过手工标注或半自动标注等方式进行人体关键点标注,其中,手工标注工作量巨大,效率自然低下,而半自动标注,对图像的污染又较为严重,无法保证图像的纯净性。换言之,现有技术中缺少一种兼顾保证图像的纯净性,又能高效地自动或半自动标注关键点的技术方案。因此,现有技术存在图像标注的效率较低的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种图像标注方法和装置及存储介质,以至少解决图像标注的效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种图像标注方法,包括:获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,上述第一类型图像与上述第二类型图像中均显示有上述目标对象,上述第一类型图像是上述目标设备中的第一类型器件对上述目标对象拍摄得到的图像,上述第二类型图像是上述目标设备中的第二类型器件对上述目标对象拍摄得到的图像,上述第二类型图像中还显示有目标感测信息,上述目标感测信息是上述第二类型器件对在上述目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,上述目标感测部件被设置为无法被上述第一类型器件拍摄到;根据上述目标感测信息,在上述第二类型图像中确定第一位置和上述第一位置上的第一标注信息,其中,上述第一位置用于表示上述目标部位所在的位置;在上述第一类型图像中确定与上述第一位置具有映射关系的第二位置,并在上述第二位置与上述第一标注信息之间建立对应关系,其中,上述第二位置用于表示上述目标部位所在的位置。
作为一种可选的方案,上述获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,包括:获取上述目标设备对上述目标对象拍摄所同时得到的RGB图像和红外图像,其中,上述第一类型图像为上述RGB图像,上述第二类型图像为上述红外图像。
作为一种可选的方案,上述获取上述目标设备对上述目标对象拍摄所同时得到的RGB图像和红外图像,包括:获取上述目标设备对安装有红外LED灯的上述目标对象拍摄所同时得到的上述RGB图像和上述红外图像,其中,上述红外LED灯安装在上述目标对象的上述目标部位上,上述红外LED灯被设置为无法被上述第一类型器件拍摄到,上述目标感测部件包括上述红外LED灯。
作为一种可选的方案,上述获取上述目标设备对安装有红外LED灯的上述目标对象拍摄所同时得到的上述RGB图像和上述红外图像,包括:获取RGB红外双通道图像采集器对安装有上述红外LED灯的上述目标对象拍摄所同时得到的上述RGB图像和上述红外图像,其中,上述目标设备包括上述RGB红外双通道图像采集器,上述RGB图像是上述RGB红外双通道图像采集器中的RGB通道图像采集器件对上述目标对象拍摄得到的图像,上述红外图像是上述RGB红外双通道图像采集器中的红外通道图像采集器件对上述目标对象拍摄得到的图像。
作为一种可选的方案,上述根据上述目标感测信息,在上述第二类型图像中确定上述第一位置上的第一标注信息,包括:在上述第二类型图像包括多帧图像、上述目标感测信息包括上述多帧图像中的每帧图像中显示的感测信息的情况下,根据上述多帧图像中显示的感测信息共同表示的编码信息,确定上述第一位置上的目标类型信息,其中,上述目标类型信息用于表示上述目标部位的部位类型,上述目标类型信息为上述编码信息所表示的类型信息。
作为一种可选的方案,上述根据上述多帧图像中显示的感测信息共同表示的编码信息,确定上述第一位置上的目标类型信息,包括:在上述第二类型图像为红外图像、上述目标感测部件包括红外LED灯、且上述每帧图像中显示的感测信息用于表示红外LED灯亮起或熄灭的情况下,根据上述多帧图像中显示的感测信息共同表示的上述红外LED灯的编码信息,确定上述第一位置上的目标类型信息。
作为一种可选的方案,在上述获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像之前,包括:在上述目标对象的第一部位上安装第一感测部件;在上述目标对象的第二部位上安装第二感测部件,其中,上述目标部位包括上述第一部位以及上述第二部位,上述目标感测部件包括上述第一感测部件以及上述第二感测部件。
作为一种可选的方案,在上述第一类型图像中确定与上述第一位置具有映射关系的第二位置,并在上述第二位置与上述第一标注信息之间建立对应关系之后,还包括:将上述第一类型图像与上述第一标注信息输入当前图像识别神经网络,其中,上述当前图像识别神经网络用于预测上述第一类型图像中上述目标部位所在的位置;获取当前上述图像识别神经网络输出的当前训练结果,其中,上述当前训练结果用于表示上述目标样本图像的预测位置;比对上述第一标注信息相对应的上述第二位置与上述预测位置,获得比对结果;在比对结果达到收敛条件的情况下,确定上述当前图像识别神经网络训练完成。
根据本发明实施例的另一方面,还提供了一种图像标注装置,包括:第一获取单元,用于获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,上述第一类型图像与上述第二类型图像中均显示有上述目标对象,上述第一类型图像是上述目标设备中的第一类型器件对上述目标对象拍摄得到的图像,上述第二类型图像是上述目标设备中的第二类型器件对上述目标对象拍摄得到的图像,上述第二类型图像中还显示有目标感测信息,上述目标感测信息是上述第二类型器件对在上述目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,上述目标感测部件被设置为无法被上述第一类型器件拍摄到;第一确定单元,用于根据上述目标感测信息,在上述第二类型图像中确定第一位置和上述第一位置上的第一标注信息,其中,上述第一位置用于表示上述目标部位所在的位置;第二确定单元,用于在上述第一类型图像中确定与上述第一位置具有映射关系的第二位置,并在上述第二位置与上述第一标注信息之间建立对应关系,其中,上述第二位置用于表示上述目标部位所在的位置。
作为一种可选的方案,上述第一获取单元,包括:获取模块,用于获取上述目标设备对上述目标对象拍摄所同时得到的RGB图像和红外图像,其中,上述第一类型图像为上述RGB图像,上述第二类型图像为上述红外图像。
作为一种可选的方案,上述获取模块,包括:获取子模块,用于获取上述目标设备对安装有红外LED灯的上述目标对象拍摄所同时得到的上述RGB图像和上述红外图像,其中,上述红外LED灯安装在上述目标对象的上述目标部位上,上述红外LED灯被设置为无法被上述第一类型器件拍摄到,上述目标感测部件包括上述红外LED灯。
作为一种可选的方案,上述获取子模块,包括:获取子单元,用于获取RGB红外双通道图像采集器对安装有上述红外LED灯的上述目标对象拍摄所同时得到的上述RGB图像和上述红外图像,其中,上述目标设备包括上述RGB红外双通道图像采集器,上述RGB图像是上述RGB红外双通道图像采集器中的RGB通道图像采集器件对上述目标对象拍摄得到的图像,上述红外图像是上述RGB红外双通道图像采集器中的红外通道图像采集器件对上述目标对象拍摄得到的图像。
作为一种可选的方案,上述第一确定单元,包括:确定模块,用于在上述第二类型图像包括多帧图像、上述目标感测信息包括上述多帧图像中的每帧图像中显示的感测信息的情况下,根据上述多帧图像中显示的感测信息共同表示的编码信息,确定上述第一位置上的目标类型信息,其中,上述目标类型信息用于表示上述目标部位的部位类型,上述目标类型信息为上述编码信息所表示的类型信息。
作为一种可选的方案,上述确定模块,包括:确定子模块,用于在上述第二类型图像为红外图像、上述目标感测部件包括红外LED灯、且上述每帧图像中显示的感测信息用于表示红外LED灯亮起或熄灭的情况下,根据上述多帧图像中显示的感测信息共同表示的上述红外LED灯的编码信息,确定上述第一位置上的目标类型信息。
作为一种可选的方案,包括:第一安装单元,用于在上述获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像之前,在上述目标对象的第一部位上安装第一感测部件;第二安装单元,用于在上述获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像之前,在上述目标对象的第二部位上安装第二感测部件,其中,上述目标部位包括上述第一部位以及上述第二部位,上述目标感测部件包括上述第一感测部件以及上述第二感测部件。
作为一种可选的方案,还包括:输入单元,用于在上述第一类型图像中确定与上述第一位置具有映射关系的第二位置,并在上述第二位置与上述第一标注信息之间建立对应关系之后,将上述第一类型图像与上述第一标注信息输入当前图像识别神经网络,其中,上述当前图像识别神经网络用于预测上述第一类型图像中上述目标部位所在的位置;第二获取单元,用于在上述第一类型图像中确定与上述第一位置具有映射关系的第二位置,并在上述第二位置与上述第一标注信息之间建立对应关系之后,获取当前上述图像识别神经网络输出的当前训练结果,其中,上述当前训练结果用于表示上述目标样本图像的预测位置;比对单元,用于在上述第一类型图像中确定与上述第一位置具有映射关系的第二位置,并在上述第二位置与上述第一标注信息之间建立对应关系之后,比对上述第一标注信息相对应的上述第二位置与上述预测位置,获得比对结果;第三确定单元,用于在上述第一类型图像中确定与上述第一位置具有映射关系的第二位置,并在上述第二位置与上述第一标注信息之间建立对应关系之后,在比对结果达到收敛条件的情况下,确定上述当前图像识别神经网络训练完成。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述图像标注方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的图像标注方法。
在本发明实施例中,获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,上述第一类型图像与上述第二类型图像中均显示有上述目标对象,上述第一类型图像是上述目标设备中的第一类型器件对上述目标对象拍摄得到的图像,上述第二类型图像是上述目标设备中的第二类型器件对上述目标对象拍摄得到的图像,上述第二类型图像中还显示有目标感测信息,上述目标感测信息是上述第二类型器件对在上述目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,上述目标感测部件被设置为无法被上述第一类型器件拍摄到;根据上述目标感测信息,在上述第二类型图像中确定第一位置和上述第一位置上的第一标注信息,其中,上述第一位置用于表示上述目标部位所在的位置;在上述第一类型图像中确定与上述第一位置具有映射关系的第二位置,并在上述第二位置与上述第一标注信息之间建立对应关系,其中,上述第二位置用于表示上述目标部位所在的位置,通过同时获取用于表示目标对象的拍摄图像的两种类型的图像,并将其中一种洁净但无标注信息的图像,与另一种不洁净但有标准信息的图像想结合,以获得洁净的图像并携带有标准信息的图像数据,进而达到了兼顾了保证图像的清洁度以及实现图像的自动标注的目的,从而实现了提高图像标注的效率的技术效果,进而解决了图像标注的效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的图像标注方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的图像标注方法的流程图的示意图;
图3是根据本发明实施例的一种可选的图像标注方法的示意图;
图4是根据本发明实施例的另一种可选的图像标注方法的示意图;
图5是根据本发明实施例的另一种可选的图像标注方法的示意图;
图6是根据本发明实施例的另一种可选的图像标注方法的示意图;
图7是根据本发明实施例的另一种可选的图像标注方法的流程图的示意图;
图8是根据本发明实施例的另一种可选的图像标注方法的示意图;
图9是根据本发明实施例的一种可选的图像标注装置的示意图;
图10是根据本发明实施例的一种可选的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种图像标注方法,可选地,作为一种可选的实施方式,上述图像标注方法可以但不限于应用于如图1所示的环境中。其中,可以但不限于包括用户设备102、网络110及服务器112,其中,该用户设备102上可以但不限于包括显示器108、处理器106及存储器104,显示器108可以但不限用于显示第一类型图像1022、第二类型图像1024以及第二类型图像1024上的目标感测信息1026。
具体过程可如下步骤:步骤S102,用户设备102通过拍摄目标对象(图中以图像的形式表示)采集到的第一类型图像1022以及第二类型图像1024,其中,第二类型图像1024包括目标感测信息1026,而第一类型图像1022不包括任何与图像无关的冗余特征,目标感测信息1026用于表示目标部位的位置以及类型信息;
步骤S104-S106,用户设备102通过网络110将第一类型图像1022、第二类型图像1024以及目标感测信息1026发送给服务器112;
步骤S108,服务器112通过数据库114以及处理引擎116将目标感测信息1026进行处理,得到用于表示在第二类型图像1024上目标部位的位置以及类型的第一位置,从而根据标识信息生成标识结果,其中,标识结果用于指示在第一类型图像1022上标识目标部位的第二位置;
步骤S110-S112,服务器112通过网络110将标识结果发送给用户设备102,用户设备102中的处理器106根据标识结果,将洁净但携带有第二位置相关信息的第二类型图像1024显示在显示器108中,并将洁净但携带有第二位置相关信息的第二类型图像1024存储在存储器104中,以供后续使用。
可选地,作为一种可选的实施方式,如图2所示,图像标注方法包括:
S202,获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,第一类型图像与第二类型图像中均显示有目标对象,第一类型图像是目标设备中的第一类型器件对目标对象拍摄得到的图像,第二类型图像是目标设备中的第二类型器件对目标对象拍摄得到的图像,第二类型图像中还显示有目标感测信息,目标感测信息是第二类型器件对在目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,目标感测部件被设置为无法被第一类型器件拍摄到;
S204,根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;
S206,在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置。
可选的,图像标注方法可以但不限于应用在样本图像数据的获取场景下,其中,样本图像数据可以但不限于为携带有标注信息的图像数据,样本图像数据可以但不限用于训练目标神经网络模型,目标神经网络模型可以但不限用于输出图像中关键部位的标识信息。目标设备可以但不限于为可采集图像的拍摄设备,例如摄像头、摄像机、相机、扫描仪等,此外,目标设备可以但不限用于通过多种采集通道,以同时或不同时地采集多种类型的图像,例如真彩色RGB图像、红外图像、二值图像、灰度图像、索引图像等。不同类型器件可以但不限于包括不同类型的采集通道,例如通过红外通道图像采集器,以采集红外图像,通过RGB通道图像采集器,以采集RGB图像。目标感测部件可以但不限于为对应类型的采集通道才能采集到的拍摄信息,例如目标感测部件为安装在不透光的遮挡物下的LED灯,则通过RGB通道图像采集器无法采集到目标感测部件发出的灯光,但通过红外通道图像采集器则可以采集到目标感测部件发出的灯光;再或者,目标感测部件为温度与目标对象可形成明显差异的,以及安装在不透光的遮挡物下的某类物体,则通过RGB通道图像采集器无法采集到目标感测部件的位置,但通过红外通道图像采集器则可以采集到目标感测部件与目标对象不一样的温度,以获得目标感测部件的位置。第一标注信息可以但不限于包括目标感测部件在目标对象的位置信息(例如坐标信息),以及与目标感测部件位置相同的目标部位的类型信息(例如关键点类型),例如目标感测部件在目标坐标处,关键点类型为手掌。
需要说明的是,获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,第一类型图像与第二类型图像中均显示有目标对象,第一类型图像是目标设备中的第一类型器件对目标对象拍摄得到的图像,第二类型图像是目标设备中的第二类型器件对目标对象拍摄得到的图像,第二类型图像中还显示有目标感测信息,目标感测信息是第二类型器件对在目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,目标感测部件被设置为无法被第一类型器件拍摄到;根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置。
进一步举例说明,可选的例如图3所示,包括目标对象302,其中,目标对象302身上的目标部位处安装有目标感测部件304,通过目标设备(图中未示出)拍摄目标图像302获取到的第一类型图像306以及第二类型图像,其中,第一类型图像306上不显示目标感测部件304,而第二类型图像308上显示目标感测部件304。
进一步举例说明,可选的例如图4所示,获取第二类型图像308中的目标感测信息402,其中,目标感测信息402包括在第二类型图像308上显示目标感测部件304的位置信息。
通过本申请提供的实施例,获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,第一类型图像与第二类型图像中均显示有目标对象,第一类型图像是目标设备中的第一类型器件对目标对象拍摄得到的图像,第二类型图像是目标设备中的第二类型器件对目标对象拍摄得到的图像,第二类型图像中还显示有目标感测信息,目标感测信息是第二类型器件对在目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,目标感测部件被设置为无法被第一类型器件拍摄到;根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置,通过同时获取用于表示目标对象的拍摄图像的两种类型的图像,并将其中一种洁净但无标注信息的图像,与另一种不洁净但有标准信息的图像想结合,以获得洁净的图像并携带有标准信息的图像数据,进而达到了兼顾了保证图像的清洁度以及实现图像的自动标注的目的,从而实现了提高图像标注的效率的技术效果。
作为一种可选的方案,获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,包括:
获取目标设备对目标对象拍摄所同时得到的RGB图像和红外图像,其中,第一类型图像为RGB图像,第二类型图像为红外图像。
可选的,RGB可以但不限于标识红、绿、蓝三个通道的颜色,RGB图像可以但不限包括了人类实例所能感知的所有颜色图像,是运用最广的颜色图像系统之一。红外图像可以但不限于为利用探测仪测量目标对象本身与背景间的红外线差得到不同热红外线形成的红外图像。
需要说明的是,获取目标设备对目标对象拍摄所同时得到的RGB图像和红外图像,其中,第一类型图像为RGB图像,第二类型图像为红外图像。
进一步举例说明,可选的例如利用RGB红外双通道图像采集器,同时采集目标对象的RGB通道图像以及红外通道图像。
通过本申请提供的实施例,获取目标设备对目标对象拍摄所同时得到的RGB图像和红外图像,其中,第一类型图像为RGB图像,第二类型图像为红外图像,达到了采集不同类型的图像的目的,实现了提高采集图像的多样性的效果。
作为一种可选的方案,获取目标设备对目标对象拍摄所同时得到的RGB图像和红外图像,包括:
获取目标设备对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,其中,红外LED灯安装在目标对象的目标部位上,红外LED灯被设置为无法被第一类型器件拍摄到,目标感测部件包括红外LED灯。
需要说明的是,获取目标设备对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,其中,红外LED灯安装在目标对象的目标部位上,红外LED灯被设置为无法被第一类型器件拍摄到,目标感测部件包括红外LED灯。可以但不限于将红外LED灯设置在不透光的遮掩物下等方式,以实现能被红外通道图像采集设备拍摄到但无法被RGB通道图像采集设备拍摄到的效果。
进一步举例说明,可选的例如图5所示,获取目标设备对安装有红外LED灯502的目标对象拍摄所同时得到的第一类型图像306(RGB图像)和第二类型图像308(红外图像)。
通过本申请提供的实施例,获取目标设备对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,其中,红外LED灯安装在目标对象的目标部位上,红外LED灯被设置为无法被第一类型器件拍摄到,目标感测部件包括红外LED灯,达到了克服图像清洁度与图像标识信息的获取的冲突的目的,实现了同时兼顾采集到的图像清洁度以及获取图像标识信息的效果。
作为一种可选的方案,获取目标设备对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,包括:
获取RGB红外双通道图像采集器对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,其中,目标设备包括RGB红外双通道图像采集器,RGB图像是RGB红外双通道图像采集器中的RGB通道图像采集器件对目标对象拍摄得到的图像,红外图像是RGB红外双通道图像采集器中的红外通道图像采集器件对目标对象拍摄得到的图像。
需要说明的是,获取RGB红外双通道图像采集器对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,其中,目标设备包括RGB红外双通道图像采集器,RGB图像是RGB红外双通道图像采集器中的RGB通道图像采集器件对目标对象拍摄得到的图像,红外图像是RGB红外双通道图像采集器中的红外通道图像采集器件对目标对象拍摄得到的图像。
进一步举例说明,可选的例如,通过RGB红外双通道图像采集器实现RGB图像与红外图像的同时采集,并保证采集到的图像皆用于表示处于同一状态下的目标对象。
通过本申请提供的实施例,获取RGB红外双通道图像采集器对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,其中,目标设备包括RGB红外双通道图像采集器,RGB图像是RGB红外双通道图像采集器中的RGB通道图像采集器件对目标对象拍摄得到的图像,红外图像是RGB红外双通道图像采集器中的红外通道图像采集器件对目标对象拍摄得到的图像,达到了通过RGB红外双通道图像采集器同时采集不同类型图像的目的,实现了提高图像采集的一致性的效果。
作为一种可选的方案,根据目标感测信息,在第二类型图像中确定第一位置上的第一标注信息,包括:
在第二类型图像包括多帧图像、目标感测信息包括多帧图像中的每帧图像中显示的感测信息的情况下,根据多帧图像中显示的感测信息共同表示的编码信息,确定第一位置上的目标类型信息,其中,目标类型信息用于表示目标部位的部位类型,目标类型信息为编码信息所表示的类型信息。
需要说明的是,在第二类型图像包括多帧图像、目标感测信息包括多帧图像中的每帧图像中显示的感测信息的情况下,根据多帧图像中显示的感测信息共同表示的编码信息,确定第一位置上的目标类型信息,其中,目标类型信息用于表示目标部位的部位类型,目标类型信息为编码信息所表示的类型信息。
进一步举例说明,可选的多帧图像用于表示多编码红外LED灯的闪烁,且每一种编码对应了一种部位类型,进而通过不同编码以表示不同的部位类型,并通过红外LED灯按照不同的编码方式循环闪烁,以实现根据红外LED灯的闪烁确定目标类型信息。。
通过本申请提供的实施例,在第二类型图像包括多帧图像、目标感测信息包括多帧图像中的每帧图像中显示的感测信息的情况下,根据多帧图像中显示的感测信息共同表示的编码信息,确定第一位置上的目标类型信息,其中,目标类型信息用于表示目标部位的部位类型,目标类型信息为编码信息所表示的类型信息,达到了根据编码信息快速获取类型信息的目的,实现了提高类型信息的获取效率的效果。
作为一种可选的方案,根据多帧图像中显示的感测信息共同表示的编码信息,确定第一位置上的目标类型信息,包括:
在第二类型图像为红外图像、目标感测部件包括红外LED灯、且每帧图像中显示的感测信息用于表示红外LED灯亮起或熄灭的情况下,根据多帧图像中显示的感测信息共同表示的红外LED灯的编码信息,确定第一位置上的目标类型信息。
进一步举例说明,可选的例如图6所示,编码“1,1,1,1:”表示部位类型“左手腕”,编码“1,1,1,0:”表示部位类型“右手腕”,编码“1,0,1,0:”表示部位类型“右脚踝”,编码“0,0,1,0:”表示部位类型“左脚踝”。可选的,信号位为高时红外LED灯亮,信号位为低位时红外LED灯暗。可选的,使用多个(如3个)连续的有效位来表征一个编码位,使得整体的解码鲁棒性更强。需要说明的是,在第二类型图像为红外图像、目标感测部件包括红外LED灯、且每帧图像中显示的感测信息用于表示红外LED灯亮起或熄灭的情况下,根据多帧图像中显示的感测信息共同表示的红外LED灯的编码信息,确定第一位置上的目标类型信息。
通过本申请提供的实施例,在第二类型图像为红外图像、目标感测部件包括红外LED灯、且每帧图像中显示的感测信息用于表示红外LED灯亮起或熄灭的情况下,根据多帧图像中显示的感测信息共同表示的红外LED灯的编码信息,确定第一位置上的目标类型信息,达到了根据红外LED灯的亮灭信息快速获取编码信息的目的,实现了提高编码信息的获取效率的效果。
作为一种可选的方案,在获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像之前,包括:
S1,在目标对象的第一部位上安装第一感测部件;
S2,在目标对象的第二部位上安装第二感测部件,其中,目标部位包括第一部位以及第二部位,目标感测部件包括第一感测部件以及第二感测部件。
需要说明的是,在目标对象的第一部位上安装第一感测部件;在目标对象的第二部位上安装第二感测部件,其中,目标部位包括第一部位以及第二部位,目标感测部件包括第一感测部件以及第二感测部件。
进一步举例说明,可选的例如以人像标识的场景举例说明,可选的将对应编码的红外LED灯按照预先设定的对应关系安装到所需要解析部位上。为了使得最终获取的RGB通道图像没有明显的干扰特征,可选的存在以下至少三种安装方式,具体内容如下:
方式一:隐藏式安装法,具体来说就是在每个关键点位置,将对应编码的红外LED灯和其控制器安装到目标对象的衣服下方,并在衣服上扣出一个仅能露出红外LED灯大小的孔,用于LED发射红外光。(因为红外LED灯的大小为2cm*2cm,在RGB图像下基本是不会产生干扰特征的);
方式二:中心控制安装法,具体来说就是每个部位位置仅仅需要安装一个红外LED灯,并且每个红外LED灯引出一条信号线,在目标对象的人体中心区域内部(比如衣服里面的肚子,腰背部区域)安装一个主控制器用于控制LED灯闪烁,进而实现既不在RGB图像下产生干扰特征,也不需要定制衣服的效果;
方式三:无线控制安装法,具体来说就是每个部位位置仅仅需要安装一个红外LED灯和大小忽略不计的信号接收器,不需要引出信号线也不需要定制衣服,将无线控制设备放在独立于人体外的控制中心,用无线信号传输法控制红外LED灯闪烁。
通过本申请提供的实施例,在目标对象的第一部位上安装第一感测部件;在目标对象的第二部位上安装第二感测部件,其中,目标部位包括第一部位以及第二部位,目标感测部件包括第一感测部件以及第二感测部件,达到了在多个部位安装对应的多个感测部件的目的,实现了提高获取的图像标识信息的准确性的效果。
作为一种可选的方案,在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系之后,还包括:
S1,将第一类型图像与第一标注信息输入当前图像识别神经网络,其中,当前图像识别神经网络用于预测第一类型图像中目标部位所在的位置;
S2,获取当前图像识别神经网络输出的当前训练结果,其中,当前训练结果用于表示目标样本图像的预测位置;
S3,比对第一标注信息相对应的第二位置与预测位置,获得比对结果;
S4,在比对结果达到收敛条件的情况下,确定当前图像识别神经网络训练完成。
需要说明的是,将第一类型图像与第一标注信息输入当前图像识别神经网络,其中,当前图像识别神经网络用于预测第一类型图像中目标部位所在的位置;获取当前图像识别神经网络输出的当前训练结果,其中,当前训练结果用于表示目标样本图像的预测位置;比对第一标注信息相对应的第二位置与预测位置,获得比对结果;在比对结果达到收敛条件的情况下,确定当前图像识别神经网络训练完成。
进一步举例说明,可选的例如,将保持洁净的第一类型图像与用于表示目标部位所在的位置以及目标部位的类型的第一标注信息输入当前图像识别神经网络,以保证输入的图像数据并不影响当前图像识别神经网络的计算过程,进而保证输出结果的完整度,提高了图像识别神经网络的整体训练效果。
通过本申请提供的实施例,将第一类型图像与第一标注信息输入当前图像识别神经网络,其中,当前图像识别神经网络用于预测第一类型图像中目标部位所在的位置;获取当前图像识别神经网络输出的当前训练结果,其中,当前训练结果用于表示目标样本图像的预测位置;比对第一标注信息相对应的第二位置与预测位置,获得比对结果;在比对结果达到收敛条件的情况下,确定当前图像识别神经网络训练完成,达到了输入纯净的且携带有标识信息的样本图像数据的目的,实现了提高图像识别神经网络的训练效率的效果。
作为一种可选的方案,将上述图像标注方法应用在利用深度神经网络训练并得到图像标识信息的场景下,换言之,通过上述图像标注方法,以获得用于训练深度神经网络的样本图像数据,可选的,具体实施步骤如图7所示:
步骤S702,为目标对象的目标部上安装目标感测部件;
步骤S704,通过RGB红外双通道图像采集器采集到无污染的RGB通道图像以及显示有目标感测部的红外通道图像;
步骤S706,获取显示有目标感测部的红外通道图像上的第一位置和第一位置上的第一标注信息;
步骤S708,将第一位置映射到无污染的RGB通道图像上,并建立映射后的第一位置(即第二位置)与第一标注信息的对应关系;
步骤S710,获得样本图像数据,其中,样本图像数据包括无污染的RGB通道图像,以及映射到RGB通道图像上的第一位置(即第二位置)与第一标注信息。
通过上述图像标注方法,利用深度神经网络训练并得到图像标识信息时,需要有人体的RGB图像以及当前RGB图像中对应部位的位置信息,而通常这种位置信息是需要人工标注获取的。而且需要注意的一点是在训练一个深度学习模型的时候,输入的RGB图像不能有额外的特征信息,不然会污染输入网络的图像特征,使得最终训练结果变得不合理。而想要进行自动化标注就需要在显示的当前RGB图像中获取额外的位置信息。很显然这两者存在一定的冲突。为了解决这个冲突,基于红外LED灯的闪烁在RGB通道图像上是看不见,且在红外通道图像上又是极其明显的这一物理现象,提出了利用RGB-红外双通道图像采集器,采集用于训练深度神经网络的纯净RGB通道图像(没有被LED灯的闪烁和控制器污染的纯净RGB图像)。以及用于定位关键点位置信息的红外通道图像(红外图像上有明显的红外LED灯闪烁用于定位关键点)。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述图像标注方法的图像标注装置。如图8所示,该装置包括:
第一获取单元802,用于获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,第一类型图像与第二类型图像中均显示有目标对象,第一类型图像是目标设备中的第一类型器件对目标对象拍摄得到的图像,第二类型图像是目标设备中的第二类型器件对目标对象拍摄得到的图像,第二类型图像中还显示有目标感测信息,目标感测信息是第二类型器件对在目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,目标感测部件被设置为无法被第一类型器件拍摄到;
第一确定单元804,用于根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;
第二确定单元806,用于在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置。
可选的,图像标注装置可以但不限于应用在样本图像数据的获取场景下,其中,样本图像数据可以但不限于为携带有标注信息的图像数据,样本图像数据可以但不限用于训练目标神经网络模型,目标神经网络模型可以但不限用于输出图像中关键部位的标识信息。目标设备可以但不限于为可采集图像的拍摄设备,例如摄像头、摄像机、相机、扫描仪等,此外,目标设备可以但不限用于通过多种采集通道,以同时或不同时地采集多种类型的图像,例如真彩色RGB图像、红外图像、二值图像、灰度图像、索引图像等。不同类型器件可以但不限于包括不同类型的采集通道,例如通过红外通道图像采集器,以采集红外图像,通过RGB通道图像采集器,以采集RGB图像。目标感测部件可以但不限于为对应类型的采集通道才能采集到的拍摄信息,例如目标感测部件为安装在不透光的遮挡物下的LED灯,则通过RGB通道图像采集器无法采集到目标感测部件发出的灯光,但通过红外通道图像采集器则可以采集到目标感测部件发出的灯光;再或者,目标感测部件为温度与目标对象可形成明显差异的,以及安装在不透光的遮挡物下的某类物体,则通过RGB通道图像采集器无法采集到目标感测部件的位置,但通过红外通道图像采集器则可以采集到目标感测部件与目标对象不一样的温度,以获得目标感测部件的位置。第一标注信息可以但不限于包括目标感测部件在目标对象的位置信息(例如坐标信息),以及与目标感测部件位置相同的目标部位的类型信息(例如关键点类型),例如目标感测部件在目标坐标处,关键点类型为手掌。
需要说明的是,第一获取单元,用于获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,第一类型图像与第二类型图像中均显示有目标对象,第一类型图像是目标设备中的第一类型器件对目标对象拍摄得到的图像,第二类型图像是目标设备中的第二类型器件对目标对象拍摄得到的图像,第二类型图像中还显示有目标感测信息,目标感测信息是第二类型器件对在目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,目标感测部件被设置为无法被第一类型器件拍摄到;第一确定单元,用于根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;第二确定单元,用于在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置。
具体实施例可以参考上述图像标注方法中所示示例,本示例中在此不再赘述。
通过本申请提供的实施例,获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,第一类型图像与第二类型图像中均显示有目标对象,第一类型图像是目标设备中的第一类型器件对目标对象拍摄得到的图像,第二类型图像是目标设备中的第二类型器件对目标对象拍摄得到的图像,第二类型图像中还显示有目标感测信息,目标感测信息是第二类型器件对在目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,目标感测部件被设置为无法被第一类型器件拍摄到;根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置,通过同时获取用于表示目标对象的拍摄图像的两种类型的图像,并将其中一种洁净但无标注信息的图像,与另一种不洁净但有标准信息的图像想结合,以获得洁净的图像并携带有标准信息的图像数据,进而达到了兼顾了保证图像的清洁度以及实现图像的自动标注的目的,从而实现了提高图像标注的效率的技术效果。
作为一种可选的方案,如图9所示,第一获取单元802,包括:
获取模块902,用于获取目标设备对目标对象拍摄所同时得到的RGB图像和红外图像,其中,第一类型图像为RGB图像,第二类型图像为红外图像。
具体实施例可以参考上述图像标注方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,获取模块902,包括:
获取子模块,用于获取目标设备对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,其中,红外LED灯安装在目标对象的目标部位上,红外LED灯被设置为无法被第一类型器件拍摄到,目标感测部件包括红外LED灯。
具体实施例可以参考上述图像标注方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,获取子模块,包括:
获取子单元,用于获取RGB红外双通道图像采集器对安装有红外LED灯的目标对象拍摄所同时得到的RGB图像和红外图像,其中,目标设备包括RGB红外双通道图像采集器,RGB图像是RGB红外双通道图像采集器中的RGB通道图像采集器件对目标对象拍摄得到的图像,红外图像是RGB红外双通道图像采集器中的红外通道图像采集器件对目标对象拍摄得到的图像。
具体实施例可以参考上述图像标注方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,第一确定单元804,包括:
确定模块,用于在第二类型图像包括多帧图像、目标感测信息包括多帧图像中的每帧图像中显示的感测信息的情况下,根据多帧图像中显示的感测信息共同表示的编码信息,确定第一位置上的目标类型信息,其中,目标类型信息用于表示目标部位的部位类型,目标类型信息为编码信息所表示的类型信息。
具体实施例可以参考上述图像标注方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,确定模块,包括:
确定子模块,用于在第二类型图像为红外图像、目标感测部件包括红外LED灯、且每帧图像中显示的感测信息用于表示红外LED灯亮起或熄灭的情况下,根据多帧图像中显示的感测信息共同表示的红外LED灯的编码信息,确定第一位置上的目标类型信息。
具体实施例可以参考上述图像标注方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,包括:
第一安装单元,用于在获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像之前,在目标对象的第一部位上安装第一感测部件;
第二安装单元,用于在获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像之前,在目标对象的第二部位上安装第二感测部件,其中,目标部位包括第一部位以及第二部位,目标感测部件包括第一感测部件以及第二感测部件。
具体实施例可以参考上述图像标注方法中所示示例,本示例中在此不再赘述。
作为一种可选的方案,还包括:
输入单元,用于在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系之后,将第一类型图像与第一标注信息输入当前图像识别神经网络,其中,当前图像识别神经网络用于预测第一类型图像中目标部位所在的位置;
第二获取单元,用于在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系之后,获取当前图像识别神经网络输出的当前训练结果,其中,当前训练结果用于表示目标样本图像的预测位置;
比对单元,用于在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系之后,比对第一标注信息相对应的第二位置与预测位置,获得比对结果;
第三确定单元,用于在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系之后,在比对结果达到收敛条件的情况下,确定当前图像识别神经网络训练完成。
具体实施例可以参考上述图像标注方法中所示示例,本示例中在此不再赘述。
根据本发明实施例的又一个方面,还提供了一种用于实施上述图像标注方法的电子装置,如图10所示,该电子装置包括存储器1002和处理器1004,该存储器1002中存储有计算机程序,该处理器1004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,第一类型图像与第二类型图像中均显示有目标对象,第一类型图像是目标设备中的第一类型器件对目标对象拍摄得到的图像,第二类型图像是目标设备中的第二类型器件对目标对象拍摄得到的图像,第二类型图像中还显示有目标感测信息,目标感测信息是第二类型器件对在目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,目标感测部件被设置为无法被第一类型器件拍摄到;
S2,根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;
S3,在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置。
可选地,本领域普通技术人员可以理解,图10所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图10中所示更多或者更少的组件(如网络接口等),或者具有与图10所示不同的配置。
其中,存储器1002可用于存储软件程序以及模块,如本发明实施例中的图像标注方法和装置对应的程序指令/模块,处理器1004通过运行存储在存储器1002内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图像标注方法。存储器1002可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1002可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1002具体可以但不限于用于存储第一类型图像、第二类型图像、目标感测信息以及第一标注信息等信息。作为一种示例,如图10所示,上述存储器1002中可以但不限于包括上述图像标注装置中的获取单元1602、处理单元1604及调整单元1606。此外,还可以包括但不限于上述图像标注装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1006为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还包括:显示器1008,用于显示上述第一类型图像、第二类型图像、目标感测信息以及第一标注信息等信息;和连接总线1010,用于连接上述电子装置中的各个模块部件。
根据本发明的实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,第一类型图像与第二类型图像中均显示有目标对象,第一类型图像是目标设备中的第一类型器件对目标对象拍摄得到的图像,第二类型图像是目标设备中的第二类型器件对目标对象拍摄得到的图像,第二类型图像中还显示有目标感测信息,目标感测信息是第二类型器件对在目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,目标感测部件被设置为无法被第一类型器件拍摄到;
S2,根据目标感测信息,在第二类型图像中确定第一位置和第一位置上的第一标注信息,其中,第一位置用于表示目标部位所在的位置;
S3,在第一类型图像中确定与第一位置具有映射关系的第二位置,并在第二位置与第一标注信息之间建立对应关系,其中,第二位置用于表示目标部位所在的位置。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种图像标注信息的获取方法,其特征在于,包括:
获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,所述第一类型图像与所述第二类型图像中均显示有所述目标对象,所述第一类型图像是所述目标设备中的第一类型器件对所述目标对象拍摄得到的图像,所述第二类型图像是所述目标设备中的第二类型器件对所述目标对象拍摄得到的图像,所述第二类型图像中还显示有目标感测信息,所述目标感测信息是所述第二类型器件对在所述目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,所述目标感测部件被设置为无法被所述第一类型器件拍摄到;
根据所述目标感测信息,在所述第二类型图像中确定第一位置和所述第一位置上的第一标注信息,其中,所述第一位置用于表示所述目标部位所在的位置;
在所述第一类型图像中确定与所述第一位置具有映射关系的第二位置,并在所述第二位置与所述第一标注信息之间建立对应关系,其中,所述第二位置用于表示所述目标部位所在的位置。
2.根据权利要求1所述的方法,其特征在于,所述获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,包括:
获取所述目标设备对所述目标对象拍摄所同时得到的RGB图像和红外图像,其中,所述第一类型图像为所述RGB图像,所述第二类型图像为所述红外图像。
3.根据权利要求2所述的方法,其特征在于,所述获取所述目标设备对所述目标对象拍摄所同时得到的RGB图像和红外图像,包括:
获取所述目标设备对安装有红外LED灯的所述目标对象拍摄所同时得到的所述RGB图像和所述红外图像,其中,所述红外LED灯安装在所述目标对象的所述目标部位上,所述红外LED灯被设置为无法被所述第一类型器件拍摄到,所述目标感测部件包括所述红外LED灯。
4.根据权利要求3所述的方法,其特征在于,所述获取所述目标设备对安装有红外LED灯的所述目标对象拍摄所同时得到的所述RGB图像和所述红外图像,包括:
获取RGB红外双通道图像采集器对安装有所述红外LED灯的所述目标对象拍摄所同时得到的所述RGB图像和所述红外图像,其中,所述目标设备包括所述RGB红外双通道图像采集器,所述RGB图像是所述RGB红外双通道图像采集器中的RGB通道图像采集器件对所述目标对象拍摄得到的图像,所述红外图像是所述RGB红外双通道图像采集器中的红外通道图像采集器件对所述目标对象拍摄得到的图像。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述目标感测信息,在所述第二类型图像中确定所述第一位置上的第一标注信息,包括:
在所述第二类型图像包括多帧图像、所述目标感测信息包括所述多帧图像中的每帧图像中显示的感测信息的情况下,根据所述多帧图像中显示的感测信息共同表示的编码信息,确定所述第一位置上的目标类型信息,其中,所述目标类型信息用于表示所述目标部位的部位类型,所述目标类型信息为所述编码信息所表示的类型信息。
6.根据权利要求5所述的方法,其特征在于,所述根据所述多帧图像中显示的感测信息共同表示的编码信息,确定所述第一位置上的目标类型信息,包括:
在所述第二类型图像为红外图像、所述目标感测部件包括红外LED灯、且所述每帧图像中显示的感测信息用于表示红外LED灯亮起或熄灭的情况下,根据所述多帧图像中显示的感测信息共同表示的所述红外LED灯的编码信息,确定所述第一位置上的目标类型信息。
7.根据权利要求1至4中任一项所述的方法,其特征在于,在所述获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像之前,包括:
在所述目标对象的第一部位上安装第一感测部件;
在所述目标对象的第二部位上安装第二感测部件,其中,所述目标部位包括所述第一部位以及所述第二部位,所述目标感测部件包括所述第一感测部件以及所述第二感测部件。
8.根据权利要求1至4中任一项所述的方法,其特征在于,在所述第一类型图像中确定与所述第一位置具有映射关系的第二位置,并在所述第二位置与所述第一标注信息之间建立对应关系之后,还包括:
将所述第一类型图像与所述第一标注信息输入当前图像识别神经网络,其中,所述当前图像识别神经网络用于预测所述第一类型图像中所述目标部位所在的位置;
获取当前所述图像识别神经网络输出的当前训练结果,其中,所述当前训练结果用于表示所述目标样本图像的预测位置;
比对所述第一标注信息相对应的所述第二位置与所述预测位置,获得比对结果;
在比对结果达到收敛条件的情况下,确定所述当前图像识别神经网络训练完成。
9.一种图像标注信息的获取装置,其特征在于,包括:
第一获取单元,用于获取目标设备对目标对象拍摄所同时得到的第一类型图像与第二类型图像,其中,所述第一类型图像与所述第二类型图像中均显示有所述目标对象,所述第一类型图像是所述目标设备中的第一类型器件对所述目标对象拍摄得到的图像,所述第二类型图像是所述目标设备中的第二类型器件对所述目标对象拍摄得到的图像,所述第二类型图像中还显示有目标感测信息,所述目标感测信息是所述第二类型器件对在所述目标对象的目标部位上安装的目标感测部件进行拍摄所得到的信息,所述目标感测部件被设置为无法被所述第一类型器件拍摄到;
第一确定单元,用于根据所述目标感测信息,在所述第二类型图像中确定第一位置和所述第一位置上的第一标注信息,其中,所述第一位置用于表示所述目标部位所在的位置;
第二确定单元,用于在所述第一类型图像中确定与所述第一位置具有映射关系的第二位置,并在所述第二位置与所述第一标注信息之间建立对应关系,其中,所述第二位置用于表示所述目标部位所在的位置。
10.根据权利要求9所述的装置,其特征在于,所述第一获取单元,包括:
获取模块,用于获取所述目标设备对所述目标对象拍摄所同时得到的RGB图像和红外图像,其中,所述第一类型图像为所述RGB图像,所述第二类型图像为所述红外图像。
11.根据权利要求10所述的装置,其特征在于,所述获取模块,包括:
获取子模块,用于获取所述目标设备对安装有红外LED灯的所述目标对象拍摄所同时得到的所述RGB图像和所述红外图像,其中,所述红外LED灯安装在所述目标对象的所述目标部位上,所述红外LED灯被设置为无法被所述第一类型器件拍摄到,所述目标感测部件包括所述红外LED灯。
12.根据权利要求11所述的装置,其特征在于,所述获取子模块,包括:
获取子单元,用于获取RGB红外双通道图像采集器对安装有所述红外LED灯的所述目标对象拍摄所同时得到的所述RGB图像和所述红外图像,其中,所述目标设备包括所述RGB红外双通道图像采集器,所述RGB图像是所述RGB红外双通道图像采集器中的RGB通道图像采集器件对所述目标对象拍摄得到的图像,所述红外图像是所述RGB红外双通道图像采集器中的红外通道图像采集器件对所述目标对象拍摄得到的图像。
13.根据权利要求9至12中任一项所述的装置,其特征在于,所述第一确定单元,包括:
确定模块,用于在所述第二类型图像包括多帧图像、所述目标感测信息包括所述多帧图像中的每帧图像中显示的感测信息的情况下,根据所述多帧图像中显示的感测信息共同表示的编码信息,确定所述第一位置上的目标类型信息,其中,所述目标类型信息用于表示所述目标部位的部位类型,所述目标类型信息为所述编码信息所表示的类型信息。
14.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至8任一项中所述的方法。
15.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至8任一项中所述的方法。
CN202010653158.4A 2020-07-08 2020-07-08 图像标注方法和装置及存储介质 Active CN111914672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010653158.4A CN111914672B (zh) 2020-07-08 2020-07-08 图像标注方法和装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010653158.4A CN111914672B (zh) 2020-07-08 2020-07-08 图像标注方法和装置及存储介质

Publications (2)

Publication Number Publication Date
CN111914672A true CN111914672A (zh) 2020-11-10
CN111914672B CN111914672B (zh) 2023-08-04

Family

ID=73227660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010653158.4A Active CN111914672B (zh) 2020-07-08 2020-07-08 图像标注方法和装置及存储介质

Country Status (1)

Country Link
CN (1) CN111914672B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130100255A1 (en) * 2010-07-02 2013-04-25 Sony Computer Entertainment Inc. Information processing system using captured image, information processing device, and information processing method
CN104700096A (zh) * 2015-03-30 2015-06-10 北京奇艺世纪科技有限公司 一种基于图像的用户动作标识区域确定方法及装置
US20150235076A1 (en) * 2014-02-20 2015-08-20 AiScreen Oy Method for shooting video of playing field and filtering tracking information from the video of playing field
US20150316473A1 (en) * 2014-05-01 2015-11-05 Rebellion Photonics, Inc. Mobile gas and chemical imaging camera
CN108256431A (zh) * 2017-12-20 2018-07-06 中车工业研究院有限公司 一种手部位置标识方法及装置
CN108305296A (zh) * 2017-08-30 2018-07-20 深圳市腾讯计算机系统有限公司 图像描述生成方法、模型训练方法、设备和存储介质
CN109117746A (zh) * 2018-07-23 2019-01-01 北京华捷艾米科技有限公司 手部检测方法及机器可读存储介质
WO2019011099A1 (zh) * 2017-07-14 2019-01-17 Oppo广东移动通信有限公司 虹膜活体检测方法及相关产品
CN109461168A (zh) * 2018-10-15 2019-03-12 腾讯科技(深圳)有限公司 目标对象的识别方法和装置、存储介质、电子装置
CN109499068A (zh) * 2018-11-14 2019-03-22 腾讯科技(深圳)有限公司 对象的控制方法和装置、存储介质、电子装置
WO2020056325A1 (en) * 2018-09-14 2020-03-19 Advanced Geosciences, Inc. Geophysical sensor positioning system
CN111046826A (zh) * 2019-12-20 2020-04-21 北京碧拓科技有限公司 一种远红外热成像人脸关键点的定位方法
CN111738180A (zh) * 2020-06-28 2020-10-02 浙江大华技术股份有限公司 关键点的标注方法、装置、存储介质及电子装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130100255A1 (en) * 2010-07-02 2013-04-25 Sony Computer Entertainment Inc. Information processing system using captured image, information processing device, and information processing method
US20150235076A1 (en) * 2014-02-20 2015-08-20 AiScreen Oy Method for shooting video of playing field and filtering tracking information from the video of playing field
US20150316473A1 (en) * 2014-05-01 2015-11-05 Rebellion Photonics, Inc. Mobile gas and chemical imaging camera
CN104700096A (zh) * 2015-03-30 2015-06-10 北京奇艺世纪科技有限公司 一种基于图像的用户动作标识区域确定方法及装置
WO2019011099A1 (zh) * 2017-07-14 2019-01-17 Oppo广东移动通信有限公司 虹膜活体检测方法及相关产品
CN108305296A (zh) * 2017-08-30 2018-07-20 深圳市腾讯计算机系统有限公司 图像描述生成方法、模型训练方法、设备和存储介质
CN108256431A (zh) * 2017-12-20 2018-07-06 中车工业研究院有限公司 一种手部位置标识方法及装置
CN109117746A (zh) * 2018-07-23 2019-01-01 北京华捷艾米科技有限公司 手部检测方法及机器可读存储介质
WO2020056325A1 (en) * 2018-09-14 2020-03-19 Advanced Geosciences, Inc. Geophysical sensor positioning system
CN109461168A (zh) * 2018-10-15 2019-03-12 腾讯科技(深圳)有限公司 目标对象的识别方法和装置、存储介质、电子装置
CN109499068A (zh) * 2018-11-14 2019-03-22 腾讯科技(深圳)有限公司 对象的控制方法和装置、存储介质、电子装置
CN111046826A (zh) * 2019-12-20 2020-04-21 北京碧拓科技有限公司 一种远红外热成像人脸关键点的定位方法
CN111738180A (zh) * 2020-06-28 2020-10-02 浙江大华技术股份有限公司 关键点的标注方法、装置、存储介质及电子装置

Also Published As

Publication number Publication date
CN111914672B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN110212451A (zh) 一种电力ar智能巡检装置
CN107239252A (zh) 一种led显示屏自动连屏方法
CN111339831B (zh) 一种照明灯控制方法和系统
CN103366196A (zh) 二维条码连线方法
CN107330143B (zh) 采用ar技术检查pcba的方法及装置
CN113011403B (zh) 手势识别方法、系统、介质及设备
CN111292504A (zh) 一种通过图像识别进行安全告警方法及系统
US20230156161A1 (en) Failure identification and handling method, and system
CN111914672B (zh) 图像标注方法和装置及存储介质
CN108886575B (zh) 图像处理装置、图像处理系统及图像处理方法
CN111738180B (zh) 关键点的标注方法、装置、存储介质及电子装置
CN105683959A (zh) 信息处理设备、信息处理方法及信息处理系统
CN105955058B (zh) 无线智能家居系统
CN106846302B (zh) 一种工具正确取件的检测方法及基于此方法的考核台
CN111931762B (zh) 基于ai的图像识别解决方法、装置及可读存储介质
CN113240602A (zh) 图像去雾方法及装置、计算机可读介质和电子设备
CN105573735B (zh) 笔记管理方法和装置
CN113313050A (zh) 一种基于视频流的皮肤智能检测系统
CN114693749A (zh) 一种用于关联不同的物理坐标系的方法及系统
CN111222392A (zh) 一种智能庭院控制系统
CN107305692B (zh) 一种确定待测对象的运动信息的方法及装置
CN107995753A (zh) 一种为照明设备生成位置平面图的方法、装置及系统
CN110310332A (zh) 按键的标定方法及装置
CN110264515B (zh) 一种标注方法及电子设备
JP2018125637A (ja) 情報処理システム及び情報処理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant