CN110781805A - 一种目标物体检测方法、装置、计算设备和介质 - Google Patents

一种目标物体检测方法、装置、计算设备和介质 Download PDF

Info

Publication number
CN110781805A
CN110781805A CN201911012285.XA CN201911012285A CN110781805A CN 110781805 A CN110781805 A CN 110781805A CN 201911012285 A CN201911012285 A CN 201911012285A CN 110781805 A CN110781805 A CN 110781805A
Authority
CN
China
Prior art keywords
target object
image
detected
information
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911012285.XA
Other languages
English (en)
Other versions
CN110781805B (zh
Inventor
金明
刘维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jianwei Zhizhu Intelligent Technology Co ltd
Original Assignee
Shanghai Jilian Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jilian Network Technology Co Ltd filed Critical Shanghai Jilian Network Technology Co Ltd
Priority to CN201911012285.XA priority Critical patent/CN110781805B/zh
Publication of CN110781805A publication Critical patent/CN110781805A/zh
Application granted granted Critical
Publication of CN110781805B publication Critical patent/CN110781805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种目标物体检测方法、装置、计算设备和介质。该方法包括:对待检测图像的场景信息和待检测图像中目标物体的类别信息进行识别,根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,解决了对目标物体进行检测时,存在很多的误检,检测准确率不高的问题。在检测图像时,本发明实施例的技术方案利用物体本身信息的同时,还结合整个图像代表的场景信息,提高了对目标物体的检测效率,实现检测目标物体更加准确的效果。

Description

一种目标物体检测方法、装置、计算设备和介质
技术领域
本发明实施例涉及计算机应用技术,尤其涉及一种目标物体检测方法、装置、计算设备和介质。
背景技术
随着科学技术的发展,计算机与视觉算法结合感知图像内容这一技术可以用于各行各业,这一技术的应用在减少人工机械化工作的同时也提高了重复性工作的效率。而目标物体检测也就是检测并识别图像中的目标物体只是这一技术中的一小部分,但是却有很强烈的社会意义与广泛的应用范围。
在现有技术中,大多数目标物体检测都是基于深度学习中的卷积神经网络对单帧图片进行检测或者通过收集图像的RGB信息和深度信息一起通过卷积神经网络进行分析识别,也有结合语音分割增强的算法来检测目标物体。
但是利用上述算法对目标物体进行检测时,由于只结合了目标物体本身的信息,导致检测出来的目标物体存在很多的误检,检测准确率不高,实用价值大打折扣。
发明内容
本发明提供一种目标物体检测方法、装置、计算设备和介质,以实现减少图像检测中目标物体的误检,提高目标物体检测的准确率。
第一方面,本发明实施例提供了一种目标物体检测方法,所述目标物体的检测方法包括:
获取待检测图像;
识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息;
根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
第二方面,本发明实施例还提供了一种目标物体检测装置,该目标物体的检测装置包括:
图片获取模块,用于获取需要检测的图片;
信息识别模块,用于识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息;
判断模块,用于根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
第三方面,本发明实施例还提供了一种计算设备,其中,所述计算设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的目标物体的检测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如本发明任意实施例所提供的事件数据的处理方法。
本发明实施例,首先通过对待检测图像的场景信息和待检测图像中目标物体的类别信息进行识别,然后根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,解决了对目标物体进行检测时,存在很多的误检,检测准确率不高的问题。本发明实施例在检测图像时,利用物体本身信息的同时,还结合整个图像代表的场景信息,提高了对目标物体的检测效率,实现检测目标物体更加准确的效果。
附图说明
图1是本发明实施例一中的一种目标物体检测方法的流程图;
图2是本发明实施例二中的一种目标物体检测方法的流程图;
图3是本发明实施例三中的一种目标物体检测方法的流程图;
图4是本发明实施例四中的一种目标物体检测装置的结构图;
图5是本发明实施例五中的一种计算设备结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种目标物体检测方法的流程图,本实施例可适用于利用物体本身信息和物体所在场景信息检测目标物体的情况,该方法可以由目标物体检测装置来执行,该目标物体检测装置可以由软件和/或硬件来实现,该目标物体检测装置可以配置在计算设备上,具体包括如下步骤:
步骤110、获取待检测图像。
在本发明实施例中,上述待检测图像可以是拍摄的,如移动终端中的相机或摄像机拍摄,也可以通过从网络上爬取获得,此处对待检测图像的来源不作限定。
步骤120、识别待检测图像的场景信息和待检测图像中目标物体的类别信息。
将待识别图像输入预先训练的检测模型中,根据检测模型的输出确定待检测图像的场景信息和待检测图像中目标物体的类别信息,其中,该检测模型可以是同时具备场景信息和物体类型的检查功能。可选的,还可以是预先设置用于检测场景信息的场景检测模型和用于识别物体类别的类别检测模型,将待检测图像分别输入至场景检测模型和类别检测模型,分别得到待检测图像的场景信息和目标物体的类别信息。其中,场景检测模型和类别检测模型可以是机器学习模型,例如神经网络模型。
示例性的,场景信息可以包括但不限于餐厅场景、医院场景、商场场景、卧室场景、浴室场景或者学校场景等,目标物体的类别信息可以是但不限于筷子、盘子、床、被子、毛巾或课桌等,例如对一幅图像进行目标物体检测,检测出的物体类别为火锅,场景类别为聚会场景。
步骤130、根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
预先建立的物体和场景的对应关系是预先对物体所对应的场景进行划分,建立映射关系,其中,一个类别的物体可以是对应至少一种场景信息。例如婴儿车和奶瓶可以是存在于母婴场景或者母婴用品类场景中,火锅和烤串存在于聚会场景中。当识别到待检测图像的场景信息为母婴场景或者母婴用品类场景,且确定待检测图像中目标物体为奶瓶或者婴儿车,根据上述物体和场景的对应关系,则认为目标物体的类别信息和场景信息相匹配,确定目标物体的类别信息识别正确,保留该目标物体的类别信息。
若目标物体的类别信息与待检测图像的场景信息不存在对应关系时,表明目标物体的类别信息不准确,不保留该目标物体的类别信息,重新对待检测图像进行检测。
本实施例的技术方案,首先通过对待检测图像的场景信息和待检测图像中目标物体的类别信息进行识别,然后根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,解决了对目标物体进行检测时,存在很多的误检,检测准确率不高的问题。本发明实施例在检测图像时,利用物体本身信息的同时,还结合整个图像代表的场景信息,提高了对目标物体的检测效率,实现检测目标物体更加准确的效果。
在上述技术方案的基础上,在步骤130中,根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息,这样设置的好处在于,在对目标物体检测时除了利用了目标物体自身属性外,还利用了目标物体所在场景对物体进行校验,通过两者间存在的对应关系,判断是否匹配,可以消除大部分误检,提高了目标物体检测的准确率。
实施例二
图2为本发明实施例二提供的一种目标物体检测方法的流程图,本实施例以上述实施例为基础进行优化,如图2所示,该方法具体包括:
步骤210、建立物体与场景的对应关系。
利用已知的先验关系来划分目标物体可能所在的场景,建立物体与场景的对应关系,示例性的,如课桌对应教室场景,病床对应医院场景等,其中,一个目标物体可以是对应于不同场景,如与苹果对应的场景包括但不限于果园场景、餐厅场景等,一个场景也可以对应多个目标物体,如果园场景中对应的目标物体可以包括但不限于葡萄、橘子和梨等。
步骤220、根据目标物体与场景的对应关系,采集各场景下的样本图像。
本实施例中,样本图像的采集方式可以是在不同的场景利用摄像机或移动终端的图像采集装置进行图像拍摄,可选的,根据样本图像的拍摄位置确定样本图像的场景信息,其中,所述位置信息可以是包括拍摄位置所在的建筑名称、店名等。示例性的,样本图像的拍摄位置为餐厅,则可确定样本图像的场景信息为聚餐惨景;样本图像的拍摄位置为办公楼,则可确定样本图像的场景信息为办公场景;样本图像的拍摄位置为学校,则可确定采集的样本图像的场景信息为学校场景等。通过拍摄位置确定样本图像的场景信息,替代认为确定样本图像的场景信息的过程,简化了场景信息确定过程。
本实施例中,样本图像的采集方式还可以是在网络上爬取后,按照场景类别进行分类,例如:将病床、注射器以及绷带等物体归为医院场景中,将锅、铲子以及菜刀等物体归为厨房场景中。可选的,若爬取的样本图像有描述文本,则对描述文本进行语义分析,根据语义分析结果确定样本图像的场景信息。示例性的,若在诸如手机等电子设备中爬取样本图像时,其中,在社交应用(例如微信或者QQ等即时通信应用)中爬取样本图像时,样本图像中一般配置有描述文本(例如在朋友圈中的图像配置有描述文本),例如描述文本为“多年不见的好友重聚”,对上述描述文本进行语义分析,可知上述描述文本对应的样本图像的场景信息为聚会场景。通过样本图像的描述信息确定样本图像的场景信息,替代认为确定样本图像的场景信息的过程,简化了场景信息确定过程。
步骤230、对样本图像进行预处理,生成至少一个衍生样本图像。
由于检测模块的训练过程需要大量的样本图像,本实施例中,通过对采集的样本图像进行预处理,以得到采集样本图像的衍生样本图像,该衍生样本图像和采集的样本图像均用于对待训练的检测模型进行训练,降低了样本图像的采集难度,提高样本图像的采集效率。可选的,预处理包括:翻转、旋转、平移、剪裁、加入噪声、抖动和图像填充中的至少一项。
步骤240、基于所述样本图像对待训练的检测模型进行训练,生成所述检测模型。
本实施例中,基于采集的样本图像和衍生样本图像对待训练的检测模型进行训练,生成检测模型,所述检测模型用于识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息。
检测模型包括依次连接的resnet网络、FPN网络和FCN网络,其中,resnet网络包括senet网络,用于对所述待检测图像进行特征提取,其中,senet网络用于对提取的特征进行增强;FPN网络用于对增强后的特征进行融合;FCN网络用于根据融合后的特征对目标物体进行分类以及对待检测图像的场景进行分类。
可选的,对检测模型进行训练可以是:将样本图像输入至待训练的检测模型中,获取该检测模型输出的预测结果,该预测结果中包括预测类别信息和预测场景信息,当预测类别信息与样本图像中目标物体的标准类别信息不同,或者预测场景信息与样本图像的标准场景信息不同时,计算损失函数,将损失函数反向输入至待训练的检测模型中,基于梯度下降方法调节检测模模型中的网络参数。迭代执行上述训练方法,直到完成预设次数的训练或者检测模型的检测精度达到预设精度时,确定检测模型训练完成。其中,检测模型的网络参数包括但不限于权重和偏移值。
可选的,检测模型在训练时确定损失函数采用了FocalLoss函数,其计算公式如下:
FL(pt)=-αt(1-pt)γlog(pt)
其中,FL(pt)为焦点损失函数,pt为特征值属于某一类的概率,αt为平衡因子,Y为焦点系数。
步骤250、获取待检测图像,识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息。
步骤260、根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
本发明实施例提供了一种目标物体检测方法首先建立物体与场景的对应关系,根据物体与场景的对应关系,采集各场景下的样本图像,之后对样本图像进行预处理,生成至少一个衍生样本图像;基于样本图像训练检测模型;获取待检测图像,通过检测模型识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息;根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
本发明实施例提供了训练检测模型的方法,通过检测模型检测目标物体的类别信息和场景信息,判断类别信息与场景信息是否匹配,解决了检测目标物体时的误检及检测准确率不高的问题,提高了目标物体检测效率,实现了检测目标物体更加准确的效果。
实施例三
图3为本发明实施例三提供的一种目标物体检测方法的流程图,本实施例以上述实施例为基础进行优化,如图3所示,该方法具体包括:
步骤310、获取待检测图像,识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息。
步骤320、根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
步骤330、识别所述待识别图像中所述目标物体的位置信息,根据所述位置信息从所述待检测图像中截取所述目标物体图像。
步骤340、对截取的目标物体图像进行物体类别的预测,根据目标物体图像的预测结果对目标物体的类别信息进行校验。
本实施例中,在对检测模型输出的目标物体的类别信息与待检测图像中场景信息进行匹配之后,对待检测图像中的目标物体进行截取,得到目标物体图像,其中,目标物体图像不包括待检测图像中的背景信息,进一步对目标物体图像的类别进行预测,对检测模型中得到的目标物体的类别信息进行校验,以提高目标物体识别的精度。
可选的,识别所述待识别图像中所述目标物体的位置信息可以是对待检测图像进行边缘识别,在边缘识别结果中确定目标物体的轮廓,基于目标物体的轮廓确定目标物体的位置信息,进一步基于目标物体的轮廓对目标物体进行截取。
在一些实施例中,检测模型还用于输出待检测图像中目标物体的位置信息,相应的,步骤310为获取待检测图像,识别所述待检测图像的场景信息、所述待检测图像中目标物体的类别信息和位置信息,步骤340为根据所述位置信息从所述待检测图像中截取所述目标物体图像。
可选的,对所述目标物体图像进行物体类别的预测,根据所述目标物体图像的预测结果对所述目标物体的类别信息进行校验,包括:通过特征提取模型提取截取的所述目标物体图像的特征信息,基于SVM(Support Vector Machine,支持向量机)模型对截取的所述目标物体图像的特征信息进行分析,得到所述目标物体图像的预测结果,若所述预测结果与所述目标物体的类别信息一致,则确定目标物体的类别信息正确,若预测结果与目标物体的类别信息不一致,则确定目标物体的类别信息不正确,舍弃该目标物体的类别信息,并重新进行检测。
其中,特征提取模型和SVM模型为预先训练的,特征提取模型具有特征提取功能,SVM模型具有物体类别的判别功能,示例性的,特征提取模型和SVM模型可以是基于上述实施例中样本图像进行训练得到,其训练过程不再赘述。
可选的,特征提取模型包括resnet网络,用于对所述待检测图像进行特征提取,其中,resnet网络包括senet网络,senet网络用于对提取的特征进行增强。
本实施例的技术方案首先通过对待检测图像的场景信息和待检测图像中目标物体的类别信息进行识别,然后根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,之后对目标物体图像进行物体类别的预测,根据目标物体图像的预测结果对目标物体的类别信息进行校验,本实施例的技术方案在对目标物体进行检测的基础上,对检测结果进行了进一步验证,进一步提高了目标物体检测的准确率。
实施例四
图4为本发明实施例四提供的一种目标物体检测装置的结构图,该目标物体检测装置包括:图片获取模块410,信息识别模块420和判断模块430。
其中,图片获取模块410,用于获取需要检测的图片;
信息识别模块420,用于识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息;
判断模块430,用于根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
在上述实施例的技术方案中,信息识别模块420,用于将所述待识别图像输入预先训练的检测模型中,根据所述检测模型的输出确定所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息。
可选的,所述检测模型包括依次连接的resnet网络、FPN网络和FCN网络,其中,所述resnet网络包括senet网络,用于对所述待检测图像进行特征提取,其中,所述senet网络用于对提取的特征进行增强;
所述FPN网络用于对增强后的特征进行融合;
所述FCN网络用于根据融合后的特征对目标物体进行分类以及对待检测图像的场景进行分类。
在上述实施例的技术方案中,目标物体检测装置还包括:样本图像采集模块,用于根据所述物体与场景的对应关系,采集各场景下的样本图像;检测模型训练模块,用于基于所述样本图像对待训练的检测模型进行训练,生成所述检测模型。
在上述实施例的技术方案中,目标物体检测装置还包括:图像预处理模块,用于对所述样本图像进行预处理,生成至少一个衍生样本图像,其中,所述预处理包括:翻转、旋转、平移、剪裁、加入噪声、抖动和图像填充中的至少一项,所述衍生样本图像用于对所述待训练的检测模型进行训练。
在上述实施例的技术方案中,目标物体检测装置还包括:
位置信息识别模块,用于识别所述待识别图像中所述目标物体的位置信息;
目标物体图像截取模块,用于根据所述位置信息从所述待检测图像中截取所述目标物体图像;
校验模块:用于对所述目标物体图像进行物体类别的预测,根据所述目标物体图像的预测结果对所述目标物体的类别信息进行校验。
可选的,校验模块,包括:特征信息提取单元,用于基于特征提取模型提取所述目标物体图像的特征信息;特征信息分析单元,用于基于SVM模型对所述目标物体图像的特征信息进行分析,得到所述目标物体图像的预测结果,若所述预测结果与所述目标物体的类别信息一致,则确定目标物体的类别信息正确。
本实施例的技术方案,解决了在检测目标物体时,存在很多的误检,检测准确率不高的问题,在检测时,除利用目标物体本身的信息外,还结合了图像中的场景信息,大大提升了检测效率,另外检测完之后,再对检测结果进行验证,进一步消除了误检,提高检测物体的准确率。
本发明实施例所提供的目标物体检测装置可执行本发明任意实施例所提供的目标物体检测方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5为本发明实施例五提供的一种计算设备的结构示意图,如图5所示,该计算设备包括处理器510、存储器520、输入装置530和输出装置540;计算设备中处理器510的数量可以是一个或多个,图5中以一个处理器510为例;计算设备中的处理器510、存储器520、输入装置530和输出装置540可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器520作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的目标物体检测方法对应的程序指令/模块(例如,目标物体检测装置中的图片获取模块410,信息识别模块420和判断模块430)。处理器510通过运行存储在存储器520中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的目标物体检测方法。
存储器520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器520可进一步包括相对于处理器510远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置530可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置540可包括显示屏等显示设备。
实施例六
本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种目标物体检测方法,该方法包括:
获取待检测图像;
识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息;
根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的目标物体检测方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述目标物体检测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种目标物体检测方法,其特征在于,包括:
获取待检测图像;
识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息;
根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
2.根据权利要求1所述的方法,其特征在于:识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息,包括:
将所述待识别图像输入预先训练的检测模型中,根据所述检测模型的输出确定所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息。
3.根据权利要求2所述的方法,其特征在于:所述检测模型包括依次连接的resnet网络、FPN网络和FCN网络,其中,
所述resnet网络包括senet网络,用于对所述待检测图像进行特征提取,其中,所述senet网络用于对提取的特征进行增强;
所述FPN网络用于对增强后的特征进行融合;
所述FCN网络用于根据融合后的特征对目标物体进行分类以及对待检测图像的场景进行分类。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述物体与场景的对应关系,采集各场景下的样本图像;
基于所述样本图像对待训练的检测模型进行训练,生成所述检测模型。
5.根据权利要求4所述的方法,其特征在于,在采集各场景下的样本图像之后,还包括:
对所述样本图像进行预处理,生成至少一个衍生样本图像,其中,所述预处理包括:翻转、旋转、平移、剪裁、加入噪声、抖动和图像填充中的至少一项,所述衍生样本图像用于对所述待训练的检测模型进行训练。
6.根据权利要求1所述的方法,其特征在于:在确定目标物体的类别信息和场景信息匹配之后,还包括:
识别所述待识别图像中所述目标物体的位置信息;
根据所述位置信息从所述待检测图像中截取所述目标物体图像;
对所述目标物体图像进行物体类别的预测,根据所述目标物体图像的预测结果对所述目标物体的类别信息进行校验。
7.根据权利要求6所述的方法,其特征在于,对所述目标物体图像进行物体类别的预测,根据所述目标物体图像的预测结果对所述目标物体的类别信息进行校验,包括:
基于特征提取模型提取所述目标物体图像的特征信息;
基于SVM模型对所述目标物体图像的特征信息进行分析,得到所述目标物体图像的预测结果,若所述预测结果与所述目标物体的类别信息一致,则确定目标物体的类别信息正确。
8.一种目标物体检测装置,其特征在于,包括:
图片获取模块,用于获取需要检测的图片;
信息识别模块,用于识别所述待检测图像的场景信息和所述待检测图像中目标物体的类别信息;
判断模块,用于根据预先建立的物体和场景的对应关系判断检测到目标物体的类别信息和场景信息是否匹配,若匹配,则保留所述目标物体的类别信息。
9.一种计算设备,其特征在于,所述计算设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的目标物体的检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的目标物体的检测方法。
CN201911012285.XA 2019-10-23 2019-10-23 一种目标物体检测方法、装置、计算设备和介质 Active CN110781805B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911012285.XA CN110781805B (zh) 2019-10-23 2019-10-23 一种目标物体检测方法、装置、计算设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911012285.XA CN110781805B (zh) 2019-10-23 2019-10-23 一种目标物体检测方法、装置、计算设备和介质

Publications (2)

Publication Number Publication Date
CN110781805A true CN110781805A (zh) 2020-02-11
CN110781805B CN110781805B (zh) 2024-05-07

Family

ID=69386563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911012285.XA Active CN110781805B (zh) 2019-10-23 2019-10-23 一种目标物体检测方法、装置、计算设备和介质

Country Status (1)

Country Link
CN (1) CN110781805B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101322A (zh) * 2020-11-17 2020-12-18 深圳市优必选科技股份有限公司 目标物体检测模型、训练方法、物体检测方法和相关设备
CN112200161A (zh) * 2020-12-03 2021-01-08 北京电信易通信息技术股份有限公司 一种基于混合注意力机制的人脸识别检测方法
CN112633069A (zh) * 2020-11-26 2021-04-09 贝壳技术有限公司 物体检测方法及装置
CN113095194A (zh) * 2021-04-02 2021-07-09 北京车和家信息技术有限公司 图像分类方法、装置、存储介质及电子设备
CN113128407A (zh) * 2021-04-21 2021-07-16 湖北微果网络科技有限公司 扫描识物方法、系统、计算机设备及存储介质
CN114049444A (zh) * 2022-01-13 2022-02-15 深圳市其域创新科技有限公司 一种3d场景生成方法及装置
CN114998357A (zh) * 2022-08-08 2022-09-02 长春摩诺维智能光电科技有限公司 基于多信息分析的工业检测方法、系统、终端和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140172643A1 (en) * 2012-12-13 2014-06-19 Ehsan FAZL ERSI System and method for categorizing an image
CN104573711A (zh) * 2014-12-22 2015-04-29 上海交通大学 基于文本-物体-场景关系的物体和场景的图像理解方法
CN108875750A (zh) * 2017-08-25 2018-11-23 北京旷视科技有限公司 物体检测方法、装置和系统及存储介质
CN109345510A (zh) * 2018-09-07 2019-02-15 百度在线网络技术(北京)有限公司 物体检测方法、装置、设备、存储介质及车辆
CN109350032A (zh) * 2018-10-16 2019-02-19 武汉中旗生物医疗电子有限公司 一种分类方法、系统、电子设备及存储介质
CN109614985A (zh) * 2018-11-06 2019-04-12 华南理工大学 一种基于密集连接特征金字塔网络的目标检测方法
CN109961423A (zh) * 2019-02-15 2019-07-02 平安科技(深圳)有限公司 一种基于分类模型的肺结节检测方法、服务器及存储介质
CN110175236A (zh) * 2019-04-24 2019-08-27 平安科技(深圳)有限公司 用于文本分类的训练样本生成方法、装置和计算机设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140172643A1 (en) * 2012-12-13 2014-06-19 Ehsan FAZL ERSI System and method for categorizing an image
CN104573711A (zh) * 2014-12-22 2015-04-29 上海交通大学 基于文本-物体-场景关系的物体和场景的图像理解方法
CN108875750A (zh) * 2017-08-25 2018-11-23 北京旷视科技有限公司 物体检测方法、装置和系统及存储介质
CN109345510A (zh) * 2018-09-07 2019-02-15 百度在线网络技术(北京)有限公司 物体检测方法、装置、设备、存储介质及车辆
CN109350032A (zh) * 2018-10-16 2019-02-19 武汉中旗生物医疗电子有限公司 一种分类方法、系统、电子设备及存储介质
CN109614985A (zh) * 2018-11-06 2019-04-12 华南理工大学 一种基于密集连接特征金字塔网络的目标检测方法
CN109961423A (zh) * 2019-02-15 2019-07-02 平安科技(深圳)有限公司 一种基于分类模型的肺结节检测方法、服务器及存储介质
CN110175236A (zh) * 2019-04-24 2019-08-27 平安科技(深圳)有限公司 用于文本分类的训练样本生成方法、装置和计算机设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101322A (zh) * 2020-11-17 2020-12-18 深圳市优必选科技股份有限公司 目标物体检测模型、训练方法、物体检测方法和相关设备
CN112633069A (zh) * 2020-11-26 2021-04-09 贝壳技术有限公司 物体检测方法及装置
CN112200161A (zh) * 2020-12-03 2021-01-08 北京电信易通信息技术股份有限公司 一种基于混合注意力机制的人脸识别检测方法
CN113095194A (zh) * 2021-04-02 2021-07-09 北京车和家信息技术有限公司 图像分类方法、装置、存储介质及电子设备
CN113128407A (zh) * 2021-04-21 2021-07-16 湖北微果网络科技有限公司 扫描识物方法、系统、计算机设备及存储介质
CN114049444A (zh) * 2022-01-13 2022-02-15 深圳市其域创新科技有限公司 一种3d场景生成方法及装置
CN114998357A (zh) * 2022-08-08 2022-09-02 长春摩诺维智能光电科技有限公司 基于多信息分析的工业检测方法、系统、终端和介质
CN114998357B (zh) * 2022-08-08 2022-11-15 长春摩诺维智能光电科技有限公司 基于多信息分析的工业检测方法、系统、终端和介质

Also Published As

Publication number Publication date
CN110781805B (zh) 2024-05-07

Similar Documents

Publication Publication Date Title
CN110781805B (zh) 一种目标物体检测方法、装置、计算设备和介质
CN109284729B (zh) 基于视频获取人脸识别模型训练数据的方法、装置和介质
US20210182611A1 (en) Training data acquisition method and device, server and storage medium
CN104537341B (zh) 人脸图片信息获取方法和装置
CN111340126B (zh) 物品识别方法、装置、计算机设备和存储介质
CN109426785B (zh) 一种人体目标身份识别方法及装置
CN108009466B (zh) 行人检测方法和装置
CN110427859A (zh) 一种人脸检测方法、装置、电子设备及存储介质
CN105046186A (zh) 一种二维码的识别方法及装置
CN108229324A (zh) 手势追踪方法和装置、电子设备、计算机存储介质
CN108228421A (zh) 数据监测方法、装置、计算机及存储介质
CN109815823B (zh) 数据处理方法及相关产品
CN111444850A (zh) 一种图片检测的方法和相关装置
JP7393475B2 (ja) 画像を検索するための方法、装置、システム、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
CN112784835A (zh) 圆形印章的真实性识别方法、装置、电子设备及存储介质
CN110751004A (zh) 二维码检测方法、装置、设备及存储介质
CN110363206B (zh) 数据对象的聚类、数据处理及数据识别方法
CN107992872B (zh) 一种对图片进行文本识别的方法及移动终端
CN111310531A (zh) 图像分类方法、装置、计算机设备及存储介质
CN110084187B (zh) 基于计算机视觉的位置识别方法、装置、设备及存储介质
CN108171053B (zh) 一种规则发现的方法以及系统
CN114266921A (zh) 图像描述信息获取方法、装置、服务器及存储介质
CN109255016A (zh) 基于深度学习的应答方法、装置及计算机可读存储介质
CN107341457A (zh) 人脸检测方法及装置
WO2017219562A1 (zh) 一种二维码生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: China

Address after: Room 1103, Building 21, 39 Jibang Road, Zhongming Town, Shanghai 202163

Applicant after: Shanghai Extreme Chain Technology Development Group Co.,Ltd.

Address before: Room 1103, Building 21, 39 Jibang Road, Zhongming Town, Shanghai 202163

Applicant before: SHANGHAI JILIAN NETWORK TECHNOLOGY Co.,Ltd.

Country or region before: China

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240402

Address after: Building 1, No. 19 West Fourth Ring Middle Road, Haidian District, Beijing, 100000, Floor 5-776

Applicant after: Beijing Jianwei Zhizhu Intelligent Technology Co.,Ltd.

Country or region after: China

Address before: Room 1103, Building 21, 39 Jibang Road, Zhongming Town, Shanghai 202163

Applicant before: Shanghai Extreme Chain Technology Development Group Co.,Ltd.

Country or region before: China

GR01 Patent grant
GR01 Patent grant