CN109063542A - 图片识别方法、装置、计算机设备及存储介质 - Google Patents

图片识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109063542A
CN109063542A CN201810594253.4A CN201810594253A CN109063542A CN 109063542 A CN109063542 A CN 109063542A CN 201810594253 A CN201810594253 A CN 201810594253A CN 109063542 A CN109063542 A CN 109063542A
Authority
CN
China
Prior art keywords
picture
face
identified
preset
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810594253.4A
Other languages
English (en)
Inventor
蔡俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810594253.4A priority Critical patent/CN109063542A/zh
Priority to PCT/CN2018/106398 priority patent/WO2019237548A1/zh
Publication of CN109063542A publication Critical patent/CN109063542A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图片识别方法、装置、计算机设备及存储介质,所述方法包括:首先,通过获取待识别的图片,和获取预设的模板图片,然后,经过对图片判断后,确定该图片是含有肤色的图片,则基于dlib识别图片是否是含有人脸的图片,如果图片是含有人脸的图片,那么基于dlib对图片进行人脸关键点检测,得到图片上的人脸关键点位置信息,最后,确定图片上的人脸关键点位置信息与模板图片上的目标人脸关键点位置信息一致,则确定图片为含有目标人物人脸的图片,经过基于dlib对图片识别的过程,从而能准确地从海量的图片中挑选出想要得到的图片信息,进而提高了识别图片的准确率。

Description

图片识别方法、装置、计算机设备及存储介质
技术领域
本发明涉及金融领域,尤其涉及一种图片识别方法、装置、计算机设备及存储介质。
背景技术
目前,在金融行业中,图片信息对金融公司的商业决策起着非常重要的作用,金融公司常常需要花费大量的时间在浏览图片,从海量的图片中进行挑选出想要的图片信息,但是在图片展现时,除了图片本身之外,只能展现一些简单的标题信息或文本信息,用户无法获得与图片相关的其他信息,从而导致获取图片信息的准确率低。
发明内容
本发明实施例提供一种图片识别方法、装置、计算机设备及存储介质,以解决获取图片信息的准确率的问题。
本发明实施例提供一种图片识别方法,包括:
获取待识别的图片;
获取预设的模板图片,其中,所述模板图片中含有目标人物人脸信息,所述目标人物人脸信息中含有目标人脸关键点位置信息;
若所述待识别的图片是含有肤色的图片,则基于dlib识别所述待识别的图片是否是含有人脸的图片;
若所述待识别的图片是含有人脸的图片,则基于dlib对所述待识别的图片进行人脸关键点检测,得到所述待识别的图片上的人脸关键点位置信息;
若所述待识别的图片上的人脸关键点位置信息与所述模板图片上的目标人脸关键点位置信息一致,则确定所述待识别的图片为含有所述目标人物人脸的图片。
本发明实施例提供一种图片识别装置,包括:
第一获取模块,用于获取待识别的图片;
第二获取模块,用于获取预设的模板图片,其中,所述模板图片中含有目标人物人脸信息,所述目标人物人脸信息中含有目标人脸关键点位置信息;
识别模块,用于若所述待识别的图片是含有肤色的图片,则基于dlib识别所述待识别的图片是否是含有人脸的图片;
检测模块,用于若所述待识别的图片是含有人脸的图片,则基于dlib对所述待识别的图片进行人脸关键点检测,得到所述待识别的图片上的人脸关键点位置信息;
第一确定模块,用于若所述待识别的图片上的人脸关键点位置信息与所述模板图片上的目标人脸关键点位置信息一致,则确定所述待识别的图片为含有所述目标人物人脸的图片。
本发明实施例提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述图片识别方法的步骤。
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述图片识别方法的步骤。
本发明实施例所提供的图片识别方法、装置、计算机设备及存储介质中,首先,通过获取待识别的图片,和获取预设的模板图片,然后,经过对图片判断后,确定该图片是含有肤色的图片,则基于dlib识别图片是否是含有人脸的图片,如果图片是含有人脸的图片,那么基于dlib对图片进行人脸关键点检测,得到图片上的人脸关键点位置信息,最后,确定图片上的人脸关键点位置信息与模板图片上的目标人脸关键点位置信息一致,则确定图片为含有目标人物人脸的图片,经过基于dlib库中的精准的机器学习算法对图片识别的过程,从而能准确地从海量的图片中挑选出想要得到的图片信息,进而提高了识别图片的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中图片识别方法的一流程图;
图2是本发明一实施例中图片识别方法中基于dlib识别图片是否是含有人脸的图片的一流程图;
图3是本发明一实施例中图片识别方法中基于dlib对图片进行人脸关键点检测的一流程图;
图4是本发明一实施例中图片识别方法中对图片进行格式转换和确定图片是含有肤色的图片的一流程图;
图5是本发明一实施例中图片识别方法中从网络中获取图片路径信息和获取图片的一流程图;
图6是本发明一实施例中图片识别装置的一示意图;
图7是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一实施例中,图1示出本实施例中图片识别方法的流程图。该图片识别方法可以应用在金融行业中。如图1所示,该图片识别方法包括如下步骤:
S10:获取待识别的图片;
在本实施例中,可以预先设有图片数据库专门用于存储待识别的图片。
具体地,首先,获取待识别的图片在待识别的图片数据库中的存储路径信息,然后,根据该存储路径信息对待识别的图片进行提取。
需要说明的是,待识别的图片的来源方式还可以为通过网络从网页上获得图片或通过收集物理相册中的图片获得图片,待识别的图片的来源方式的具体内容,根据实际应用需求进行设定,此处不做限制。
S20:获取预设的模板图片;
在本实施例中,模板图片中含有目标人物人脸信息,目标人物人脸信息中含有目标人脸关键点位置信息。模板数据库专门用于存储预设的模板图片。目标人物是指模板图片中的人,目标人物人脸信息包括目标人物的肤色、眉毛和目标人脸关键点位置等信息,目标人脸关键点包括目标人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框,目标人脸关键点位置信息可以为目标人脸关键点的目标坐标值。
具体地,首先,获取预设的模板图片在模板数据库中的目标存储路径信息,然后,根据该目标存储路径信息对预设的模板图片进行提取,其中,预设的模板图片中包含有目标人物的肤色、眉毛和目标人脸关键点位置等信息,目标人脸关键点位置信息为目标人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框的目标坐标值。
S30:若待识别的图片是含有肤色的图片,则基于dlib识别待识别的图片是否是含有人脸的图片;
在本实施例中,含有肤色的图片具体可以代表图片中含有人体肤色,因此可以认为含有肤色的图片中也包含有人物。dlib是指一个包含机器学习算法的C++开源工具包,是一个跨平台的C++库,包含了许多机器学习算法。
具体地,如果待识别的图片是含有人的图片,那么基于dlib识别含有人的图片是否是含有人脸的图片,如果含有人的图片不是含有肤色的图片,则将该含有人的图片保存到备用数据库中,以便可以在实际需要时对该含有人的图片进行提取。
需要说明的是,含有肤色的图片保存在肤色数据库中。
S40:若待识别的图片是含有人脸的图片,则基于dlib对待识别的图片进行人脸关键点检测,得到待识别的图片上的人脸关键点位置信息;
在本实施例中,人脸关键点包括人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框,人脸关键点位置信息为人脸关键点的坐标值。含有人脸的图片保存在人脸数据库中。
具体地,若肤色数据库中的含有肤色的图片是含有人脸的图片,则基于dlib对含有人脸的图片进行人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框检测,得到含有人脸的图片上的人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框的坐标值,并将人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框的坐标值保存到关键点数据库中。若肤色数据库中的含有肤色的图片不是含有人脸的图片,则将该含有人脸的图片保存到备用数据库中,以便可以在实际需要时对该含有人脸的图片进行提取。
S50:若待识别的图片上的人脸关键点位置信息与模板图片上的目标人脸关键点位置信息一致,则确定待识别的图片为含有目标人物人脸的图片。
具体地,首先,获取人脸关键点位置信息在关键点数据库中的存储路径信息,然后,根据该存储路径信息对人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框的坐标值进行提取,接下来,获取模板图片在模板数据库中的目标存储路径信息,再接下来,根据该目标存储路径信息对模板图片进行提取,得到模板图片,提取模板图片中的目标人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框的目标坐标值,再接下来,比对坐标值与目标坐标值是否一致,最后,若含人脸的图片上的人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框的坐标值与模板图片上的目标人物的眼睛边框、鼻子边框、嘴巴边框和人脸边框的坐标值一致,则确定该含人脸的图片为含有目标人物人脸的图片。
为了更好地理解步骤S50,下面通过一个例子进行说明,具体表述如下:例如,假设含人脸的图片为2007 007763.jpg,关键点数据库为第一mysql数据库,人脸关键点信息在第一mysql数据库中的存储路径信息为C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\Data1,2007 007763.jpg中人物的人脸关键点信息为左眼睛的坐标值为(-19,0)、(-5,0)、(0,13)和(0,20),右眼睛边框的坐标值为(6,0)、(20,0)、(0,13)和(0,20),鼻子边框的坐标值为(-8,0)、(8,0)、(0,-10)和(0,15),嘴巴边框的坐标值为(-10,0)、(10,0)、(0,-15)和(0,-19),人脸边框的坐标值为(-24,0)、(26,0)、(0,-37)和(0,43),模板图片为2005 003563.jpg,模板数据库为第二mysql数据库,模板图片在第二mysql数据库中的存储路径信息为C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\Data2,目标人物为小明,2005 003563.jpg中小明目标关键点信息为左眼睛边框的目标坐标值为(-19,0)、(-5,0)、(0,13)和(0,20),右眼睛边框的目标坐标值为(6,0)、(20,0)、(0,13)和(0,20),鼻子边框的目标坐标值为(-8,0)、(8,0)、(0,-10)和(0,15),嘴巴边框的目标坐标值为(-10,0)、(10,0)、(0,-15)和(0,-19),人脸边框的目标坐标值为(-24,0)、(26,0)、(0,-37)和(0,43),则首先,获取左眼睛的坐标值(-19,0)、(-5,0)、(0,13)和(0,20),右眼睛边框的坐标值(6,0)、(20,0)、(0,13)和(0,20),鼻子边框的坐标值(-8,0)、(8,0)、(0,-10)和(0,15),嘴巴边框的坐标值(-10,0)、(10,0)、(0,-15)和(0,-19),人脸边框的坐标值(-24,0)、(26,0)、(0,-37)和(0,43)在第一mysql数据库中的C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\Data1,然后,根据C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\Data1对左眼睛的坐标值(-19,0)、(-5,0)、(0,13)和(0,20),右眼睛边框的坐标值(6,0)、(20,0)、(0,13)和(0,20),鼻子边框的坐标值(-8,0)、(8,0)、(0,-10)和(0,15),嘴巴边框的坐标值(-10,0)、(10,0)、(0,-15)和(0,-19),人脸边框的坐标值(-24,0)、(26,0)、(0,-37)和(0,43)进行提取,接下来,获取2005 003563.jpg在第二mysql数据库中的C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\Data2,再接下来,根据C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\Data2对2005 003563.jpg进行提取,得到2005 003563.jpg,提取2005 003563.jpg中的小明的左眼睛边框的目标坐标值(-19,0)、(-5,0)、(0,13)和(0,20),右眼睛边框的目标坐标值(6,0)、(20,0)、(0,13)和(0,20),鼻子边框的目标坐标值(-8,0)、(8,0)、(0,-10)和(0,15),嘴巴边框的目标坐标值(-10,0)、(10,0)、(0,-15)和(0,-19),人脸边框的目标坐标值(-24,0)、(26,0)、(0,-37)和(0,43),接下来,经过比对,2007 007763.jpg上的人物的左眼睛的坐标值(-19,0)、(-5,0)、(0,13)和(0,20),右眼睛边框的坐标值(6,0)、(20,0)、(0,13)和(0,20),鼻子边框的坐标值(-8,0)、(8,0)、(0,-10)和(0,15),嘴巴边框的坐标值(-10,0)、(10,0)、(0,-15)和(0,-19),人脸边框的坐标值(-24,0)、(26,0)、(0,-37)和(0,43)与2005 003563.jpg上的小明的左眼睛边框的目标坐标值(-19,0)、(-5,0)、(0,13)和(0,20),右眼睛边框的目标坐标值(6,0)、(20,0)、(0,13)和(0,20),鼻子边框的目标坐标值(-8,0)、(8,0)、(0,-10)和(0,15),嘴巴边框的目标坐标值(-10,0)、(10,0)、(0,-15)和(0,-19),人脸边框的目标坐标值(-24,0)、(26,0)、(0,-37)和(0,43)一致,则确定2007 007763.jpg为含有目标人物人脸的图片。
在图1对应的实施例中,首先,通过获取待识别的图片,和获取预设的模板图片,然后,经过对图片判断后,确定该图片是含有肤色的图片,则基于dlib识别图片是否是含有人脸的图片,如果图片是含有人脸的图片,那么基于dlib对图片进行人脸关键点检测,得到图片上的人脸关键点位置信息,最后,确定图片上的人脸关键点位置信息与模板图片上的目标人脸关键点位置信息一致,则确定图片为含有目标人物人脸的图片,经过基于dlib对图片识别的过程,从而能准确地从海量的图片中挑选出想要得到的图片信息,进而提高了识别图片的准确率。
在一实施例中,该图片识别方法应用在金融行业中。如图2所示,步骤S30中,即基于dlib识别图片是否是含有人脸的图片具体包括如下步骤:
S301:采用支持向量机人脸检测器对待识别的图片进行人脸检测,得到输出数值,其中,支持向量机人脸检测器基于dlib预先训练得到;
在本实施例中,SVM,英文全称为Support Vector Machine,中文名为支持向量机,是指针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能,同时,基于结构风险最小化理论之上在特征空间中构建最优超平面,使得学习器得到全局最优化,并且在整个样本空间的期望以某个概率满足一定上界的一种算法模型。
具体地,首先,获取含有肤色的图片在肤色数据库中的存储路径信息,然后,根据该存储路径信息对含有肤色的图片进行提取,接下来,采用支持向量机人脸检测器对该含有肤色的图片进行人脸检测,得到输出数值,其中,支持向量机人脸检测器基于dlib通过机器学习算法预先训练得到。
S302:若输出数值大于预设的第一阈值,则确定待识别的图片是含有人脸的图片;
具体地,如果输出数值大于预设的第一阈值,那么确定肤色数据中的含有肤色的图片是含有人脸的图片。
在图2对应的实施例中,通过采用基于dlib预先训练得到的支持向量机人脸检测器对待识别的图片进行人脸检测,得到输出数值,若输出数值大于预设的第一阈值,则确定待识别的图片是含有人脸的图片,从而可以从海量的未知图片中,识别出待识别的图片是否是含有人脸的图片,进而提高了识别图片的准确率。
在一实施例中,该图片识别方法应用在金融行业中。如图3所示,步骤S40中,即基于dlib对图片进行人脸关键点检测,得到图片上的人脸关键点信息具体包括如下步骤:
S401:采用梯度提升决策树人脸关键点检测器对图片进行人脸关键点检测,得到图片上的人脸关键点位置信息,梯度提升决策树人脸关键点检测器基于dlib通过机器学习算法预先训练得到;
在本实施例中,GBDT,全称为Gradient Boosting Decision Tree,中文名为梯度提升决策树,是一种迭代的决策树算法。
具体地,首先,获取含有人脸的图片在人脸数据库中的存储路径信息,然后,根据该存储路径信息对含有人脸的图片进行提取,接下来,采用GBDT人脸关键点检测器对人脸数据中的含有人脸的图片进行人脸关键点检测,得到含有人脸的图片上的人脸关键点信息,GBDT人脸关键点检测器基于dlib预先训练得到。
在图3对应的实施例中,通过采用基于dlib预先训练得到的GBDT人脸关键点检测器对图片进行人脸关键点检测,得到图片上的人脸关键点信息,从而能够从含有人脸的图片中,精准地获取人脸关键点位置信息,进而提高了识别图片的准确率。
在一实施例中,该图片识别方法应用在金融行业中。如图4所示,在确定步骤S30中,即图片是含有肤色的图片之前,该图片识别方法还包括如下步骤:
S61:按照预设的补偿方式对图片进行补偿,得到第一格式图片;
在本实施例中,第一格式可以为RGB888色彩格式,其中,RGB888是指真色彩模式,图像中的每个像素值都分为R、G和B三个基色分量,其中,R代表红色、G代表绿色和B代表蓝色,8代表每一色光以8位元表示。第一格式的具体内容,根据实际应用需求进行设定,此处不做限制。
需要说明的是,第一格式包括多个分量。
具体地,首先,获取待识别的图片在图片数据库中的存储路径信息,然后,根据该存储路径信息对含有待识别的图片进行提取,接下来,按照预设的补偿方式对待识别的图片数据库中的待识别的图片进行补偿,得到第一格式图片。
需要说明的是,预设的补偿方式可以为在第一格式图片在原有的基础上进行N轮补偿,其中,N大于等于2。预设的补偿方式的具体内容,根据实际应用需求进行设定,此处不做限制。
为了更好地理解步骤S61,下面通过一个例子进行说明,具体表述如下:
例如,假设待识别的图片数据库为第三mysql数据库,待识别的图片为timg.jpg,第一格式为RGB格式,timg.jpg的R为{R2 R1 R0},G为{G2 G1 G0}和B为{B1 B0},timg.jpg的存储路径信息为:C:\ProgramFiles\MicrosoftSQLServer\MSSQL.1\MSSQL\Data\timg.jpg,预设的补偿方式为在待识别的图片的R、G和B部分在原有的基础上进行4轮补偿,则,首先,获取timg.jpg在第三mysql数据库中的C:\ProgramFiles\MicrosoftSQLServer\MSSQL.1\MSSQL\Data\timg.jpg,然后,根据C:\ProgramFiles\MicrosoftSQLServer\MSSQL.1\MSSQL\Data\timg.jpg对含有timg.jpg进行提取,接下来,将timg.jpg的R为{R2R1 R0},G为{G2 G1 G0}和B为{B1 B0}进行四轮的补偿,四轮补偿为:第一轮:{R2R1R0 0 00 0 0}{G2 G1 G0 0 0 0 0 0}{B1 B0 0 0 0 0 0 0},第二轮:{R2 R1 R0 R2 R1 R0 0 0}{G2 G1 G0 G2 G1 G0 0 0}{B1 B0 B1 B0 0 0 0 0},第三轮:{R2 R1 R0 R2 R1 R0 R2 R1}{G2 G1 G0 G2 G1 G0 G2 G1}{B1 B0 B1 B0 B1 B0 0 0},第四轮:RGB888{R2 R1 R0 R2 R1R0 R2 R1}{G2 G1 G0 G2 G1 G0 G2 G1}{B1 B0 B1 B0 B1 B0 B1 B0},得到RGB888格式的timg.jpg,RGB888格式的timg.jpg的R为{R2 R1 R0 R2 R1 R0 R2 R1},G为{G2 G1 G0 G2G1 G0 G2 G1}和B为{B1 B0 B1 B0 B1 B0 B1 B0}。
S62:按照预设的转换方式对第一格式图片进行转换,得到转换后的第二格式的图片;
在本实施例中,第二格式可以为YCbCr,YCbCr是一种色彩空间,通常会用于影片中的影像连续处理,或是数字摄影系统中。Y为颜色的亮度成分、而Cb和Cr则为蓝色和红色的浓度偏移量成份,Cb和Cr合称为色彩分量。Y就是所谓的流明,表示光的浓度且为非线性,第二格式的具体内容,根据实际应用需求进行设定,此处不做限制。
需要说明的是,第二格式包括多个分量。
具体地,采用预设的转换公式对第一格式图片进行转换,得到第二格式的图片,并将第二格式的图片保存到格式数据库中,其中,预设的转换公式为Y=0.257*R+0.504*G+0.098*B+16,Cb=0.148*R0.291*G+0.439*B+128,Cr=0.439*R-0.368*G-0.071*B+128。
为了更好地理解步骤S62,下面通过一个例子进行说明,具体表述如下:
例如,继续以步骤S61中的例子进行说明,假设第一格式为RGB888,第一格式为YCbCr,RGB888格式timg.jpg中的R为11011011,G为10110110,B为01010101,格式数据库为第四mysql数据库,则,采用Y=0.257*R+0.504*G+0.098*B+16,Cb=0.148*R0.291*G+0.439*B+128,Cr=0.439*R-0.368*G-0.071*B+128对timg.jpg进行转换,得到转换后的YCbCr格式timg.jpg,timg.jpg的Y为00010011、Cb为131和Cr为131,并将timg.jpg保存到第四mysql数据库。
确定图片是含有肤色的图片具体为:S631:提取转第二格式的图片中的第一分量。
在本实施例中,第一分量可以为Cb分量,第一分量的具体内容,根据实际应用需求进行设定,此处不做限制。
具体地,首先,获取第二格式的图片在格式数据库中的存储路径信息,然后,根据该存储路径信息对第二格式的图片进行提取,接下来,提取第二格式的图片中的第一分量。
S632:提取第二格式的图片中的第二分量;
在本实施例中,第二分量可以为Cr分量,第二分量的具体内容,根据实际应用需求进行设定,此处不做限制。
具体地,提取第二格式的图片中的第一分量。
S633:若第一分量在预设的第二阈值与预设的第三阈值之间,且第二分量在预设的第四阈值与预设的第五阈值之间,则确定第二格式的图片是含有肤色的图片;
具体地,若第二格式的图片中的第一分量在预设的第二阈值与预设的第三阈值之间,且第二格式的图片中的第二分量在预设的第四阈值与预设的第五阈值之间,则确定第二格式的图片是含有肤色的图片。
为了更好地理解步骤S633,下面通过一个例子进行说明,具体表述如下:
例如,继续以步骤S61和步骤S62中的例子进行说明,假设timg.jpg在第四mysql数据库中的存储路径信息为C:\ProgramFiles\MicrosoftSQLServer\MSSQL.1\MSSQL\Data\timg.jpg,预设的阈值一为97,预设的阈值二为137,预设的阈值三为121,预设的阈值一为173,则,首先,获取timg.jpg在第四mysql数据库中的C:\ProgramFiles\MicrosoftSQLServer\MSSQL.1\MSSQL\Data\timg.jpg,然后,根据C:\ProgramFiles\MicrosoftSQLServer\MSSQL.1\MSSQL\Data\timg.jpg对timg.jpg进行提取,接下来,提取timg.jpg的131,提取timg.jpg的另一个131,显然,131在97与137之间,且另一个131在121与173之间,则确定第二格式的timg.jpg是含有肤色的图片。
在图4对应的实施例中,首先,通过按照预设的补偿方式对图片进行补偿,得到全色彩第二格式的图片,按照预设的转换方式将全色彩模拟量第一格式图片进行转换为数字化第二格式的图片,然后,提取经转换得到的第二格式的图片中的第一分量,提取第二格式的图片中的第二分量,最后,确定第一分量在预设的第二阈值与预设的第三阈值之间,且第二分量在预设的第四阈值与预设的第五阈值之间,则确定第二格式的图片是含有肤色的图片,从而将非全色彩图片转换为全色彩图片,增强了图片的光亮度,再将模拟量图片转为数字化图片,最后能从海量图片中确定出图片是否含有人,进而提高了识别图片的精准度。
在一实施例中,该图片识别方法应用在金融行业中。如图5所示,在步骤S10之前,该图片识别方法还包括如下步骤:
S71:访问预设的网页地址信息对应的第一网页;
在本实施例中,预设的网页地址信息为一个网站的首页的地址信息,如:https://news.baidu.com/。
具体地,采用预设的浏览器访问预设的网页地址信息对应的网站首页。
需要说明的是,预设的浏览器可以为IE浏览器或360浏览器等,预设的网页地址信息和预设的浏览器的具体内容,根据实际应用需求进行设定,此处不做限制。
S72:若访问成功,则在第一网页中,按照预设的查询方式查询出预设的类别信息对应的资源信息;
具体地,若采用预设的浏览器访问预设的网页地址信息对应的网页成功,则在该网页中,按照预设的查询方式查询出预设的类别信息对应的资源信息。
需要说明的是,预设的查询方式可以为在网页内的搜索栏输入关键字段进行查询或者按照从上到下顺序浏览网页方式进行查询。预设的类别信息可以为姓氏类型等,预设的查询方式和预设的类别信息的具体内容,根据实际应用需求进行设定,此处不做限制。
为了更好地理解步骤S72,下面通过一个例子进行说明,具体表述如下:
例如,假设预设的浏览器为IE浏览器,网页为instagram网站的首页,网页地址信息为www.instagram.com,预设的查询方式为在网页内的搜索栏输入关键字段进行查询,预设的类别信息为Dawit,资源列表为dawitzu、dawit_dk。则,若使用IE浏览器访问www.instagram.com对应的instagram网站的首页成功,则在instagram网站的首页中,将Dawit输入到www.instagram.com对应的首页内的搜索栏中,查询出Dawit对应的dawitzu和dawit_dk。
S73:按照预设的拼接方式将网页地址信息与资源信息进行拼接,得到目标网页地址信息;
具体地,按照预设的拼接方式将网页地址信息与资源信息进行拼接,得到目标网页地址信息。
需要说明的是,预设的拼接方式可以为将两个信息进行连接等方式,预设的拼接方式的具体内容,根据实际应用需求进行设定,此处不做限制。
为了更好地理解步骤S73,下面通过一个例子进行说明,具体表述如下:
例如,继续以步骤S72中例子进行说明,假设预设的拼接方式可以为将两个信息进行连接,则,将www.instagram.com与dawitzu或dawit_dk进行拼接,得到www.instagram.com/dawitzu/或www.instagram.com/dawit_dk/。
S74:访问目标网页地址信息对应的第二网页;
在本实施例中,第二网页为除网站首页外的其他网页。
具体地,使用预设的浏览器访问目标网页地址信息对应的除网站首页外的其他网页。
S75:若访问目标网页地址信息对应的第二网页成功,则获取第二网页中图片的存储路径信息;
具体地,若使用预设的浏览器访问目标网页地址信息对应的除网站首页外的其他网页成功,则获取除网站首页外的其他网页中图片的存储路径信息。
获取图片具体为:S101:根据存储路径信息从第二网页中获取到的待识别的图片。
具体地,从除网站首页外的其他网页中提取存储路径信息对应的待识别的图片。
在图5对应的实施例中,通过访问预设的网页地址信息对应的第一网页,若访问成功,则在第一网页中,按照预设的查询方式查询出预设的类别信息对应的资源信息,按照预设的拼接方式将网页地址信息与资源信息进行拼接,得到目标网页地址信息,访问目标网页地址信息对应的第二网页,若访问目标网页地址信息对应的第二网页成功,则获取第二网页中图片的存储路径信息,根据存储路径信息从第二网页中获取到的待识别的图片,从而可以通过网络将获取图片资源的范围扩大到世界各地,进而提高了获取图片的便捷性。
在本发明实施例中,首先,通过访问预设的网页地址信息对应的第一网页,若访问成功,则在第一网页中,按照预设的查询方式查询出预设的类别信息对应的资源信息,按照预设的拼接方式将网页地址信息与资源信息进行拼接,得到目标网页地址信息,访问目标网页地址信息对应的第二网页,若访问目标网页地址信息对应的第二网页成功,则获取第二网页中图片的存储路径信息,根据存储路径信息从第二网页中获取到的待识别的图片,获取预设的模板图片,其中,模板图片中含有目标人物人脸信息,目标人物人脸信息中含有目标人脸关键点位置信息,按照预设的补偿方式对图片进行补偿,得到第一格式图片,然后,按照预设的转换方式对第一格式图片进行转换,得到第二格式的图片,提取第二格式的图片中的第一分量,提取第二格式的图片中的第二分量,若第一分量在预设的第二阈值与预设的第三阈值之间,且第二分量在预设的第四阈值与预设的第五阈值之间,则确定第二格式的图片是含有肤色的图片,采用支持向量机人脸检测器对图片进行人脸检测,得到输出数值,其中,支持向量机人脸检测器基于dlib预先训练得到,若输出数值大于预设的第一阈值,则确定图片是含有人脸的图片,接下来,采用GBDT人脸关键点检测器对图片进行人脸关键点检测,得到图片上的人脸关键点位置信息,GBDT人脸关键点检测器基于dlib预先训练得到,最后,确定图片上的人脸关键点位置信息与模板图片上的目标人脸关键点位置信息一致,则确定图片为含有目标人物人脸的图片,通过网络的便捷性获取到世界各地的图片,接着,将弱亮度非全色彩图片转换为强亮度全色彩图片,再将模拟量图片转为数字化图片,再接着,基于dlib中机器学习算法预先训练得到的支持向量机人脸检测器识别图片是否是含有人脸的图片,基于dlib机器学习算法预先训练得到的GBDT人脸关键点检测器对图片进行人脸关键点检测,得到图片上的人脸关键点信息,再接着,确定图片上的人脸关键点位置信息与模板图片上的目标人脸关键点位置信息一致,从而能够从海量的图片中确定出含有目标人物人脸的图片,进而提高了识别图片的准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种图片识别装置,该图片识别装置与上述实施例中图片识别方法一一对应。如图6所示,该图片识别装置包括第一获取模块61、第二获取模块62、识别模块63、检测模块64、第一确定模块65、补偿模块66、转换模块67、第二确定模块68、第一访问模块69、查询模块610、拼接模块611、第二访问模块612和第三获取模块613。各功能模块详细说明如下:
第一获取模块61,用于获取待识别的图片;
第二获取模块62,用于获取预设的模板图片,其中,模板图片中含有目标人物人脸信息,目标人物人脸信息中含有目标人脸关键点位置信息;
识别模块63,用于若待识别的图片是含有肤色的图片,则基于dlib识别待识别的图片是否是含有人脸的图片;
检测模块64,用于若待识别的图片是含有人脸的图片,则基于dlib对待识别的图片进行人脸关键点检测,得到待识别的图片上的人脸关键点位置信息;
第一确定模块65,用于若待识别的图片上的人脸关键点位置信息与模板图片上的目标人脸关键点位置信息一致,则确定待识别的图片为含有目标人物人脸的图片;
补偿模块66,用于按照预设的补偿方式对待识别的图片进行补偿,得到第一格式图片;
转换模块67,用于按照预设的转换方式对第一格式图片进行转换,得到第二格式的图片;
第二确定模块68,用于确定待识别的图片是含有肤色的图片具体为:提取第二格式的图片中的第一分量,提取第二格式的图片中的第二分量,若第一分量在预设的第二阈值与预设的第三阈值之间,且第二分量在预设的第四阈值与预设的第五阈值之间,则确定第二格式的图片是含有肤色的图片。
第一访问模块69,用于访问预设的网页地址信息对应的第一网页;
查询模块610,用于若访问预设的网页地址信息对应的第一网页成功,则在第一网页中,按照预设的查询方式查询出预设的类别信息对应的资源信息;
拼接模块611,用于按照预设的拼接方式将网页地址信息与资源信息进行拼接,得到目标网页地址信息;
第二访问模块612,用于访问目标网页地址信息对应的第二网页;
第三获取模块613,用于若访问目标网页地址信息对应的第二网页成功,则获取第二网页中图片的存储路径信息;
进一步地,第一获取模块61包括:
图片获取子模块6101,用于根据存储路径信息从第二网页中获取到的待识别的图片。
进一步地,识别模块63包括:
人脸检测子模块631,用于采用支持向量机人脸检测器对待识别的图片进行人脸检测,得到输出数值,其中,支持向量机人脸检测器基于dlib预先训练得到;
人脸确定子模块632,用于若输出数值大于预设的第一阈值,则确定待识别的图片是含有人脸的图片。
进一步地,检测模块64包括:
关键点检测子模块641,用于采用梯度提升决策树人脸关键点检测器对待识别的图片进行人脸关键点检测,得到待识别的图片上的人脸关键点位置信息,梯度提升决策树人脸关键点检测器基于dlib预先训练得到。
进一步地,第二确定模块68包括:
第一提取子模块681,用于提取转换后的第二格式的图片中的第一分量;
第二提取子模块682,用于提取转换后的第二格式的图片中的第一分量;
肤色确定子模块683,用于若第一分量在预设的第二阈值与预设的第三阈值之间,且第二分量在预设的第四阈值与预设的第五阈值之间,则确定第二格式的图片是含有肤色的图片。
其中,第一获取模块61、第二获取模块62、识别模块63、检测模块64、第一确定模块65、补偿模块66、转换模块67、第二确定模块68、第一访问模块69、查询模块610、拼接模块611、第二访问模块612和第三获取模块613的实现功能与上述实施例中图片识别方法对应的步骤一一对应,为避免赘述,本实施例不一一详述。
在一实施例中,提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中图片识别方法,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述实施例中图片识别装置的各模块/单元的功能,为避免重复,这里不再赘述。
该计算机可读存储介质可以包括:能够携带所述计算机程序的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号和电信信号等。
在一实施例中,提供一种计算机设备。如图7所示,该实施例的计算机设备70包括:处理器71、存储器72以及存储在存储器72中并可在处理器71上运行的计算机程序73。处理器71执行计算机程序73时实现上述实施例中图片识别方法的步骤,例如图1所示的步骤S10至步骤S50。或者,处理器71执行计算机程序73时实现上述实施例中图片识别装置的各模块/单元的功能,例如图6所示模块60至模块613的功能。
其中,计算机设备70可以是桌上型计算机、笔记本、掌上电脑及云端服务器等设备,图7仅为本实施例中计算机设备的示例,可以包括比如图7示更多或更少的部件,或者组合某些部件或者不同的部件。存储器72可以是计算机设备的内部存储单元,如硬盘或内存,也可以是计算机设备的外部存储单元,如插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。计算机程序73包括程序代码,该程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种图片识别方法,其特征在于,所述图片识别方法包括:
获取待识别的图片;
获取预设的模板图片,其中,所述模板图片中含有目标人物人脸信息,所述目标人物人脸信息中含有目标人脸关键点位置信息;
若所述待识别的图片是含有肤色的图片,则基于dlib识别所述待识别的图片是否是含有人脸的图片;
若所述待识别的图片是含有人脸的图片,则基于dlib对所述待识别的图片进行人脸关键点检测,得到所述待识别的图片上的人脸关键点位置信息;
若所述待识别的图片上的人脸关键点位置信息与所述模板图片上的目标人脸关键点位置信息一致,则确定所述待识别的图片为含有所述目标人物人脸的图片。
2.如权利要求1所述的图片识别方法,其特征在于,所述基于dlib识别所述待识别的图片是否是含有人脸的图片包括:
采用支持向量机人脸检测器对所述待识别的图片进行人脸检测,得到输出数值,其中,所述支持向量机人脸检测器基于dlib预先训练得到;
若所述输出数值大于预设的第一阈值,则确定所述待识别的图片是含有人脸的图片。
3.如权利要求1所述的图片识别方法,其特征在于,所述基于dlib对所述待识别的图片进行人脸关键点检测,得到所述待识别的图片上的人脸关键点位置信息包括:
采用梯度提升决策树人脸关键点检测器对所述待识别的图片进行人脸关键点检测,得到所述待识别的图片上的人脸关键点位置信息,所述梯度提升决策树人脸关键点检测器基于dlib预先训练得到。
4.如权利要求1所述的图片识别方法,其特征在于,在确定所述待识别的图片是含有肤色的图片之前,所述图片识别方法还包括:
按照预设的补偿方式对所述待识别的图片进行补偿,得到第一格式图片;
按照预设的转换方式对所述第一格式图片进行转换,得到第二格式的图片;
所述确定所述待识别的图片是含有肤色的图片具体为:提取所述第二格式的图片中的第一分量;
提取所述第二格式的图片中的第二分量;
若所述第一分量在预设的第二阈值与预设的第三阈值之间,且所述第二分量在预设的第四阈值与预设的第五阈值之间,则确定所述第二格式的图片是所述含有肤色的图片。
5.如权利要求1至4中任一项所述的图片识别方法,其特征在于,在所述获取待识别的图片之前,所述图片识别方法还包括:
访问预设的网页地址信息对应的第一网页;
若访问预设的网页地址信息对应的第一网页成功,则在所述第一网页中,按照预设的查询方式查询出预设的类别信息对应的资源信息;
按照预设的拼接方式将所述网页地址信息与所述资源信息进行拼接,得到目标网页地址信息;
访问所述目标网页地址信息对应的第二网页;
若访问所述目标网页地址信息对应的第二网页成功,则获取所述第二网页中图片的存储路径信息;
所述获取图片具体为:根据所述存储路径信息从所述第二网页中获取到的待识别的图片。
6.一种图片识别装置,其特征在于,所述图片识别装置包括:
第一获取模块,用于获取待识别的图片;
第二获取模块,用于获取预设的模板图片,其中,所述模板图片中含有目标人物人脸信息,所述目标人物人脸信息中含有目标人脸关键点位置信息;
识别模块,用于若所述待识别的图片是含有肤色的图片,则基于dlib识别所述待识别的图片是否是含有人脸的图片;
检测模块,用于若所述待识别的图片是含有人脸的图片,则基于dlib对所述待识别的图片进行人脸关键点检测,得到所述待识别的图片上的人脸关键点位置信息;
第一确定模块,用于若所述待识别的图片上的人脸关键点位置信息与所述模板图片上的目标人脸关键点位置信息一致,则确定所述待识别的图片为含有所述目标人物人脸的图片。
7.如权利要求6所述的图片识别装置,其特征在于,所述基于dlib识别所述待识别的图片是否是含有人脸的图片包括:
人脸检测子模块,用于采用支持向量机人脸检测器对所述待识别的图片进行人脸检测,得到输出数值,其中,所述支持向量机人脸检测器基于dlib预先训练得到;
人脸确定子模块,用于若所述输出数值大于预设的第一阈值,则确定所述待识别的图片是含有人脸的图片。
8.如权利要求6所述的图片识别装置,其特征在于,所述基于dlib对所述待识别的图片进行人脸关键点检测,得到所述待识别的图片上的人脸关键点位置信息包括:
关键点检测子模块,用于采用梯度提升决策树人脸关键点检测器对所述待识别的图片进行人脸关键点检测,得到所述待识别的图片上的人脸关键点位置信息,所述梯度提升决策树人脸关键点检测器基于dlib预先训练得到。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述图片识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述图片识别方法的步骤。
CN201810594253.4A 2018-06-11 2018-06-11 图片识别方法、装置、计算机设备及存储介质 Withdrawn CN109063542A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810594253.4A CN109063542A (zh) 2018-06-11 2018-06-11 图片识别方法、装置、计算机设备及存储介质
PCT/CN2018/106398 WO2019237548A1 (zh) 2018-06-11 2018-09-19 图片识别方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810594253.4A CN109063542A (zh) 2018-06-11 2018-06-11 图片识别方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109063542A true CN109063542A (zh) 2018-12-21

Family

ID=64820026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810594253.4A Withdrawn CN109063542A (zh) 2018-06-11 2018-06-11 图片识别方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN109063542A (zh)
WO (1) WO2019237548A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309060A (zh) * 2019-05-24 2019-10-08 平安科技(深圳)有限公司 识别算法更新的检测方法、装置、存储介质及计算机设备
CN111144479A (zh) * 2019-12-25 2020-05-12 福州数据技术研究院有限公司 基于图像处理的中医面色识别方法
CN111198960A (zh) * 2019-12-27 2020-05-26 五八有限公司 用户画像数据的确定方法、装置、电子设备及存储介质
CN112418184A (zh) * 2020-12-14 2021-02-26 杭州魔点科技有限公司 基于鼻部特征的人脸检测方法、装置、电子设备及介质
CN113269155A (zh) * 2021-06-28 2021-08-17 苏州市科远软件技术开发有限公司 端到端的人脸识别方法、装置、设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160193B (zh) * 2019-12-20 2024-02-09 中国平安财产保险股份有限公司 关键信息提取方法、装置及存储介质
CN111475699B (zh) * 2020-03-07 2023-09-08 咪咕文化科技有限公司 网站数据爬取方法和装置、电子设备、及可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103632132B (zh) * 2012-12-11 2017-02-15 广西科技大学 一种基于肤色分割和模板匹配的人脸检测与识别方法
CN103679159B (zh) * 2013-12-31 2017-10-17 海信集团有限公司 人脸识别方法
CN108009465B (zh) * 2016-10-31 2021-08-27 杭州海康威视数字技术股份有限公司 一种人脸识别方法及装置
CN106909882A (zh) * 2017-01-16 2017-06-30 广东工业大学 一种应用于保安机器人的人脸识别系统及方法
CN107316032A (zh) * 2017-07-06 2017-11-03 中国医学科学院北京协和医院 一种建立人脸图像识别器方法
CN107679546A (zh) * 2017-08-17 2018-02-09 平安科技(深圳)有限公司 人脸图像数据采集方法、装置、终端设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309060A (zh) * 2019-05-24 2019-10-08 平安科技(深圳)有限公司 识别算法更新的检测方法、装置、存储介质及计算机设备
CN110309060B (zh) * 2019-05-24 2021-08-17 平安科技(深圳)有限公司 识别算法更新的检测方法、装置、存储介质及计算机设备
CN111144479A (zh) * 2019-12-25 2020-05-12 福州数据技术研究院有限公司 基于图像处理的中医面色识别方法
CN111198960A (zh) * 2019-12-27 2020-05-26 五八有限公司 用户画像数据的确定方法、装置、电子设备及存储介质
CN112418184A (zh) * 2020-12-14 2021-02-26 杭州魔点科技有限公司 基于鼻部特征的人脸检测方法、装置、电子设备及介质
CN113269155A (zh) * 2021-06-28 2021-08-17 苏州市科远软件技术开发有限公司 端到端的人脸识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2019237548A1 (zh) 2019-12-19

Similar Documents

Publication Publication Date Title
CN109063542A (zh) 图片识别方法、装置、计算机设备及存储介质
CN111104962B (zh) 图像的语义分割方法、装置、电子设备及可读存储介质
CN114155543B (zh) 神经网络训练方法、文档图像理解方法、装置和设备
US8805812B1 (en) Learning semantic image similarity
WO2019200783A1 (zh) 动态图表类页面数据爬取方法、装置、终端及存储介质
WO2021114500A1 (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN108399386A (zh) 饼图中的信息提取方法及装置
US20210141826A1 (en) Shape-based graphics search
CN107908641B (zh) 一种获取图片标注数据的方法和系统
US20240004703A1 (en) Method, apparatus, and system for multi-modal multi-task processing
CN110968808B (zh) 一种实现网页主题更新的方法及装置
CN112215171B (zh) 目标检测方法、装置、设备及计算机可读存储介质
CN109902672A (zh) 图像标注方法及装置、存储介质、计算机设备
CN113204659B (zh) 多媒体资源的标签分类方法、装置、电子设备及存储介质
CN111143613A (zh) 选择视频封面的方法、系统、电子设备与存储介质
CN110765882A (zh) 一种视频标签确定方法、装置、服务器及存储介质
EP3975139A1 (en) Querying semantic data from unstructured documents
CN112200031A (zh) 一种用于生成图像对应文字说明的网络模型训练方法与设备
Kim et al. Image Recoloring with Valence‐Arousal Emotion Model
CN111126243B (zh) 一种图像数据检测方法、装置以及计算机可读存储介质
CN110990617B (zh) 一种图片标记方法、装置、设备及存储介质
CN109564636B (zh) 使用一个神经网络来训练另一个神经网络
CN113657087B (zh) 信息的匹配方法及装置
CN113505786A (zh) 试题拍照评判方法、装置及电子设备
CN111062385A (zh) 一种用于图像文本信息检测的网络模型构建方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20181221

WW01 Invention patent application withdrawn after publication