CN116311225A - 一种基于图像识别的大数据采集方法、数据管理方法及系统 - Google Patents

一种基于图像识别的大数据采集方法、数据管理方法及系统 Download PDF

Info

Publication number
CN116311225A
CN116311225A CN202310561031.3A CN202310561031A CN116311225A CN 116311225 A CN116311225 A CN 116311225A CN 202310561031 A CN202310561031 A CN 202310561031A CN 116311225 A CN116311225 A CN 116311225A
Authority
CN
China
Prior art keywords
real
pictures
dimensional scene
scene model
preselected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310561031.3A
Other languages
English (en)
Other versions
CN116311225B (zh
Inventor
贺敬川
康凤珠
徐斌
张劲胜
李勇
吕楠
吴默然
付国龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Yingshun Information Technology Co.,Ltd.
Original Assignee
Sichuan Xinyingshun Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Xinyingshun Information Technology Co ltd filed Critical Sichuan Xinyingshun Information Technology Co ltd
Priority to CN202310561031.3A priority Critical patent/CN116311225B/zh
Publication of CN116311225A publication Critical patent/CN116311225A/zh
Application granted granted Critical
Publication of CN116311225B publication Critical patent/CN116311225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提出了一种基于图像识别的大数据采集方法、数据管理方法及系统,涉及计算机技术领域。该方法包括:根据检索文字信息,确定现实三维场景模型。将仿真相机布设于现实三维场景模型,获取图像画面,计算图像画面的可见区域。刻画真实相机拍摄视角下的拍摄画面,得到预选图片,更改仿真相机位置,得到多个预选图片。遍历所有现实三维场景模型,得到各自的多个预选图片。分别提取示例图片和多个预选图片的GIST特征,判断是否将多个预选图片作为待采集图片。遍历所有现实三维场景模型,以采集所有待采集图片。实现了借助于现实三维场景模型获取多个预选图片,并从多个现实三维场景模型的多个预选图片中确定待采集图片的目的。

Description

一种基于图像识别的大数据采集方法、数据管理方法及系统
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种基于图像识别的大数据采集方法、数据管理方法及系统。
背景技术
随着科技的发展,人们经常会遇到需要获取大量图片数据的情况,例如人工智能算法需要大量数据训练模型,经过训练的模型才可以用来推理,实现对新数据的识别。再例如做摄影、油画类的艺术工作需要大量参考图。目前,人们获取大量的需求图片通常有以下两种方式:
第一种方式是在通过真实相机线下拍摄真实场景获取需求图片,这种方式不仅要求真实相机具有足够的内存,而且需要拍摄者实际到达拍摄现场进行拍摄,十分不方便。
第二种方式是通过网络上搜索获取需求图片,这种方式获取的图片不仅存在可能不符合用户需求的问题,而且也难以获取大量有效的图片数据,以实现对图片的采集,而且同样也十分耗时耗力。
发明内容
本发明的目的在于提供一种基于图像识别的大数据采集方法、数据管理方法及系统,其能够借助于现实三维场景模型获取多个预选图片,并从多个现实三维场景模型的多个预选图片中确定待采集图片。
为解决上述技术问题,本发明采用的技术方案为:
第一方面,本申请实施例提供一种基于图像识别的大数据采集方法,包括如下步骤:
S110:获取任务参数,任务参数包括检索文字信息和示例图片;
S120:根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;
S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;
S140:根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;
S150:重复执行S130至S140,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;
S160:重复执行S130至S150,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片;
S170:分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,以得到预选图片和示例图片对应的全局表征结果;
S180:根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集;
S190:重复执行S170至S180,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片。
在本发明中,进一步的,上述S180的步骤包括:
根据全局表征结果,利用多个预选图片与示例图片进行匹配;
当示例图片匹配到的预选图片的数量低于预设数量时,判定不将现实三维场景模型的多个预选图片作为待采集图片;
当示例图片匹配到的预选图片的数量不低于预设数量时,判定将现实三维场景模型的多个预选图片作为待采集图片。
在本发明中,进一步的,上述S120的步骤包括:
将检索文字信息输入至关键词分析模型中,得到多个关键词;
将多个关键词输入至预置场景模型数据库中进行匹配,确定至少一个现实三维场景模型。
在本发明中,进一步的,上述将多个关键词输入至预置场景模型数据库中进行匹配的步骤之前,还包括:
获取多种类型的真实场景信息,其中,任一真实场景信息包括场景特点信息和真实场景中的所有真实物体参数;
根据所有真实物体参数,建立现实三维场景模型;
根据场景特点信息,为现实三维场景模型配置标识ID;
根据标识ID,对现实三维场景模型进行封装后,保存至预置场景模型数据库中。
在本发明中,进一步的,上述S130的步骤之前,还包括:
获取真实相机参数;
根据真实相机参数配置仿真相机参数,仿真相机参数包括仿真相机的拍摄视角。
在本发明中,进一步的,上述基于图像画面,计算得到可见区域和不可见区域的步骤包括:
获取每个像素点在图像画面中的第一深度值,并获取每个像素点在默认视图下的第二深度值;
若第一深度值大于第二深度值,则像素点属于不可见区域;
若第一深度值小于第二深度值,则像素点属于可见区域。
第二方面,本申请实施例提供一种数据管理方法,包括如下步骤:
S110:获取任务参数,任务参数包括检索文字信息和示例图片;
S120:根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;
S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;
S140:根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;
S150:重复执行S130至S140,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;
S160:重复执行S130至S150,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片;
S170:分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,以得到预选图片和示例图片对应的全局表征结果;
S180:根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集;
S190:重复执行S170至S180,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片;
S200:按照预设时间范围,创建多个索引文件,并根据任一待采集图片的获得时间,将待采集图片存入对应的索引文件中,同时根据待采集图片的获得时间和对应的现实三维场景模型,为待采集图片编号;
S210:根据多个索引文件,建立索引目录,以得到图片集合。
第三方面,本申请实施例提供一种基于图像识别的大数据采集系统,包括:
任务参数获取模块,用于获取任务参数,任务参数包括检索文字信息和示例图片;
现实三维场景模型确定模块,用于根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;
仿真相机布设模块,用于响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;
预选图片得到模块,用于根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;
仿真相机遍历模块,用于重复执行仿真相机布设模块至预选图片得到模块,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;
现实三维场景模型遍历模块,用于重复执行仿真相机布设模块至仿真相机遍历模块,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片;
GIST特征提取模块,用于分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,以得到预选图片和示例图片对应的全局表征结果;
待采集图片确定模块,用于根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集;
采集模块,用于重复执行GIST特征提取模块至待采集图片确定模块,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片。
第四方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器运行时,使得处理器执行如上述第一方面中任一项的方法。
第五方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
本发明提出了一种基于图像识别的大数据采集方法、数据管理方法及系统,包括如下步骤:S110:获取任务参数,任务参数包括检索文字信息和示例图片。S120:根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型。S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域。S140:根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置。S150:重复执行S130至S140,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片。S160:重复执行S130至S150,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片。S170:分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,以得到预选图片和示例图片对应的全局表征结果。S180:根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集。S190:重复执行S170至S180,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片,实现了图片采集的目的。该大数据采集方法、数据管理方法及系统根据任务参数中的检索文字信息,借助于现实三维场景模型获取多个预选图片,并根据任务参数中的示例图片,对比示例图片和任一现实三维场景模型的多个预选图片的全局特征,以根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,实现了借助于现实三维场景模型获取多个预选图片,并从多个现实三维场景模型的多个预选图片中确定待采集图片的目的。不仅避免了现有技术中需要用户到达实际拍摄现场进行拍摄的情况,而且能够采集大量有效且符合任务参数的图片,避免了耗时耗力的问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种基于图像识别的大数据采集方法的流程图;
图2为本发明实施例提供的一种数据管理方法的流程图;
图3为本发明实施例提供的一种基于图像识别的大数据采集系统的结构框图;
图4为本发明实施例提供的一种电子设备的示意性结构框图。
图标:110-任务参数获取模块;120-现实三维场景模型确定模块;130-仿真相机布设模块;140-预选图片得到模块;150-仿真相机遍历模块;160-现实三维场景模型遍历模块;170-GIST特征提取模块;180-待采集图片确定模块;190-采集模块;101-存储器;102-处理器;103-通信接口。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
实施例
请参照图1,图1所示为本发明实施例提供的一种基于图像识别的大数据采集方法的流程图。本申请实施例提供一种基于图像识别的大数据采集方法,包括如下步骤:
S110:获取任务参数,任务参数包括检索文字信息和示例图片;
其中,任务参数可由外部应用下发。
S120:根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;
在本实施例的一些实施方式中,上述S120的步骤包括:将检索文字信息输入至关键词分析模型中,得到多个关键词。将多个关键词输入至预置场景模型数据库中进行匹配,确定至少一个现实三维场景模型。
其中,预置场景模型数据库中包含丰富的多种现实三维场景模型。
具体的,首先通过关键词分析模型对检索文字信息进行分析,得到多个关键词。然后根据多个关键词,在预置场景模型数据库查找与多个关键词相匹配的至少一个现实三维场景模型。
在本实施例的一些实施方式中,将检索文字信息输入至关键词分析模型中的步骤之前,该方法还包括:建立关键词分析初始模型。获取多个样本,多个样本包括多个长句和各个长句的关键词。利用多个样本训练关键词分析初始模型,从而得到能够分析检索文字信息的关键词分析模型。
S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;
具体的,针对任一现实三维场景模型,用户可以随机选取现实三维场景模型中的任意点作为仿真相机的位置,同时可通过拖拽调整操作,以选择仿真相机的拍摄方位。根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,对图像画面进行逐片段分析,以区分可见区域和不可见区域。
在本实施例的一些实施方式中,上述基于图像画面,计算得到可见区域和不可见区域的步骤包括:获取每个像素点在图像画面中的第一深度值,并获取每个像素点在默认视图下的第二深度值。若第一深度值大于第二深度值,则像素点属于不可见区域。若第一深度值小于第二深度值,则像素点属于可见区域。具体的,对仿真相机所拍摄的图像画面需要进行逐片段判断。对每个像素点而言,首先获取仿真相机空间深度缓冲区,然后变换仿真相机NDC坐标系以查询该像素点在仿真相机拍摄视角下的图像画面中的深度值即第一深度值d1。然后获取用户电脑屏幕默认深度缓冲区,并查询该像素点在默认视图即用户电脑屏幕上的深度值即第二深度值d2。对“d1>d2”进行判定,若“d1>d2”为假,则判定该像素点为属于可见区域,若“d1>d2”为真,则判定该像素点属于不可见区域。
S140:根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;
S150:重复执行S130至S140,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;
具体的,根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,可以确定可见区域中的所有可见物体以及各个可见物体的可见程度和角度,从而刻画真实相机的拍摄视角下的拍摄画面,以完成一张预选图片的构建。然后多次更改仿真相机在现实三维场景模型中的位置,按照S130至S140的步骤,完成多张预选图片的构建,从而得到现实三维场景模型相匹配的多个预选图片。
S160:重复执行S130至S150,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片;
具体的,针对任一现实三维场景模型,执行S130至S150的步骤,以得到任一现实三维场景模型相匹配的多个预选图片。
S170:分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,以得到预选图片和示例图片对应的全局表征结果;
具体的,GIST特征为全局特征,采用全局特征信息对示例图片和预选图片进行识别与分类不需要对图像进行分割和局部特征提取,也就可以实现图像的快速识别与分类。
S180:根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集;
具体的,根据全局表征结果,可以计算出预选图片和示例图片的欧式距离。通过欧式距离可以对预选图片和示例图片进行匹配,最后得到与示例图片相匹配的预选图片的数量,从而根据与示例图片相匹配的预选图片的数量,可以判断出是否将现实三维场景模型的多个预选图片作为待采集图片。
在本实施例的一些实施方式中,上述S180的步骤包括:根据全局表征结果,利用多个预选图片与示例图片进行匹配。当示例图片匹配到的预选图片的数量低于预设数量时,判定不将现实三维场景模型的多个预选图片作为待采集图片。当示例图片匹配到的预选图片的数量不低于预设数量时,判定将现实三维场景模型的多个预选图片作为待采集图片。从而实现了根据与示例图片相匹配的预选图片的数量,判断是否将现实三维场景模型的多个预选图片作为待采集图片的目的。
S190:重复执行S170至S180,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片。
具体的,针对任一现实三维场景模型的多个预选图片,执行S170至S180的步骤,以确定所有可作为待采集图片的预选图片。达到了遍历所有现实三维场景模型,选择出多张满足示例图片的预选图片作为待采集图片的效果,从而实现了图片采集的目的。
上述实现过程中,该方法首先获取任务参数。并根据任务参数中的检索文字信息,确定至少一个现实三维场景模型。然后针对任一现实三维场景模型,响应用户操作,将现实三维场景模型中的任意点作为仿真相机的位置布设仿真相机至现实三维场景模型。根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,对图像画面进行逐片段分析,以区分可见区域和不可见区域。根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,可以确定可见区域中的所有可见物体以及各个可见物体的可见程度和角度,从而刻画真实相机的拍摄视角下的拍摄画面,以完成一张预选图片的构建。多次更改仿真相机在现实三维场景模型中的位置,重复执行上述构建预选图片的步骤,直至仿真相机的位置更改次数达到预设次数,从而完成多张预选图片的构建,进而得到现实三维场景模型相匹配的多个预选图片。然后针对任一现实三维场景模型,执行上述构建多张预选图片的步骤,以遍历所有现实三维场景模型得到各个现实三维场景模型相匹配的多个预选图片。对于任一现实三维场景模型的多个预选图片,分别提取示例图片和多个预选图片的GIST特征,以得到各自的全局表征结果。根据全局表征结果,得到与示例图片相匹配的预选图片的数量,从而根据该数量,可以判断出是否将现实三维场景模型的多个预选图片作为待采集图片。再针对任一现实三维场景模型的多个预选图片,执行上述步骤,以确定所有可作为待采集图片的预选图片。达到了遍历所有现实三维场景模型,选择出多张满足示例图片的预选图片作为待采集图片的效果,从而实现了图片采集的目的。该方法根据任务参数中的检索文字信息,借助于现实三维场景模型获取多个预选图片,并根据任务参数中的示例图片,对比示例图片和任一现实三维场景模型的多个预选图片的全局特征,以根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,实现了借助于现实三维场景模型获取多个预选图片,并从多个现实三维场景模型的多个预选图片中确定待采集图片的目的。不仅避免了现有技术中需要用户到达实际拍摄现场进行拍摄的情况,而且能够采集大量有效且符合任务参数的图片,避免了耗时耗力的问题。
在本实施例的一些实施方式中,上述将多个关键词输入至预置场景模型数据库中进行匹配的步骤之前,还包括:
获取多种类型的真实场景信息,其中,任一真实场景信息包括场景特点信息和真实场景中的所有真实物体参数;
根据所有真实物体参数,建立现实三维场景模型;
根据场景特点信息,为现实三维场景模型配置标识ID;
根据标识ID,对现实三维场景模型进行封装后,保存至预置场景模型数据库中。
具体的,针对任一类型的真实场景信息,根据所有真实物体参数,建立与真实场景信息相匹配的现实三维场景模型,同时根据场景特点信息,为现实三维场景模型配置标识ID,并根据标识ID,封装现实三维场景模型后,保存至预置场景模型数据库中。从而不仅使得预置场景模型数据库中包含丰富的多种现实三维场景模型,而且通过标识ID可以快速锁定对应的现实三维场景模型。
在本实施例的一些实施方式中,上述S130的步骤之前,还包括:
获取真实相机参数;
根据真实相机参数配置仿真相机参数,仿真相机参数包括仿真相机的拍摄视角。
具体的,上述真实相机参数包括实际焦距和实际尺寸,根据实际焦距与实际尺寸可以计算出仿真相机的拍摄视角。其中,真实相机的可视范围主要由芯片大小与实际焦距决定。
请参照图2,图2所示为本发明实施例提供的一种数据管理方法的流程图。本申请实施例提供一种数据管理方法,包括如下步骤:
S110:获取任务参数,任务参数包括检索文字信息和示例图片;
S120:根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;
S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;
S140:根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;
S150:重复执行S130至S140,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;
S160:重复执行S130至S150,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片;
S170:分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,以得到预选图片和示例图片对应的全局表征结果;
S180:根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集;
S190:重复执行S170至S180,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片;
S200:按照预设时间范围,创建多个索引文件,并根据任一待采集图片的获得时间,将待采集图片存入对应的索引文件中,同时根据待采集图片的获得时间和对应的现实三维场景模型,为待采集图片编号;
S210:根据多个索引文件,建立索引目录,以得到图片集合。
上述实现过程中,该方法首先获取任务参数。并根据任务参数中的检索文字信息,确定至少一个现实三维场景模型。然后针对任一现实三维场景模型,响应用户操作,将现实三维场景模型中的任意点作为仿真相机的位置布设仿真相机至现实三维场景模型。根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,对图像画面进行逐片段分析,以区分可见区域和不可见区域。根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,可以确定可见区域中的所有可见物体以及各个可见物体的可见程度和角度,从而刻画真实相机的拍摄视角下的拍摄画面,以完成一张预选图片的构建。多次更改仿真相机在现实三维场景模型中的位置,重复执行上述构建预选图片的步骤,直至仿真相机的位置更改次数达到预设次数,从而完成多张预选图片的构建,进而得到现实三维场景模型相匹配的多个预选图片。然后针对任一现实三维场景模型,执行上述构建多张预选图片的步骤,以遍历所有现实三维场景模型得到各个现实三维场景模型相匹配的多个预选图片。对于任一现实三维场景模型的多个预选图片,分别提取示例图片和多个预选图片的GIST特征,以得到各自的全局表征结果。根据全局表征结果,得到与示例图片相匹配的预选图片的数量,从而根据该数量,可以判断出是否将现实三维场景模型的多个预选图片作为待采集图片。再针对任一现实三维场景模型的多个预选图片,执行上述步骤,以确定所有可作为待采集图片的预选图片。达到了遍历所有现实三维场景模型,选择出多张满足示例图片的预选图片作为待采集图片的效果,从而实现了图片采集的目的。根据预设时间范围,预先创建多个索引文件,根据各个待采集图片的获得时间,将待采集图片存入对应的索引文件中,同时根据待采集图片的获得时间和对应的现实三维场景模型,为待采集图片编号。并根据多个索引文件,建立索引目录,以得到图片集合,实现了对采集的所有图片进行有序管理的目的。该方法根据任务参数中的检索文字信息,借助于现实三维场景模型获取多个预选图片,并根据任务参数中的示例图片,对比示例图片和任一现实三维场景模型的多个预选图片的全局特征,以根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,实现了借助于现实三维场景模型获取多个预选图片,并从多个现实三维场景模型的多个预选图片中确定待采集图片的目的。不仅避免了现有技术中需要用户到达实际拍摄现场进行拍摄的情况,而且能够采集大量有效且符合任务参数的图片,避免了耗时耗力的问题。
请参照图3,图3所示为本发明实施例提供的一种基于图像识别的大数据采集系统的结构框图。本申请实施例提供一种基于图像识别的大数据采集系统,包括:
任务参数获取模块110,用于获取任务参数,任务参数包括检索文字信息和示例图片;
现实三维场景模型确定模块120,用于根据检索文字信息,确定至少一个现实三维场景模型,其中,现实三维场景模型包括至少一个物体三维模型;
仿真相机布设模块130,用于响应用户操作将与真实相机相匹配的仿真相机布设于任一现实三维场景模型中,同时根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,基于图像画面,计算得到可见区域和不可见区域;
预选图片得到模块140,用于根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改仿真相机在现实三维场景模型中的位置;
仿真相机遍历模块150,用于重复执行仿真相机布设模块130至预选图片得到模块140,直至仿真相机的位置更改次数达到预设次数,得到现实三维场景模型相匹配的多个预选图片;
现实三维场景模型遍历模块160,用于重复执行仿真相机布设模块130至仿真相机遍历模块150,直至遍历所有现实三维场景模型,得到所有现实三维场景模型的多个预选图片;
GIST特征提取模块170,用于分别提取示例图片和任一现实三维场景模型的多个预选图片的GIST特征,以得到预选图片和示例图片对应的全局表征结果;
待采集图片确定模块180,用于根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,若是,则将现实三维场景模型的多个预选图片作为待采集图片进行采集;
采集模块190,用于重复执行GIST特征提取模块170至待采集图片确定模块180,直至遍历所有现实三维场景模型的多个预选图片,以采集所有待采集图片。
上述实现过程中,该系统首先获取任务参数。并根据任务参数中的检索文字信息,确定至少一个现实三维场景模型。然后针对任一现实三维场景模型,响应用户操作,将现实三维场景模型中的任意点作为仿真相机的位置布设仿真相机至现实三维场景模型。根据仿真相机的拍摄视角获取仿真相机拍摄的图像画面,对图像画面进行逐片段分析,以区分可见区域和不可见区域。根据可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,可以确定可见区域中的所有可见物体以及各个可见物体的可见程度和角度,从而刻画真实相机的拍摄视角下的拍摄画面,以完成一张预选图片的构建。多次更改仿真相机在现实三维场景模型中的位置,重复执行仿真相机布设模块130至预选图片得到模块140,直至仿真相机的位置更改次数达到预设次数,从而完成多张预选图片的构建,进而得到现实三维场景模型相匹配的多个预选图片。然后针对任一现实三维场景模型,执行仿真相机布设模块130至仿真相机遍历模块150,以遍历所有现实三维场景模型得到各个现实三维场景模型相匹配的多个预选图片。对于任一现实三维场景模型的多个预选图片,分别提取示例图片和多个预选图片的GIST特征,以得到各自的全局表征结果。根据全局表征结果,得到与示例图片相匹配的预选图片的数量,从而根据该数量,可以判断出是否将现实三维场景模型的多个预选图片作为待采集图片。再针对任一现实三维场景模型的多个预选图片,执行GIST特征提取模块170至待采集图片确定模块180,以确定所有可作为待采集图片的预选图片。达到了遍历所有现实三维场景模型,选择出多张满足示例图片的预选图片作为待采集图片的效果,从而实现了图片采集的目的。该系统根据任务参数中的检索文字信息,借助于现实三维场景模型获取多个预选图片,并根据任务参数中的示例图片,对比示例图片和任一现实三维场景模型的多个预选图片的全局特征,以根据全局表征结果,判断是否将现实三维场景模型的多个预选图片作为待采集图片,实现了借助于现实三维场景模型获取多个预选图片,并从多个现实三维场景模型的多个预选图片中确定待采集图片的目的。不仅避免了现有技术中需要用户到达实际拍摄现场进行拍摄的情况,而且能够采集大量有效且符合任务参数的图片,避免了耗时耗力的问题。
请参照图4,图4为本申请实施例提供的电子设备的一种示意性结构框图。电子设备包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,如本申请实施例所提供的一种基于图像识别的大数据采集系统对应的程序指令/模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以理解,图4所示的结构仅为示意,电子设备还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种基于图像识别的大数据采集方法,其特征在于,包括如下步骤:
S110:获取任务参数,所述任务参数包括检索文字信息和示例图片;
S120:根据所述检索文字信息,确定至少一个现实三维场景模型,其中,所述现实三维场景模型包括至少一个物体三维模型;
S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一所述现实三维场景模型中,同时根据所述仿真相机的拍摄视角获取所述仿真相机拍摄的图像画面,基于所述图像画面,计算得到可见区域和不可见区域;
S140:根据所述可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画所述真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改所述仿真相机在所述现实三维场景模型中的位置;
S150:重复执行S130至S140,直至所述仿真相机的位置更改次数达到预设次数,得到所述现实三维场景模型相匹配的多个预选图片;
S160:重复执行S130至S150,直至遍历所有所述现实三维场景模型,得到所有所述现实三维场景模型的多个预选图片;
S170:分别提取所述示例图片和任一所述现实三维场景模型的所述多个预选图片的GIST特征,以得到所述预选图片和所述示例图片对应的全局表征结果;
S180:根据所述全局表征结果,判断是否将所述现实三维场景模型的所述多个预选图片作为待采集图片,若是,则将所述现实三维场景模型的所述多个预选图片作为待采集图片进行采集;
S190:重复执行S170至S180,直至遍历所有所述现实三维场景模型的所述多个预选图片,以采集所有待采集图片。
2.根据权利要求1所述的基于图像识别的大数据采集方法,其特征在于,所述S180的步骤包括:
根据所述全局表征结果,利用所述多个预选图片与所述示例图片进行匹配;
当所述示例图片匹配到的所述预选图片的数量低于预设数量时,判定不将所述现实三维场景模型的所述多个预选图片作为待采集图片;
当所述示例图片匹配到的所述预选图片的数量不低于所述预设数量时,判定将所述现实三维场景模型的所述多个预选图片作为待采集图片。
3.根据权利要求1所述的基于图像识别的大数据采集方法,其特征在于,所述S120的步骤包括:
将所述检索文字信息输入至关键词分析模型中,得到多个关键词;
将所述多个关键词输入至预置场景模型数据库中进行匹配,确定至少一个所述现实三维场景模型。
4.根据权利要求3所述的基于图像识别的大数据采集方法,其特征在于,所述将所述多个关键词输入至预置场景模型数据库中进行匹配的步骤之前,还包括:
获取多种类型的真实场景信息,其中,任一所述真实场景信息包括场景特点信息和真实场景中的所有真实物体参数;
根据所述所有真实物体参数,建立所述现实三维场景模型;
根据所述场景特点信息,为所述现实三维场景模型配置标识ID;
根据所述标识ID,对所述现实三维场景模型进行封装后,保存至所述预置场景模型数据库中。
5.根据权利要求1所述的基于图像识别的大数据采集方法,其特征在于,所述S130的步骤之前,还包括:
获取真实相机参数;
根据所述真实相机参数配置仿真相机参数,所述仿真相机参数包括所述仿真相机的拍摄视角。
6.根据权利要求1所述的基于图像识别的大数据采集方法,其特征在于,所述基于所述图像画面,计算得到可见区域和不可见区域的步骤包括:
获取每个像素点在所述图像画面中的第一深度值,并获取每个像素点在默认视图下的第二深度值;
若所述第一深度值大于所述第二深度值,则所述像素点属于不可见区域;
若所述第一深度值小于所述第二深度值,则所述像素点属于可见区域。
7.一种数据管理方法,其特征在于,包括如下步骤:
S110:获取任务参数,所述任务参数包括检索文字信息和示例图片;
S120:根据所述检索文字信息,确定至少一个现实三维场景模型,其中,所述现实三维场景模型包括至少一个物体三维模型;
S130:响应用户操作将与真实相机相匹配的仿真相机布设于任一所述现实三维场景模型中,同时根据所述仿真相机的拍摄视角获取所述仿真相机拍摄的图像画面,基于所述图像画面,计算得到可见区域和不可见区域;
S140:根据所述可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画所述真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改所述仿真相机在所述现实三维场景模型中的位置;
S150:重复执行S130至S140,直至所述仿真相机的位置更改次数达到预设次数,得到所述现实三维场景模型相匹配的多个预选图片;
S160:重复执行S130至S150,直至遍历所有所述现实三维场景模型,得到所有所述现实三维场景模型的多个预选图片;
S170:分别提取所述示例图片和任一所述现实三维场景模型的所述多个预选图片的GIST特征,以得到所述预选图片和所述示例图片对应的全局表征结果;
S180:根据所述全局表征结果,判断是否将所述现实三维场景模型的所述多个预选图片作为待采集图片,若是,则将所述现实三维场景模型的所述多个预选图片作为待采集图片进行采集;
S190:重复执行S170至S180,直至遍历所有所述现实三维场景模型的所述多个预选图片,以采集所有待采集图片;
S200:按照预设时间范围,创建多个索引文件,并根据任一所述待采集图片的获得时间,将所述待采集图片存入对应的所述索引文件中,同时根据所述待采集图片的获得时间和对应的现实三维场景模型,为所述待采集图片编号;
S210:根据所述多个索引文件,建立索引目录,以得到图片集合。
8.一种基于图像识别的大数据采集系统,其特征在于,包括:
任务参数获取模块,用于获取任务参数,所述任务参数包括检索文字信息和示例图片;
现实三维场景模型确定模块,用于根据所述检索文字信息,确定至少一个现实三维场景模型,其中,所述现实三维场景模型包括至少一个物体三维模型;
仿真相机布设模块,用于响应用户操作将与真实相机相匹配的仿真相机布设于任一所述现实三维场景模型中,同时根据所述仿真相机的拍摄视角获取所述仿真相机拍摄的图像画面,基于所述图像画面,计算得到可见区域和不可见区域;
预选图片得到模块,用于根据所述可见区域中的物体三维模型、物体分布信息以及各个物体的局部特征,刻画所述真实相机的拍摄视角下的拍摄画面,以得到预选图片,响应用户操作更改所述仿真相机在所述现实三维场景模型中的位置;
仿真相机遍历模块,用于重复执行仿真相机布设模块至预选图片得到模块,直至所述仿真相机的位置更改次数达到预设次数,得到所述现实三维场景模型相匹配的多个预选图片;
现实三维场景模型遍历模块,用于重复执行仿真相机布设模块至仿真相机遍历模块,直至遍历所有所述现实三维场景模型,得到所有所述现实三维场景模型的多个预选图片;
GIST特征提取模块,用于分别提取所述示例图片和任一所述现实三维场景模型的所述多个预选图片的GIST特征,以得到所述预选图片和所述示例图片对应的全局表征结果;
待采集图片确定模块,用于根据所述全局表征结果,判断是否将所述现实三维场景模型的所述多个预选图片作为待采集图片,若是,则将所述现实三维场景模型的所述多个预选图片作为待采集图片进行采集;
采集模块,用于重复执行GIST特征提取模块至待采集图片确定模块,直至遍历所有所述现实三维场景模型的所述多个预选图片,以采集所有待采集图片。
9.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器运行时,使得所述处理器执行如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在如权利要求9所述的电子设备上运行时,使得所述电子设备执行如权利要求1-6中任一项所述的方法。
CN202310561031.3A 2023-05-18 2023-05-18 一种基于图像识别的大数据采集方法、数据管理方法及系统 Active CN116311225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310561031.3A CN116311225B (zh) 2023-05-18 2023-05-18 一种基于图像识别的大数据采集方法、数据管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310561031.3A CN116311225B (zh) 2023-05-18 2023-05-18 一种基于图像识别的大数据采集方法、数据管理方法及系统

Publications (2)

Publication Number Publication Date
CN116311225A true CN116311225A (zh) 2023-06-23
CN116311225B CN116311225B (zh) 2023-07-21

Family

ID=86803567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310561031.3A Active CN116311225B (zh) 2023-05-18 2023-05-18 一种基于图像识别的大数据采集方法、数据管理方法及系统

Country Status (1)

Country Link
CN (1) CN116311225B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182765A (zh) * 2014-08-21 2014-12-03 南京大学 一种互联网图像驱动的三维模型最优视图自动选择方法
CN105279750A (zh) * 2014-07-09 2016-01-27 雷震 一种基于ir-uwb和图像矩的装备展示导览系统
CN108509848A (zh) * 2018-02-13 2018-09-07 视辰信息科技(上海)有限公司 三维物体的实时检测方法及系统
CN110704712A (zh) * 2019-09-20 2020-01-17 武汉大学 基于图像检索的场景图片拍摄位置范围识别方法及系统
CN112258267A (zh) * 2020-10-14 2021-01-22 上海爱购智能科技有限公司 一种用于ai商品识别训练的数据采集方法
US20210294834A1 (en) * 2020-03-17 2021-09-23 Adobe Inc. 3d-aware image search
CN114694136A (zh) * 2022-03-29 2022-07-01 北京字跳网络技术有限公司 一种物品展示方法、装置、设备及介质
CN115100339A (zh) * 2022-06-15 2022-09-23 北京百度网讯科技有限公司 图像生成方法、装置、电子设备和存储介质
WO2023015868A1 (zh) * 2021-08-13 2023-02-16 华为技术有限公司 图像背景生成方法及装置、计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279750A (zh) * 2014-07-09 2016-01-27 雷震 一种基于ir-uwb和图像矩的装备展示导览系统
CN104182765A (zh) * 2014-08-21 2014-12-03 南京大学 一种互联网图像驱动的三维模型最优视图自动选择方法
CN108509848A (zh) * 2018-02-13 2018-09-07 视辰信息科技(上海)有限公司 三维物体的实时检测方法及系统
CN110704712A (zh) * 2019-09-20 2020-01-17 武汉大学 基于图像检索的场景图片拍摄位置范围识别方法及系统
US20210294834A1 (en) * 2020-03-17 2021-09-23 Adobe Inc. 3d-aware image search
CN112258267A (zh) * 2020-10-14 2021-01-22 上海爱购智能科技有限公司 一种用于ai商品识别训练的数据采集方法
WO2023015868A1 (zh) * 2021-08-13 2023-02-16 华为技术有限公司 图像背景生成方法及装置、计算机可读存储介质
CN114694136A (zh) * 2022-03-29 2022-07-01 北京字跳网络技术有限公司 一种物品展示方法、装置、设备及介质
CN115100339A (zh) * 2022-06-15 2022-09-23 北京百度网讯科技有限公司 图像生成方法、装置、电子设备和存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JUEFEI YUAN 等: "Sketch/image-based 3D scene retrieval: Benchmark, algorithm, evaluation", 《2019 IEEE CONFERENCE ON MULTIMEDIA INFORMATION PROCESSING AND RETRIEVAL (MIPR)》, pages 264 - 269 *
NOAH SNAVELY 等: "Modeling the World from Internet Photo Collections", 《INTERNATIONAL JOURNAL OF COMPUTER VISION》, pages 189 - 210 *
李康 等: "基于无人机的大场景序列图像自动采集和三维建模", 《西北大学学报(自然科学版)》, vol. 47, no. 1, pages 30 - 37 *
樊亚春 等: "基于形状检索的场景图像三维建模", 《高技术通讯》, vol. 23, no. 8, pages 781 - 788 *

Also Published As

Publication number Publication date
CN116311225B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
WO2021017998A1 (zh) 文本位置定位方法和系统以及模型训练方法和系统
CN108416028B (zh) 一种搜索内容资源的方法、装置及服务器
CN109960742B (zh) 局部信息的搜索方法及装置
US20200175062A1 (en) Image retrieval method and apparatus, and electronic device
CA2711402C (en) Three-dimensional annotations for street view data
CN107633023B (zh) 一种图像去重方法和装置
Ma et al. No-reference retargeted image quality assessment based on pairwise rank learning
JP5608680B2 (ja) モバイルの画像検索及びインデキシングのシステム及び方法
US10089762B2 (en) Methods for navigating through a set of images
CN111581423B (zh) 一种目标检索方法及装置
CN111209897B (zh) 视频处理的方法、装置和存储介质
US20210326376A1 (en) Navigating through a set of images
US11341183B2 (en) Apparatus and method for searching for building based on image and method of constructing building search database for image-based building search
CN110147460B (zh) 基于卷积神经网络与多视角图的三维模型检索方法及装置
WO2021196551A1 (zh) 图像检索方法、装置、计算机设备和存储介质
CN111191065B (zh) 一种同源图像确定方法及装置
CN116311225B (zh) 一种基于图像识别的大数据采集方法、数据管理方法及系统
CN115601687B (zh) 用于保险理赔过程的现场勘察数据智能处理方法
CN114694185B (zh) 一种跨模态目标重识别方法、装置、设备及介质
Li et al. Global-scale location prediction for social images using geo-visual ranking
CN116304155A (zh) 基于二维图片的三维构件检索方法、装置、设备及介质
KR101305732B1 (ko) 비디오 검색을 위한 블록 생성 방법 및 이를 통해 생성된 블록을 기초로 한 질의 처리 방법
JP6244887B2 (ja) 情報処理装置、画像探索方法、及びプログラム
JP6132996B1 (ja) 画像処理装置,画像処理方法,画像処理プログラム
US11270120B2 (en) Visual object insertion classification for videos

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 610042 floor 6, unit 1, building 4, Fengde International Plaza, No. 6, hanghang Road, Wuhou District, Chengdu, Sichuan

Patentee after: New Yingshun Information Technology Co.,Ltd.

Address before: 610042 floor 6, unit 1, building 4, Fengde International Plaza, No. 6, hanghang Road, Wuhou District, Chengdu, Sichuan

Patentee before: SICHUAN XINYINGSHUN INFORMATION TECHNOLOGY CO.,LTD.