CN117290538A - 识别照片中兴趣点的方法、装置及机器可读存储介质 - Google Patents

识别照片中兴趣点的方法、装置及机器可读存储介质 Download PDF

Info

Publication number
CN117290538A
CN117290538A CN202310972122.6A CN202310972122A CN117290538A CN 117290538 A CN117290538 A CN 117290538A CN 202310972122 A CN202310972122 A CN 202310972122A CN 117290538 A CN117290538 A CN 117290538A
Authority
CN
China
Prior art keywords
interest
photos
photo
points
interest point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310972122.6A
Other languages
English (en)
Inventor
范淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Navinfo Co Ltd
Original Assignee
Navinfo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navinfo Co Ltd filed Critical Navinfo Co Ltd
Priority to CN202310972122.6A priority Critical patent/CN117290538A/zh
Publication of CN117290538A publication Critical patent/CN117290538A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种识别照片中兴趣点的方法、装置及机器可读存储介质。方法包括:获取用于更新地图上兴趣点的原始照片;通过兴趣点分类模型对原始照片进行筛选,得到包含兴趣点的目标照片;其中,兴趣点分类模型用于判断原始照片中是否存在兴趣点;通过招牌分割模型对目标照片上兴趣点的所在区域的轮廓处进行标记,得到目标照片上兴趣点的分割区域;其中,招牌分割模型用于分割目标照片上兴趣点的所在区域;识别分割区域中的兴趣点,降低了标记照片的兴趣点以及标记兴趣点轮廓的人工成本,提高了效率,并且具有很高的准确率。

Description

识别照片中兴趣点的方法、装置及机器可读存储介质
技术领域
本说明书涉及照片中兴趣点识别技术领域,尤其涉及一种识别照片中兴趣点的方法、装置及机器可读存储介质。
背景技术
地图中的兴趣点(Point of Interest,POI)是可以变化的,为了维护地图中兴趣点的时效性,需要采集大量的影像,提取影像中的兴趣点,将提取的兴趣点和地图中对应的兴趣点进行比较,如果不一致,采用提取的兴趣点替代地图中对应的兴趣点。在提取影像中兴趣点的过程中,现有方案中是通过人工判断影像中是否存在兴趣点,对于存在兴趣点的影像,需要人工对影像中兴趣点所在区域的轮廓进行标记,以便提取被标记区域中的兴趣点。但是,人工判断影像中是否存在兴趣点以及对影像中的兴趣点所在区域的轮廓进行标记的效率较低,需要耗费大量的人力成本,并且,当工作人员处于疲劳状态时,也容易出现对影像中是否存在兴趣点判断错误的情况,以及对影像中兴趣点所在区域的轮廓标记错误的情况,无法满足实际需要。
发明内容
有鉴于此,本说明书实施例提供了一种识别照片中兴趣点的方法、装置及机器可读存储介质,用于解决现有技术中标记照片的兴趣点以及标记兴趣点轮廓的成本高和容易出错的问题。
本说明书实施例采用下述技术方案:
本说明书实施例提供一种识别照片中兴趣点的方法,包括:
获取用于更新地图上兴趣点的原始照片;
通过兴趣点分类模型对所述原始照片进行筛选,得到包含兴趣点的目标照片;其中,所述兴趣点分类模型用于判断原始照片中是否存在兴趣点;
通过招牌分割模型对所述目标照片上兴趣点的所在区域的轮廓处进行标记,得到所述目标照片上兴趣点的分割区域;其中,所述招牌分割模型用于分割目标照片上兴趣点的所在区域;
识别所述分割区域中的兴趣点。
可选地,在所述通过兴趣点分类模型对所述原始照片进行筛选之前,还包括:
获取存在对于兴趣点的标注信息的第一照片集合;
采用所述第一照片集合对所述兴趣点分类模型进行训练。
可选地,在所述通过招牌分割模型对所述目标照片上兴趣点的所在区域的轮廓处进行标记之前,还包括:
获取存在对于兴趣点所在区域的标注信息的第二照片集合;
采用所述第二照片集合对所述招牌分割模型进行训练。
可选地,所述第二照片集合中的照片是所述第一照片集合中的至少部分照片。
可选地,在所述采用所述第二照片集合对所述招牌分割模型进行训练之前,还包括:
将训练后的兴趣点分类模型的模型参数迁移至所述招牌分割模型,得到迁移参数后的招牌分割模型;其中,所述模型参数用于判断照片中是否存在兴趣点;
所述采用所述第二照片集合对所述招牌分割模型进行训练,包括:
采用所述第二照片集合对所述迁移参数后的招牌分割模型进行训练。
可选地,所述通过兴趣点分类模型对所述原始照片进行筛选,包括:
通过兴趣点分类模型对所述原始照片中存在兴趣点的照片的标识进行记录,剔除标识未被记录的照片。
可选地,所述通过兴趣点分类模型对所述原始照片进行筛选,包括:
通过兴趣点分类模型提取所述原始照片的中间特征,其中所述中间特征为通过向量形式表示的所述原始照片的图像像素;
通过所述兴趣点分类模型根据所述原始照片的中间特征对所述原始照片进行打分,剔除打分低于预设阈值的照片,其中打分低于预设阈值的照片未包含兴趣点。
可选地,所述通过招牌分割模型对所述目标照片上兴趣点的所在区域的轮廓处进行标记,包括:
通过招牌分割模型根据目标照片的中间特征识别兴趣点在目标照片上的所在区域;
对所述目标照片上兴趣点的所在区域的轮廓处进行标记。
本说明书实施例还提供了一种识别照片中兴趣点的装置,包括:
照片获取模块,用于获取用于更新地图上兴趣点的原始照片;
照片筛选模块,用于通过兴趣点分类模型对所述原始照片进行筛选,得到包含兴趣点的目标照片;其中,所述兴趣点分类模型用于判断原始照片中是否存在兴趣点;
兴趣点分割模块,用于通过招牌分割模型对所述目标照片上兴趣点的所在区域的轮廓处进行标记,得到所述目标照片上兴趣点的分割区域;其中,所述招牌分割模型用于分割目标照片上兴趣点的所在区域;
兴趣点识别模块,用于识别所述分割区域中的兴趣点。
本说明书实施例还提供了一种机器可读存储介质,其上存储有机器可执行程序和/或指令,所述机器可执行程序和/或指令被处理器执行时实现根据上述任一项所述的识别照片中兴趣点的方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
获取街景图像采集设备拍摄的用于更新地图上兴趣点的原始照片,通过兴趣点分类模型对原始照片进行筛选,得到包含兴趣点的目标照片,通过招牌分割模型对目标照片上兴趣点的所在区域的轮廓处进行标记,得到目标照片上兴趣点的分割区域,识别分割区域中的兴趣点,具有非常高的处理效率和准确率,并且明显降低了人工成本。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书一实施例中识别照片中兴趣点的方法的流程示意图;
图2为本说明书一实施例中识别照片中兴趣点的方法的架构示意图;
图3为本说明书一实施例中识别照片中兴趣点的装置的结构示意框图;
图4为本说明书一实施例中不包含兴趣点分类模型和包含兴趣点分类模型的对比示意图;
图5为本说明书一实施例中招牌分割模型和兴趣点分类模总和的训练成本与单独对招牌分割模型的训练成本的对比示意图;
图6为本说明书一实施例中用于将目标照片存储到redis数据库的人机界示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书一实施例中识别照片中兴趣点的方法的流程示意图。参见图1,识别照片中兴趣点的方法可包括:
步骤S102:获取用于更新地图上兴趣点的原始照片;
在本步骤中,原始照片可以通过图像采集设备拍摄得到。图像采集设备可以为带有摄像头的专业采集车或者车载行车记录仪,也可以为众包用户用于拍摄照片的照相机等采集设备。兴趣点俗称点位,可以由坐标和名称等要素构成,例如可以表示地图中的房子、商铺、邮筒或者公交站等,兴趣点还可以理解为招牌。一般情况下,可以将获取的原始照片进行本地存储。原始照片的格式可以为jpg,也可以为png。
步骤S104:通过兴趣点分类模型对原始照片进行筛选,得到包含兴趣点的目标照片;其中,兴趣点分类模型用于判断原始照片中是否存在兴趣点;
在本步骤中,通过兴趣点分类模型对原始照片进行筛选,得到包含兴趣点的目标照片,可以避免不包含兴趣点的原始照片进入到招牌分割模型,减少对不必要照片的处理,提高全链路图像的处理效率。例如,参见图4,图4为本说明书一实施例中不包含兴趣点分类模型和包含兴趣点分类模型的对比示意图。图4B为本实施例的方案,兴趣点分类模型排除了不存在兴趣点的照片,保证存在兴趣点的照片进入到招牌分割模型,通过招牌分割模型对兴趣点的所在区域的轮廓处进行标记。图4A为其他方案,所有的原始照片均进入了招牌分割模,招牌分割模需要在所有照片中找到兴趣点的所在区域的轮廓处进行标记,效率低下。
步骤S106:通过招牌分割模型对目标照片上兴趣点的所在区域的轮廓处进行标记,得到目标照片上兴趣点的分割区域;其中,招牌分割模型用于分割目标照片上兴趣点的所在区域;
在本步骤中,通过招牌分割模型对目标照片上兴趣点的所在区域的轮廓处进行标记,得到目标照片上兴趣点的分割区域,以便针对分割区域中的兴趣点进行识别,也有利于提高兴趣点的识别效率。
步骤S108:识别分割区域中的兴趣点。
在本实施例中,获取街景图像采集设备拍摄的用于更新地图上兴趣点的原始照片,通过兴趣点分类模型对原始照片进行筛选,得到包含兴趣点的目标照片,通过招牌分割模型对目标照片上兴趣点的所在区域的轮廓处进行标记,得到目标照片上兴趣点的分割区域,识别分割区域中的兴趣点,具有非常高的处理效率和准确率,并且明显降低了人工成本。
本说明书实施例中,在通过兴趣点分类模型对原始照片进行筛选之前,还可包括:
获取存在对于兴趣点的标注信息的第一照片集合;
采用第一照片集合对兴趣点分类模型进行训练。
在本实施例中,对于兴趣点的标注信息,可以理解为在第一照片上标注存在兴趣点。一般可以对原始照片中的兴趣点进行标注得到第一照片集合。采用第一照片集合对兴趣点分类模型进行训练,使兴趣点分类模型能够具备准确判断原始照片是否包含兴趣点的能力,无需人工继续标注照片是否存在兴趣点,节约人工成本和提高效率。
本说明书实施例中,在通过招牌分割模型对目标照片上兴趣点的所在区域的轮廓处进行标记之前,还可包括:
获取存在对于兴趣点所在区域的标注信息的第二照片集合;
采用第二照片集合对招牌分割模型进行训练。
在本实施例中,一般可以对原始照片中兴趣点所在区域进行标注得到第二照片集合。对于兴趣点所在区域的标注信息,可以理解为对第二照片上兴趣点所在区域的轮廓进行标记,也可以理解为框选出第二照片上兴趣点所在区域的轮廓。采用第二照片集合对招牌分割模型进行训练,使招牌分割模型能够具备对兴趣点所在区域的轮廓进行标记的能力,无需人工继续对兴趣点所在区域的轮廓进行标记,节约人工成本和提高效率。
本说明书实施例中,第二照片集合中的照片可以是第一照片集合中的至少部分照片。
在本实施例中,第二照片集合中的照片是第一照片集合中的部分照片,可以减少对原始照片的获取数量的要求,也可以进一步提高处理效率。
本说明书实施例中,在采用第二照片集合对招牌分割模型进行训练之前,还可包括:
将训练后的兴趣点分类模型的模型参数迁移至招牌分割模型,得到迁移参数后的招牌分割模型;其中,模型参数用于判断照片中是否存在兴趣点;
采用第二照片集合对招牌分割模型进行训练,可包括:
采用第二照片集合对迁移参数后的招牌分割模型进行训练。
在本实施例中,将训练后的兴趣点分类模型的模型参数迁移至招牌分割模型,得到迁移参数后的招牌分割模型,也就是使招牌分割模型继承了兴趣点分类模型的模型参数,对兴趣点分类模型的模型参数实现了复用,避免了采用第二照片集合对最原始的招牌分割模型进行训练,也可以理解为避免了采用第二照片集合对招牌分割模型从零开始进行训练,从而可以减少对第二照片集合中照片数量的需求,能够在减少对兴趣点所在区域的轮廓进行标记的人工成本的同时,使招牌分割模型仍然具备对兴趣点所在区域的轮廓进行准确标记的能力。
举例来说,招牌分割模型的处理效率约为:11FPS;每次需要处理一张分辨率为896*896*3的高分辨率照片。招牌分割模型每提升1%的精度,需要向第二照片集合中增加10000张经过人工标注的照片。一般情况下,对于第二照片集合中的一张照片,标注员需要作业5分钟,耗资5元;对于第一照片集合中的一张照片,标注员需要作业1分钟,耗资1元;也就是说第一照片集合可以看作低成本照片集合,第二照片集合可以看作高成本照片集合。图5为本说明书一实施例中招牌分割模型和兴趣点分类模总和的训练成本与单独对招牌分割模型的训练成本的对比示意图,参见图5,假设未将训练后的兴趣点分类模型的模型参数迁移至招牌分割模型,对于一个精度可以达到80%的招牌分割模型,需要向第二照片集合中增加80000张经过人工标注的照片,如图5A所示,耗资40W人民币。而本实施例中,如图5B所示,将训练后的兴趣点分类模型的模型参数迁移至招牌分割模型,兴趣点分类模型的训练需要50000张照片,成本为5万,招牌分割模型的训练需要20000张照片,成本为10万,总成本为15万,远远低于40W。一般情况下,当第一照片集合满足对兴趣点分类模型进行训练的要求下,将训练后的兴趣点分类模型的模型参数迁移至招牌分割模型,第二照片集合中照片的数量可以是第一照片集合中照片数量的10%至40%,例如20%,便可以使招牌分割模型具备对兴趣点所在区域的轮廓进行准确标记的能力。本实施例实现了使用相对较多的低成本的第一照片集合,使用少量的高成本的第二照片集合,通过少量的第二照片集合对招牌分割模型的模型参数进行微调,明显节约了成本。
本说明书实施例中,将训练后的兴趣点分类模型的模型参数迁移至招牌分割模型,可包括:
确定兴趣点分类模型和招牌分割模型之间共享的底层模型结构;
将训练后的兴趣点分类模型的模型参数通过底层模型结构迁移至招牌分割模型。
在本实施例中,可以预先使兴趣点分类模型和招牌分割模型之间共享相同的底层模型结构。当需要将训练后的兴趣点分类模型的模型参数迁移至招牌分割模型时,确定兴趣点分类模型和招牌分割模型之间共享的底层模型结构,将训练后的兴趣点分类模型的模型参数通过底层模型结构迁移至招牌分割模型,非常的简单方便。模型参数的迁移过程,即模型参数的复制和粘贴的过程,无需改变模型参数的格式。
本说明书实施例中,通过兴趣点分类模型对原始照片进行筛选,可包括:
通过兴趣点分类模型对原始照片中存在兴趣点的照片的标识进行记录,剔除标识未被记录的照片。
在本实施例中,通过兴趣点分类模型对原始照片中存在兴趣点的照片的标识进行记录,可以在数据库中建立一个包含两列的表格,一列存储照片的id,一列存储是或否,从而记录每张照片是否包含兴趣点,剔除了标识未被记录的照片,非常的简单方便。
本说明书实施例中,通过兴趣点分类模型对原始照片进行筛选,可包括:
通过兴趣点分类模型提取原始照片的中间特征,其中中间特征为通过向量形式表示的原始照片的图像像素;
通过兴趣点分类模型根据原始照片的中间特征对原始照片进行打分,剔除打分低于预设阈值的照片,其中打分低于预设阈值的照片未包含兴趣点。
在本实施例中,通过兴趣点分类模型提取原始照片的中间特征,通过兴趣点分类模型根据原始照片的中间特征对原始照片进行打分,剔除打分低于预设阈值的照片,可以得到比较准确的筛选结果,即得到比较准确的目标照片。
本说明书实施例中,通过招牌分割模型对目标照片上兴趣点的所在区域的轮廓处进行标记,可包括:
通过招牌分割模型根据目标照片的中间特征识别兴趣点在目标照片上的所在区域;
对目标照片上兴趣点的所在区域的轮廓处进行标记。
在本实施例中,通过招牌分割模型根据目标照片的中间特征识别兴趣点在目标照片上的所在区域,对目标照片上兴趣点的所在区域的轮廓处进行标记,一般可以理解为对目标照片上兴趣点所在区域轮廓的四个角点进行标记,非常简单高效。对目标照片上兴趣点的所在区域的轮廓处进行标记,便于只识别被标记区域中包含的文字信息,避免其他区域对识别过程产生干扰,更加地直接高效。另外,本实施例中目标照片的中间特征可以为前述实施例的通过兴趣点分类模型提取的原始照片的中间特征,实现了将前述实施例的中间特征作为本实施例的输入,充分利用了前述实施例的计算结果,接力进行对兴趣点所在区域的轮廓进行标记,避免重复计算,提高了计算效率,避免造成前述实施例的算力的浪费。
图2为本说明书一实施例中识别照片中兴趣点的方法的架构示意图。兴趣点分类模型和招牌分割模型均可以为卷积神经网络。兴趣点分类模型和招牌分割模型可以设置在同一个AI平台,也可以设置在不同的AI平台。具体地,参见图2,兴趣点分类模型可以获取到原始照片,然后获取原始照片的中间特征,其中中间特征为通过向量形式表示的原始照片的图像像素。兴趣点分类模型根据原始照片的中间特征对照片进行筛选,得到包含兴趣点的目标照片。将目标照片的中间特征存储到Redis数据库。招牌分割模型从Redis数据库中获取到中间特征,根据中间特征对目标照片的兴趣点的所在区域的轮廓处进行标记,得到分割区域。兴趣点识别模块识别分割区域中包含的文字信息。将识别的文字信息存储到Redis数据库中。然后,将Redis存储的文字信息的结果落盘ES。综上所述,本方案实现了人工标注成本的降低、处理照片吞吐量的提升、优化了利用GPU计算的资源、提高了地图中兴趣点更新的效率。一般可以通过人机界面将目标照片(目标照片的中间特征)存储到redis数据库,如图6所示,图6为本说明书一实施例中用于将目标照片存储到redis数据库的人机界面示意图,可以通过人机界面连接到Redis服务器,点击插入行按钮,输入标识(order_id)和照片的存储地址(url)即可。标识可以对应人机界面中的key,存储地址可以对应人机界面中的value。
图3为本说明书一实施例中识别照片中兴趣点的装置的结构示意框图。基于同一构思,本发明还提供了一种识别照片中兴趣点的装置。装置可包括照片获取模块501、照片筛选模块502、兴趣点分割模块503以及兴趣点识别模块504。照片获取模块501用于获取用于更新地图上兴趣点的原始照片;照片筛选模块502用于通过兴趣点分类模型对原始照片进行筛选,得到包含兴趣点的目标照片;其中,兴趣点分类模型用于判断原始照片中是否存在兴趣点;兴趣点分割模块503用于通过招牌分割模型对目标照片上兴趣点的所在区域的轮廓处进行标记,得到目标照片上兴趣点的分割区域;其中,招牌分割模型用于分割目标照片上兴趣点的所在区域;兴趣点识别模块504用于识别分割区域中的兴趣点。
本发明还提供了一种机器可读存储介质,其上存储有机器可执行程序和/或指令,机器可执行程序和/或指令被处理器执行时实现根据上述实施例中任一项的识别照片中兴趣点的方法。
需要说明的是,本申请提供的装置是与本申请提供的方法一一对应的,因此,装置也具有与方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置的有益技术效果。本申请中的上述各个实施例可以任意组合。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种识别照片中兴趣点的方法,其特征在于,包括:
获取用于更新地图上兴趣点的原始照片;
通过兴趣点分类模型对所述原始照片进行筛选,得到包含兴趣点的目标照片;其中,所述兴趣点分类模型用于判断原始照片中是否存在兴趣点;
通过招牌分割模型对所述目标照片上兴趣点的所在区域的轮廓处进行标记,得到所述目标照片上兴趣点的分割区域;其中,所述招牌分割模型用于分割目标照片上兴趣点的所在区域;
识别所述分割区域中的兴趣点。
2.根据权利要求1所述的方法,其特征在于,在所述通过兴趣点分类模型对所述原始照片进行筛选之前,还包括:
获取存在对于兴趣点的标注信息的第一照片集合;
采用所述第一照片集合对所述兴趣点分类模型进行训练。
3.根据权利要求2所述的方法,其特征在于,在所述通过招牌分割模型对所述目标照片上兴趣点的所在区域的轮廓处进行标记之前,还包括:
获取存在对于兴趣点所在区域的标注信息的第二照片集合;
采用所述第二照片集合对所述招牌分割模型进行训练。
4.根据权利要求3所述的方法,其特征在于,所述第二照片集合中的照片是所述第一照片集合中的至少部分照片。
5.根据权利要求3所述的方法,其特征在于,在所述采用所述第二照片集合对所述招牌分割模型进行训练之前,还包括:
将训练后的兴趣点分类模型的模型参数迁移至所述招牌分割模型,得到迁移参数后的招牌分割模型;其中,所述模型参数用于判断照片中是否存在兴趣点;
所述采用所述第二照片集合对所述招牌分割模型进行训练,包括:
采用所述第二照片集合对所述迁移参数后的招牌分割模型进行训练。
6.根据权利要求1所述的方法,其特征在于,所述通过兴趣点分类模型对所述原始照片进行筛选,包括:
通过兴趣点分类模型对所述原始照片中存在兴趣点的照片的标识进行记录,剔除标识未被记录的照片。
7.根据权利要求1所述的方法,其特征在于,所述通过兴趣点分类模型对所述原始照片进行筛选,包括:
通过兴趣点分类模型提取所述原始照片的中间特征,其中所述中间特征为通过向量形式表示的所述原始照片的图像像素;
通过所述兴趣点分类模型根据所述原始照片的中间特征对所述原始照片进行打分,剔除打分低于预设阈值的照片,其中打分低于预设阈值的照片未包含兴趣点。
8.根据权利要求7所述的方法,其特征在于,所述通过招牌分割模型对所述目标照片上兴趣点的所在区域的轮廓处进行标记,包括:
通过招牌分割模型根据目标照片的中间特征识别兴趣点在目标照片上的所在区域;
对所述目标照片上兴趣点的所在区域的轮廓处进行标记。
9.一种识别照片中兴趣点的装置,其特征在于,包括:
照片获取模块,用于获取用于更新地图上兴趣点的原始照片;
照片筛选模块,用于通过兴趣点分类模型对所述原始照片进行筛选,得到包含兴趣点的目标照片;其中,所述兴趣点分类模型用于判断原始照片中是否存在兴趣点;
兴趣点分割模块,用于通过招牌分割模型对所述目标照片上兴趣点的所在区域的轮廓处进行标记,得到所述目标照片上兴趣点的分割区域;其中,所述招牌分割模型用于分割目标照片上兴趣点的所在区域;
兴趣点识别模块,用于识别所述分割区域中的兴趣点。
10.一种机器可读存储介质,其上存储有机器可执行程序和/或指令,所述机器可执行程序和/或指令被处理器执行时实现根据权利要求1至8任一项所述的识别照片中兴趣点的方法。
CN202310972122.6A 2023-08-03 2023-08-03 识别照片中兴趣点的方法、装置及机器可读存储介质 Pending CN117290538A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310972122.6A CN117290538A (zh) 2023-08-03 2023-08-03 识别照片中兴趣点的方法、装置及机器可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310972122.6A CN117290538A (zh) 2023-08-03 2023-08-03 识别照片中兴趣点的方法、装置及机器可读存储介质

Publications (1)

Publication Number Publication Date
CN117290538A true CN117290538A (zh) 2023-12-26

Family

ID=89257870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310972122.6A Pending CN117290538A (zh) 2023-08-03 2023-08-03 识别照片中兴趣点的方法、装置及机器可读存储介质

Country Status (1)

Country Link
CN (1) CN117290538A (zh)

Similar Documents

Publication Publication Date Title
CN107358596B (zh) 一种基于图像的车辆定损方法、装置、电子设备及系统
WO2020133442A1 (zh) 一种识别文本的方法及终端设备
CN111311709A (zh) 一种生成高精地图的方法及装置
WO2018233055A1 (zh) 保单信息录入的方法、装置、计算机设备及存储介质
US11106933B2 (en) Method, device and system for processing image tagging information
CN110287831A (zh) 一种基于地标的控制点的获取方法、装置和电子设备
WO2025060272A1 (zh) 一种基于注意力掩码的弱监督语义分割方法及装置
CN111626145A (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
CN114359935A (zh) 一种模型训练以及表格识别方法及装置
CN112365513A (zh) 一种模型训练的方法及装置
CN114626437A (zh) 一种模型训练方法、装置、存储介质及电子设备
CN111291758A (zh) 用于识别印章文字的方法和装置
CN103915035B (zh) 一种数据转换方法及数据转换装置
CN111898641A (zh) 一种目标模型检测、装置、电子设备及计算机可读存储介质
CN112000274B (zh) 车载智能设备屏幕的缩放方法、装置及设备
CN118823186A (zh) 一种地质图的标注方法、装置、存储介质及电子设备
CN117197781B (zh) 一种交通标志识别的方法、装置、存储介质及电子设备
CN116563857A (zh) 一种识别指示牌的方法、装置、设备、介质及产品
CN117290538A (zh) 识别照片中兴趣点的方法、装置及机器可读存储介质
CN110990647A (zh) 数据处理方法以及装置
CN117237675A (zh) 一种无人机自主定位的方法、装置、存储介质及电子设备
CN115018866A (zh) 一种边界确定方法、装置、存储介质及电子设备
CN114187355A (zh) 一种图像标定方法及装置
CN113128496B (zh) 一种从图像中提取结构化数据的方法、装置和设备
CN117271827A (zh) 更新地图中兴趣点的方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination