CN112860993B - 兴趣点的分类方法、装置、设备、存储介质及程序产品 - Google Patents

兴趣点的分类方法、装置、设备、存储介质及程序产品 Download PDF

Info

Publication number
CN112860993B
CN112860993B CN202110154377.2A CN202110154377A CN112860993B CN 112860993 B CN112860993 B CN 112860993B CN 202110154377 A CN202110154377 A CN 202110154377A CN 112860993 B CN112860993 B CN 112860993B
Authority
CN
China
Prior art keywords
cluster
interest
processed
point
interest point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110154377.2A
Other languages
English (en)
Other versions
CN112860993A (zh
Inventor
朱永福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110154377.2A priority Critical patent/CN112860993B/zh
Publication of CN112860993A publication Critical patent/CN112860993A/zh
Application granted granted Critical
Publication of CN112860993B publication Critical patent/CN112860993B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds

Abstract

本申请公开了兴趣点的分类方法、装置、设备、存储介质及程序产品,涉及图像处理、电子地图领域。具体实现方案为:获取待处理兴趣点,并确定待处理兴趣点的候选类别;获取候选类别对应的多个簇,多个簇中包括第一簇和第二簇,第一簇中包括的第一兴趣点的图像信息的数量大于预设值,第二簇中包括有第二兴趣点的图像信息,第一兴趣点的真实类别为候选类别,第二兴趣点的真实类别为候选类别之外的其他类别;根据待处理兴趣点的图像信息和多个簇,对待处理兴趣点的候选类别的真实性进行验证。该方法提高了兴趣点分类的准确性。

Description

兴趣点的分类方法、装置、设备、存储介质及程序产品
技术领域
本申请实施例涉及图像处理技术,尤其涉及一种兴趣点(Point of Interest,POI)的分类方法、装置、设备、存储介质及程序产品,可用于电子地图领域。
背景技术
兴趣点是电子地图中展示的能够引起关注的点,如景点、公司、商场、店铺、公交站等,兴趣点一般包括名称、地址、电话、商户描述以及实地照片等基础信息。
在确定兴趣点的分类(例如品牌)时,通常是将兴趣点名称中的核心词与预设的类别词表中的类别进行匹配,得到兴趣点对应的类别。然而,若一些兴趣点的名称中的核心词与某类别相同,但这些兴趣点实际并不是该类别的兴趣点,则采用这种名称匹配的方式会导致分类错误。
发明内容
本申请提供了一种用于提高准确性的兴趣点的分类方法、装置、设备、存储介质及程序产品。
根据本申请的一方面,提供了一种兴趣点的分类方法,包括:
获取待处理兴趣点,并确定所述待处理兴趣点的候选类别;
获取所述候选类别对应的多个簇,所述多个簇中包括第一簇和第二簇,所述第一簇中包括的第一兴趣点的图像信息的数量大于预设值,所述第二簇中包括有第二兴趣点的图像信息,所述第一兴趣点的真实类别为所述候选类别,所述第二兴趣点的真实类别为所述候选类别之外的其他类别;
根据所述待处理兴趣点的图像信息和所述多个簇,对所述待处理兴趣点的候选类别的真实性进行验证。
根据本申请的另一方面,提供了一种兴趣点的分类装置,包括:
第一获取模块,用于获取待处理兴趣点,并确定所述待处理兴趣点的候选类别;
第二获取模块,用于获取所述候选类别对应的多个簇,所述多个簇中包括第一簇和第二簇,所述第一簇中包括的第一兴趣点的图像信息的数量大于预设值,所述第二簇中包括有第二兴趣点的图像信息,所述第一兴趣点的真实类别为所述候选类别,所述第二兴趣点的真实类别为所述候选类别之外的其他类别;
验证模块,用于根据所述待处理兴趣点的图像信息和所述多个簇,对所述待处理兴趣点的候选类别的真实性进行验证。
根据本申请的再一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述兴趣点的分类方法。
根据本申请的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述兴趣点的分类方法。
根据本申请的又一方面,提供了一种计算机程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
根据本申请的技术方案,提高了兴趣点分类的准确性。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例提供的兴趣点的分类方法的流程示意图;
图2是根据本申请实施例提供的兴趣点的图像示意图一;
图3是根据本申请实施例提供的兴趣点的图像示意图二;
图4是根据本申请实施例提供的兴趣点的图像示意图三;
图5是根据本申请实施例提供的样本示意图;
图6是根据本申请实施例提供的兴趣点的分类装置的结构示意图;
图7是用来实现本申请实施例的兴趣点的分类方法的电子设备的示意性框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
兴趣点的分类可以基于多种维度,例如可以基于品牌维度对兴趣点进行分类。兴趣点的品牌分类,对于兴趣点检索、品牌之外的其他维度的分类以及兴趣点命名规范化等场景都有重要作用。例如,名称为“AA超市”的兴趣点对应的品牌分类为“AA”,用户在地图中搜索AA时,可以直接返回“AA”品牌的所有兴趣点。又如,在对兴趣点进行其他维度的分类过程中,“AA”品牌的所有兴趣点全部被分类为“购物”。再如,对于不同地点的“AA超市”,兴趣点命名时可以采用“AA超市”+地点的统一格式以便于用户查看。
在确定兴趣点的分类(例如品牌)时,通常是将兴趣点名称中的核心词与预设的类别词表中的类别进行匹配,得到兴趣点对应的类别。然而,若一些兴趣点的名称中的核心词与某类别相同,但这些兴趣点实际并不是该类别的兴趣点,则采用这种名称匹配的方式会导致分类错误。
仍以“AA超市”进行举例说明。假设“AA”品牌为一知名连锁品牌,该品牌的超市名称通常为“AA超市”,且在预设的品牌词表中具有“AA”这一词条。在确定某个地点的“AA超市”的品牌分类时,将其名称中的核心词“AA”与预设的品牌词表进行匹配,即可确定该“AA超市”对应的品牌分类为“AA”。然而,对于这类知名品牌,在实际生活中可能会有一些小店铺故意取与之类似的店铺名称,例如地图中存在一个名称为“AA大超市”的兴趣点,在确定“AA大超市”的品牌分类时,若将其名称中的核心词“AA”与预设的品牌词表进行匹配,同样可以得到匹配的结果,从而将“AA大超市”对应的品牌分类确定为“AA”,这样就导致对一些假的店铺进行了错误的品牌分类。
本申请实施例提供一种兴趣点的分类方法,可以应用于电子地图领域。由于同一分类的兴趣点的图像信息之间会具有明显的一致性,而不属于该分类的兴趣点的图像信息则会有明显的差异性,因此,利用一个分类下的兴趣点的图像信息的集合,可以对待处理兴趣点的类别进行校验,确定待处理兴趣点的真实类别是否是该分类。
下面,将通过具体的实施例对本申请提供的兴趣点的分类方法进行详细地说明。可以理解的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1是根据本申请实施例提供的兴趣点的分类方法的流程示意图。该方法的执行主体为兴趣点的分类装置,该装置可以通过软件和/或硬件的方式实现。如图1所示,该方法包括:
S101、获取待处理兴趣点,并确定待处理兴趣点的候选类别。
待处理兴趣点为待确定类别的兴趣点,示例的,对于地图中新增的一个兴趣点,为了便于后续对该兴趣点的命名、搜索和管理等,需要确定该新增兴趣点的类别。本实施例中仍然以类别为品牌为例进行说明。
可选的,待处理兴趣点的候选品牌可以通过是根据待处理兴趣点的文本信息确定的,例如根据待处理兴趣点的名称确定的,如待处理兴趣点的名称为“AA大超市”,根据该名称确定候选品牌为“AA”。
可选的,待处理兴趣点的候选品牌可以是通过用户提交的信息确定的,例如待处理兴趣点为一店铺,该店铺的所有者主动提交该店铺的品牌,该品牌可以作为该待处理兴趣点的候选品牌。
可选的,待处理兴趣点的候选品牌也可以通过分类模型获得,分类模型可以基于待处理兴趣点文本信息和/或图像信息确定待处理兴趣点的候选品牌。
S102、获取候选类别对应的多个簇。
其中,多个簇中包括第一簇和第二簇,第一簇中包括的第一兴趣点的图像信息的数量大于预设值,第二簇中包括有第二兴趣点的图像信息,第一兴趣点的真实类别为候选类别,第二兴趣点的真实类别为候选类别之外的其他类别。
仍然以类别为品牌为例,在确定待处理兴趣点的候选品牌后,获取该候选品牌对应的多个簇。候选品牌对应的多个簇可以是预先生成的,每个簇中包括了该候选品牌对应的多个兴趣点的图像信息,其中部分兴趣点的真实品牌为该候选品牌,而部分兴趣点的真实品牌不是该候选品牌。第一兴趣点为真实品牌为该候选品牌的兴趣点,而第二兴趣点则是真实品牌不是该候选品牌的兴趣点,即,第一兴趣点是候选品牌对应的真实兴趣点,第二兴趣点时候选品牌对应的伪兴趣点。
可以理解,对于一个品牌的真实兴趣点,例如对于一些品牌店铺,由于统一的装修布局等原因,真实兴趣点的图像,如门脸图、招牌图,通常图像相似度较高,而伪兴趣点通常仅仅是名称与真实兴趣点相似,但是图像则有较大差异。示例的,如图2和图3中所示的为“AA”品牌对应的两个第一兴趣点的门脸图,这两个门脸图中均具有文字“AA”以及“AA”品牌的图标1,而图4所示则是“AA”品牌对应的一个第二兴趣点的门脸图,该门脸图中仅具有文字“AA商店”,而没有“AA”品牌的图标1。
可见,第一兴趣点的图像信息具有一致性,且第一兴趣点的图像信息与第二兴趣点的图像信息之间有差异,因此,候选品牌对应的第一兴趣点和第二兴趣点可以根据其图像信息被划分在不同的集合中,即不同的簇中。其中,第一簇中包括第一兴趣点的图像信息,用于表征候选品牌对应的真实兴趣点的图像特征,第二簇中包括第二兴趣点的图像信息,用于表征候选品牌对应的伪兴趣点的图像特征。
需要说明的是,第一簇中也可以存在第二兴趣点的图像信息,但第一簇中第一兴趣点的图像信息的数量更多,例如第一簇中第一兴趣点的图像信息的数量大于预设值,或者第一兴趣点的的图像信息的比例大于预设比例。第二簇中也可以存在第一兴趣点的图像信息,但第二簇中第二兴趣点的图像信息的数量更多。第一簇和第二簇均可以是多个。
S103、根据待处理兴趣点的图像信息和多个簇,对待处理兴趣点的候选类别的真实性进行验证。
待处理兴趣点对应的多个簇中,第一簇中的图像信息表征候选品牌对应的真实兴趣点的图像特征,而第二簇中的图像信息表征候选品牌对应的伪兴趣点的图像特征。可以理解,若待处理兴趣点的候选品牌是待处理兴趣点的真实品牌,那么待处理兴趣点的图像信息会与第一簇中的图像信息接近,若待处理兴趣点的候选品牌不是待处理兴趣点的真实品牌,那么待处理兴趣点的图像信息会与第一簇中的图像信息有差异,或者与第二簇中的图像信息接近,因此,可以根据待处理兴趣点的图像信息和多个簇的图像信息,对待处理兴趣点的候选品牌的真实性进行验证,确定待处理兴趣点的候选品牌是否是其真实品牌。
本实施例提供的兴趣点的分类方法,在获取待处理兴趣点的候选类别后,将待处理兴趣点的图像信息与该候选类别对应的多个已知的簇中的图像信息进行比较,由于该多个已知的簇中的图像信息表征了候选类别对应的真实兴趣点和伪兴趣点的图像特征,因此可以基于多个已知的簇,对待处理兴趣点的真实类别是否为该候选类别进行验证,提高了兴趣点的类别的准确性。
上述实施例中已经说明,候选类别对应的多个簇可以预先生成,以下对此进行说明。
可选的,获取候选类别对应的多个兴趣点的图像,并提取每个图像的特征向量,多个兴趣点包括第一兴趣点和第二兴趣点;采用聚类算法对多个兴趣点的图像的特征向量进行聚类,生成候选类别对应的多个簇。
以类别为品牌为例,示例的,对于候选品牌“AA”,获取候选品牌对应的多个第一兴趣点如“AA超市一店”、“AA超市二店”、“AA超市二店”等,多个第二兴趣点如“AA便利店”、“AA小店”、“BB超市”等。对于这些兴趣点,提取每个兴趣点的门脸图的特征向量,利用聚类算法进行聚类,例如利用基于密度的聚类算法(Density-Based Spatial Clustering ofApplications with Noise,DBSCAN)。
对DBSCAN相关的概念进行说明:
邻域:对于任意样本i和给定距离e,样本i的e邻域是指所有与样本i距离不大于e的样本集合;
核心对象:若样本i的e邻域中至少包含MinPts个样本,则i是一个核心对象;
密度直达:若样本j在样本i的e邻域中,且i是核心对象,则称样本j由样本i密度直达;
密度可达:对于样本i和样本j,如果存在样本序列p1,p2,...,pn,其中p1=i,pn=j,并且pm由pm-1密度直达,1<m≤n,则称样本i与样本j密度可达;
密度相连:对于样本i和样本j,若存在样本k使得i与j均由k密度可达,则称样本i与样本j密度相连。
示例的,如图5中所示,当MinPts=3的时候,虚线圆圈为e邻域,x1是核心对象,x2由x1密度直达,x3由x1密度可达,x3与x4密度相连。
根据以上概念,DBSCAN中将簇定义为:由密度可达关系导出的最大的密度相连样本集合。采用DBSCAN进行聚类的步骤描述如下:
对于给定的邻域距离e和邻域最小样本个数MinPts,遍历所有样本,找出所有满足邻域距离e的核心对象的集合;
任意选择一个核心对象,找出其所有密度可达的样本并生成聚类簇,从剩余的核心对象中移除上述步骤中找到的密度可达的样本;
从更新后的核心对象集合重复执行上述步骤直到核心对象都被遍历或移除。
对于本申请实施例,在生成候选类别对应的簇时,预先获取候选类别对应的多个兴趣点,将每个兴趣点的图像的特征向量作为一个样本,对样本集按照上述方法进行聚类,即可生成候选类别对应的多个簇。通过基于密度的聚类算法,可以得到一个候选类别对应的兴趣点的图像特征的集合,从而可以基于此对待处理兴趣点进行校验,提高分类的准确性。
可以理解的是,采用聚类算法生成的簇中,同一各簇中的兴趣点的图像的特征向量距离较小,即图像具有相似性,但是不可避免的,在一个簇中可能同时存在第一兴趣点和第二兴趣点,因此,可选的,在生成候选类别对应的多个簇之后,还可以根据每个簇中包括的第一兴趣点和第二兴趣点的数量,确定每个簇的类型,类型为第一簇或第二簇。例如,一个簇包括的兴趣点中,第一兴趣点的比例大于90%,则将该簇确定为第一簇。利用生成的簇中每个簇包括的兴趣点的真实类别,确定簇的类型,保证了簇的类型的准确性,进而保证后续对待处理兴趣点的分类进行校验的准确性。
对于生成的多个簇,每个簇可以采用聚类中心+簇半径+簇的分类标签的形式表示,其中,簇的分类标签可以是品牌标识+簇标识+真伪标识。品牌标识即候选品牌的标识,真伪标识即用于指示该簇为第一簇或第二簇,例如真伪标识为0表示该簇为候选品牌对应的第一簇,真伪标识为1表示该簇为候选品牌对应的第二簇。通过这种方式,预先生成各个品牌对应的簇,从而在后续应用中,对于一个待处理兴趣点,可以根据其候选品牌以及候选品牌对应的簇,确定待处理兴趣点的真实品牌是否是该候选品牌,从而提高了品牌分类的准确性。
对上述实施例中,如何根据待处理兴趣点的图像信息和多个簇,对待处理兴趣点的候选类别的真实性进行验证进行说明。
可选的,根据待处理兴趣点的图像信息,确定多个簇中与待处理兴趣点距离最近的目标簇;若目标簇为第一簇,且待处理兴趣点与目标簇的距离小于或等于目标簇的簇半径,则确定待处理兴趣点的真实类别为候选类别。
其中,图像信息可以为图像的特征向量,待处理兴趣点与簇的距离是指待处理兴趣点的图像的特征向量与簇的聚类中心的距离,因此,确定多个簇中每个簇的聚类中心,并分别计算待处理兴趣点的图像的特征向量与每个簇的聚类中心的距离,从而确定多个簇中与待处理兴趣点距离最近的目标簇。
图像的特征向量为形如[0.00438548-0.00702555-0.003299-0.00730199-0.00241332 0.0046599]的向量表示,簇的聚类中心可以根据簇包括的兴趣点的图像的特征向量的平均值确定,因此聚类中心同样也如上述向量表示。两个特征向量之间的距离可以通过特征向量的余弦相似度计算。采用待处理兴趣点的图像的特征向量与每个簇的聚类中心的距离来确定目标簇,保证了目标簇与待处理兴趣点具有最接近的图像特征,从而保证分类的准确性。
在确定目标簇之后,若目标簇为第一簇且待处理兴趣点与目标簇的距离小于或等于目标簇的簇半径,则可以确定待处理兴趣点的真实类别为候选类别。其中,簇半径即簇中的特征向量与簇的聚类中心的最远距离。若目标簇为第一簇,但待处理兴趣点与目标簇的距离大于目标簇的簇半径,则确定待处理兴趣点的真实类别为候选类别之外的其他类别,即待处理兴趣点是候选类别对应的伪兴趣点。若目标簇为第二簇,也可确定待处理兴趣点的真实类别为候选类别之外的其他类别,即待处理兴趣点是候选类别对应的伪兴趣点。
采用本实施例的方法,利用待处理兴趣点与簇的距离来确定待处理兴趣点是否在候选类别对应的第一簇的范围内,从而确定待处理兴趣点是否是候选类别对应的一个真实兴趣点,提高了分类的准确性。
图6是根据本申请实施例提供的兴趣点的分类装置的结构示意图。如图6所示,兴趣点的分类装置600,包括:
第一获取模块601,用于获取待处理兴趣点,并确定待处理兴趣点的候选类别;
第二获取模块602,用于获取候选类别对应的多个簇,多个簇中包括第一簇和第二簇,第一簇中包括的第一兴趣点的图像信息的数量大于预设值,第二簇中包括有第二兴趣点的图像信息,第一兴趣点的真实类别为候选类别,第二兴趣点的真实类别为候选类别之外的其他类别;
验证模块603,用于根据待处理兴趣点的图像信息和多个簇,对待处理兴趣点的候选类别的真实性进行验证。
可选的,验证模块603包括:
第一确定单元,用于根据待处理兴趣点的图像信息,确定多个簇中与待处理兴趣点距离最近的目标簇;
第二确定单元,用于在目标簇为第一簇,且待处理兴趣点与目标簇的距离小于或等于目标簇的簇半径时,确定待处理兴趣点的真实类别为候选类别。
可选的,图像信息为图像的特征向量,第一确定单元包括:
第一确定子单元,用于确定多个簇中每个簇的聚类中心;
第二确定子单元,用于分别计算待处理兴趣点的图像的特征向量与每个簇的聚类中心的距离,确定多个簇中与待处理兴趣点距离最近的目标簇。
可选的,第一确定子单元用于:
根据每个簇包括的兴趣点的图像的特征向量的平均值,确定每个簇的聚类中心。
可选的,第二获取模块602包括:
获取单元,用于获取候选类别对应的多个兴趣点的图像,并提取每个图像的特征向量,多个兴趣点包括第一兴趣点和第二兴趣点;
生成单元,用于采用聚类算法对多个兴趣点的图像的特征向量进行聚类,生成候选类别对应的多个簇。
可选的,第二获取模块602还包括:
第三确定单元,用于根据每个簇中包括的第一兴趣点和第二兴趣点的数量,确定每个簇的类型,类型为第一簇或第二簇。
可选的,第一获取模块601用于,根据待处理兴趣点的文本信息确定待处理兴趣点的候选类别。
可选的,验证模块603还包括:
第四确定单元,用于目标簇为第二簇,或者,若目标簇为第一簇且待处理兴趣点与目标簇的距离大于目标簇的簇半径时,确定待处理兴趣点的真实类别为候选类别之外的其他类别。
根据本申请的实施例,本申请还提供了一种电子设备和存储有计算机指令的非瞬时计算机可读存储介质。
根据本申请的实施例,本申请还提供了一种计算机程序产品,程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
图7是用来实现本申请实施例的兴趣点的分类方法的电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,电子设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如兴趣点的分类方法。例如,在一些实施例中,兴趣点的分类方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的兴趣点的分类方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行兴趣点的分类方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (13)

1.一种兴趣点的分类方法,包括:
获取待处理兴趣点,并确定所述待处理兴趣点的候选类别;
获取所述候选类别对应的多个簇,所述多个簇中包括第一簇和第二簇,所述第一簇中包括的第一兴趣点的图像信息的数量大于预设值,所述第二簇中包括有第二兴趣点的图像信息,所述第一兴趣点的真实类别为所述候选类别,所述第二兴趣点的真实类别为所述候选类别之外的其他类别;
根据所述待处理兴趣点的图像信息和所述多个簇,对所述待处理兴趣点的候选类别的真实性进行验证;
所述根据所述待处理兴趣点的图像信息和所述多个簇,对所述待处理兴趣点的候选类别的真实性进行验证,包括:
根据所述待处理兴趣点的图像信息,确定所述多个簇中与所述待处理兴趣点距离最近的目标簇;
若所述目标簇为第一簇,且所述待处理兴趣点与所述目标簇的距离小于或等于所述目标簇的簇半径,则确定所述待处理兴趣点的真实类别为所述候选类别,所述簇半径为簇中的特征向量与簇的聚类中心的最远距离;
所述图像信息为图像的特征向量,所述根据所述待处理兴趣点的图像信息,确定所述多个簇中与所述待处理兴趣点距离最近的目标簇,包括:
确定所述多个簇中每个簇的聚类中心;
分别计算所述待处理兴趣点的图像的特征向量与每个簇的聚类中心的距离,确定所述多个簇中与所述待处理兴趣点距离最近的目标簇;
所述确定所述待处理兴趣点的候选类别,包括:
根据所述待处理兴趣点的文本信息确定所述待处理兴趣点的候选类别。
2.根据权利要求1所述的方法,所述确定所述多个簇中每个簇的聚类中心,包括:
根据每个簇包括的兴趣点的图像的特征向量的平均值,确定每个所述簇的聚类中心。
3.根据权利要求1-2中任一项所述的方法,还包括:
获取所述候选类别对应的多个兴趣点的图像,并提取每个图像的特征向量,所述多个兴趣点包括第一兴趣点和第二兴趣点;
采用聚类算法对所述多个兴趣点的图像的特征向量进行聚类,生成所述候选类别对应的多个簇。
4.根据权利要求3所述的方法,生成所述候选类别对应的多个簇之后,还包括:
根据每个簇中包括的第一兴趣点和第二兴趣点的数量,确定每个簇的类型,所述类型为第一簇或第二簇。
5.根据权利要求1-2中任一项所述的方法,还包括:
若所述目标簇为第二簇,或者,若所述目标簇为第一簇且所述待处理兴趣点与所述目标簇的距离大于所述目标簇的簇半径,则确定所述待处理兴趣点的真实类别为所述候选类别之外的其他类别。
6.一种兴趣点的分类装置,包括:
第一获取模块,用于获取待处理兴趣点,并确定所述待处理兴趣点的候选类别;
第二获取模块,用于获取所述候选类别对应的多个簇,所述多个簇中包括第一簇和第二簇,所述第一簇中包括的第一兴趣点的图像信息的数量大于预设值,所述第二簇中包括有第二兴趣点的图像信息,所述第一兴趣点的真实类别为所述候选类别,所述第二兴趣点的真实类别为所述候选类别之外的其他类别;
验证模块,用于根据所述待处理兴趣点的图像信息和所述多个簇,对所述待处理兴趣点的候选类别的真实性进行验证;
所述验证模块包括:
第一确定单元,用于根据所述待处理兴趣点的图像信息,确定所述多个簇中与所述待处理兴趣点距离最近的目标簇;
第二确定单元,用于在所述目标簇为第一簇,且所述待处理兴趣点与所述目标簇的距离小于或等于所述目标簇的簇半径时,确定所述待处理兴趣点的真实类别为所述候选类别,所述簇半径为簇中的特征向量与簇的聚类中心的最远距离;
所述图像信息为图像的特征向量,所述第一确定单元包括:
第一确定子单元,用于确定所述多个簇中每个簇的聚类中心;
第二确定子单元,用于分别计算所述待处理兴趣点的图像的特征向量与每个簇的聚类中心的距离,确定所述多个簇中与所述待处理兴趣点距离最近的目标簇;
所述第一获取模块,具体用于根据所述待处理兴趣点的文本信息确定所述待处理兴趣点的候选类别。
7.根据权利要求6所述的装置,所述第一确定子单元用于:
根据每个簇包括的兴趣点的图像的特征向量的平均值,确定每个所述簇的聚类中心。
8.根据权利要求6-7中任一项所述的装置,所述第二获取模块包括:
获取单元,用于获取所述候选类别对应的多个兴趣点的图像,并提取每个图像的特征向量,所述多个兴趣点包括第一兴趣点和第二兴趣点;
生成单元,用于采用聚类算法对所述多个兴趣点的图像的特征向量进行聚类,生成所述候选类别对应的多个簇。
9.根据权利要求8所述的装置,所述第二获取模块还包括:
第三确定单元,用于根据每个簇中包括的第一兴趣点和第二兴趣点的数量,确定每个簇的类型,所述类型为第一簇或第二簇。
10.根据权利要求6-7中任一项所述的装置,所述第一获取模块用于,根据所述待处理兴趣点的文本信息确定所述待处理兴趣点的候选类别。
11.根据权利要求6-7中任一项所述的装置,所述验证模块还包括:
第四确定单元,用于所述目标簇为第二簇,或者,若所述目标簇为第一簇且所述待处理兴趣点与所述目标簇的距离大于所述目标簇的簇半径时,确定所述待处理兴趣点的真实类别为所述候选类别之外的其他类别。
12.一种电子设备,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。
13.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。
CN202110154377.2A 2021-02-04 2021-02-04 兴趣点的分类方法、装置、设备、存储介质及程序产品 Active CN112860993B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110154377.2A CN112860993B (zh) 2021-02-04 2021-02-04 兴趣点的分类方法、装置、设备、存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110154377.2A CN112860993B (zh) 2021-02-04 2021-02-04 兴趣点的分类方法、装置、设备、存储介质及程序产品

Publications (2)

Publication Number Publication Date
CN112860993A CN112860993A (zh) 2021-05-28
CN112860993B true CN112860993B (zh) 2023-08-04

Family

ID=75986602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110154377.2A Active CN112860993B (zh) 2021-02-04 2021-02-04 兴趣点的分类方法、装置、设备、存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN112860993B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901257B (zh) 2021-10-28 2023-10-27 北京百度网讯科技有限公司 地图信息的处理方法、装置、设备和存储介质
CN114004314A (zh) * 2021-12-14 2022-02-01 北京百度网讯科技有限公司 样本分类方法、装置、电子设备及存储介质
CN114625984B (zh) * 2022-03-31 2023-07-25 北京百度网讯科技有限公司 兴趣点验证方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130128097A (ko) * 2012-05-16 2013-11-26 전자부품연구원 깊이 정보를 이용한 물체 인식 방법 및 장치
WO2016156937A1 (en) * 2015-03-31 2016-10-06 Yandex Europe Ag System and method of clustering points of interest using a grid
CN110727816A (zh) * 2018-06-29 2020-01-24 百度在线网络技术(北京)有限公司 兴趣点类别确定方法和装置
CN111832578A (zh) * 2020-07-20 2020-10-27 北京百度网讯科技有限公司 兴趣点信息处理方法、装置、电子设备和存储介质
CN112101165A (zh) * 2020-09-07 2020-12-18 腾讯科技(深圳)有限公司 兴趣点识别方法、装置、计算机设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2297703A1 (en) * 2008-06-03 2011-03-23 ETH Zurich Method and system for generating a pictorial reference database using geographical information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130128097A (ko) * 2012-05-16 2013-11-26 전자부품연구원 깊이 정보를 이용한 물체 인식 방법 및 장치
WO2016156937A1 (en) * 2015-03-31 2016-10-06 Yandex Europe Ag System and method of clustering points of interest using a grid
CN110727816A (zh) * 2018-06-29 2020-01-24 百度在线网络技术(北京)有限公司 兴趣点类别确定方法和装置
CN111832578A (zh) * 2020-07-20 2020-10-27 北京百度网讯科技有限公司 兴趣点信息处理方法、装置、电子设备和存储介质
CN112101165A (zh) * 2020-09-07 2020-12-18 腾讯科技(深圳)有限公司 兴趣点识别方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于混合度量方法的用户兴趣模型;李辉;梅佩;易军凯;;计算机工程与设计(03);全文 *

Also Published As

Publication number Publication date
CN112860993A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN112860993B (zh) 兴趣点的分类方法、装置、设备、存储介质及程序产品
CN109271418B (zh) 可疑团伙识别方法、装置、设备及计算机可读存储介质
CN113095336B (zh) 关键点检测模型的训练方法和检测目标对象关键点的方法
CN113780098B (zh) 文字识别方法、装置、电子设备以及存储介质
CN114648676A (zh) 点云处理模型的训练和点云实例分割方法及装置
CN113627536A (zh) 模型训练、视频分类方法,装置,设备以及存储介质
CN113205041A (zh) 结构化信息提取方法、装置、设备和存储介质
CN115359308A (zh) 模型训练、难例识别方法、装置、设备、存储介质及程序
CN112784102B (zh) 视频检索方法、装置和电子设备
CN113378855A (zh) 用于处理多任务的方法、相关装置及计算机程序产品
CN113033194A (zh) 语义表示图模型的训练方法、装置、设备和存储介质
CN114741433B (zh) 一种社群挖掘方法、装置、设备及存储介质
CN113420104B (zh) 兴趣点采全率确定方法、装置、电子设备及存储介质
CN116295466A (zh) 地图生成方法、装置、电子设备、存储介质、及车辆
CN113742485A (zh) 一种处理文本的方法和装置
CN112381162A (zh) 信息点识别方法、装置及电子设备
CN114861062B (zh) 信息过滤方法和装置
CN114724090B (zh) 行人再识别模型的训练方法、行人再识别方法及装置
CN114490909B (zh) 对象关联方法、装置和电子设备
CN111263421A (zh) 无线网络的匹配方法、装置、电子设备及存储介质
CN115169489B (zh) 数据检索方法、装置、设备以及存储介质
CN115205555B (zh) 确定相似图像的方法、训练方法、信息确定方法及设备
CN115659067A (zh) Poi处理方法、装置、电子设备和存储介质
CN113343979B (zh) 用于训练模型的方法、装置、设备、介质和程序产品
CN116049335A (zh) Poi分类及模型训练方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant