CN113486976B - 一种地图标注内容的自动分类方法和装置 - Google Patents

一种地图标注内容的自动分类方法和装置 Download PDF

Info

Publication number
CN113486976B
CN113486976B CN202110844227.4A CN202110844227A CN113486976B CN 113486976 B CN113486976 B CN 113486976B CN 202110844227 A CN202110844227 A CN 202110844227A CN 113486976 B CN113486976 B CN 113486976B
Authority
CN
China
Prior art keywords
map
classification
classified
data set
spatial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110844227.4A
Other languages
English (en)
Other versions
CN113486976A (zh
Inventor
罗安
王勇
刘纪平
徐胜华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Academy of Surveying and Mapping
Original Assignee
Chinese Academy of Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Academy of Surveying and Mapping filed Critical Chinese Academy of Surveying and Mapping
Priority to CN202110844227.4A priority Critical patent/CN113486976B/zh
Publication of CN113486976A publication Critical patent/CN113486976A/zh
Application granted granted Critical
Publication of CN113486976B publication Critical patent/CN113486976B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种地图标注内容的自动分类方法和装置,涉及数据处理的技术领域,包括:获取地图标注的分类体系,并基于地图标注的分类体系获取各类地图标注的样本数据;提取样本数据的特征信息,特征信息包括:文本特征向量和空间位置信息;利用无核支持向量机对样本数据的文本特征向量进行训练,得到地图标注内容分类模型;基于空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;在获取到待分类地图标注数据集之后,利用地图标注内容分类模型和空间关联定量化模型,对待分类地图标注数据集进行分类,得到分类结果数据集,解决了现有地图标注内容的自动分类方法的准确率和效率较低的技术问题。

Description

一种地图标注内容的自动分类方法和装置
技术领域
本发明涉及数据分析处理的技术领域,尤其是涉及一种地图标注内容的自动分类方法和装置。
背景技术
现有的研究发现,迄今为止绝大部分文本分类方法使用的都是有核(Kernel)的算法模型。然而对于不同的分类问题和实际样本数据,不同类型的核函数及其参数值会对模型的性能产生很大影响。在实际应用中,研究者们常常耗费大量的时间和精力,通过一系列冗长的实验来选择与调试核函数及其参数,却始终未必能达到最优,导致文本分类准确度不尽人意。可以说,核的存在使得有核支持向量机不能较好地满足大数据分析挖掘的实时性和精确性,也限制了其在大规模问题上的应用。
现有的网络POI信息分类方法主要存在以下不足:(1)过度依赖POI名称信息,通过基于有核的机器学习方法(主要以支持向量机模型为主)实现POI信息自动分类。这些方法受到有核模型算法的约束,导致分类准确性和性能不高。(2)空间位置、类别标签等特征属性在POI信息自动分类算法中并没有得到体现与挖掘。
针对上述问题,还未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种地图标注内容的自动分类方法和装置,以缓解了现有地图标注内容的自动分类方法的准确率和效率较低的技术问题。
第一方面,本发明实施例提供了一种地图标注内容的自动分类方法,包括:获取地图标注的分类体系,并基于所述地图标注的分类体系自动获取各类地图标注的样本数据;提取出所述样本数据的特征信息,其中,所述特征信息包括:文本特征向量和空间位置信息;利用无核支持向量机对样本数据的文本特征向量进行训练,得到地图标注内容分类模型;基于所述空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;在获取到待分类地图标注数据集之后,利用所述地图标注内容分类模型和所述空间关联定量化模型,对所述待分类地图标注数据集进行分类,得到分类结果数据集。
进一步地,利用所述地图标注内容分类模型和所述空间关联定量化模型,对所述待分类地图标注数据集进行分类,得到分类结果数据集,包括:利用所述地图标注内容分类模型,对所述待分类地图标注数据集中的待分类地图标注数据进行特征提取,得到待分类地图标注数据的特征向量;对所述待分类地图标注数据的特征向量进行主题分类,得到所述待分类地图标注数据的初始分类结果数据集,并确定出所述初始分类结果数据集中每个分类的相似度;将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集。
进一步地,对所述待分类地图标注数据集中的各个待分类地图标注数据进行特征提取,得到各个待分类地图标注数据的特征向量,包括:利用LDA主题模型提取出所述待分类地图标注数据集中的待分类地图标注数据的主题分类特征词;基于所述主题分类特征词,提取出所述待分类地图标注数据的特征向量。
进一步地,在利用LDA主题模型提取出所述待分类地图标注数据集中的待分类地图标注数据的主题分类特征词之后,所述方法还包括:基于所述主题分类特征词的词义特征,对所述主题分类特征词进行优化。
进一步地,将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集,包括:利用所述空间关联定量化模型、所述待分类地图标注数据集和所述待分类地图标注数据集中的待分类地图标注数据的空间位置坐标,确定出各类待分类地图标注数据之间的空间拓扑关系;基于所述各类待分类地图标注数据之间的空间拓扑关系,确定出所述各类待分类地图标注数据之间空间关联关系,并将所述各类待分类地图标注数据之间空间关联关系中的部分空间关联关系确定为目标空间关联关系;基于所述初始分类结果数据集中各个分类之间的空间关联关系和所述目标空间关联关系,得到所述目标空间关联关系中目标分类与其他各类之间的关联关系,其中,所述目标分类为所述初始分类结果数据集中的分类;基于所述目标分类与其他各类之间的关联关系、所述初始分类结果数据集和所述初始分类结果数据集中每个分类的相似度,确定出所述分类结果数据集。
第二方面,本发明实施例还提供了一种地图标注内容的自动分类装置,包括:获取单元,确定单元,训练单元,构建单元和分类单元,其中,所述获取单元,所述获取单元,用于获取地图标注的分类体系,进行自动化地获取各类地图标注的样本数据;所述确定单元,用于提取出所述样本数据的特征信息,其中,所述特征信息包括:文本特征向量和空间位置信息;所述训练单元,用于利用无核支持向量机对所述特征向量进行训练,得到地图标注内容分类模型;所述构建单元,用于基于所述空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;所述分类单元,用于在获取到待分类地图标注数据集之后,利用所述地图标注内容分类模型和所述空间关联定量化模型,对所述待分类地图标注数据集进行分类,得到分类结果数据集。
进一步地,所述分类单元,用于:利用所述地图标注内容分类模型,对所述待分类地图标注数据集中的待分类地图标注数据进行特征提取,得到待分类地图标注数据的特征向量;对所述待分类地图标注数据的特征向量进行主题分类,得到所述待分类地图标注数据的初始分类结果数据集,并确定出所述初始分类结果数据集中每个分类的相似度;将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集。
进一步地,所述分类单元,用于:利用LDA主题模型提取出所述待分类地图标注数据集中的待分类地图标注数据的主题分类特征词;基于所述主题分类特征词,提取出所述待分类地图标注数据的特征向量。结合无核支持向量机,对所述待分类地图标注数据的特征向量进行主题分类,得到所述待分类地图标注数据的初始分类结果数据集,并确定出所述初始分类结果数据集中每个分类的相似度;将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集。
第三方面,本发明实施例还提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储支持处理器执行上述第一方面中所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
第四方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序。
在本发明实施例中,通过获取地图标注的分类体系,并基于该分类体系获取各类地图标注的样本数据;提取样本数据的特征信息,主要包括:文本特征向量和空间位置信息;利用无核支持向量机对样本数据的文本特征向量进行训练,得到地图标注内容分类模型;基于空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;在获取到待分类的地图标注数据集之后,利用训练出的地图标注内容分类模型和空间关联定量化模型,对待分类地图标注数据集进行分类,得到分类结果数据集,达到了利用无核支持向量机模型以及构建POI类型空间语义关联的约束关系对地图标注内容的进行分类的目的,进而解决了现有地图标注内容的自动分类方法的准确率和效率较低的技术问题,从而实现了提高地图标注内容的自动分类方法的准确率和效率的技术效果。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种地图标注内容的自动分类方法的流程图;
图2为本发明实施例提供的一种地图标注内容的自动分类装置的示意图;
图3为本发明实施例提供的一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种地图标注内容的自动分类方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种地图标注内容的自动分类方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取地图标注的分类体系,并基于所述地图标注的分类体系获取各类地图标注的样本数据;
需要说明的是,上述的地图标注的分类体系一般采用的是三级分类体系,各类标注样本数据最好超过100条。
步骤S104,提取出所述样本数据的特征信息,其中,所述特征信息包括:文本特征向量和空间位置信息;
步骤S106,利用无核支持向量机对样本数据的文本特征向量进行训练,得到地图标注内容分类模型;
具体的,利用无核二次曲面支持向量机模型(Quadratic Surface SupportVector Machine,QSSVM)对构建的地图标注分类体系中的各类样本数据的特征向量进行分类训练,并通过参数的最大求解,实现QSSVM文本分类模型(即,目标无核支持向量机)的构建与优化。
步骤S108,基于所述空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;
具体的,利用各类地图标注样本数据的空间位置信息,通过建立不同类型地图标注数据之间的九交模型,提炼出不同类型之间的定量化空间关联关系,构建出各类地图标注之间的空间关联定量化模型(Spatial Correlation Quantitative Model,SCQM)。
步骤S110,在获取到待分类地图标注数据集之后,利用所述地图标注内容分类模型和所述空间关联定量化模型,对所述待分类地图标注数据集进行分类,得到分类结果数据集。
在本发明实施例中,通过获取地图标注的分类体系,并基于该分类体系获取各类地图标注的样本数据;提取样本数据的特征信息,主要包括:文本特征向量和空间位置信息;利用无核支持向量机对样本数据的文本特征向量进行训练,得到地图标注内容分类模型;基于空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;在获取到待分类的地图标注数据集之后,利用训练出的地图标注内容分类模型和空间关联定量化模型,对待分类地图标注数据集进行分类,得到分类结果数据集,达到了利用无核支持向量机模型以及构建POI类型空间语义关联的约束关系对地图标注内容的进行分类的目的,进而解决了现有地图标注内容的自动分类方法的准确率和效率较低的技术问题,从而实现了提高地图标注内容的自动分类方法的准确率和效率的技术效果。
在本发明实施例中,步骤S108包括如下步骤:
步骤S11,利用所述地图标注内容分类模型,对所述待分类地图标注数据集中的待分类地图标注数据进行特征提取,得到待分类地图标注数据的特征向量;
步骤S12,对所述待分类地图标注数据的特征向量进行主题分类,得到所述待分类地图标注数据的初始分类结果数据集,并确定出所述初始分类结果数据集中每个分类的相似度;
步骤S13,将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集。
在本发明实施例中,地图标注内容分类模型用于对待分类地图标注数据集中的待分类地图标注数据的地图标注的名称与相关文本属性的自动分类。首选对地图标注的名称和文本属性进行特征提取,形成地图标注的文本特征向量表示向量,对地图标注的特征向量进行自动分类,并输出各类的相似度数值。
接着,将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,根据附近地图标注的类型,对分类结果进行选择与优化,最终形成地图标注自动分类结果,实现最大限度地提高地图标注自动分类准确度。
在本发明实施例中,步骤S11包括如下步骤:
步骤S111,利用LDA主题模型提取出所述待分类地图标注数据集中的待分类地图标注数据的主题分类特征词;
步骤S112,基于所述主题分类特征词的词义特征,对所述主题分类特征词进行优化;
步骤S113,基于所述主题分类特征词,提取出所述待分类地图标注数据的特征向量。
在本发明实施例中,首先,在中文分词的基础上,通过LDA主题模型提取主题分类特征词,形成主题特征词库。
然后,针对LDA特征抽取后形成的各主题及特征词列表,结合主题的实际情况与特征词的语义特征,对主题与特征词进行调整,实现主题与特征词列表的选择与优化。
最后,基于各主题特征词库,针对每条实际的地图标注名称,进行特征词提取与特征表示,形成每条地图标注对应的特征表示向量。
在本发明实施例中,步骤S12包括如下步骤:
步骤S121,将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集,包括:
步骤S122,利用所述空间关联定量化模型、所述待分类地图标注数据集和所述待分类地图标注数据集中的待分类地图标注数据的空间位置坐标,确定出各类待分类地图标注数据之间的空间拓扑关系;
步骤S123,基于所述初始分类结果数据集中各个分类之间的空间关联关系和所述目标空间关联关系,得到所述目标空间关联关系中目标分类与其他各类之间的关联关系,其中,所述目标分类为所述初始分类结果数据集中的分类;
步骤S124,基于所述目标分类与其他各类之间的关联关系、所述初始分类结果数据集和所述初始分类结果数据集中每个分类的相似度,确定出所述分类结果数据集。
在本发明实施例中,首先,所述待分类地图标注数据集和所述待分类地图标注数据集中的待分类地图标注数据的空间位置坐标,计算不同类型的地图标注之间的空间拓扑关系,空间拓扑关系主要包括点之间的欧式距离、多点之间形成的共线、多个点之间形成的共面关系。
接着,基于不同类型地图标注之间的空间拓扑关系,通过分析各类型之间的关联情况,选取部分空间关联关系作为空间关联规则(即,目标空间关联关系)存入空间关联规则库中。
然后,通过候选结果分类中多个候选类别(即初始分类结果数据集中各个分类)之间的空间关联关系计算,如果该空间关联关系出现在目标空间关联关系中,则保留该候选类型(即,最终关联关系对应的分类),否则可以删除该对应的候选类型。
最后,从保留的候选类型结果中,选取相似度最大的分类类型作为最终的分类结果。
实施例二:
本发明实施例还提供了一种地图标注内容的自动分类装置,该地图标注内容的自动分类装置用于执行本发明实施例上述内容所提供的地图标注内容的自动分类方法,以下是本发明实施例提供的地图标注内容的自动分类装置的具体介绍。
如图2所示,图2为上述地图标注内容的自动分类装置的示意图,该地图标注内容的自动分类装置包括:获取单元10,确定单元20,训练单元30,构建单元40和分类单元50。
所述获取单元10,用于获取地图标注的分类体系,并基于所述地图标注的分类体系获取各类地图标注的样本数据;
所述确定单元20,用于确定出所述样本数据的特征信息,其中,所述特征信息包括:文本特征向量和空间位置信息;
所述训练单元30,用于利用无核支持向量机对所述特征向量进行训练,得到地图标注内容分类模型;
所述构建单元40,用于基于所述空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;
所述分类单元50,用于在获取到待分类地图标注数据集之后,利用所述地图标注内容分类模型和所述空间关联定量化模型,对所述待分类地图标注数据集进行分类,得到分类结果数据集。
在本发明实施例中,通过获取地图标注的分类体系,并基于该分类体系获取各类地图标注的样本数据;提取样本数据的特征信息,主要包括:文本特征向量和空间位置信息;利用无核支持向量机对样本数据的文本特征向量进行训练,得到地图标注内容分类模型;基于空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;在获取到待分类的地图标注数据集之后,利用训练出的地图标注内容分类模型和空间关联定量化模型,对待分类地图标注数据集进行分类,得到分类结果数据集,达到了利用无核支持向量机模型以及构建POI类型空间语义关联的约束关系对地图标注内容的进行分类的目的,进而解决了现有地图标注内容的自动分类方法的准确率和效率较低的技术问题,从而实现了提高地图标注内容的自动分类方法的准确率和效率的技术效果。
优选的,所述分类单元,用于:利用所述地图标注内容分类模型,对所述待分类地图标注数据集中的待分类地图标注数据进行特征提取,得到待分类地图标注数据的特征向量;对所述待分类地图标注数据的特征向量进行主题分类,得到所述待分类地图标注数据的初始分类结果数据集,并确定出所述初始分类结果数据集中每个分类的相似度;将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集。
优选的,所述分类单元,用于利用LDA主题模型提取出所述待分类地图标注数据集中的待分类地图标注数据的主题分类特征词;基于所述主题分类特征词,提取出所述待分类地图标注数据的特征向量。
优选的,所述分类单元,用于基于所述主题分类特征词的词义特征,对所述主题分类特征词进行优化。
优选的,所述分类单元,用于利用所述空间关联定量化模型、所述待分类地图标注数据集和所述待分类地图标注数据集中的待分类地图标注数据的空间位置坐标,确定出各类待分类地图标注数据之间的空间拓扑关系;基于所述各类待分类地图标注数据之间的空间拓扑关系,确定出所述各类待分类地图标注数据之间空间关联关系,并将所述各类待分类地图标注数据之间空间关联关系中的部分空间关联关系确定为目标空间关联关系;基于所述初始分类结果数据集中各个分类之间的空间关联关系和所述目标空间关联关系,得到所述目标空间关联关系中目标分类与其他各类之间的关联关系,其中,所述目标分类为所述初始分类结果数据集中的分类;基于所述目标分类与其他各类之间的关联关系、所述初始分类结果数据集和所述初始分类结果数据集中每个分类的相似度,确定出所述分类结果数据集。
实施例三:
本发明实施例还提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储支持处理器执行上述实施例一中所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
参见图3,本发明实施例还提供一种电子设备100,包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器60用于执行存储器61中存储的可执行模块,例如计算机程序。
其中,存储器61可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线62可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器61用于存储程序,所述处理器60在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
实施例四:
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例一中所述方法的步骤。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (7)

1.一种地图标注内容的自动分类方法,其特征在于,包括:
获取地图标注的分类体系,并基于所述地图标注的分类体系自动获取各类地图标注的样本数据;
提取出所述样本数据的特征信息,其中,所述特征信息包括:文本特征向量和空间位置信息;
利用无核支持向量机对所述样本数据的文本特征向量进行训练,得到地图标注内容分类模型;
基于所述空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;
在获取到待分类地图标注数据集之后,利用所述地图标注内容分类模型和所述空间关联定量化模型,对所述待分类地图标注数据集进行分类,得到分类结果数据集;
其中,利用所述地图标注内容分类模型和空间关联定量化模型,对所述待分类地图标注数据集进行分类,得到分类结果数据集,包括:
利用所述地图标注内容分类模型,对所述待分类地图标注数据集中的待分类地图标注数据进行特征提取,得到待分类地图标注数据的特征向量;
对所述待分类地图标注数据的特征向量进行主题分类,得到所述待分类地图标注数据的初始分类结果数据集,并确定出所述初始分类结果数据集中每个分类的相似度;
将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集;
其中,将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集,包括:
利用所述空间关联定量化模型、所述待分类地图标注数据集和所述待分类地图标注数据集中的待分类地图标注数据的空间位置坐标,确定出各类待分类地图标注数据之间的空间拓扑关系;
基于所述各类待分类地图标注数据之间的空间拓扑关系,确定出所述各类待分类地图标注数据之间空间关联关系,并将所述各类待分类地图标注数据之间空间关联关系中的部分空间关联关系确定为目标空间关联关系;
基于所述初始分类结果数据集中各个分类之间的空间关联关系和所述目标空间关联关系,得到所述目标空间关联关系中目标分类与其他各类之间的关联关系,其中,所述目标分类为所述初始分类结果数据集中的分类;
基于所述目标分类与其他各类之间的关联关系、所述初始分类结果数据集和所述初始分类结果数据集中每个分类的相似度,确定出所述分类结果数据集;
其中,基于所述空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型,包括:
利用各类地图标注样本数据的空间位置信息,建立所述各类地图标注样本数据之间的九交模型;
基于所述九交模型提取出所述各类地图标注样本数据之间的定量化空间关联关系;
基于所述各类地图标注样本数据之间的定量化空间关联关系,构建所述各类地图标注样本数据之间 的空间关联定量化模型。
2.根据权利要求1所述的方法,其特征在于,对所述待分类地图标注数据集中的各个待分类地图标注数据进行特征提取,得到各个待分类地图标注数据的特征向量,包括:
利用LDA主题模型提取出所述待分类地图标注数据集中的待分类地图标注数据的主题分类特征词;
基于所述主题分类特征词,提取出所述待分类地图标注数据的特征向量。
3.根据权利要求2所述的方法,其特征在于,在利用LDA主题模型提取出所述待分类地图标注数据集中的待分类地图标注数据的主题分类特征词之后,所述方法还包括:
基于所述主题分类特征词的词义特征,对所述主题分类特征词进行优化。
4.一种地图标注内容的自动分类装置,其特征在于,包括:获取单元,确定单元,训练单元,构建单元和分类单元,其中,
所述获取单元,用于获取地图标注的分类体系,进行自动化地获取各类地图标注的样本数据;
所述确定单元,用于提取出所述样本数据的特征信息,其中,所述特征信息包括:文本特征向量和空间位置信息;
所述训练单元,用于利用无核支持向量机对所述特征向量进行训练,得到地图标注内容分类模型;
所述构建单元,用于基于所述空间位置信息,以九交模型为基础构建各类地图标注样本数据之间的空间关联定量化模型;
所述分类单元,用于在获取到待分类地图标注数据集之后,利用所述地图标注内容分类模型和所述空间关联定量化模型,对所述待分类地图标注数据集进行分类,得到分类结果数据集;
其中,所述分类单元,用于:
利用所述地图标注内容分类模型,对所述待分类地图标注数据集中的待分类地图标注数据进行特征提取,得到待分类地图标注数据的特征向量;
对所述待分类地图标注数据的特征向量进行主题分类,得到所述待分类地图标注数据的初始分类结果数据集,并确定出所述初始分类结果数据集中每个分类的相似度;
将所述初始分类结果数据集和所述待分类地图标注数据集输入所述空间关联定量化模型,得到所述分类结果数据集;
所述分类单元,还用于:
利用所述空间关联定量化模型、所述待分类地图标注数据集和所述待分类地图标注数据集中的待分类地图标注数据的空间位置坐标,确定出各类待分类地图标注数据之间的空间拓扑关系;
基于所述各类待分类地图标注数据之间的空间拓扑关系,确定出所述各类待分类地图标注数据之间空间关联关系,并将所述各类待分类地图标注数据之间空间关联关系中的部分空间关联关系确定为目标空间关联关系;
基于所述初始分类结果数据集中各个分类之间的空间关联关系和所述目标空间关联关系,得到所述目标空间关联关系中目标分类与其他各类之间的关联关系,其中,所述目标分类为所述初始分类结果数据集中的分类;
基于所述目标分类与其他各类之间的关联关系、所述初始分类结果数据集和所述初始分类结果数据集中每个分类的相似度,确定出所述分类结果数据集;
其中,所述构建单元,用于:
利用各类地图标注样本数据的空间位置信息,建立所述各类地图标注样本数据之间的九交模型;
基于所述九交模型提取出所述各类地图标注样本数据之间的定量化空间关联关系;
基于所述各类地图标注样本数据之间的定量化空间关联关系,构建所述各类地图标注样本数据之间 的空间关联定量化模型。
5.根据权利要求4所述的装置,其特征在于,所述分类单元,用于:
利用LDA主题模型提取出所述待分类地图标注数据集中的待分类地图标注数据的主题分类特征词;
基于所述主题分类特征词,提取出所述待分类地图标注数据的特征向量。
6.一种电子设备,其特征在于,包括存储器以及处理器,所述存储器用于存储支持处理器执行权利要求1至3任一项所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
7.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,计算机程序被处理器运行时执行上述权利要求1至3任一项所述方法的步骤。
CN202110844227.4A 2021-07-26 2021-07-26 一种地图标注内容的自动分类方法和装置 Active CN113486976B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110844227.4A CN113486976B (zh) 2021-07-26 2021-07-26 一种地图标注内容的自动分类方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110844227.4A CN113486976B (zh) 2021-07-26 2021-07-26 一种地图标注内容的自动分类方法和装置

Publications (2)

Publication Number Publication Date
CN113486976A CN113486976A (zh) 2021-10-08
CN113486976B true CN113486976B (zh) 2022-09-02

Family

ID=77942619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110844227.4A Active CN113486976B (zh) 2021-07-26 2021-07-26 一种地图标注内容的自动分类方法和装置

Country Status (1)

Country Link
CN (1) CN113486976B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541574B (zh) * 2023-07-07 2023-10-03 湖北珞珈实验室 地图敏感信息的智能提取方法、装置、存储介质及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975512A (zh) * 2016-04-28 2016-09-28 浙江大学宁波理工学院 一种顾及空间位置的多维属性可视化广义模型的构建方法
CN106919680A (zh) * 2017-02-28 2017-07-04 山东师范大学 一种利用poi数据进行地表覆盖分类的方法及系统
CN113127605A (zh) * 2021-06-17 2021-07-16 明品云(北京)数据科技有限公司 一种目标识别模型的建立方法、系统、电子设备及介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798729A (zh) * 2017-10-31 2018-03-13 浙江大学宁波理工学院 一种空间实体之间拓扑关系的统一表达模型的构建方法
CN110851588B (zh) * 2018-07-25 2022-04-12 中国人民解放军战略支援部队信息工程大学 基于概率主题模型的网络定位方法及系统
CN110929175B (zh) * 2018-08-30 2024-07-16 北京京东尚科信息技术有限公司 对用户评价进行评估的方法、装置、系统及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975512A (zh) * 2016-04-28 2016-09-28 浙江大学宁波理工学院 一种顾及空间位置的多维属性可视化广义模型的构建方法
CN106919680A (zh) * 2017-02-28 2017-07-04 山东师范大学 一种利用poi数据进行地表覆盖分类的方法及系统
CN113127605A (zh) * 2021-06-17 2021-07-16 明品云(北京)数据科技有限公司 一种目标识别模型的建立方法、系统、电子设备及介质

Also Published As

Publication number Publication date
CN113486976A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
WO2022116537A1 (zh) 一种资讯推荐方法、装置、电子设备和存储介质
WO2020238054A1 (zh) Pdf文档中图表的定位方法、装置及计算机设备
CN110543592B (zh) 信息搜索方法、装置以及计算机设备
CN105279277A (zh) 知识数据的处理方法和装置
CN109857957B (zh) 建立标签库的方法、电子设备及计算机存储介质
CN107330027B (zh) 一种弱监督的深度台标检测方法
CN112818162B (zh) 图像检索方法、装置、存储介质和电子设备
CN110889437B (zh) 一种图像处理方法、装置、电子设备及存储介质
CN111522901A (zh) 文本中地址信息的处理方法及装置
CN111680506A (zh) 数据库表的外键映射方法、装置、电子设备和存储介质
CN113239227A (zh) 图像数据结构化方法、装置、电子设备及计算机可读介质
CN113312899A (zh) 文本分类方法、装置和电子设备
CN113486976B (zh) 一种地图标注内容的自动分类方法和装置
CN111797772B (zh) 发票图像自动分类方法、系统、装置
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
CN113297249A (zh) 慢查询语句的识别和分析、查询语句的统计方法及装置
CN116682130A (zh) 图签信息的提取方法、装置、设备及可读存储介质
CN115062200A (zh) 基于人工智能的用户行为挖掘方法及系统
CN114511857A (zh) 一种ocr识别结果处理方法、装置、设备及存储介质
CN107909054A (zh) 图片文本的相似度评价方法及装置
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
CN110688995A (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
CN110807286A (zh) 一种结构网格识别方法
CN110414579A (zh) 元数据模型合标性检查方法及装置、存储介质
CN112257970A (zh) 一种基于兴趣点大数据的城市功能区自动划分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant