CN116756438A - 一种基于向量空间模型检索微地图的改进方法 - Google Patents

一种基于向量空间模型检索微地图的改进方法 Download PDF

Info

Publication number
CN116756438A
CN116756438A CN202310897657.1A CN202310897657A CN116756438A CN 116756438 A CN116756438 A CN 116756438A CN 202310897657 A CN202310897657 A CN 202310897657A CN 116756438 A CN116756438 A CN 116756438A
Authority
CN
China
Prior art keywords
map
vector space
micro
calculating
scoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310897657.1A
Other languages
English (en)
Inventor
杨维芳
侯宇豪
闫香蓉
王卓
马文骏
王小龙
高墨通
彭毅博
富璇
曹小双
董浩杰
王炳瑄
谢开翼
包俊帆
余懿韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanzhou Jiaotong University
Original Assignee
Lanzhou Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanzhou Jiaotong University filed Critical Lanzhou Jiaotong University
Priority to CN202310897657.1A priority Critical patent/CN116756438A/zh
Publication of CN116756438A publication Critical patent/CN116756438A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于向量空间模型检索微地图的改进方法,包括:利用自然语言处理方法将微地图元数据文本划分为若干字段,包括但不局限于名称、类型、评分、经度和纬度;对类型字段进行重分类;计算地图的区域信息;计算地图评分的语义信息;若地图评分语义表达为“优”,“良”,“差”,则在向量空间上依权重填充若干位置;若地图评分语义表达权重比为5:3:2,则在向量空间中评分位置填充比例为5:3:2;将上述字段信息组成特征文本;生成特征向量空间模型;计算地图内容与用户检索词的相似度;计算相似度排名,输出对应微地图号,显示检索地图;S4结束。该方法充分考虑到了微地图检索的权重设计且计算复杂度低。

Description

一种基于向量空间模型检索微地图的改进方法
技术领域
本发明涉及地图制图学与地理信息工程的技术领域,更具体的说是涉及一种基于向量空间模型检索微地图的改进方法。
背景技术
地图是人们日常生活中必不可少的工具之一,随着科学技术的不断发展和普及,地图的使用场景也越来越广泛,从大范围的使用纸质地图到使用电子地图的过程中,涌现出各种各样的地图形式。而在自媒体时代,微地图作为一种新型的地图形式,具有传播快、易于更新等特点,受到了越来越多人的青睐。
微地图是一种面向大众″草根″的电子地图,使用门槛较低,精度要求不高,使用者可根据自身需要在电子媒介上快速制作、分发和传播微地图。然而如此使用简便、面对大众″草根″的微地图,仍需用户手动浏览检索微地图,因此亟需一种快速而精准的检索方法,以帮助用户在大量微地图中找到需要的资源。
微地图经过近几年的发展已经形成一个系统的体系。目前,微地图研究内容主要分为两部分,首先从用户角度出发:①证明微地图存在的可能性与现代化属性;②对多个情境下的微地图用户进行定性定量的描述分析,讨论如何建立用户模型。其次从技术层面出发:①研究如何解决传统手绘地图线要素数据冗余和失真偏差问题;②讨论如何创建用于微地图平台的地标集;③研究如何设计微地图符号的视觉变量;④探索通过图片快速匹配微地图符号的方法。然而目前尚未有如何检索微地图的研究,这使得用户在海量微地图中难以找到所需地图,增加了快速检索微地图的难度。
因此,如何提供一种充分考虑到地图评分权重的微地图检索方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于向量空间模型检索微地图的改进方法,在顾及地图元数据信息情况下,增加地图评分权重,填充向量空间模型,避免检索地图内容质量低,以检索不同语义下都符合用户需求的微地图,解决了传统微地图方法手动查找地图、未顾及地图质量、地图内容复杂等问题。
为了实现上述目的,本发明采用如下技术方案:
一种基于向量空间模型检索微地图的改进方法,包括:
S1:利用自然语言处理方法将微地图元数据文本划分为若干字段;
S2:对类型字段进行重分类;计算地图的区域信息;计算地图评分的语义信息;若地图评分语义表达为″优″,″良″,″差″,则在向量空间上依权重填充若干位置;若地图评分语义表达权重比为5:3:2,则在向量空间中评分位置填充比例为5∶3∶2;
S3:将上述字段信息组成特征文本;生成特征向量空间模型;计算地图内容与用户检索词的相似度;计算相似度排名;输出对应微地图号;
S4:显示检索地图。
优选的,在步骤S2中,利用评分语义信息填充向量空间模型。
经由上述的技术方案可知,与现有技术相比,本发明提供了一种基于向量空间模型检索微地图的改进方法,在顾及地图元数据信息情况下,增加地图评分权重,填充向量空间模型,避免检索地图内容质量低,以检索不同语义下都符合用户需求的微地图,解决了传统微地图方法手动查找地图、未顾及地图质量、地图内容复杂等问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的一种基于向量空间模型检索微地图的改进方法的流程图;
图2为本发明提供的检索图;
图3为本发明提供的检索图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见附图1,本发明实施例公开了一种基于向量空间模型检索微地图的改进方法,包括:
S1:利用自然语言处理方法将微地图元数据文本划分为若干字段;
S2:对类型字段进行重分类;计算地图的区域信息;计算地图评分的语义信息;若地图评分语义表达为″优″,″良″,″差″,则在向量空间上依权重填充若干位置;若地图评分语义表达权重比为5:3:2,则在向量空间中评分位置填充比例为5∶3∶2;
S3:将上述字段信息组成特征文本;生成特征向量空间模型;计算地图内容与用户检索词的相似度;计算相似度排名;输出对应微地图号;
S4:显示检索地图。
为了进一步优化上述技术方案,在步骤S2中,利用评分语义信息填充向量空间模型。
下面对本发明中涉及到的方法做进一步说明。
本发明选择向量空间模型作为检索微地图的算法,是因为地图元数据具有可分割性,一般以字段形式存在,除了以数字形式存在的评分信息,其他所有检索结果均一致,说明该方法具有较好的稳定性和经验性,这对于检索包含属性信息,没有经过二次处理的微地图十分适用。此外,该方法也易于实现,计算简单。
向量空间模型检索方法的关键是提取微地图特征,将地图内容中提取到的信息组合,如果地图评分信息为数值信息,则计算该评分的语义信息,增加该部分信息在计算过程中的权重,建立稀疏矩阵,生成特征向量空间模型。
如图2是微地图检索的示意图X1,微地图元数据包括:名称(歆鱼坊鲜烤全鱼),位置(中天健广场),评分(4.2)。根据图X1的评分区间占比判断评分的语义信息为″优″,请参见式(1)。因此可以组合地图名称,位置,评分字段,形成地图特征向量空间模型。
定义检索信息为烤鱼,图3为检索得到包含烤鱼信息的微地图示例,示例字段内容包括但不局限于地图名称,地图评分,地图位置。组合上述字段内容信息,计算用户检索词与组合信息的相似度,输出图3。
如图1所示,本发明提供的方法的主要步骤如下:
(1)利用自然语言处理方法将微地图元数据文本划分为若干字段。
(2)对类型字段进行重分类;计算地图的区域信息;计算地图评分的语义信息;若地图评分语义表达为″优″,″良″,″差″,则在向量空间上依权重填充若干位置;若地图评分语义表达权重比为5:3:2,则在向量空间中评分位置填充比例为5∶3∶2。
(3)将上述字段信息组成特征文本;生成特征向量空间模型;计算地图内容与用户检索词的相似度;计算相似度排名;输出对应微地图号。
(4)显示检索地图。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (2)

1.一种基于向量空间模型检索微地图的改进方法,其特征在于,包括:
S1:利用自然语言处理方法将微地图元数据文本划分为若干字段;
S2:对类型字段进行重分类;计算地图的区域信息;计算地图评分的语义信息;若地图评分语义表达为″优″,″良″,″差″,则在向量空间上依权重填充若干位置;若地图评分语义表达权重比为5∶3∶2,则在向量空间中评分位置填充比例为5∶3∶2;
S3:将上述字段信息组成特征文本;生成特征向量空间模型;计算地图内容与用户检索词的相似度;计算相似度排名;输出对应微地图号;
S4:显示检索地图。
2.根据权利要求1所述的一种基于向量空间模型检索微地图的改进方法,其特征在于,在步骤S2中,利用评分语义信息填充向量空间模型。
CN202310897657.1A 2023-07-20 2023-07-20 一种基于向量空间模型检索微地图的改进方法 Pending CN116756438A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310897657.1A CN116756438A (zh) 2023-07-20 2023-07-20 一种基于向量空间模型检索微地图的改进方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310897657.1A CN116756438A (zh) 2023-07-20 2023-07-20 一种基于向量空间模型检索微地图的改进方法

Publications (1)

Publication Number Publication Date
CN116756438A true CN116756438A (zh) 2023-09-15

Family

ID=87951467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310897657.1A Pending CN116756438A (zh) 2023-07-20 2023-07-20 一种基于向量空间模型检索微地图的改进方法

Country Status (1)

Country Link
CN (1) CN116756438A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140274137A1 (en) * 2011-11-01 2014-09-18 Telefonaktiebolaget L M Ericsson (Publ) Methods and Devices for Providing, Receiving or Managing Maps
CN106372087A (zh) * 2015-07-23 2017-02-01 北京大学 一种面向信息检索的信息地图生成方法及其动态更新方法
CN112328890A (zh) * 2020-11-23 2021-02-05 北京百度网讯科技有限公司 搜索地理位置点的方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140274137A1 (en) * 2011-11-01 2014-09-18 Telefonaktiebolaget L M Ericsson (Publ) Methods and Devices for Providing, Receiving or Managing Maps
CN106372087A (zh) * 2015-07-23 2017-02-01 北京大学 一种面向信息检索的信息地图生成方法及其动态更新方法
CN112328890A (zh) * 2020-11-23 2021-02-05 北京百度网讯科技有限公司 搜索地理位置点的方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张书瑜 等: "多源异构土地基础数据一体化管理检索方法研究", 《浙江大学学报(理学版)》, vol. 45, no. 5, 30 September 2018 (2018-09-30), pages 589 - 594 *

Similar Documents

Publication Publication Date Title
US11868357B2 (en) Search result ranking and presentation
US10997185B2 (en) Information query method and apparatus
US10430425B2 (en) Generating suggested queries based on social graph information
US9501577B2 (en) Recommending points of interests in a region
US8930391B2 (en) Progressive spatial searching using augmented structures
US7698332B2 (en) Projecting queries and images into a similarity space
US20120271831A1 (en) Dynamically Generating Recommendations Based on Social Graph Information
CN107145545A (zh) 一种基于位置的社交网络中Top‑k区域用户文本数据推荐方法
CN111143672B (zh) 基于知识图谱的专业特长学者推荐方法
US20130138429A1 (en) Method and Apparatus for Information Searching
CN109902087B (zh) 用于问答的数据处理方法及装置、服务器
CN107153687B (zh) 一种社交网络文本数据的索引方法
CN107193882A (zh) RDF数据上基于图匹配的why‑not查询回答方法
CN113190593A (zh) 一种基于数字人文知识图谱的搜索推荐方法
CN107016566A (zh) 基于本体的用户模型构建方法
CN114663164A (zh) 电商站点推广配置方法及其装置、设备、介质、产品
CN109582868A (zh) 基于词向量加权、支持向量回归和用户点击偏好的搜索推荐方法
CN110377684A (zh) 一种基于用户反馈的空间关键字个性化语义查询方法
CN116756438A (zh) 一种基于向量空间模型检索微地图的改进方法
CN103440342B (zh) 基于网页类型的信息推送方法和装置
CN112163065A (zh) 信息检索方法、系统及介质
Feng et al. A system for region search and exploration
CN111241254A (zh) 一种语句相似度计算方法
CN115329221B (zh) 一种针对多源地理实体的查询方法及查询系统
CN105095270B (zh) 检索装置和检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination