CN110716994B - 一种支持异构地理数据资源检索的检索方法及装置 - Google Patents

一种支持异构地理数据资源检索的检索方法及装置 Download PDF

Info

Publication number
CN110716994B
CN110716994B CN201910335451.3A CN201910335451A CN110716994B CN 110716994 B CN110716994 B CN 110716994B CN 201910335451 A CN201910335451 A CN 201910335451A CN 110716994 B CN110716994 B CN 110716994B
Authority
CN
China
Prior art keywords
retrieval
geographic data
information
index
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910335451.3A
Other languages
English (en)
Other versions
CN110716994A (zh
Inventor
杜佳
乐夏芳
杨雅萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Geographic Sciences and Natural Resources of CAS
Original Assignee
Institute of Geographic Sciences and Natural Resources of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Geographic Sciences and Natural Resources of CAS filed Critical Institute of Geographic Sciences and Natural Resources of CAS
Priority to CN201910335451.3A priority Critical patent/CN110716994B/zh
Publication of CN110716994A publication Critical patent/CN110716994A/zh
Application granted granted Critical
Publication of CN110716994B publication Critical patent/CN110716994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种支持异构地理数据资源检索的检索方法及装置,该方法包括:获取用户的检索需求,包括检索字段、对应的检索词、检索词包含情况以及检索字段间关系;根据检索需求生成检索请求,并在索引文件中执行检索;索引文件包括基于异构地理数据资源的预设共性信息抽取得到的索引元数据;检索字段为预设共性信息中的一个或多个;在检索完成后,输出检索结果;检索结果包括满足检索需求的地理数据资源的预设信息,预设信息包括部分或全部索引元数据。本发明实施例提供的支持异构地理数据资源检索的检索方法及装置通过在根据异构地理数据资源的预设共性信息抽取的索引元数据建立的索引文件中执行检索,实现了异构地理数据资源的统一检索。

Description

一种支持异构地理数据资源检索的检索方法及装置
技术领域
本发明实施例涉及数据检索技术领域,具体涉及一种支持异构地理数据资源检索的检索方法及装置。
背景技术
地理数据资源是地理科学研究中非常重要的一部分,是进行地球科学分支学科研究和地球系统科学综合研究的驱动力。地球科学研究范围涉及大气圈、水圈、岩石圈、生物圈等各个圈层,支持地学研究的地理数据资源具有来源多样、类型复杂、格式丰富、存储分散等特征。
地理数据资源通常有文本、属性、矢量、栅格四大类型数据。文本数据涉及期刊论文、考察报告、法规文本、标准文本等,具有PDF、MS WORD等不同存储格式。属性数据涉及仪器监测数据、调查统计数据、要素属性数据等,具有纯文本、MS Excel、MS Access等不同的存储格式。矢量数据主要涉及空间数据,是用点、线、面及其X,Y坐标来构建具体空间要素的数据模型,通常以关系型数据库为载体存储矢量数据。栅格数据是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据,是为方便表达地物空间分布的数据模型,一般是一种点阵图像格式的存储方式。栅格数据涉及到地学领域中大量的遥感影像数据。
不同类型和存储格式的异构地理数据资源,给数据检索带来一定的困难。不可能针对每一种数据格式甚至将来新的数据格式都重新写一套检索程序。
发明内容
为解决异构地理数据资源检索中的问题,本发明实施例提供一种支持异构地理数据资源检索的检索方法及装置。
第一方面,本发明实施例提供一种支持异构地理数据资源检索的检索方法,包括:获取用户的检索需求,所述检索需求包括检索字段、各个所述检索字段对应的检索词、所述检索词在检索结果中的包含情况以及所述检索字段间的关系;根据所述检索需求生成检索请求,并根据所述检索请求在索引文件中执行检索;所述索引文件包括基于异构地理数据资源的预设共性信息而抽取得到的索引元数据;所述检索字段为所述预设共性信息中的一个或多个;在检索完成后,输出检索结果;所述检索结果包括满足所述检索需求的地理数据资源的预设信息,所述预设信息包括部分或全部所述索引元数据。
第二方面,本发明实施例提供一种支持异构地理数据资源检索的检索装置,包括:检索需求获取模块,用于获取用户的检索需求,所述检索需求包括检索字段、各个所述检索字段对应的检索词、所述检索词在检索结果中的包含情况以及所述检索字段间的关系;检索模块,用于根据所述检索需求生成检索请求,并根据所述检索请求在索引文件中执行检索;所述索引文件包括基于异构地理数据资源的预设共性信息而抽取得到的索引元数据;所述检索字段为所述预设共性信息中的一个或多个;结果输出模块,用于在检索完成后,输出检索结果;所述检索结果包括满足所述检索需求的地理数据资源的预设信息,所述预设信息包括部分或全部所述索引元数据。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的支持异构地理数据资源检索的检索方法及装置,通过在根据异构地理数据资源的预设共性信息抽取的索引元数据建立的索引文件中执行检索,实现了异构地理数据资源的统一检索。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的支持异构地理数据资源检索的检索方法流程图;
图2是本发明实施例提供的支持异构地理数据资源检索的检索装置结构示意图;
图3是本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的支持异构地理数据资源检索的检索方法流程图。如图1所示,所述方法包括:
步骤101、获取用户的检索需求,所述检索需求包括检索字段、各个所述检索字段对应的检索词、所述检索词在检索结果中的包含情况以及所述检索字段间的关系。
支持异构地理数据资源检索的检索装置(简称检索装置)获取用户的检索需求。所述检索需求包括检索字段、各个所述检索字段对应的检索词、所述检索词在检索结果中的包含情况以及所述检索字段间的关系。所述检索需求还可以包括检索结果的显示、返回格式。
用户检索有两种形式的检索途径可供选择,它们是一般检索和高级检索。在一般检索中,由检索服务提供者根据数据资源的特点指定默认的检索字段,无需用户指定检索字段;在高级检索中,由用户选择一个或多个检索字段限定检索范围。检索词在检索结果的包含情况涉及检索结果中包含全部检索词、检索结果中包含任意检索词、检索结果中不包含检索词三种情况。检索字段间的关系包括“与”、“或”。“与”表示两者同时成立,“或”表示两者中至少一个成立。
检索结果的显示涉及每页记录条数和页码显示方式。检索结果的返回格式包括:面向特定编程语言的集合对象形式、JSON格式、XML格式等。
步骤102、根据所述检索需求生成检索请求,并根据所述检索请求在索引文件中执行检索;所述索引文件包括基于异构地理数据资源的预设共性信息而抽取得到的索引元数据;所述检索字段为所述预设共性信息中的一个或多个。
用户的检索需求表现为一串检索参数,这些参数在进行检索前生成检索请求,检索请求的核心是符合一定语法规则的检索表达式。检索装置根据检索请求中的检索字段、检索词、检索词在检索结果的包含情况在索引文件中执行检索。执行检索前,可以通过语言分析处理对检索词进行分词,遍历检索请求中的全部检索字段执行对应的检索,根据检索字段间的关系合并检索结果。
所述索引文件包括基于各个地理数据资源的预设共性信息而抽取得到的索引元数据。为支持异构地理数据资源的检索,根据异构地理数据资源(如文本数据、属性数据、矢量数据、栅格数据)筛选所述预设共性信息,根据所述预设共性信息抽取各个地理数据资源的所述预设共性信息得到索引元数据,以用于检索。所述各个地理数据资源是指检索装置在提供检索服务时用于实现检索的各个地理数据资源,各个地理数据资源可以存储于不同的服务器。
所述检索字段为所述预设共性信息中的一个或多个。由于索引文件中的索引元数据为根据所述预设共性信息而抽取的数据,检索字段也是根据所述预设共性信息设置,从而可以根据检索字段在索引文件中进行检索。
比如,若所述预设共性信息为标题,则索引文件中包括各个地理数据资源的标题信息;所述检索字段为标题时,则根据用户对应于检索字段为“标题”的检索词,在索引文件中执行检索。若有对应的标题,则检索到相应的地理数据资源。在检索字段为多个时,则根据检索字段间的关系执行检索及得到检索结果。
步骤103、在检索完成后,输出检索结果;所述检索结果包括满足所述检索需求的地理数据资源的预设信息,所述预设信息包括部分或全部所述索引元数据。
检索装置在完成检索后,输出检索结果,可以输出检索结果到检索响应对象,所述检索响应对象可以为某个显示模块。
根据检索需求执行检索,所述检索结果包括满足所述检索需求的地理数据资源的预设信息。所述预设信息包括部分或全部所述索引元数据。若所述预设共性信息的个数较少,则可以在检索结果中显示满足检索需求的各个地理数据资源的全部索引元数据;若所述预设共性信息的个数较多、较繁杂,则可以在检索结果中显示满足检索需求的各个地理数据资源的部分索引元数据。具体地,显示根据哪个预设共性信息得到的索引元数据,可以预先设定。
检索结果中显示的各项信息,并不一定要通过一个页面进行显示。比如,可以在检索结果的初始界面,只显示简单信息;而在点击进入详情页面后,再显示详细信息。
本发明实施例通过在根据异构地理数据资源的预设共性信息抽取的索引元数据建立的索引文件中执行检索,实现了异构地理数据资源的统一检索。
进一步地,基于上述实施例,所述预设共性信息包括地理数据资源的标识符、标题、摘要、关键词、时间范围及空间范围。
所述预设共性信息可以包括地理数据资源的标识符、标题、摘要、关键词、时间范围及空间范围。其中,所述标识符是地理数据资源的唯一标识编码。标题是指地理数据资源的名称,规范名称应包含时间/地质时代、区域、精细程度、专题要素等内容,标题长度宜控制在30个字符以内。摘要是地理数据资源内容的综述性介绍,包括地理数据资源的来源、特征、指标、用途等,具体内容如:应用背景、数据来源、产生方法、空间投影信息、字段简要说明、数据质量与精度分析等内容。关键词是用于描述地理数据资源信息主题的通用词、形式化词或短语。时间范围是地理数据资源内容的时间点或时间范围。空间范围是地理数据资源内容的空间点或空间范围。
所述预设共性信息是预先设置的,可以根据具体需求而定,因此,并不要求一定包含上述地理数据资源的标识符、标题、摘要、关键词、时间范围及空间范围的全部内容,可以只包含部分内容,也可以包含其他内容。
比如,所述预设共性信息还可以包括数据类别、类目名称、类目代码、分类标准名称、分类标准版本号、数据类型、资源质量描述、最近提交日期、数据贡献者信息、数据负责单位信息、联系人信息、资源建设方式、资源共享方式等。
在上述实施例的基础上,本发明实施例通过合理设定预设共性信息,利用设定的预设共性信息得到索引元数据,有利于提高检索的准确度及可靠性。
进一步地,基于上述实施例,在所述获取用户的检索需求之前,所述方法还包括:抽取所述索引元数据,具体包括:根据索引配置文件抽取各个地理数据资源的所述索引元数据;其中,所述索引配置文件包括各个地理数据资源的所述标识符、访问链接参数、预设共性信息查找匹配信息及文本处理提示信息;建立所述索引文件,具体包括:根据抽取的各个地理数据资源的所述索引元数据,建立所述索引文件。
在检索装置获取用户的检索需求之前,所述方法还包括抽取所述索引元数据以及建立所述索引文件。
所述抽取所述索引元数据,具体包括:根据索引配置文件抽取各个地理数据资源的所述索引元数据;其中,所述索引配置文件包括各个地理数据资源的所述标识符、访问链接参数、预设共性信息查找匹配信息及文本处理提示信息。
根据所述索引配置文件的所述标识符获取对应地理数据资源在所述索引配置文件中的配置信息,所述配置信息如所述访问链接参数、所述预设共性信息查找匹配信息及所述文本处理提示信息,并将所述标识符作为对应地理数据资源的索引元数据进行存储。
所述访问链接参数包括对应地理数据资源的获取方式的信息,比如所述访问链接参数可以为对应地理数据资源的在线链接地址以及数据源访问方法。根据所述索引配置文件中的所述访问链接参数查找并获取对应的地理数据资源。
在获取到对应的地理数据资源后,需要根据所述预设共性信息抽取相应的元数据,得到与所述地理数据资源对应的索引元数据。由于不同地理数据资源中所述预设共性信息的表达方式可能不同,比如,同样是标题,某个地理数据资源的信息中可能为“标题”,而另一地理数据资源的信息中可能为“名称”或“Title”,因此,需要事先获知每个地理数据资源的所述预设共性信息的表达方式,才能实现每个地理数据资源索引元数据的获取。
所述预设共性信息查找匹配信息即包含地理数据资源的所述预设共性信息的表达方式信息,用于实现每个地理数据资源的所述预设共性信息的查找,以帮助得到每个地理数据资源的所述索引元数据。
所述文本处理提示信息包括每个地理数据资源的文本处理需求的信息,比如是否需要进行文本处理以及需要做何种文本处理等。是否需要进行文本处理,比如是否需要进行分词处理。若需要进行分词处理,对英语的分词处理可以通过空格自然分开,对中文,则可以借助于中文分词词库或一些分词算法进行语言处理。
需要做何种文本处理,比如,是否需要进行空格标识符的替换。进行文本处理是为了实现获取的索引元数据能够正确识别。比如,检索装置用空格来区分各个词,但在某个地理数据资源中是用“/”来区分各个词,则在获取索引元数据时则需要将“/”替换为空格。
因此,根据索引配置文件中的各个地理数据资源的所述标识符、所述访问链接参数、所述预设共性信息查找匹配信息及所述文本处理提示信息可以获取到各个地理数据资源的索引元数据。
在获取到各个地理数据资源的索引元数据后,则根据所述索引元数据建立所述索引文件。所述索引文件可以为各个地理数据资源的所述索引元数据的集合。
在上述实施例的基础上,本发明实施例通过根据索引配置文件抽取索引元数据,并根据索引元数据建立索引文件,提高了索引文件建立的可靠性,由此进一步提高了检索的可靠性。
进一步地,基于上述实施例,所述索引文件还包括所述索引元数据的统计信息,所述索引元数据的统计信息包括所述关键词在对应地理数据资源的出现频率;所述方法还包括:根据所述出现频率计算所述检索结果中各个地理数据资源的相关度,并根据相关度由高到低的顺序在所述检索结果中显示所述预设信息。
所述索引文件还包括所述索引元数据的统计信息,所述索引元数据的统计信息包括所述关键词在对应地理数据资源的出现频率,还可包括所述关键词在对应地理数据资源的出现位置。关键词出现的频率可作为计算相关度的要素,关键词出现的位置可用于定位。
所述方法还包括:根据所述出现频率计算所述检索结果中各个地理数据资源的相关度,出现频率越高,表明相关度越大;根据相关度由高到低的顺序在所述检索结果中显示各个地理数据资源的所述预设信息。
在上述实施例的基础上,本发明实施例通过使得检索到的数据结果按相关度排序,使得检索结果的展示更加人性化,优化了检索结果的展示。
进一步地,基于上述实施例,所述方法还包括按照预设的时间周期更新所述索引文件。
由于索引文件根据从各个地理数据资源抽取的索引元数据建立,那么,在某个或多个地理数据资源有更新、或增加新的地理数据资源时,则需要更新所述索引文件,以能够得到可靠的检索结果。
更新所述索引文件可以通过清空原索引文件,并利用上述建立索引文件的方式重新建立所述索引文件。
由于有的地理数据资源的改动是有记录的,比如明确显示了更新的数据,则在更新所述索引文件时,可以只根据发生改动的地理数据资源进行更新,以提高更新效率。
由于地理数据资源通常是不定期更新,因此,可以设置周期性地更新所述索引文件,具体的时间周期可以根据实际情况设定。这样,一方面可避免实时更新的高消耗,另一方面可以实现及时地更新。
在上述实施例的基础上,本发明实施例通过按照预设的时间周期更新索引文件,进一步提高了检索的可靠性。
进一步地,基于上述实施例,所述预设信息还包括与每个所述满足所述检索需求的地理数据资源对应的访问链接参数;在检索完成后,输出检索结果之前,所述方法还包括:根据所述满足所述检索需求的地理数据资源的所述索引元数据中的所述标识符,从所述索引配置文件中获取对应地理数据资源的所述访问链接参数。
在检索完成后,输出检索结果;所述检索结果包括满足所述检索需求的地理数据资源的预设信息,所述预设信息包括部分或全部所述索引元数据,所述预设信息还包括与每个所述满足所述检索需求的地理数据资源对应的访问链接参数。
检索装置针对用户的检索需求提供检索服务。所述检索结果除了显示索引元数据的相关信息外,还可显示对应地理数据资源的访问链接参数,以供用户获取相应的地理数据资源。
由于索引配置文件中包括所述访问链接参数的信息以及地理数据资源的标识符,因此,在检索完成后,输出检索结果之前,所述方法还包括:根据所述满足所述检索需求的地理数据资源的所述索引元数据中的所述标识符,从所述索引配置文件中获取对应地理数据资源的所述访问链接参数。则在检索结果中可以显示所述访问链接参数的信息。
在上述实施例的基础上,本发明实施例通过在检索结果中包含地理数据资源的访问链接参数,便利了地理数据资源的获取。
进一步地,基于上述实施例,所述检索请求还包括为用户分配的检索服务器的端口信息及在所述检索服务器上存储的所述索引文件的位置信息;所述在索引文件中执行检索,具体包括:通过所述端口信息连接至所述检索服务器,并在所述检索服务器的所述索引文件中执行检索。
为均衡负载,为用户提供快速、流畅的检索服务,执行检索的步骤可以设置于不同的检索服务器上,并在各个检索服务器上同步所述索引文件。所述索引文件可以存储于各个检索服务器的预设位置。
因此,根据网络及用户数量的情况,在接收到用户的检索需求,根据所述检索需求生成检索请求时,所述检索请求还包括为用户分配的检索服务器的端口信息及在所述检索服务器上存储的所述索引文件的位置信息。所述在索引文件中执行检索,具体包括:通过所述端口信息连接至所述检索服务器,并在所述检索服务器的所述索引文件中执行检索。
检索完成后,可以将检索结果输出于检索装置的检索响应对象。
在上述实施例的基础上,本发明实施例通过在检索请求中包含检索服务器的信息,有利于均衡负载,为用户提供更好的检索服务。
图2是本发明实施例提供的支持异构地理数据资源检索的检索装置结构示意图。如图2所示,所述装置包括检索需求获取模块10、检索模块20及结果输出模块30,其中:
检索需求获取模块10用于获取用户的检索需求,所述检索需求包括检索字段、各个所述检索字段对应的检索词、所述检索词在检索结果中的包含情况以及所述检索字段间的关系;
检索模块20用于根据所述检索需求生成检索请求,并根据所述检索请求在索引文件中执行检索;所述索引文件包括基于异构地理数据资源的预设共性信息而抽取得到的索引元数据;所述检索字段为所述预设共性信息中的一个或多个;
结果输出模块30用于在检索完成后,输出检索结果;所述检索结果包括满足所述检索需求的地理数据资源的预设信息,所述预设信息包括部分或全部所述索引元数据。
本发明实施例通过在根据异构地理数据资源的预设共性信息抽取的索引元数据建立的索引文件中执行检索,实现了异构地理数据资源的统一检索。
进一步地,基于上述实施例,所述预设共性信息包括地理数据资源的标识符、标题、摘要、关键词、时间范围及空间范围。
在上述实施例的基础上,本发明实施例通过合理设定预设共性信息,利用设定的预设共性信息得到索引元数据,有利于提高检索的准确度及可靠性。
进一步地,基于上述实施例,所述装置还包括索引建立模块,所述索引建立模块包括索引元数据抽取子模块以及索引文件建立子模块,其中:
索引元数据抽取子模块用于抽取所述索引元数据,具体用于:根据索引配置文件抽取各个地理数据资源的所述索引元数据;其中,所述索引配置文件包括各个地理数据资源的所述标识符、访问链接参数、预设共性信息查找匹配信息及文本处理提示信息。
索引文件建立子模块用于根据抽取的各个地理数据资源的所述索引元数据,建立所述索引文件。
在上述实施例的基础上,本发明实施例通过根据索引配置文件抽取索引元数据,并根据索引元数据建立索引文件,提高了索引文件建立的可靠性,由此进一步提高了检索的可靠性。
进一步地,基于上述实施例,所述索引文件还包括所述索引元数据的统计信息,所述索引元数据的统计信息包括所述关键词在对应地理数据资源的出现频率;所述结果输出模块30还用于:根据所述出现频率计算所述检索结果中各个地理数据资源的相关度,并根据相关度由高到低的顺序在所述检索结果中显示所述预设信息。
在上述实施例的基础上,本发明实施例通过使得检索到的数据结果按相关度排序,使得检索结果的展示更加人性化,优化了检索结果的展示。
进一步地,基于上述实施例,所述索引建立模块还用于按照预设的时间周期更新所述索引文件。
在上述实施例的基础上,本发明实施例通过按照预设的时间周期更新索引文件,进一步提高了检索的可靠性。
进一步地,基于上述实施例,所述预设信息还包括与每个所述满足所述检索需求的地理数据资源对应的访问链接参数;所述装置还包括访问链接参数获取模块,具体用于:在检索模块20检索完成后,结果输出模块30输出检索结果之前,根据所述满足所述检索需求的地理数据资源的所述索引元数据中的所述标识符,从所述索引配置文件中获取对应地理数据资源的所述访问链接参数。
所述结果输出模块30还用于在所述检索结果中显示所述访问链接参数。
在上述实施例的基础上,本发明实施例通过在检索结果中包含地理数据资源的访问链接参数,便利了地理数据资源的获取。
进一步地,基于上述实施例,所述检索请求还包括为用户分配的检索服务器的端口信息及在所述检索服务器上存储的所述索引文件的位置信息;所述检索模块20在用于在索引文件中执行检索时,具体用于:通过所述端口信息连接至所述检索服务器,并在所述检索服务器的所述索引文件中执行检索。
在上述实施例的基础上,本发明实施例通过在检索请求中包含检索服务器的信息,有利于均衡负载,为用户提供更好地检索服务。
本发明实施例提供的装置是用于上述方法的,具体功能可参照上述方法流程,此处不再赘述。
本发明实施例针对地理数据资源的来源多样、类型复杂、格式丰富、存储分散等特征,提出面向文献、图书、百科、科学数据等多种地理数据资源共性信息的索引元数据标准(构建索引元数据的标准,也即所述预设共性信息),根据索引元数据标准对各类地理数据资源进行解析抽取,形成不同资源的索引元数据,以索引元数据概括描述地理数据资源的关键要素,并作为提取集成的依据和来源。索引元数据表达采用XML格式,但不限于XML格式,存储方式采用支持海量数据存储的数据库。根据索引元数据建立索引文件。面向检索的代价和复杂度都比较高的异构地理数据资源,本发明实施例提供了一种灵活支持多种异构地理数据资源的检索,并可人性化展示的检索方法及装置。
图3是本发明实施例提供的电子设备的实体结构示意图。如图3所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如下方法:获取用户的检索需求,所述检索需求包括检索字段、各个所述检索字段对应的检索词、所述检索词在检索结果中的包含情况以及所述检索字段间的关系;根据所述检索需求生成检索请求,并根据所述检索请求在索引文件中执行检索;所述索引文件包括基于异构地理数据资源的预设共性信息而抽取得到的索引元数据;所述检索字段为所述预设共性信息中的一个或多个;在检索完成后,输出检索结果;所述检索结果包括满足所述检索需求的地理数据资源的预设信息,所述预设信息包括部分或全部所述索引元数据。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种支持异构地理数据资源检索的检索方法,其特征在于,包括:
获取用户的检索需求,所述检索需求包括检索字段、各个所述检索字段对应的检索词、所述检索词在检索结果中的包含情况以及所述检索字段间的关系;
根据所述检索需求生成检索请求,并根据所述检索请求在索引文件中执行检索;所述索引文件包括基于异构地理数据资源的预设共性信息而抽取得到的索引元数据;所述检索字段为所述预设共性信息中的一个或多个;
在检索完成后,输出检索结果;所述检索结果包括满足所述检索需求的地理数据资源的预设信息,所述预设信息包括部分或全部所述索引元数据;
所述预设共性信息包括地理数据资源的标识符;在所述获取用户的检索需求之前,所述方法还包括:
抽取所述索引元数据,具体包括:根据索引配置文件抽取各个地理数据资源的所述索引元数据;其中,所述索引配置文件包括各个地理数据资源的所述标识符、访问链接参数、预设共性信息查找匹配信息及文本处理提示信息;所述预设共性信息查找匹配信息包括地理数据资源的所述预设共性信息的表达方式信息;所述文本处理提示信息包括地理数据资源的文本处理需求的信息;
建立所述索引文件,具体包括:根据抽取的各个地理数据资源的所述索引元数据,建立所述索引文件。
2.根据权利要求1所述的方法,其特征在于,所述预设共性信息还包括地理数据资源的标题、摘要、关键词、时间范围及空间范围。
3.根据权利要求2所述的方法,其特征在于,所述索引文件还包括所述索引元数据的统计信息,所述索引元数据的统计信息包括所述关键词在对应地理数据资源的出现频率;所述方法还包括:
根据所述出现频率计算所述检索结果中各个地理数据资源的相关度,并根据相关度由高到低的顺序在所述检索结果中显示所述预设信息。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括按照预设的时间周期更新所述索引文件。
5.根据权利要求1所述的方法,其特征在于,所述预设信息还包括与每个所述满足所述检索需求的地理数据资源对应的访问链接参数;
在检索完成后,输出检索结果之前,所述方法还包括:根据所述满足所述检索需求的地理数据资源的所述索引元数据中的所述标识符,从所述索引配置文件中获取对应地理数据资源的所述访问链接参数。
6.根据权利要求1所述的方法,其特征在于,所述检索请求还包括为用户分配的检索服务器的端口信息及在所述检索服务器上存储的所述索引文件的位置信息;
所述在索引文件中执行检索,具体包括:
通过所述端口信息连接至所述检索服务器,并在所述检索服务器的所述索引文件中执行检索。
7.一种支持异构地理数据资源检索的检索装置,其特征在于,包括:
检索需求获取模块,用于获取用户的检索需求,所述检索需求包括检索字段、各个所述检索字段对应的检索词、所述检索词在检索结果中的包含情况以及所述检索字段间的关系;
检索模块,用于根据所述检索需求生成检索请求,并根据所述检索请求在索引文件中执行检索;所述索引文件包括基于异构地理数据资源的预设共性信息而抽取得到的索引元数据;所述检索字段为所述预设共性信息中的一个或多个;
结果输出模块,用于在检索完成后,输出检索结果;所述检索结果包括满足所述检索需求的地理数据资源的预设信息,所述预设信息包括部分或全部所述索引元数据;
所述预设共性信息包括地理数据资源的标识符;所述装置还包括索引建立模块,所述索引建立模块包括索引元数据抽取子模块以及索引文件建立子模块,其中:
所述索引元数据抽取子模块用于抽取所述索引元数据,具体用于:根据索引配置文件抽取各个地理数据资源的所述索引元数据;其中,所述索引配置文件包括各个地理数据资源的所述标识符、访问链接参数、预设共性信息查找匹配信息及文本处理提示信息;所述预设共性信息查找匹配信息包括地理数据资源的所述预设共性信息的表达方式信息;所述文本处理提示信息包括地理数据资源的文本处理需求的信息;
所述索引文件建立子模块用于根据抽取的各个地理数据资源的所述索引元数据,建立所述索引文件。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。
CN201910335451.3A 2019-04-24 2019-04-24 一种支持异构地理数据资源检索的检索方法及装置 Active CN110716994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910335451.3A CN110716994B (zh) 2019-04-24 2019-04-24 一种支持异构地理数据资源检索的检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910335451.3A CN110716994B (zh) 2019-04-24 2019-04-24 一种支持异构地理数据资源检索的检索方法及装置

Publications (2)

Publication Number Publication Date
CN110716994A CN110716994A (zh) 2020-01-21
CN110716994B true CN110716994B (zh) 2022-07-05

Family

ID=69209287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910335451.3A Active CN110716994B (zh) 2019-04-24 2019-04-24 一种支持异构地理数据资源检索的检索方法及装置

Country Status (1)

Country Link
CN (1) CN110716994B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115114361B (zh) * 2022-06-25 2023-07-07 上海道客网络科技有限公司 一种基于容器云平台统一接口的资源检索方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7849065B2 (en) * 2007-07-20 2010-12-07 Microsoft Corporation Heterogeneous content indexing and searching
CN101609460B (zh) * 2009-07-22 2011-12-14 中国科学院地理科学与资源研究所 一种支持异构地学数据资源的检索方法及检索系统
CN109324823B (zh) * 2018-09-17 2021-10-29 安徽华博胜讯信息科技股份有限公司 数字内容资源异构多元整合系统及整合方法

Also Published As

Publication number Publication date
CN110716994A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN111753060B (zh) 信息检索方法、装置、设备及计算机可读存储介质
CN106796578B (zh) 知识自动化系统和方法以及存储器
US9495345B2 (en) Methods and systems for modeling complex taxonomies with natural language understanding
CN100447779C (zh) 文档信息处理设备及文档信息处理方法
US9047346B2 (en) Reporting language filtering and mapping to dimensional concepts
US11907669B2 (en) Creation of component templates based on semantically similar content
US20160196564A1 (en) Systems and methods for analyzing consumer sentiment with social perspective insight
CN106664463A (zh) 任意大小内容条目生成
CN111708774B (zh) 一种基于大数据的产业分析系统
CN111078835A (zh) 简历评估方法、装置、计算机设备及存储介质
CN110705226A (zh) 电子表格的创建方法、装置及计算机设备
CN113687825B (zh) 一种软件模块的构建方法、装置、设备及存储介质
CN110716994B (zh) 一种支持异构地理数据资源检索的检索方法及装置
CN111881900B (zh) 语料生成、翻译模型训练、翻译方法、装置、设备及介质
CN110209780A (zh) 一种问题模板生成方法、装置、服务器及存储介质
CN117420998A (zh) 一种客户端ui交互组件生成方法、装置、终端及介质
CN115210705A (zh) 具有无效值或等效值的关系表的向量嵌入模型
CN110334112B (zh) 一种简历信息检索方法及装置
US11238102B1 (en) Providing an object-based response to a natural language query
CN116797195A (zh) 工单处理方法、装置、计算机设备和计算机可读存储介质
CN113407678B (zh) 知识图谱构建方法、装置和设备
CN115269862A (zh) 一种基于知识图谱的电力问答与可视化系统
US20220164377A1 (en) Method and apparatus for distributing content across platforms, device and storage medium
CN116127066A (zh) 文本聚类方法、文本聚类装置、电子设备及存储介质
CN115757720A (zh) 基于知识图谱的项目信息搜索方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant