CN103092979B - 遥感数据检索自然语言的处理方法 - Google Patents

遥感数据检索自然语言的处理方法 Download PDF

Info

Publication number
CN103092979B
CN103092979B CN201310037237.2A CN201310037237A CN103092979B CN 103092979 B CN103092979 B CN 103092979B CN 201310037237 A CN201310037237 A CN 201310037237A CN 103092979 B CN103092979 B CN 103092979B
Authority
CN
China
Prior art keywords
keyword
remotely
sensed data
word
remote sensing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310037237.2A
Other languages
English (en)
Other versions
CN103092979A (zh
Inventor
杨进
宣萱
刘建波
刘士彬
梁龙彬
戴芹
马彩虹
张静
段建波
李信鹏
屈倩
刘巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CENTER FOR EARTH OBSERVATION AND DIGITAL EARTH CHINESE ACADEMY OF SCIENCES
Original Assignee
CENTER FOR EARTH OBSERVATION AND DIGITAL EARTH CHINESE ACADEMY OF SCIENCES
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CENTER FOR EARTH OBSERVATION AND DIGITAL EARTH CHINESE ACADEMY OF SCIENCES filed Critical CENTER FOR EARTH OBSERVATION AND DIGITAL EARTH CHINESE ACADEMY OF SCIENCES
Priority to CN201310037237.2A priority Critical patent/CN103092979B/zh
Publication of CN103092979A publication Critical patent/CN103092979A/zh
Application granted granted Critical
Publication of CN103092979B publication Critical patent/CN103092979B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种遥感数据检索自然语言的处理方法及装置,该方法包括步骤:S1,切分用户的查询语句,从中提取得到待处理关键词;S2,对所述待处理关键词进行语义挖掘,得到标准格式的关键词组;S3,对所述关键词组进行语义分析,得到条件组,以用作检索遥感数据的条件。利用本发明对遥感数据的自然查询语言进行处理,可克服一般自然语言处理方法解析不足的缺点,能有效地“理解”自然查询语句并将其转化为符合用户意图的查询条件组,从而解决现有技术中存在的前述问题。

Description

遥感数据检索自然语言的处理方法
技术领域
本发明涉及遥感数据检索领域,尤其涉及一种遥感数据检索自然语言的处理方法能够应用于面向自然语言的遥感数据检索系统。
背景技术
自然语言相对于受控语言,是未经过加工和规范化处理的人类语言。面向自然语言的查询系统能够允许用户不受专业术语的约束,直接使用字、词、句子甚至段落等自然语言表达提问,完成信息的查询检索。该查询方式有利于非专业人员的信息检索,为信息检索系统更好地应用普及提供了技术支持。目前,遥感数据查询一般是系统提供一个图形化的查询界面,用户根据需求在其上直接选择如采集时间、经纬度、卫星名、传感器名等查询参数,系统按照选定的参数进行查询。这种方法简单、直观但也限制了用户的需求。当用户的查询需求界面选择没有或满足不了时,如查询用于“土壤湿度分析”的遥感数据,用户只能先将该应用需求转换成为一系列的元数据信息,再在查询界面进行条件设置才能达到查询目的,这就要求用户具有遥感专业背景,还要对数据库内部结构有一定的了解。为数据库建立一个自然语言检索的接口可以突破这些局限,使遥感数据为更多的非专业用户所用,该接口将用户输入的自然查询语句转化成数据库结构化的查询语言,其过程就包括将用户的应用需求转换成元数据信息。
然而,由于自然语言的复杂性,如何正确、充分的理解自然查询语句是面向自然语言检索系统亟待解决的重要问题之一。特别是当自然语言检索系统应用于某一专业领域时,一般的自然语言处理技术并不能很好地挖掘、理解出与专业领域相关的用户检索需求。
发明内容
本发明的目的在于提供一种遥感数据检索自然语言的处理方法以进一步为遥感数据检索系统建立自然语言检索接口。利用本发明对遥感数据的自然查询语言进行处理,可克服一般自然语言处理方法解析不足的缺点,能有效地“理解”自然查询语句并将其转化为符合用户意图的查询条件组,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种遥感数据检索自然语言的处理方法,包括以下步骤:
S1,切分用户的查询语句,从中提取得到待处理关键词;
S2,对所述待处理关键词进行语义挖掘,得到标准格式的关键词组;
S3,对所述关键词组进行语义分析,得到条件组,以用作检索遥感数据的条件。
优选的,S1具体为对用户查询语句进行分词和词性标注,并从切分出的词中筛选出与遥感数据属性有关的部分,作为关键词。
优选的,S1包括以下步骤:
S11,建立遥感专业术语词典RSDic;
S12,利用正则表达式从所述查询语句中匹配提取得到待处理关键词;
和/或
利用ICTCLAS2012汉语分词软件和所述遥感专业术语词典RSDic从所述查询语句中提取得到待处理关键词。
优选的,所述利用正则表达式匹配提取得到的待处理关键词包括:时间、经纬度和比例尺中的一种或几种;所述利用ICTCLAS2012汉语分词软件和所述遥感专业术语词典RSDic从所述查询语句中提取得到的待处理关键词包括:卫星、传感器、空间区域和应用中的一种或几种。
优选的,S12后还包括以下步骤:
S13,把从所述查询语句中提取出的所有关键词表示为一N元组:
vKeyWord(W1,W2,…,WN)
其中W为关键词KeyWord
S14,把任何一个KeyWord都由五元组来描述:
KeyWord(Word,Attribute,No,SameFlag,WordDB)
其中Word是关键词,Attribute是关键词的词性,No表示关键词在源语句中的词序,SameFlag值为1或0,表示上下文中是否存在跟Word词性相同的词,WordDB是Word对应的遥感数据库语义。
优选的,S2包括以下步骤:
S21,建立遥感数据库语义词典DBDic;利用本体编辑工具Protégé构建遥感应用本体知识库RSAO;
S22,基于所述遥感数据库语义词典DBDic对S1中提取得到的所述关键词进行正规化和归一化处理,得到所述关键词的标准格式的遥感数据库语义
S23,根据所述遥感应用本体知识库RSAO中的事件应用信息与遥感数据元数据信息的对应关系,获得事件应用类关键词相应的元数据信息;
S24,将得到的所述遥感数据库语义和所述元数据信息置于所述KeyWord的WordDB属性中;
循环执行S22-S24,直到处理完从所述查询语句中提取出的所有关键词,形成关键词组。
优选的,S3包括以下步骤:
S31,对所述关键词组进行组合条件判断,将复杂查询语句拆分为符合用户查询意图的条件组;
S32,对相邻的所述条件组进行正序比较和倒序比较,完善所述条件组。
优选的,所述组合条件是目标关键词与相邻关键词Attribute不同且在非相邻的关键词中存在与目标关键词Attribute相同的词;所述组合条件判断具体为迭代判断关键词组vKeyWord是否符合所述组合条件,如符合,则以目标关键词为界将vKeyWord划分为多个条件组Wordlists(Wordlist1,Wordlist2,…),并将与目标关键词Attribute相同的关键词的SameFlag标记为1;否则,判定源语句为简单句,系统将vKeyWord作为单一条件组Wordlist返回。
优选的,所述正序比较和倒序比较具体为:对已生成的Wordlists中相邻条件组进行正序和倒序比较,以Wordlist1,Wordlist2标识:按照词序,从前往后正序比较Wordlist1中SameFlag为1的关键词之前的关键词与Wordlist2关键词的Attribute是否相同,全部不同时将目标关键词加入Wordlist2中;然后按照相同的方法从后往前倒序比较Wordlist2的关键词与Wordlist1中SameFlag为1的关键词之后的所有关键词Attribute,从而完善Wordlist1。
一种遥感数据检索自然语言的处理装置,包括:
关键词提取模块,用于切分用户的查询语句,从中提取得到待处理关键词;
语义挖掘模块,用于对所述待处理关键词进行语义挖掘,得到标准格式的关键词组;
语义分析模块,用于对所述关键词组进行语义分析,得到条件组,以用作检索遥感数据的条件。
本发明的有益效果是:
利用本发明的方法或装置对遥感数据的自然查询语言进行处理,可克服一般自然语言处理方法解析不足的缺点,能有效地“理解”自然查询语句并将其转化为符合用户意图的查询条件组。本发明根据遥感数据查询特点,从自然语言的词法分析和语义分析层面上,提出一种适用于遥感数据检索领域的自然语言处理方法,以充分理解用户查询语句。
附图说明
图1是本发明的遥感数据检索自然语言的处理方法的步骤流程示意图;
图2是本发明的遥感数据检索自然语言的处理方法中关键词语义分析的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
如图1所示本发明公开了一种遥感数据检索自然语言的处理方法,包括以下步骤:
S1,切分用户的查询语句,从中提取得到待处理关键词;
S2,对所述待处理关键词进行语义挖掘,得到标准格式的关键词组;
S3,对所述关键词组进行语义分析,得到条件组,以用作检索遥感数据的条件。
以下对具体步骤进行详述:
遥感数据检索自然语言处理方法是从自然查询语句中筛选出能反映用户查询意图的关键词,并对关键词进行语义挖掘和语义分析,从而得到符合用户意图的查询条件组。
关键词提取是对用户查询语句进行分词和词性标注,并从切分出的词中筛选出与遥感数据属性有关的部分。本发明采用规则与统计相结合的策略进行分词。规则体现在正则表达式的运用,对于经纬度、时间、比例尺等内容不定,格式固定的词,一般的基于统计的分词算法很难将其正确分离出来,正则匹配则根据其格式特点通过定义正则表达式将其匹配提取出来。其他如卫星、传感器模式、图像模式、事件应用、地点等没有特定格式所循的关键词,本发明利用基于统计的汉语分词软件ICTCLAS2012进行处理[http://www.nlpir.org]。查询语句中的通用词汇如常见地名,借助ICTCLAS2012自带的通用词典即可分离,而遥感专业术语则需借助遥感专业术语词典RSdic进行处理。该词典用txt文件格式进行描述,涵盖了卫星、传感器模式、图像模式、事件应用等遥感领域词汇。每个词条还有相应词性标注,与传统的名词、动词、形容词等标注不同,RSdic的词性是根据词的遥感数据库语义来定义,卫星、传感器模式、图像模式、时间、地点、事件应用的词性分别标识为:rs_sate、rs_senp、rs_type、rs_time、rs_plac、rs_evet。
从查询语句提取出的所有关键词形成一N元组:
vKeyWord(W1,W2,…,WN)
其中W为关键词KeyWord,任一KeyWord都由五元组来描述:
KeyWord(Word,Attribute,No,SameFlag,WordDB)
其中Word是关键词,Attribute是关键词的词性,No表示关键词在源语句中的词序,SameFlag值为1或0,表示上下文中是否存在跟Word词性相同的词,WordDB是Word对应的遥感数据库语义。
关键词语义挖掘是为关键词赋予数据库语义,具体有两个步骤:一是将关键词正规化、归一化处理成数据库标准形式;二是根据遥感应用本体知识库(RSAO)中事件应用信息与遥感数据元数据信息的对应关系,获得事件应用类关键词相应的元数据信息。
本发明根据遥感语义词典DBdic对空间区域、卫星、传感器模式、图像模式、事件应用关键词进行正规化、归一化处理。该词典也用txt文件格式描述,主要记录了关键词及其在数据库中的表示形式。正规化处理是根据DBdic将一些特殊的空间区域转换成数据库可识别的行政区域,如“东北三省”应正规化表式为“辽宁,黑龙江,吉林”。归一化处理则是将同义不同形的关键词表示成唯一的数据库标准格式,如将“l7、ls7、landsat7、LandSat7”归一表示为“LANDSAT-7”。对于表示形式复杂、多变的时间和经纬度,语义挖掘需利用专门的解析程序进行正规化处理,如将“08年5月到2010年3月”表达为数据库标准形式“[2008-05-01,2010-03-31]”。
事件应用对应遥感元数据信息的获取需借助遥感应用本体知识库RSAO完成。RSAO由本体编辑工具Protégé构建完成,以owl文件形式进行存放。RSAO从语义和知识的层面上描述并组织了遥感元数据和事件应用信息。借助本体的推理机机制,根据本体规则可自动地将事件应用与遥感元数据信息关联起来。本发明通过读取RSAO即可得到遥感事件应用对应的元数据信息。
语义挖掘出的数据库语义将存放在KeyWord的WordDB属性中。
关键词语义分析是对提取出的关键词词组进行组合分析,并生成符合用户查询意图的条件组。如图2所示,首先判断查询语句是否为复合句,即组合条件判断,满足条件则将复合句拆分成为多个条件组,然后结合关键词间的语义关系对相邻条件组进行正序比较和倒序比较,从而完善条件组。
组合条件判断对于关键词组vKeyWord(W1,W2,…,WN),组合条件如下:
①Wi的Attribute值与Wi-1的Attribute值不同,i为1到N中的任一整数;
②(W1,…,Wi-1)中存在Wj的Attribute值与Wi的Attribute值相同,j为1到i-1中的任一整数
当①②都满足时,得到一新条件组Wordlist(W1,…,Wi-1),同时标记Wj的SameFlag值为1,迭代判断可将vKeyWord初步拆分为多个条件组,记为Wordlist1,Wordlist2,…。当①或②有任一不满足时,将vKeyWord作为单一条件组Wordlist返回。组合条件判断后形成的条件组记为Wordlists(Wordlist1,…,WordlistM),M为不小于1的整数。
条件组完善
当条件组Wordlist个数M>=2时,记Wordlists中任意相邻两条件组为:
Wordlist1(W1,…,Wj-1,Wj,Wj+1,…,Wp)
Wordlist2(W1,…,Wq)
其中Wj的SameFlag值为1,p、q为1到N间的整数,且p与q的和不大于N。
Ⅰ正序比较:正序判断Wordlist1的(W1,…,Wj-1)中Ws的Attribute值是否与Wordlist2的(W2,…,Wq)中关键词的Attribute值相同,全都不同则将Ws添入Wordlist2。
Ⅱ倒序比较:倒序判断Wordlist2的(Wq,…,W2)中Wt的Attribute值是否与Wordlist1的(Wj+1,…,Wp)中关键词的Attribut值相同,全都不同则将Wt添入Wordlist1。
其中s为1到j-1间的任意整数,t为2到q间的任意整数。
利用本发明的方法对自然查询语句如“查询2010年12月用于分析大兴安岭植被覆盖率的遥感数据”进行处理,可得到用关键词的WordDB属性描述的条件组:
Wordlist([2010-12-012010-12-31]、大兴安岭地区、SPOT-4、LANDSAT-5)
该方法正确的提取出时间、地点、事件应用等遥感专业词汇,并将“植被覆盖率”转化为相应的卫星信息“SPOT-4、LANDSAT-5”,克服一般自然语言处理方法解析不足的缺点,有效地“理解”自然查询语句并将其转化为符合用户意图的查询条件组。
本发明的遥感数据检索自然语言的处理方法还可以以装置的形式体现:一种遥感数据检索自然语言的处理装置,包括:
关键词提取模块,用于在待处理查询语句中提取关键词;
语义挖掘模块,用于对提取出的所述关键词进行语义挖掘;
语义分析模块,用于对提取出的所述关键词进行语义分析。
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
利用本发明的方法或装置对遥感数据的自然查询语言进行处理,可克服一般自然语言处理方法解析不足的缺点,能有效地“理解”自然查询语句并将其转化为符合用户意图的查询条件组。本发明根据遥感数据查询特点,从自然语言的词法分析和语义分析层面上,提出一种适用于遥感数据检索领域的自然语言处理方法,以充分理解用户查询语句。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (5)

1.一种遥感数据检索自然语言的处理方法,其特征在于,包括以下步骤:
S1,切分用户的查询语句,从中提取得到待处理关键词;
S2,对所述待处理关键词进行语义挖掘,得到标准格式的关键词组;
S3,对所述关键词组进行语义分析,得到条件组,将所述条件组用作检索遥感数据的条件;
S1具体为对用户查询语句进行分词和词性标注,并从切分出的词中筛选出与遥感数据属性有关的部分,作为关键词;
S1包括以下步骤:
S11,建立遥感专业术语词典RSDic;
S12,利用正则表达式从所述查询语句中匹配提取得到待处理关键词;
和/或
利用ICTCLAS2012汉语分词软件和所述遥感专业术语词典RSDic从所述查询语句中提取得到待处理关键词;
S12后还包括以下步骤:
S13,把从所述查询语句中提取出的所有关键词表示为一N元组:
vKeyWord(W1,W2,…,WN)
其中W为关键词KeyWord
S14,把任何一个KeyWord都由五元组来描述:
KeyWord(Word,Attribute,No,SameFlag,WordDB)
其中Word是关键词,Attribute是关键词的词性,No表示关键词在源语句中的词序,SameFlag值为1或0,表示上下文中是否存在跟Word词性相同的词,WordDB是Word对应的遥感数据库语义;
S2包括以下步骤:
S21,建立遥感数据库语义词典DBDic;利用本体编辑工具Protégé构建遥感应用本体知识库RSAO;
S22,基于所述遥感数据库语义词典DBDic对S1中提取得到的所述关键词进行正规化和归一化处理,得到所述关键词的标准格式的遥感数据库语义
S23,根据所述遥感应用本体知识库RSAO中的事件应用信息与遥感数据元数据信息的对应关系,获得事件应用类关键词相应的元数据信息;
S24,将得到的所述遥感数据库语义和所述元数据信息置于所述KeyWord的WordDB属性中;
循环执行S22-S24,直到处理完从所述查询语句中提取出的所有关键词,形成关键词组。
2.根据权利要求1所述的遥感数据检索自然语言的处理方法,其特征在于,所述利用正则表达式匹配提取得到的待处理关键词包括:时间、经纬度和比例尺中的一种或几种;所述利用ICTCLAS2012汉语分词软件和所述遥感专业术语词典RSDic从所述查询语句中提取得到的待处理关键词包括:卫星、传感器、空间区域和应用中的一种或几种。
3.根据权利要求1所述的遥感数据检索自然语言的处理方法,其特征在于,S3包括以下步骤:
S31,对所述关键词组进行组合条件判断,将复杂查询语句拆分为符合用户查询意图的条件组;
S32,对相邻的所述条件组进行正序比较和倒序比较,完善所述条件组。
4.根据权利要求3所述的遥感数据检索自然语言的处理方法,其特征在于,所述组合条件是目标关键词与相邻关键词Attribute不同且在非相邻的关键词中存在与目标关键词Attribute相同的词;所述组合条件判断具体为迭代判断关键词组vKeyWord是否符合所述组合条件,如符合,则以目标关键词为界将vKeyWord划分为多个条件组Wordlists(Wordlist1,Wordlist2,…),并将与目标关键词Attribute相同的关键词的SameFlag标记为1;否则,判定源语句为简单句,将vKeyWord作为单一条件组Wordlist返回。
5.根据权利要求3所述的遥感数据检索自然语言的处理方法,其特征在于,所述正序比较和倒序比较具体为:对已生成的Wordlists中相邻条件组进行正序和倒序比较,以Wordlist1,Wordlist2标识:按照词序,从前往后正序比较Wordlist1中SameFlag为1的关键词之前的关键词与Wordlist2关键词的Attribute是否相同,全部不同时将目标关键词加入Wordlist2中;然后按照相同的方法从后往前倒序比较Wordlist2的关键词与Wordlist1中SameFlag为1的关键词之后的所有关键词Attribute,从而完善Wordlist1。
CN201310037237.2A 2013-01-31 2013-01-31 遥感数据检索自然语言的处理方法 Expired - Fee Related CN103092979B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310037237.2A CN103092979B (zh) 2013-01-31 2013-01-31 遥感数据检索自然语言的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310037237.2A CN103092979B (zh) 2013-01-31 2013-01-31 遥感数据检索自然语言的处理方法

Publications (2)

Publication Number Publication Date
CN103092979A CN103092979A (zh) 2013-05-08
CN103092979B true CN103092979B (zh) 2016-01-27

Family

ID=48205544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310037237.2A Expired - Fee Related CN103092979B (zh) 2013-01-31 2013-01-31 遥感数据检索自然语言的处理方法

Country Status (1)

Country Link
CN (1) CN103092979B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226606B (zh) 2013-04-28 2016-08-10 浙江核新同花顺网络信息股份有限公司 查询选取方法及系统
CN104298676A (zh) * 2013-07-18 2015-01-21 佳能株式会社 主题挖掘方法和设备、以及查询扩展方法和设备
CN104298683B (zh) * 2013-07-18 2017-11-28 佳能株式会社 主题挖掘方法和设备、以及查询扩展方法和设备
CN104021198B (zh) * 2014-06-16 2017-09-01 北京理工大学 基于本体语义索引的关系数据库信息检索方法及装置
CN105243145B (zh) * 2015-10-16 2018-07-27 武汉大学 基于任务和传感器典型配置的遥感影像发现方法及系统
CN105589936A (zh) * 2015-12-11 2016-05-18 航天恒星科技有限公司 一种数据查询方法及系统
CN105843849B (zh) * 2016-03-15 2019-11-26 北京百度网讯科技有限公司 搜索方法及装置
CN106126545A (zh) * 2016-06-15 2016-11-16 北京智能管家科技有限公司 分布式的裂变查询方法及装置
CN106528644B (zh) * 2016-10-14 2020-07-31 航天恒星科技有限公司 一种遥感数据的检索方法及装置
CN106503194A (zh) * 2016-11-02 2017-03-15 大唐软件技术股份有限公司 信息获取方法及装置
CN106934069B (zh) * 2017-04-24 2021-01-01 中国工商银行股份有限公司 数据检索方法及系统
CN106970913A (zh) * 2017-05-12 2017-07-21 湖南中周至尚信息技术有限公司 一种时间的提取方法及装置
CN107256260A (zh) * 2017-06-13 2017-10-17 浪潮软件股份有限公司 一种智能语义识别方法、搜索方法、装置及系统
CN107622208A (zh) * 2017-08-31 2018-01-23 广东欧珀移动通信有限公司 便签加密、解密方法及相关产品
CN109345282A (zh) * 2018-08-22 2019-02-15 中国平安人寿保险股份有限公司 一种业务咨询的响应方法及设备
CN109344300A (zh) * 2018-08-31 2019-02-15 深圳壹账通智能科技有限公司 自然语言的数据查询意图确定方法、装置和计算机设备
CN109299129A (zh) * 2018-09-05 2019-02-01 深圳壹账通智能科技有限公司 自然语言的数据查询方法、装置、计算机设备及存储介质
CN109241103A (zh) * 2018-09-26 2019-01-18 深圳壹账通智能科技有限公司 数据扩展查询方法、电子装置及计算机可读存储介质
CN111176650B (zh) * 2018-11-09 2023-04-18 阿里巴巴集团控股有限公司 解析器生成方法、检索方法、服务器及存储介质
CN109697201B (zh) * 2018-12-27 2020-12-04 清华大学 一种查询处理的方法、系统、设备及计算机可读存储介质
CN110378704B (zh) * 2019-07-23 2021-10-22 珠海格力电器股份有限公司 基于模糊识别的意见反馈的方法、存储介质和终端设备
CN110532551A (zh) * 2019-08-15 2019-12-03 苏州朗动网络科技有限公司 文本关键词自动提取的方法、设备和存储介质
CN110737687A (zh) * 2019-09-06 2020-01-31 平安普惠企业管理有限公司 数据查询方法、装置、设备及存储介质
CN111126028B (zh) * 2019-12-30 2023-07-18 中国联合网络通信集团有限公司 数据处理方法、装置及设备
CN111272679B (zh) * 2020-02-11 2023-07-28 广东海洋大学 一种基于高分辨率的遥感反射率产品的生成系统及方法
CN111339768B (zh) * 2020-02-27 2024-03-05 携程旅游网络技术(上海)有限公司 敏感文本检测方法、系统、电子设备及介质
CN113779329A (zh) * 2021-08-16 2021-12-10 北京神矢数据科技有限公司 一种应用于技术转移的矩阵式映射分析方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314610A (zh) * 2010-07-07 2012-01-11 北京师范大学 一种基于概率潜语义分析模型的面向对象影像聚类方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010037328A1 (en) * 2000-03-23 2001-11-01 Pustejovsky James D. Method and system for interfacing to a knowledge acquisition system
KR20020049164A (ko) * 2000-12-19 2002-06-26 오길록 유전자 알고리즘을 이용한 카테고리 학습과 단어클러스터에 의한 문서 자동 분류 시스템 및 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314610A (zh) * 2010-07-07 2012-01-11 北京师范大学 一种基于概率潜语义分析模型的面向对象影像聚类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Research on the natural language querying for remote sensing databases;xuan-Xuan;《Computer Science&Service System(CSSS),2012 International Conference on》;20120813;第230页左栏第1段-右栏最后1段 *
基于应用本体的多卫星遥感数据检索;杨小忠等;《遥感信息》;20070228;全文 *

Also Published As

Publication number Publication date
CN103092979A (zh) 2013-05-08

Similar Documents

Publication Publication Date Title
CN103092979B (zh) 遥感数据检索自然语言的处理方法
Kara et al. An ontology-based retrieval system using semantic indexing
Day et al. Reference metadata extraction using a hierarchical knowledge representation framework
CN109739964A (zh) 知识数据提供方法、装置、电子设备和存储介质
Vicient et al. An automatic approach for ontology-based feature extraction from heterogeneous textualresources
Herbelot et al. Acquiring ontological relationships from wikipedia using rmrs
CN105335487A (zh) 基于农业技术信息本体库的农业专家信息检索系统及方法
EP2183684A2 (en) Coreference resolution in an ambiguity-sensitive natural language processing system
Fuchs Natural language processing for building code interpretation: systematic literature review report
Shiwen et al. Rule-based machine translation
Zhu et al. A natural language interface to a graph-based bibliographic information retrieval system
CN110390022A (zh) 一种自动化的专业知识图谱构建方法
CN113868387A (zh) 一种基于改进tf-idf加权的word2vec医疗相似问题检索方法
CN101539906A (zh) 一种专利文本自动分析的系统及方法
Garrido et al. GEO-NASS: A semantic tagging experience from geographical data on the media
Mohnot et al. Hybrid approach for Part of Speech Tagger for Hindi language
Govilkar et al. Question answering system using ontology in Marathi language
KR101092356B1 (ko) 상호 정보를 이용한 형태소 품사 태깅 장치 및 방법
Gupta et al. A new approach towards bibliographic reference identification, parsing and inline citation matching
Xu et al. Open relation extraction from chinese microblog text
Luong et al. Enriching concept descriptions in an amphibian ontology with vocabulary extracted from wordnet
Ren et al. Research on geographic information extraction based on knowledge graph
Craveiro et al. It is the time for Portuguese texts!
CN118363981A (zh) 一种医疗文本混合检索方法及系统
Vivekanandam et al. A concept based ontology mapping method for effective retrieval of bio-medical documents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160127

Termination date: 20200131