CN117271577A - 一种基于智能分析的关键字检索方法 - Google Patents
一种基于智能分析的关键字检索方法 Download PDFInfo
- Publication number
- CN117271577A CN117271577A CN202311554993.2A CN202311554993A CN117271577A CN 117271577 A CN117271577 A CN 117271577A CN 202311554993 A CN202311554993 A CN 202311554993A CN 117271577 A CN117271577 A CN 117271577A
- Authority
- CN
- China
- Prior art keywords
- keyword
- keywords
- user
- space
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000004458 analytical method Methods 0.000 title claims abstract description 52
- 230000008569 process Effects 0.000 claims description 14
- 241001122767 Theaceae Species 0.000 claims description 10
- 238000007405 data analysis Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000000691 measurement method Methods 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000007670 refining Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于智能分析的关键字检索方法,所述该方法包括以下步骤:步骤一:用户通过智能终端向搜索引擎或查询系统提交目标关键字,系统基于目标关键字对应的空间网络数据进行空间位置和文本内容两个属性的分析;步骤二:基于给出的具有坐标信息的主题进行关键字、关键词对应地理位置区域的范围划分,并根据地理位置区域中心构建检索路径;步骤三:在基于语义理解的空间关键字检索场景下,给定一个空间关键字查询,搜索引擎将利用概率主题模型对其进行语义化解析;步骤四:输出用户根据关键字、关键词得出的关于空间文本对象的空间维度和语义维度上的其余需求偏好位置内容,本发明,具有提高检索精确度和提高用户意图分析的特点。
Description
技术领域
本发明涉及信息检索技术领域,具体为一种基于智能分析的关键字检索方法。
背景技术
基于关键字检索地理位置的应用中,某用户想要去一个陌生的地方逗留几天,所以用户想要找到一块区域,这个区域内有很多的可活动场所,用户将选择这块区域作为自己主要的活动区域,例如用户提交饭店、酒店、奶茶店关键字,算法返回若干个区域,并且区域中含有饭店、酒店、奶茶店对象,基于提到的含有饭店、酒店、奶茶店对象的区域,基于模糊关键字检索算法后发现算法中用到了大量的排序,造成基于关键字检索算法的效率低下,用户想要找到确定目标点周围的区域作为活动范围,例如用户想要找到目标酒店周围的模糊区域,而匹配结果的智能性不高,搜索引擎的搜索结果往往只包含和关键字相关的信息,不能有效地匹配用户需求的细节,尤其是在搜索长尾关键字时,结果不够准确,而当关键字搜索结果较多时,用户就更难找到所需信息。因此,设计提高检索精确度和提高用户意图分析的一种基于智能分析的关键字检索方法是很有必要的。
发明内容
本发明的目的在于提供一种基于智能分析的关键字检索方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于智能分析的关键字检索方法,包括以下步骤:
步骤一:用户通过智能终端向搜索引擎或查询系统提交目标关键字,系统基于目标关键字对应的空间网络数据进行空间位置和文本内容两个属性的分析;
步骤二:基于给出的具有坐标信息的主题进行关键字、关键词对应地理位置区域的范围划分,并根据地理位置区域中心构建检索路径;
步骤三:在基于语义理解的空间关键字检索场景下,给定一个空间关键字查询,搜索引擎将利用概率主题模型对其进行语义化解析;
步骤四:输出用户根据关键字、关键词得出的关于空间文本对象的空间维度和语义维度上的其余需求偏好位置内容。
根据上述技术方案,所述用户通过智能终端向搜索引擎或查询系统提交目标关键字的步骤,包括:
用户在基于关键字进行的地理位置相关信息检索的过程中,输入简短的关键字表达查询意图,在这个过程中,当用户通过智能终端向搜索引擎或查询系统提交目标关键字后,若根据用户输入的简短关键字、关键词不能准确表达其查询需求时,以用户提交的关键字、关键词为依据,基于目标关键字对应的空间网络数据进行空间位置属性和文本内容属性分析。
根据上述技术方案,所述进行空间位置属性和文本内容属性分析的方法步骤,包括:
步骤11:基于目标关键字对应的地理位置信息属于空间网络数据,其属性特征是以标签对的形式存在,地理信息特征都有属性信息并通过经纬度确定空间数据的地理位置;
步骤12:对用户输入的检索关键字和关键词矩阵进行奇异值分解,得到简短的关键字和关键词之间的潜在联系,利用概率主题模型挖掘关键字词描述中主题相关的语义信息;
步骤13:通过对大量与用户输入的关键字、关键词对应的相关文本内容属性进行训练分析,得到具有隐式语义包括用户搜索检索的饭店、酒店和奶茶店关键字对应的地理要素,且地理要素均有坐标信息的主题;
步骤14:其中每一个主题代表一组与用户输入的关键字、关键词对应的文本内容属性语义相关且具有内在耦合性的类别信息,在空间关键字查询的场景中,将每一个主题定义为用户的一种潜在意图需求。
根据上述技术方案,所述基于给出的具有坐标信息的主题进行关键字、关键词对应地理位置区域的范围划分的步骤,包括:
用户提交基于地理位置进行关键字、关键词的搜索查询,判断含有关键字相关对象的区域范围,定义该地理区域为区域范围中针对关键字、关键词查询的目标区域,当用户提交饭店、酒店、奶茶店的关键字时,在目标区域中寻找对应的关键字对象集合,通过现有地图应用的开发者API获得关键字对象集合的散列点位置信息,并使用聚类算法对每一类关键字对象点进行聚类,然后针对提交的每个关键字采用算法寻找相应的关键字对象凸包集合,通过面积相等法判断关键词对应的集合是否在区域中出现,当出现后对区域分别进行关键地理位置区域中心的划分。
根据上述技术方案,所述进行关键地理位置区域中心的划分方法步骤,包括:
步骤21:通过分散的关键字对应地理位置信息源,进行区域位置信息的搜集和加工,根据关键字对应文本内容信息的描述体构成区域位置信息库,通过选取和提炼关键字空间位置特征和主题内容的标示把区域位置信息变成有序化的组织形式进行存储;
步骤22:通过由近及远的查找空间位置关键点周围网格中的符合关键字要求的相同搜索用户,将每一个网格里的对象都按关键字分类,在查找中心点的过程中筛选掉不包含查询关键字的冗余用户,从而省去了为每一个用户专门调取文本信息一一验证是否符合关键字要求的时间;
步骤23:每个网格对应包含了在该网格中的所有用户的相关关键字集合;
步骤24:每个关键字对应一个列表用来存储在该网格中包含该关键字的所有集合,列表中的每一个元素用二元组表示,在网格中查找中心点集合时,通过查找该网格出现的所有关键字所对应的列表的集合求并集,得到符合关键字要求的文本对象对应的地理位置区域中心;
步骤25:根据地理位置区域中心构建检索路径,通过在存储和检索过程中使用统一的关键字空间位置特征标示,对用户的关键字、关键词检索标示或信息内容的形式特征和存储中的标示进行比较,当双方的标示相符时,从检索系统中把围绕地理位置区域中心相关的地理位置标示的数据信息按特定的要求进行输出。
根据上述技术方案,所述在基于语义理解的空间关键字检索场景下,给定一个空间关键字查询的步骤,包括:
基于语义理解的空间关键字检索场景下,根据用户的检索位置和提交关键字的检索请求,系统获得用户的查询位置信息和查询关键字,从查询关键词与空间文本对象的关键字的字符串匹配角度理解用户的查询意图,即同时考虑用户所在位置和查询关键字的检索,搜索引擎将利用概率主题模型对其进行语义化解析,得到用户关于空间文本对象的空间维度和语义维度上的其余需求偏好。
根据上述技术方案,所述进行语义化解析的方法步骤,包括:
步骤31:用户通过搜索引擎或查询系统向服务器发送数据,包括查询的关键字、关键词和用户的当前位置,系统利用文本语义化技术对用户查询关键字词进行语义解析,根据语义向量距离来度量对象和查询之间的文本相似度,根据文本相似度构建用户输入关键字、关键词对应的多需求意愿的结果集;
步骤32:对结果集中的数据进行预处理操作,提取关键字信息建立倒排索引表,提取空间节点信息建立空间树索引,当节点上包含关键字对应的空间位置信息时定义为位置节点,抽取和节点相关的属性、描述等信息的关键字信息构成该节点对应的关键字文档;
步骤33:结合步骤二中的主题,通过概率主题模型,将根据文本相似度得出结果集中的每个需求意愿定义为一个维度,再基于用户的当前位置,得到包含位置信息的节点,然后从该节点出发边遍历空间RDF图,查找到包含所有查询关键字的节点树;
步骤34:对于RDF图中的每个节点都对应一个关键字文档,根据每个节点的查询关键字文档和节点建立对应的倒排索引,根据所有包含空间位置信息的节点建立树索引。
根据上述技术方案,所述输出用户根据关键字、关键词得出的关于空间文本对象的空间维度和语义维度上的其余需求偏好位置内容的方法步骤,包括:
步骤41:通过语义解析得到的代表用户查询意图的形式化描述,转化关于关键字对应的用户意图偏好,每一个维度上的概率分布值反映用户对于该潜在主题的偏好程度;
步骤42:通过概率主题模型对查询输入以及空间文本对象的文本描述进行语义解析,分别得到其在高维空间的概率分布,基于语义理解的空间关键字查询通过距离度量方法进行相关性排序,然后输出与查询关联程度极高的多个空间文本对象;
步骤43:对于用户的每次输入检索,均通过提取查询位置信息、主要的查询关键字和符合条件的语义位置三个输入参数信息进行属性和语义的分析,输出关键字对应的地理位置标示和对应的多需求意愿的结果集,并根据关联度由高到低进行排序,依次输出返回给用户。
与现有技术相比,本发明所达到的有益效果是:本发明,
通过基于目标关键字对应的空间网络数据进行空间位置和文本内容两个属性的分析,将用户基于关键字的潜在需求定义为多个主题,提高用户意图分析方便后续的检索输出;
通过搜索引擎将利用概率主题模型对其进行语义化解析,同时考虑地理位置、关键字内容文本信息的基于区域范围的检索,提高检索查询的精准度。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例一提供的一种基于智能分析的关键字检索方法的流程图;
图2为本发明实施例二提供的一种基于智能分析的关键字检索系统的模块组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:图1为本发明实施例一提供的一种基于智能分析的关键字检索方法的流程图,本实施例可应用关键字检索地理位置的场景,该方法可以由本实施例提供的一种基于智能分析的关键字检索系统来执行,如图1所示,该方法具体包括以下步骤:
步骤一:用户通过智能终端向搜索引擎或查询系统提交目标关键字,系统基于目标关键字对应的空间网络数据进行空间位置和文本内容两个属性的分析;
在本发明实施例中,用户在基于关键字进行的地理位置相关信息检索的过程中,通常只用简短的几个关键字表达查询意图,在这个过程中,当用户通过智能终端向搜索引擎或查询系统提交目标关键字后,若根据用户输入的简短关键字、关键词不能准确表达其查询需求时,以用户提交的关键字、关键词为依据,基于目标关键字对应的空间网络数据进行空间位置属性和文本内容属性分析;
示例性的,进行空间位置属性和文本内容属性分析的方法为:
步骤11:基于目标关键字对应的地理位置信息属于空间网络数据,其属性特征是以标签对的形式存在,地理信息特征都有属性信息并通过经纬度确定空间数据的地理位置;
步骤12:对用户输入的检索关键字和关键词矩阵进行奇异值分解,得到简短的关键字和关键词之间的潜在联系,利用概率主题模型挖掘关键字词描述中主题相关的语义信息;
步骤13:通过对大量与用户输入的关键字、关键词对应的相关文本内容属性进行训练分析,得到具有隐式语义包括用户搜索检索的饭店、酒店和奶茶店关键字对应的地理要素,且地理要素均有坐标信息的主题;
步骤14:其中每一个主题代表一组与用户输入的关键字、关键词对应的文本内容属性语义相关且具有内在耦合性的类别信息,在空间关键字查询的场景中,将每一个主题定义为用户的一种潜在意图需求,比如饭店、酒店和奶茶店。
步骤二:基于给出的具有坐标信息的主题进行关键字、关键词对应地理位置区域的范围划分,并根据地理位置区域中心构建检索路径;
在本发明实施例中,用户提交基于地理位置进行关键字、关键词的搜索查询,判断含有关键字相关对象的区域范围,定义该地理区域为区域范围中针对关键字、关键词查询的目标区域,当用户提交饭店、酒店、奶茶店的关键字时,在目标区域中寻找对应的关键字对象集合,通过现有地图应用的开发者API获得关键字对象集合的散列点位置信息,并使用聚类算法对每一类关键字对象点进行聚类,然后针对提交的每个关键字采用算法寻找相应的关键字对象凸包集合,通过面积相等法判断关键词对应的集合是否在区域中出现,当出现后对区域分别进行关键地理位置区域中心的划分,
示例性的,进行关键地理位置区域中心的划分方法为:
步骤21:通过分散的关键字对应地理位置信息源,进行区域位置信息的搜集和加工,根据关键字对应文本内容信息的描述体构成区域位置信息库,通过选取和提炼关键字空间位置特征和主题内容的标示把区域位置信息变成有序化的组织形式进行存储;
步骤22:通过由近及远的查找空间位置关键点周围网格中的符合关键字要求的相同搜索用户,将每一个网格里的对象都按关键字分类,在查找中心点的过程中筛选掉不包含查询关键字的冗余用户,从而省去了为每一个用户专门调取文本信息一一验证是否符合关键字要求的时间;
步骤23:每个网格对应包含了在该网格中的所有用户的相关关键字集合;
步骤24:每个关键字对应一个列表用来存储在该网格中包含该关键字的所有集合,列表中的每一个元素用二元组表示,在网格中查找中心点集合时,通过查找该网格出现的所有关键字所对应的列表的集合求并集,得到符合关键字要求的文本对象对应的地理位置区域中心;
步骤25:根据地理位置区域中心构建检索路径,通过在存储和检索过程中使用统一的关键字空间位置特征标示,对用户的关键字、关键词检索标示或信息内容的形式特征和存储中的标示进行比较,当双方的标示相符时,从检索系统中把围绕地理位置区域中心相关的地理位置标示的数据信息按特定的要求进行输出。
步骤三:在基于语义理解的空间关键字检索场景下,给定一个空间关键字查询,搜索引擎将利用概率主题模型对其进行语义化解析;
在本发明实施例中,基于语义理解的空间关键字检索场景下,根据用户的检索位置和提交关键字的检索请求,系统获得用户的查询位置信息和查询关键字,从查询关键词与空间文本对象的关键字的字符串匹配角度理解用户的查询意图,即同时考虑用户所在位置和查询关键字的检索,搜索引擎将利用概率主题模型对其进行语义化解析,得到用户关于空间文本对象的空间维度和语义维度上的其余需求偏好;
示例性的,进行语义化解析的方法为:
步骤31:用户通过搜索引擎或查询系统向服务器发送数据,包括查询的关键字、关键词和用户的当前位置,系统利用文本语义化技术对用户查询关键字词进行语义解析,根据语义向量距离来度量对象和查询之间的文本相似度,根据文本相似度构建用户输入关键字、关键词对应的多需求意愿的结果集;
步骤32:对结果集中的数据进行预处理操作,提取关键字信息建立倒排索引表,提取空间节点信息建立空间树索引,当节点上包含关键字对应的空间位置信息时定义为位置节点,抽取和节点相关的属性、描述等信息的关键字信息构成该节点对应的关键字文档;
步骤33:结合步骤二中的主题,通过概率主题模型,将根据文本相似度得出结果集中的每个需求意愿定义为一个维度,再基于用户的当前位置,得到包含位置信息的节点,然后从该节点出发边遍历空间RDF图,查找到包含所有查询关键字的节点树;
步骤34:对于RDF图中的每个节点都对应一个关键字文档,根据每个节点的查询关键字文档和节点建立对应的倒排索引,根据所有包含空间位置信息的节点建立树索引;
步骤四:输出用户根据关键字、关键词得出的关于空间文本对象的空间维度和语义维度上的其余需求偏好位置内容;
在本发明实施例中,得出用户其余需求偏好的方法为:
步骤41:通过语义解析得到的代表用户查询意图的形式化描述,转化关于关键字对应的用户意图偏好,每一个维度上的概率分布值反映用户对于该潜在主题的偏好程度;
步骤42:通过概率主题模型对查询输入以及空间文本对象的文本描述进行语义解析,分别得到其在高维空间的概率分布,基于语义理解的空间关键字查询通过距离度量方法进行相关性排序,然后输出与查询关联程度极高的多个空间文本对象;
步骤43:对于用户的每次输入检索,均通过提取查询位置信息、主要的查询关键字和符合条件的语义位置三个输入参数信息进行属性和语义的分析,输出关键字对应的地理位置标示和对应的多需求意愿的结果集,并根据关联度由高到低进行排序,依次输出返回给用户。
实施例二:本发明实施例二提供了一种基于智能分析的关键字检索系统,图2为本发明实施例二提供的一种基于智能分析的关键字检索系统的模块组成示意图,如图2所示,该系统包括:
空间网络数据分析模块,用于系统基于目标关键字对应的空间网络数据进行分析;
地理位置区域范围划分模块,用于;
检索路径构建模块,用于基于给出的具有坐标信息的主题进行关键字、关键词对应地理位置区域的范围划分;
语义化解析模块,用于搜索引擎将利用概率主题模型进行语义化解析;
需求偏好输出模块,用于输出用户根据关键字、关键词得出的关于空间文本对象的空间维度和语义维度上的其余需求偏好位置内容。
在本发明的一些实施例中,空间网络数据分析模块包括:
空间位置属性模块,用于基于目标关键字对应的属于空间网络数据的地理位置信息进行分析;
文本内容属性模块,用于根据关键字对应的文本内容属性进行分析。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于智能分析的关键字检索方法,其特征在于:所述该方法包括以下步骤:
步骤一:用户通过智能终端向搜索引擎或查询系统提交目标关键字,系统基于目标关键字对应的空间网络数据进行空间位置和文本内容两个属性的分析;
步骤二:基于给出的具有坐标信息的主题进行关键字、关键词对应地理位置区域的范围划分,并根据地理位置区域中心构建检索路径;
步骤三:在基于语义理解的空间关键字检索场景下,给定一个空间关键字查询,搜索引擎将利用概率主题模型对其进行语义化解析;
步骤四:输出用户根据关键字、关键词得出的关于空间文本对象的空间维度和语义维度上的其余需求偏好位置内容。
2.根据权利要求1所述的一种基于智能分析的关键字检索方法,其特征在于:所述用户通过智能终端向搜索引擎或查询系统提交目标关键字的步骤,包括:
用户在基于关键字进行的地理位置相关信息检索的过程中,输入简短的关键字表达查询意图,在这个过程中,当用户通过智能终端向搜索引擎或查询系统提交目标关键字后,若根据用户输入的简短关键字、关键词不能准确表达其查询需求时,以用户提交的关键字、关键词为依据,基于目标关键字对应的空间网络数据进行空间位置属性和文本内容属性分析。
3.根据权利要求2所述的一种基于智能分析的关键字检索方法,其特征在于:所述进行空间位置属性和文本内容属性分析的方法步骤,包括:
步骤11:基于目标关键字对应的地理位置信息属于空间网络数据,其属性特征是以标签对的形式存在,地理信息特征都有属性信息并通过经纬度确定空间数据的地理位置;
步骤12:对用户输入的检索关键字和关键词矩阵进行奇异值分解,得到简短的关键字和关键词之间的潜在联系,利用概率主题模型挖掘关键字词描述中主题相关的语义信息;
步骤13:通过对大量与用户输入的关键字、关键词对应的相关文本内容属性进行训练分析,得到具有隐式语义包括用户搜索检索的饭店、酒店和奶茶店关键字对应的地理要素,且地理要素均有坐标信息的主题;
步骤14:其中每一个主题代表一组与用户输入的关键字、关键词对应的文本内容属性语义相关且具有内在耦合性的类别信息,在空间关键字查询的场景中,将每一个主题定义为用户的一种潜在意图需求。
4.根据权利要求3所述的一种基于智能分析的关键字检索方法,其特征在于:所述基于给出的具有坐标信息的主题进行关键字、关键词对应地理位置区域的范围划分的步骤,包括:
用户提交基于地理位置进行关键字、关键词的搜索查询,判断含有关键字相关对象的区域范围,定义该地理区域为区域范围中针对关键字、关键词查询的目标区域,当用户提交饭店、酒店、奶茶店的关键字时,在目标区域中寻找对应的关键字对象集合,通过现有地图应用的开发者API获得关键字对象集合的散列点位置信息,并使用聚类算法对每一类关键字对象点进行聚类,然后针对提交的每个关键字采用算法寻找相应的关键字对象凸包集合,通过面积相等法判断关键词对应的集合是否在区域中出现,当出现后对区域分别进行关键地理位置区域中心的划分。
5.根据权利要求4所述的一种基于智能分析的关键字检索方法,其特征在于:所述进行关键地理位置区域中心的划分方法步骤,包括:
步骤21:通过分散的关键字对应地理位置信息源,进行区域位置信息的搜集和加工,根据关键字对应文本内容信息的描述体构成区域位置信息库,通过选取和提炼关键字空间位置特征和主题内容的标示把区域位置信息变成有序化的组织形式进行存储;
步骤22:通过由近及远的查找空间位置关键点周围网格中的符合关键字要求的相同搜索用户,将每一个网格里的对象都按关键字分类,在查找中心点的过程中筛选掉不包含查询关键字的冗余用户,从而省去了为每一个用户专门调取文本信息一一验证是否符合关键字要求的时间;
步骤23:每个网格对应包含了在该网格中的所有用户的相关关键字集合;
步骤24:每个关键字对应一个列表用来存储在该网格中包含该关键字的所有集合,列表中的每一个元素用二元组表示,在网格中查找中心点集合时,通过查找该网格出现的所有关键字所对应的列表的集合求并集,得到符合关键字要求的文本对象对应的地理位置区域中心;
步骤25:根据地理位置区域中心构建检索路径,通过在存储和检索过程中使用统一的关键字空间位置特征标示,对用户的关键字、关键词检索标示或信息内容的形式特征和存储中的标示进行比较,当双方的标示相符时,从检索系统中把围绕地理位置区域中心相关的地理位置标示的数据信息按特定的要求进行输出。
6.根据权利要求5所述的一种基于智能分析的关键字检索方法,其特征在于:所述在基于语义理解的空间关键字检索场景下,给定一个空间关键字查询的步骤,包括:
基于语义理解的空间关键字检索场景下,根据用户的检索位置和提交关键字的检索请求,系统获得用户的查询位置信息和查询关键字,从查询关键词与空间文本对象的关键字的字符串匹配角度理解用户的查询意图,即同时考虑用户所在位置和查询关键字的检索,搜索引擎将利用概率主题模型对其进行语义化解析,得到用户关于空间文本对象的空间维度和语义维度上的其余需求偏好。
7.根据权利要求6所述的一种基于智能分析的关键字检索方法,其特征在于:所述进行语义化解析的方法步骤,包括:
步骤31:用户通过搜索引擎或查询系统向服务器发送数据,包括查询的关键字、关键词和用户的当前位置,系统利用文本语义化技术对用户查询关键字词进行语义解析,根据语义向量距离来度量对象和查询之间的文本相似度,根据文本相似度构建用户输入关键字、关键词对应的多需求意愿的结果集;
步骤32:对结果集中的数据进行预处理操作,提取关键字信息建立倒排索引表,提取空间节点信息建立空间树索引,当节点上包含关键字对应的空间位置信息时定义为位置节点,抽取和节点相关的属性、描述等信息的关键字信息构成该节点对应的关键字文档;
步骤33:结合步骤二中的主题,通过概率主题模型,将根据文本相似度得出结果集中的每个需求意愿定义为一个维度,再基于用户的当前位置,得到包含位置信息的节点,然后从该节点出发边遍历空间RDF图,查找到包含所有查询关键字的节点树;
步骤34:对于RDF图中的每个节点都对应一个关键字文档,根据每个节点的查询关键字文档和节点建立对应的倒排索引,根据所有包含空间位置信息的节点建立树索引。
8.根据权利要求7所述的一种基于智能分析的关键字检索方法,其特征在于:所述输出用户根据关键字、关键词得出的关于空间文本对象的空间维度和语义维度上的其余需求偏好位置内容的方法步骤,包括:
步骤41:通过语义解析得到的代表用户查询意图的形式化描述,转化关于关键字对应的用户意图偏好,每一个维度上的概率分布值反映用户对于该潜在主题的偏好程度;
步骤42:通过概率主题模型对查询输入以及空间文本对象的文本描述进行语义解析,分别得到其在高维空间的概率分布,基于语义理解的空间关键字查询通过距离度量方法进行相关性排序,然后输出与查询关联程度极高的多个空间文本对象;
步骤43:对于用户的每次输入检索,均通过提取查询位置信息、主要的查询关键字和符合条件的语义位置三个输入参数信息进行属性和语义的分析,输出关键字对应的地理位置标示和对应的多需求意愿的结果集,并根据关联度由高到低进行排序,依次输出返回给用户。
9.执行如权利要求1所述的一种基于智能分析的关键字检索方法的关键字检索系统,其特征在于:所述该系统包括:
空间网络数据分析模块,用于系统基于目标关键字对应的空间网络数据进行分析;
地理位置区域范围划分模块,用于;
检索路径构建模块,用于基于给出的具有坐标信息的主题进行关键字、关键词对应地理位置区域的范围划分;
语义化解析模块,用于搜索引擎将利用概率主题模型进行语义化解析;
需求偏好输出模块,用于输出用户根据关键字、关键词得出的关于空间文本对象的空间维度和语义维度上的其余需求偏好位置内容。。
10.根据权利要求9所述的关键字检索系统,其特征在于:所述空间网络数据分析模块包括:
空间位置属性模块,用于基于目标关键字对应的属于空间网络数据的地理位置信息进行分析;
文本内容属性模块,用于根据关键字对应的文本内容属性进行分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311554993.2A CN117271577B (zh) | 2023-11-21 | 2023-11-21 | 一种基于智能分析的关键字检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311554993.2A CN117271577B (zh) | 2023-11-21 | 2023-11-21 | 一种基于智能分析的关键字检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117271577A true CN117271577A (zh) | 2023-12-22 |
CN117271577B CN117271577B (zh) | 2024-03-15 |
Family
ID=89206683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311554993.2A Active CN117271577B (zh) | 2023-11-21 | 2023-11-21 | 一种基于智能分析的关键字检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117271577B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160373456A1 (en) * | 2015-06-16 | 2016-12-22 | Business Objects Software, Ltd. | Business intelligence (bi) query and answering using full text search and keyword semantics |
CN110377684A (zh) * | 2019-07-19 | 2019-10-25 | 辽宁工程技术大学 | 一种基于用户反馈的空间关键字个性化语义查询方法 |
CN110569367A (zh) * | 2019-09-10 | 2019-12-13 | 苏州大学 | 一种基于知识图谱的空间关键字查询方法、装置及设备 |
-
2023
- 2023-11-21 CN CN202311554993.2A patent/CN117271577B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160373456A1 (en) * | 2015-06-16 | 2016-12-22 | Business Objects Software, Ltd. | Business intelligence (bi) query and answering using full text search and keyword semantics |
CN110377684A (zh) * | 2019-07-19 | 2019-10-25 | 辽宁工程技术大学 | 一种基于用户反馈的空间关键字个性化语义查询方法 |
CN110569367A (zh) * | 2019-09-10 | 2019-12-13 | 苏州大学 | 一种基于知识图谱的空间关键字查询方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN117271577B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104239513B (zh) | 一种面向领域数据的语义检索方法 | |
CN102087669B (zh) | 基于语义关联的智能搜索引擎系统 | |
CN105045875B (zh) | 个性化信息检索方法及装置 | |
CN108846029B (zh) | 基于知识图谱的情报关联分析方法 | |
CN108932347B (zh) | 一种分布式环境下基于社会感知的空间关键字查询方法 | |
CN106874426B (zh) | 基于Storm的RDF流式数据关键词实时搜索方法 | |
CN107590128B (zh) | 一种基于高置信度特征属性分层聚类方法的论文同名作者消歧方法 | |
CN101350013A (zh) | 一种地理信息的搜索方法和系统 | |
CN106503223B (zh) | 一种结合位置和关键词信息的在线房源搜索方法及装置 | |
WO2004013772A2 (en) | System and method for indexing non-textual data | |
CN114218400A (zh) | 基于语义的数据湖查询系统及方法 | |
CN115563313A (zh) | 基于知识图谱的文献书籍语义检索系统 | |
CN103761286B (zh) | 一种基于用户兴趣的服务资源检索方法 | |
CN112015918A (zh) | 数据处理方法及装置 | |
CN109783599A (zh) | 基于多种存储介质的知识图谱检索方法及系统 | |
Saad et al. | Efficient skyline computation on uncertain dimensions | |
CN117708270A (zh) | 企业数据查询方法、装置、设备及存储介质 | |
WO2009064313A1 (en) | Correlation of data in a system and method for conducting a search | |
CN117271577B (zh) | 一种基于智能分析的关键字检索方法 | |
CN107291875B (zh) | 一种基于元数据图的元数据组织管理方法和系统 | |
CN110222156B (zh) | 发现实体的方法和装置、电子设备、计算机可读介质 | |
Zhao et al. | Integration of link and semantic relations for information recommendation | |
CN105159899A (zh) | 一种搜索的方法和装置 | |
Metre et al. | Efficient processing of continuous spatial-textual queries over geo-textual data stream | |
Chuang et al. | Improving the effectiveness of POI search by associated information summarization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |