CN113946760B - 一种基于导航数据的高效poi搜索方法 - Google Patents
一种基于导航数据的高效poi搜索方法 Download PDFInfo
- Publication number
- CN113946760B CN113946760B CN202111106851.0A CN202111106851A CN113946760B CN 113946760 B CN113946760 B CN 113946760B CN 202111106851 A CN202111106851 A CN 202111106851A CN 113946760 B CN113946760 B CN 113946760B
- Authority
- CN
- China
- Prior art keywords
- information
- search
- poi
- instruction
- search instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Remote Sensing (AREA)
- Navigation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于导航数据的高效POI搜索方法,包括:获取用户进行搜索的搜索指令,搜索指令包括目标搜索的POI;针对搜索指令进行识别,获得搜索指令识别结果;根据搜索指令识别结果在导航数据中进行POI信息搜索,得到POI搜索信息;对POI搜索信息进行信息融合,确定POI搜索结果;将POI搜索结果通过输出呈现给用户。本发明提出的一种基于导航数据的高效POI搜索方法,基于导航数据进行实时获取搜索结果,不仅成本消耗少,而且还能够对不同的输入数据规模实现高效快速搜索。
Description
技术领域
本发明涉及信息检索技术领域,特别涉及一种基于导航数据的高效POI搜索方法。
背景技术
POI搜索作为位置信息服务的基础技术之一,直接影响到用户的服务体。POI搜索在技术上与Web搜索一脉相承,支持用户搜索与地理位置相关的兴趣点,具有广阔的市场前景和巨大的应用价值。随着社会信息快速增长给人们生活带来的巨大的变化,人们身边都充斥着大量的信息,目前,在大规模数据的场景下进行POI搜索,建立索引的时间较长,索引存储开销较大,而且由于数据的大量化和多元化,在进行复杂度较高的搜索时,查询速度较慢,因此,本发明提出了一种基于导航数据的高效POI搜索方法,基于导航数据进行实时获取搜索结果,不仅成本消耗少,而且还能够对不同的输入数据规模实现高效快速搜索。
发明内容
本发明的目的在于提供一种基于导航数据的高效POI搜索方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于导航数据的高效POI搜索方法,包括:
获取用户进行搜索的搜索指令,所述搜索指令包括目标搜索的POI;
针对所述搜索指令进行识别,获得搜索指令识别结果;
根据所述搜索指令识别结果在导航数据中进行POI信息搜索,得到POI搜索信息;
对所述POI搜索信息进行信息融合,确定POI搜索结果;
将所述POI搜索结果通过输出呈现给所述用户。
进一步地,所述获取用户进行搜索的搜索指令时,获取用户进行搜索的搜索指令的方法包括:手动输入搜索信息获取搜索指令和语音输入搜索信息获取搜索指令。
进一步地,所述手动输入搜索信息获取搜索指令时,搜索信息的类型包括:关键词和与关键词相关的短语。
进一步地,针对所述搜索指令进行识别,包括:解析所述搜索指令,针对所述搜索指令进行输入方法判断,判断所述搜索指令是通过手动输入搜索信息得到的,还是通过语音输入搜索信息得到的,得到指令解析结果;根据所述指令解析结果进行识别得到POI搜索信息;当所述搜索指令是通过手动输入搜索信息得到的时候,针对所述用户输入的搜索信息进行语义分割,并将所述搜索信息中虚词剔除后得到搜索指令识别结果;当所述搜索指令是通过语音输入搜索信息得到的时候,针对所述搜索指令进行预处理,得到有效语音信号;对所述有效语音信号进行分析得到有效语音信号特征参数;结合所述有效语音信号特征参数识别所述搜索指令中文字信息,得到搜索指令文字信息;在所述搜索指令文字信息中搜索关键词提取出来得到搜索指令识别结果。
进一步地,所述导航数据中文本数据采用倒排引索的结构。
进一步地,根据所述搜索指令识别结果在导航数据中进行POI信息搜索,包括:
针对所述搜索指令识别结果中搜索特征信息进行搜索预处理,将所述搜索特征信息进行标准化处理得到搜索指令识别结果的预处理信息;
根据所述搜索指令识别结果的预处理信息在所述导航数据中依次进行POI信息搜索,得到POI搜索信息。
进一步地,所述搜索预处理包括:
在所述搜索指令识别结果中对搜索特征信息依次进行第一判断,判断所述搜索特征信息是否为不完整信息,如果是不完整信息,则针对不完整信息进行补充,得到第一判断结果信息,所述第一判断结果信息包括完整情况下的搜索特征信息和不完整情况下补充后的搜索特征信息;
针对所述第一判断结果信息依次进行第二判断,判断所述第一判断结果信息是否存在错误信息,所述错误信息包括:错别字、空格、符号和数字,当所述第一判断结果信息存在错误信息时,针对所述错误信息进行分析与纠正,得到第二判断结果信息,所述第二判断结果信息包括存在错误信息且将错误信息纠正后的第一判断结果信息以及不存在错误信息的第一判断结果信息;
根据重复过滤原则将所述第二判断结果信息中重复信息过滤掉,得到搜索指令识别结果的预处理信息。
进一步地,根据所述搜索指令识别结果的预处理信息在所述导航数据中依次进行POI信息搜索,包括:
将所述搜索指令识别结果的预处理信息按照信息属性分为空间属性信息和非空间属性信息,所述空间属性信息包括:经度信息和纬度信息,所述非空间属性信息包括:名称信息和地址信息;
对于所述空间属性信息,根据所述搜索指令识别结果的预处理信息进行空间属性信息搜索得到空间属性初步搜索信息,在所述空间属性初步搜索信息中结合允许差值范围确定空间属性搜索信息;
对于所述非空间属性信息,根据所述搜索指令识别结果的预处理信息进行非空间属性信息搜索时,当所述非空间属性信息是名称信息时,将所述搜索指令识别结果的预处理信息中名称信息以及所述导航数据中的名称信息经过分词处理后分别得到第一名称向量和第二名称向量集合;将第二名称向量中的子向量与所述第一名称向量进行元素合并,得到合并向量;分别计算所述合并向量中子元素在所述第一名称向量和所述第二名称向量中的子向量中的语音分数,得到第一语义向量和第二语义向量;根据所述第一语义向量和第二语义向量得到所述搜索指令识别结果的预处理信息中名称信息与所述导航数据中子信息的相似度;进而根据所述相似度确定非空间属性搜索信息;当所述非空间属性信息是地址信息时,针对所述搜索指令识别结果的预处理信息中地址信息进行分级,以镇信息作为分界线,省、市、区、镇为第一等级,乡、街道、路、门牌号为第二等级,并确定所述第一等级的权值和所述第二等级的权值;针对所述第一等级信息计算第一语义相似度,针对所述第二等级信息计算第二语义相似度;将所述第一语义相似度和所述第二语义相似度结合所述第一等级的权值和所述第二等级的权值得到所述搜索指令识别结果的预处理信息中地址信息与所述导航数据中子信息的相似度;进而根据所述相似度确定非空间属性搜索信息;
将所述空间属性搜索信息和所述非空间属性搜索信息进行信息融合与剔除,得到POI搜索信息。
进一步地,对所述POI搜索信息进行信息融合,包括:针对所述搜索指令进行判断,判断所述搜索指令是复合指令还是简单指令,当所述搜索指令是复合指令时,将所述POI搜索信息进行复合融合,并确定POI搜索结果,当所述搜索指令是简单指令时,所述POI搜索信息即为POI搜索结果。
进一步地,将所述POI搜索结果通过输出呈现给所述用户时,针对所述POI搜索结果中包含的POI进行客观评价后根据客观评价结果按照优先次序排列呈现。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明所述的高效POI搜索方法的步骤示意图;
图2为本发明所述的高效POI搜索方法中步骤三的示意图;
图3为本发明所述的高效POI搜索方法中步骤三的S301的示意图;
图4为本发明所述的高效POI搜索方法中步骤三的S302的示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,本发明实施例提供了一种基于导航数据的高效POI搜索方法,包括:
步骤一、获取用户进行搜索的搜索指令,所述搜索指令包括目标搜索的POI;
步骤二、针对所述搜索指令进行识别,获得搜索指令识别结果;
步骤三、根据所述搜索指令识别结果在导航数据中进行POI信息搜索,得到POI搜索信息;
步骤四、对所述POI搜索信息进行信息融合,确定POI搜索结果;
步骤五、将所述POI搜索结果通过输出呈现给所述用户。
上述技术方案提供的一种基于导航数据的高效POI搜索方法在进行POI搜索时,首先,获取用户进行搜索的搜索指令,并且在搜索指令中至少包括一个目标搜索的POI;然后,针对搜索指令进行识别,将搜索指令中包含目标搜索的POI的关键信息识别处理,从而得到搜索指令识别结果;接着,根据搜索指令识别结果,将目标搜索的POI的关键信息依次在导航数据中进行POI信息搜索,得到POI搜索信息;然后再将得到的POI搜索信息进行信息融合,去掉重复信息的赘余,得到POI搜索结果;最后,将POI搜索结果输出呈现给用户。
上述技术方案在进行POI搜索时,通过在导航数据中进行POI信息搜索能够使得获取实时搜索结果,而且导航数据中的信息是实时更新的,从而使得获得的搜索结果更加准确,并且在POI搜索过程中,无需针对较多数据进行索引存储,有效降低了成本消耗,此外,本发明提供的一种基于导航数据的高效POI搜索方法,步骤简单,不涉及复杂步骤,能够针对目标搜索的POI快速得到POI搜索结果,有效提高POI搜索的效率,即使对多个目标搜索的POI也能够快速得到与目标搜索的POI对应的POI搜索结果。
本发明提供的一个实施例中,所述获取用户进行搜索的搜索指令时,获取用户进行搜索的搜索指令的方法包括:手动输入搜索信息获取搜索指令和语音输入搜索信息获取搜索指令。
上述技术方案在获取用户进行搜索的搜索指令时,既可以通过手动输入搜索信息获取搜索指令,也可以通过语音输入搜索信息获取搜索指令。上述技术方案通过语言输入搜索信息获取搜索指令能够使得用户在不方便手动输入搜索信息获取搜索指令时也能够进行POI搜索,而且语音输入搜索信息获取搜索指令不仅方便,而容易实现,并且还能够提高获取搜索指令的效率,从而提高POI搜索效率。
本发明提供的一个实施例中,所述手动输入搜索信息获取搜索指令时,搜索信息的类型包括:关键词和与关键词相关的短语。
上述技术方案中,在手动输入搜索信息获取搜索指令时,既可以通过输入关键词获取搜索指令,也可以通过输入与关键词相关的短语获取搜索指令。
上述技术方案通过输入关键词或者与关键词相关的短语从而获得搜索指令不仅方便搜索,而且还能够减少输入搜索信息消耗的时间与经历,进而还能够提升用户的体验感。
本发明提供的一个实施例中,针对所述搜索指令进行识别,包括:解析所述搜索指令,针对所述搜索指令进行输入方法判断,判断所述搜索指令是通过手动输入搜索信息得到的,还是通过语音输入搜索信息得到的,得到指令解析结果;根据所述指令解析结果进行识别得到POI搜索信息;当所述搜索指令是通过手动输入搜索信息得到的时候,针对所述用户输入的搜索信息进行语义分割,并将所述搜索信息中虚词剔除后得到搜索指令识别结果;当所述搜索指令是通过语音输入搜索信息得到的时候,针对所述搜索指令进行预处理,得到有效语音信号;对所述有效语音信号进行分析得到有效语音信号特征参数;结合所述有效语音信号特征参数识别所述搜索指令中文字信息,得到搜索指令文字信息;在所述搜索指令文字信息中搜索关键词提取出来得到搜索指令识别结果。
上述技术方案在针对搜索指令进行识别时,首先,解析搜索指令,在解析搜索指令时,对搜索指令进行输入方法判断,判断搜索指令是通过哪种方式输入搜索信息得到搜索指令的,从而得到指令解析结果;然后,根据指令解析结果进行识别得到POI搜索信息,如果搜索指令是通过手动输入搜索信息得到,则针对用户输入的搜索信息进行语义分割,接着再将搜索信息中虚词剔除,得到搜索指令识别结果;如果搜索指令是通过语音输入搜索信息得到,则先对搜索指令进行预处理,得到有效语音信号;并在有效语音信号中进行特征分析得到有效语音信号特征参数,再结合有效语音信号特征参数识别搜索指令中文字信息,得到搜索指令文字信息,从而在搜索指令文字信息中搜索关键词提取出来得到搜索指令识别结果。
上述技术方案在对搜索指令进行识别时,通过解析搜索指令确定搜索指令进行输入方法,从而按照搜索指令的输入方法采取不同的识别方法进行识别,进而提高搜索指令识别的准确性,而且,对于手动输入搜索信息得到的搜索指令在识别时直接将搜索信息中的虚词进行剔除得到搜索指令识别结果,不仅能够快速得到搜索指令识别结果,而且还能够去除虚词的赘余与影响,有效降低复杂程度以及出错概率,对于语音输入搜索信息得到的搜索指令通过进行预处理使得语音信号中无关信号过滤,从而使得有效语音信号更加精准,并且根据有效语音信号特征参数将识别出来的搜索指令中文字信息中搜索关键词提取出来得到搜索指令识别结果能够使得搜索指令识别结果更加精炼。
本发明提供的一个实施例中,所述导航数据中文本数据采用倒排引索的结构。
上述技术方案中,导航数据中文本数据采用倒排引索的结构。上述技术方案通过对导航数据的文本数据构建倒排索引可以根据特征词快速获取包含这个特征词的文本文档,用以更好地支持基于导航数据的POI搜索技术。
如图2所示,本发明提供的一个实施例中,根据所述搜索指令识别结果在导航数据中进行POI信息搜索,包括:
针对所述搜索指令识别结果中搜索特征信息进行搜索预处理,将所述搜索特征信息进行标准化处理得到搜索指令识别结果的预处理信息;
根据所述搜索指令识别结果的预处理信息在所述导航数据中依次进行POI信息搜索,得到POI搜索信息。
上述技术方案在根据搜索指令识别结果在导航数据中进行POI信息搜索时,首先,针对搜索指令识别结果中搜索特征信息进行搜索预处理,将搜索特征信息进行标准化处理得到搜索指令识别结果的预处理信息;然后,根据搜索指令识别结果的预处理信息在导航数据中依次进行POI信息搜索,得到POI搜索信息。
上述技术方案通过对搜索指令识别结果中搜索特征信息进行搜索预处理能够使得在根据搜索特征信息进行POI信息搜索时与导航数据中的信息具有统一的标准化形式,进而提高POI信息搜索的效率,而且还能够确保POI搜索信息准确性。
如图3所示,本发明提供的一个实施例中,所述搜索预处理包括:
在所述搜索指令识别结果中对搜索特征信息依次进行第一判断,判断所述搜索特征信息是否为不完整信息,如果是不完整信息,则针对不完整信息进行补充,得到第一判断结果信息,所述第一判断结果信息包括完整情况下的搜索特征信息和不完整情况下补充后的搜索特征信息;
针对所述第一判断结果信息依次进行第二判断,判断所述第一判断结果信息是否存在错误信息,所述错误信息包括:错别字、空格、符号和数字,当所述第一判断结果信息存在错误信息时,针对所述错误信息进行分析与纠正,得到第二判断结果信息,所述第二判断结果信息包括存在错误信息且将错误信息纠正后的第一判断结果信息以及不存在错误信息的第一判断结果信息;
根据重复过滤原则将所述第二判断结果信息中重复信息过滤掉,得到搜索指令识别结果的预处理信息。
上述技术方案在进行搜索预处理包括:在搜索指令识别结果中对搜索特征信息依次进行第一判断,判断搜索特征信息是否为不完整信息,如果是不完整信息,则针对不完整信息进行补充,得到第一判断结果信息,第一判断结果信息包括完整情况下的搜索特征信息和不完整情况下补充后的搜索特征信息;例如,标准的地址信息为xx省+xx市+xx区+xx镇+xx乡+xx街道+xx路+xx门牌号+附加信息,通过第一判断将搜索特征信息中地址信息进行补充,从而得到标准状态下的搜索特征信息。针对第一判断结果信息依次进行第二判断,判断第一判断结果信息是否存在错误信息,错误信息包括:错别字、空格、符号和数字,当第一判断结果信息存在错误信息时,针对错误信息进行分析与纠正,得到第二判断结果信息,第二判断结果信息包括存在错误信息且将错误信息纠正后的第一判断结果信息以及不存在错误信息的第一判断结果信息;在判断错别字时,建立拼音和汉字对照的词库实现拼音和汉字之间的双向查询,将汉字转为拼音再比较,同时还要注意多音字的处理。根据重复过滤原则将第二判断结果信息中重复信息过滤掉,得到搜索指令识别结果的预处理信息。
上述技术方案通过预处理使得能够对不完整信息进行准确搜索,提高POI搜索的适用范围,降低对用户输入搜索信息的要求,而且还能够针对错误信息进行纠错,提高POI搜索的容错率,同时还能够降低POI搜索过程中出错概率,提高POI搜索方法的准确度,并且通过根据重复过滤原则将第二判断结果信息中重复信息过滤掉能够有效避免在对同一个POI进行搜索时将相同信息进行多次搜索,减少信息冗余,从而有效提高POI搜索效率。
如图4所示,本发明提供的一个实施例中,根据所述搜索指令识别结果的预处理信息在所述导航数据中依次进行POI信息搜索,包括:
将所述搜索指令识别结果的预处理信息按照信息属性分为空间属性信息和非空间属性信息,所述空间属性信息包括:经度信息和纬度信息,所述非空间属性信息包括:名称信息和地址信息;
对于所述空间属性信息,根据所述搜索指令识别结果的预处理信息进行空间属性信息搜索得到空间属性初步搜索信息,在所述空间属性初步搜索信息中结合允许差值范围确定空间属性搜索信息;
对于所述非空间属性信息,根据所述搜索指令识别结果的预处理信息进行非空间属性信息搜索时,当所述非空间属性信息是名称信息时,将所述搜索指令识别结果的预处理信息中名称信息以及所述导航数据中的名称信息经过分词处理后分别得到第一名称向量和第二名称向量集合;将第二名称向量中的子向量与所述第一名称向量进行元素合并,得到合并向量;分别计算所述合并向量中子元素在所述第一名称向量和所述第二名称向量中的子向量中的语音分数,得到第一语义向量和第二语义向量;根据所述第一语义向量和第二语义向量得到所述搜索指令识别结果的预处理信息中名称信息与所述导航数据中子信息的相似度;进而根据所述相似度确定非空间属性搜索信息;当所述非空间属性信息是地址信息时,针对所述搜索指令识别结果的预处理信息中地址信息进行分级,以镇信息作为分界线,省、市、区、镇为第一等级,乡、街道、路、门牌号为第二等级,并确定所述第一等级的权值和所述第二等级的权值;针对所述第一等级信息计算第一语义相似度,针对所述第二等级信息计算第二语义相似度;将所述第一语义相似度和所述第二语义相似度结合所述第一等级的权值和所述第二等级的权值得到所述搜索指令识别结果的预处理信息中地址信息与所述导航数据中子信息的相似度;进而根据所述相似度确定非空间属性搜索信息;
将所述空间属性搜索信息和所述非空间属性搜索信息进行信息融合与剔除,得到POI搜索信息。
上述技术方案在根据搜索指令识别结果在导航数据中进行POI信息搜索时,首先,将搜索指令识别结果的预处理信息按照信息属性分为空间属性信息和非空间属性信息,其中,空间属性信息包括:经度、纬度等,非空间属性信息包括:名称、地址等文本类信息;然后,在空间属性信息中,根据搜索指令识别结果的预处理信息进行空间属性信息搜索得到空间属性初步搜索信息,在空间属性初步搜索信息中结合允许差值范围确定空间属性搜索信息;在非空间属性信息中,根据搜索指令识别结果的预处理信息进行非空间属性信息搜索时,通过语义相似度计算后结合特征权值确定非空间属性搜索信息;如果非空间属性信息是名称信息,则先是将搜索指令识别结果的预处理信息中名称信息以及导航数据中的名称信息经过分词处理后分别得到第一名称向量和第二名称向量集合;然后将第二名称向量中的子向量与第一名称向量进行元素合并,得到合并向量;接着分别计算合并向量中子元素在第一名称向量和第二名称向量中的子向量中的语音分数,得到第一语义向量和第二语义向量;最后根据第一语义向量和第二语义向量得到搜索指令识别结果的预处理信息中名称信息与导航数据中子信息的相似度,从而根据相似度确定非空间属性搜索信息;如果非空间属性信息是地址信息,则先是针对搜索指令识别结果的预处理信息中地址信息进行分级,以镇信息作为分界线,省、市、区、镇为第一等级,乡、街道、路、门牌号为第二等级,同时确定第一等级的权值和第二等级的权值;然后针对第一等级信息和第二等级信息分别计算第一语义相似度和第二语义相似度;最后将第一语义相似度和第二语义相似度结合第一等级的权值和第二等级的权值得到搜索指令识别结果的预处理信息中地址信息与导航数据中子信息的相似度,从而根据相似度确定非空间属性搜索信息。其中,在根据第一语义向量和第二语义向量得到搜索指令识别结果的预处理信息中名称信息与导航数据中子信息的相似度时,通过如下公式得到搜索指令识别结果的预处理信息中名称信息与导航数据中子信息的相似度:
上述公式中,YXSij表示搜索指令识别结果的预处理信息中名称信息与导航数据中子信息的相似度,aj表示合并向量中第j个子元素在第一名称向量在的语音分数,bij表示合并向量中第j个子元素在第二名称向量在的语音分数。
在将第一语义相似度和第二语义相似度结合第一等级的权值和第二等级的权值得到搜索指令识别结果的预处理信息中地址信息与导航数据中子信息的相似度时,通过如下公式确定搜索指令识别结果的预处理信息中地址信息与导航数据中子信息的相似度:
上述公式中,YXSk表示搜索指令识别结果的预处理信息中地址信息与导航数据中第k个子信息的相似度,hl表示第l等级的权值,YSMkl表示关于第l等级的语义相似度。
最后,将空间属性搜索信息和非空间属性搜索信息进行信息融合与剔除,得到POI搜索信息。
上述技术方案通过根据搜索指令识别结果在导航数据中进行POI信息搜索能够使得POI搜索信息更加精炼,而且对于空间属性信息和非空间属性信息采用不同的处理方法得到搜索信息,从而提高提高POI搜索信息的准确性,并且在空间属性信息中能够根据空间属性信息准确且快速搜索到符合要求的搜索信息,从而快速得到空间属性搜索信息,在非空间属性信息中,通过语义相似度来确定非空间属性搜索信息有效避免了个人表述差异带来的搜索误差,使得即使出现个人习惯表述不一致也能够搜索出来准确结果,避免非空间属性搜索信息出现遗漏,提高非空间属性搜索信息的准确性。
本发明提供的一个实施例中,对所述POI搜索信息进行信息融合,包括:针对所述搜索指令进行判断,判断所述搜索指令是复合指令还是简单指令,当所述搜索指令是复合指令时,将所述POI搜索信息进行复合融合,并确定POI搜索结果,当所述搜索指令是简单指令时,所述POI搜索信息即为POI搜索结果。
上述技术方案在对POI搜索信息进行信息融合时,根据搜索指令的类型确定POI搜索结果,判断搜索指令是复合指令还是简单指令,如果搜索指令是复合指令,则将POI搜索信息进行复合融合,并确定POI搜索结果,如果搜索指令是简单指令,则POI搜索信息即为POI搜索结果。上述技术方案通过对POI搜索信息进行信息融合能够使得针对复杂的搜索指令也能够准确获得POI搜索结果,从而使得具有良好的可扩展性,满足用户查询的可用性和高效性需求。
本发明提供的一个实施例中,将所述POI搜索结果通过输出呈现给所述用户时,针对所述POI搜索结果中包含的POI进行客观评价后根据客观评价结果按照优先次序排列呈现。
上述技术方案在将POI搜索结果通过输出呈现给用户时,先对POI搜索结果中包含的POI进行客观评价,再根据客观评价结果按照优先次序排列呈现。上述技术方案通过进行客观评价后根据客观评价结果按照优先次序排列呈现能够使得用户能够直观在POI搜索结果中了解POI搜索得到的信息,而且关联度较高在前面,越往下关联度越低。
本领域技术人员应当理解的是,本发明中的第一、第二仅仅指的是不同应用阶段而已。
本领域技术客户员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (8)
1.一种基于导航数据的高效POI搜索方法,其特征在于,包括:
获取用户进行搜索的搜索指令,所述搜索指令包括目标搜索的POI;
针对所述搜索指令进行识别,获得搜索指令识别结果;
根据所述搜索指令识别结果在导航数据中进行POI信息搜索,得到POI搜索信息,包括:针对所述搜索指令识别结果中搜索特征信息进行搜索预处理,将所述搜索特征信息进行标准化处理得到搜索指令识别结果的预处理信息;根据所述搜索指令识别结果的预处理信息在所述导航数据中依次进行POI信息搜索,得到POI搜索信息,包括:
将所述搜索指令识别结果的预处理信息按照信息属性分为空间属性信息和非空间属性信息,所述空间属性信息包括:经度信息和纬度信息,所述非空间属性信息包括:名称信息和地址信息;
对于所述空间属性信息,根据所述搜索指令识别结果的预处理信息进行空间属性信息搜索得到空间属性初步搜索信息,在所述空间属性初步搜索信息中结合允许差值范围确定空间属性搜索信息;
对于所述非空间属性信息,根据所述搜索指令识别结果的预处理信息进行非空间属性信息搜索时,当所述非空间属性信息是名称信息时,将所述搜索指令识别结果的预处理信息中名称信息以及所述导航数据中的名称信息经过分词处理后分别得到第一名称向量和第二名称向量集合;将第二名称向量中的子向量与所述第一名称向量进行元素合并,得到合并向量;分别计算所述合并向量中子元素在所述第一名称向量和所述第二名称向量中的子向量中的语义分数,得到第一语义向量和第二语义向量;根据所述第一语义向量和第二语义向量得到所述搜索指令识别结果的预处理信息中名称信息与所述导航数据中子信息的相似度;进而根据所述相似度确定非空间属性搜索信息;当所述非空间属性信息是地址信息时,针对所述搜索指令识别结果的预处理信息中地址信息进行分级,以镇信息作为分界线,省、市、区、镇为第一等级,乡、街道、路、门牌号为第二等级,并确定所述第一等级的权值和所述第二等级的权值;针对所述第一等级信息计算第一语义相似度,针对所述第二等级信息计算第二语义相似度;将所述第一语义相似度和所述第二语义相似度结合所述第一等级的权值和所述第二等级的权值得到所述搜索指令识别结果的预处理信息中地址信息与所述导航数据中子信息的相似度;进而根据所述相似度确定非空间属性搜索信息;
将所述空间属性搜索信息和所述非空间属性搜索信息进行信息融合与剔除,得到POI搜索信息;
对所述POI搜索信息进行信息融合,确定POI搜索结果;
将所述POI搜索结果通过输出呈现给所述用户。
2.根据权利要求1所述的高效POI搜索方法,其特征在于,所述获取用户进行搜索的搜索指令时,获取用户进行搜索的搜索指令的方法包括:手动输入搜索信息获取搜索指令和语音输入搜索信息获取搜索指令。
3.根据权利要求2所述的高效POI搜索方法,其特征在于,所述手动输入搜索信息获取搜索指令时,搜索信息的类型包括:关键词和与关键词相关的短语。
4.根据权利要求2所述的高效POI搜索方法,其特征在于,针对所述搜索指令进行识别,包括:解析所述搜索指令,针对所述搜索指令进行输入方法判断,判断所述搜索指令是通过手动输入搜索信息得到的,还是通过语音输入搜索信息得到的,得到指令解析结果;根据所述指令解析结果进行识别得到POI搜索信息;当所述搜索指令是通过手动输入搜索信息得到的时候,针对所述用户输入的搜索信息进行语义分割,并将所述搜索信息中虚词剔除后得到搜索指令识别结果;当所述搜索指令是通过语音输入搜索信息得到的时候,针对所述搜索指令进行预处理,得到有效语音信号;对所述有效语音信号进行分析得到有效语音信号特征参数;结合所述有效语音信号特征参数识别所述搜索指令中文字信息,得到搜索指令文字信息;将所述搜索指令文字信息中搜索关键词提取出来得到搜索指令识别结果。
5.根据权利要求1所述的高效POI搜索方法,其特征在于,所述导航数据中文本数据采用倒排索引的结构。
6.根据权利要求1所述的高效POI搜索方法,其特征在于,所述搜索预处理包括:
在所述搜索指令识别结果中对搜索特征信息依次进行第一判断,判断所述搜索特征信息是否为不完整信息,如果是不完整信息,则针对不完整信息进行补充,得到第一判断结果信息,所述第一判断结果信息包括完整情况下的搜索特征信息和不完整情况下补充后的搜索特征信息;
针对所述第一判断结果信息依次进行第二判断,判断所述第一判断结果信息是否存在错误信息,所述错误信息包括:错别字、空格、符号和数字,当所述第一判断结果信息存在错误信息时,针对所述错误信息进行分析与纠正,得到第二判断结果信息,所述第二判断结果信息包括存在错误信息且将错误信息纠正后的第一判断结果信息以及不存在错误信息的第一判断结果信息;
根据重复过滤原则将所述第二判断结果信息中重复信息过滤掉,得到搜索指令识别结果的预处理信息。
7.根据权利要求1所述的高效POI搜索方法,其特征在于,对所述POI搜索信息进行信息融合,包括:针对所述搜索指令进行判断,判断所述搜索指令是复合指令还是简单指令,当所述搜索指令是复合指令时,将所述POI搜索信息进行复合融合,并确定POI搜索结果,当所述搜索指令是简单指令时,所述POI搜索信息即为POI搜索结果。
8.根据权利要求1所述的高效POI搜索方法,其特征在于,将所述POI搜索结果通过输出呈现给所述用户时,针对所述POI搜索结果中包含的POI进行客观评价后根据客观评价结果按照优先次序排列呈现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111106851.0A CN113946760B (zh) | 2021-09-22 | 2021-09-22 | 一种基于导航数据的高效poi搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111106851.0A CN113946760B (zh) | 2021-09-22 | 2021-09-22 | 一种基于导航数据的高效poi搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113946760A CN113946760A (zh) | 2022-01-18 |
CN113946760B true CN113946760B (zh) | 2022-06-24 |
Family
ID=79328879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111106851.0A Active CN113946760B (zh) | 2021-09-22 | 2021-09-22 | 一种基于导航数据的高效poi搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113946760B (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4632096B2 (ja) * | 2007-06-07 | 2011-02-16 | ソニー株式会社 | ナビゲーション装置及び最寄検索方法 |
CN101226063A (zh) * | 2008-01-30 | 2008-07-23 | 深圳市戴文科技有限公司 | 一种获取导航信息的方法、移动终端和导航系统 |
-
2021
- 2021-09-22 CN CN202111106851.0A patent/CN113946760B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113946760A (zh) | 2022-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145281B (zh) | 语音识别方法、装置及存储介质 | |
EP2631814B1 (en) | Method for mapping text phrases to geographical locations | |
US20080010259A1 (en) | Natural language based location query system, keyword based location query system and a natural language and keyword based location query system | |
CN114036930A (zh) | 文本纠错方法、装置、设备及计算机可读介质 | |
CN107203526B (zh) | 一种查询串语义需求分析方法及装置 | |
CN101539907A (zh) | 词性标注模型训练装置、词性标注系统及其方法 | |
CN109065020B (zh) | 多语言类别的识别库匹配方法及系统 | |
CN106570180A (zh) | 基于人工智能的语音搜索方法及装置 | |
CN110232112A (zh) | 文章中关键词提取方法及装置 | |
CN111292751A (zh) | 语义解析方法及装置、语音交互方法及装置、电子设备 | |
CN103914455B (zh) | 一种兴趣点检索方法和装置 | |
CN112256845A (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
CN111930793A (zh) | 目标行为挖掘与检索分析方法、系统、计算机设备及应用 | |
Mokhtari et al. | Tagging address queries in maps search | |
CN108304411A (zh) | 地理位置语句的语义识别方法和装置 | |
CN112989811B (zh) | 一种基于BiLSTM-CRF的历史典籍阅读辅助系统及其控制方法 | |
CN111104503A (zh) | 一种建筑工程质量验收规范问答系统及其构建方法 | |
CN113094547B (zh) | 日语在线视频语料中特定动作视频片断检索方法 | |
CN116955541B (zh) | 融合地理要素语义分割与相似度的地址匹配方法和系统 | |
CN104615621A (zh) | 搜索中的相关性处理方法和系统 | |
Yang et al. | Vocabulary expansion through automatic abbreviation generation for Chinese voice search | |
CN113946760B (zh) | 一种基于导航数据的高效poi搜索方法 | |
CN110232160B (zh) | 兴趣点变迁事件检测方法、装置及存储介质 | |
CN116662583A (zh) | 一种文本生成方法、地点检索方法及相关装置 | |
CN103901450A (zh) | 语音导航方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |