CN110609880A - 一种信息查询方法、装置及电子设备 - Google Patents
一种信息查询方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110609880A CN110609880A CN201810621736.9A CN201810621736A CN110609880A CN 110609880 A CN110609880 A CN 110609880A CN 201810621736 A CN201810621736 A CN 201810621736A CN 110609880 A CN110609880 A CN 110609880A
- Authority
- CN
- China
- Prior art keywords
- query
- word
- interest
- type
- inquiry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000011218 segmentation Effects 0.000 claims abstract description 97
- 238000002372 labelling Methods 0.000 claims abstract description 86
- 238000012549 training Methods 0.000 claims description 21
- 239000002131 composite material Substances 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 239000003208 petroleum Substances 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种信息查询方法、装置及电子设备。该地图查询方法包括:对用户输入的查询信息进行分词获得分词结果;对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。上述技术方案中,通过兴趣词标注和意图识别来获得查询类型,通过查询类型表征用户的查询意图,由此进行地图查询,解决了现有技术中对复杂查询信息的地图查询准确性较低的技术问题,提高了地图查询的准确性。
Description
技术领域
本发明涉及软件技术领域,特别涉及一种信息查询方法、装置及电子设备。
背景技术
随着地图应用程序的不断发展及完善,不仅提供了全面的地理位置搜索,实时的交通路况,还提供了合理的路径规划和导航,给人们日常的生活出行提供了巨大的帮助。
目前,在地图中的信息查询方法是通过用户输入明确的查询地址,若非地址查询还需要用户指明查询意图,如选择停车场查询、酒店查询、公交查询等,即现在的地图查询无法很好的识别用户的查询意图,尤其是在用户输入的查询信息较为复杂时如:在地图搜索框中输入“开车不走高速去XXX广场东侧500米的XX停车场”,现有的地图查询无法获得准确的查询结果。随着语音输入技术的不断发展,语音输入的使用越来越多,而在语音输入时,用户更倾向于输入复杂的查询信息。为此,亟需一种新的地图查询方法,来获取用户查询意图,提高地图查询的准确性。
发明内容
本发明实施例提供一种信息查询方法、装置及电子设备,用于实现对用户地图查询意图的获取,提高地图查询的准确性。
本发明实施例提供一种信息查询方法,所述方法包括:
对用户输入的查询信息进行分词获得分词结果;
对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
可选的,对所述分词结果进行兴趣词标注获得标注序列,包括:
对所述分词结果进行预设类型的兴趣词识别,并对所述分词结果中包含的预设类型的兴趣词进行标注获得标注序列。
可选的,所述预设类型的兴趣词包括:方位词、空间关系词和/或动词。
可选的,对所述分词结果进行预设类型的兴趣词识别,包括:
基于预设词库对所述分词结果进行预设类型的兴趣词识别,获得第一兴趣词及未识别词;
基于输入法语料、地图搜索语料和/或网页搜索语料,对所述未识别词进行标注训练,获得所述未识别词中的第二兴趣词及所述第二兴趣词所属的类型;
对所述第一兴趣词和所述第二兴趣词进行兴趣词标注获得所述标注序列。
可选的,所述预设词库的建立方法包括:
对兴趣词词库进行分类提取;
对输入法语料、地图搜索语料和/或网页搜索语料进行分类训练;
根据所述分类提取和所述分类训练获得的兴趣词及兴趣词类型建立所述预设词库,其中,所述预设词库中的兴趣词类型包括道路词、后缀词、品牌词、行政区域词、公交词、方位词、空间关系词及动词。
可选的,所述查询类型包括:
公交查询、地址查询、导航查询、路况查询、时间查询、距离查询和/或复合查询,其中,所述复合查询对应的查询信息中包含至少两个实体。
可选的,根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果,包括:
若所述查询类型为所述复合查询,根据所述标注序列从所述查询信息中的至少两个实体中获得目标实体;
将所述目标实体作为查询目标进行地图查询,获取并展现查询结果。
可选的,对用户输入的查询信息进行分词获得分词结果,包括:
基于最大匹配算法的中文文本识别系统对用户输入的查询信息进行分词获得分词结果。
本发明实施例还提供一种信息查询装置,包括:
分词单元,用于对用户输入的查询信息进行分词获得分词结果;
标注单元,用于对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
识别单元,用于根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
查询单元,用于根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
可选的,所述标注单元具体用于:
对所述分词结果进行预设类型的兴趣词识别,并对所述分词结果中包含的预设类型的兴趣词进行标注获得标注序列。
可选的,所述预设类型的兴趣词包括:方位词、空间关系词和/或动词。
可选的,所述标注单元还用于:
基于预设词库对所述分词结果进行预设类型的兴趣词识别,获得第一兴趣词及未识别词;
基于输入法语料、地图搜索语料和/或网页搜索语料,对所述未识别词进行标注训练,获得所述未识别词中的第二兴趣词及所述第二兴趣词所属的类型;
对所述第一兴趣词和所述第二兴趣词进行兴趣词标注获得所述标注序列。
可选的,所述装置还包括:
训练单元,用于对兴趣词词库进行分类提取;对输入法语料、地图搜索语料和/或网页搜索语料进行分类训练;根据所述分类提取和所述分类训练获得的兴趣词及兴趣词类型建立所述预设词库,其中,所述预设词库中的兴趣词类型包括道路词、后缀词、品牌词、行政区域词、公交词、方位词、空间关系词及动词。
可选的,所述查询类型包括:
公交查询、地址查询、导航查询、路况查询、时间查询、距离查询和/或复合查询,其中,所述复合查询对应的查询信息中包含至少两个实体。
可选的,所述查询单元还用于:
若所述查询类型为所述复合查询,根据所述标注序列从所述查询信息中的至少两个实体中获得目标实体;
将所述目标实体作为查询目标进行地图查询,获取并展现查询结果。
可选的,所述分词单元具体用于:
基于最大匹配算法的中文文本识别系统对用户输入的查询信息进行分词获得分词结果。
本发明实施例还提供的一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对用户输入的查询信息进行分词获得分词结果;
对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
本发明实施例还提供的一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
对用户输入的查询信息进行分词获得分词结果;
对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
本申请实施例中的上述一个或多个技术方案,至少具有如下技术效果:
本申请实施例提供一种信息查询方法,对用户输入的查询信息进行分词,并对分词结果进行兴趣词标注,获得用于表征分词结果中包含的每个兴趣词所属类型的标注序列,以根据该标注序列和预设的标注识别规则,对查询信息进行意图识别获得该查询信息对应的查询类型,即由查询类型来指明用户的查询意图,根据该查询类型在地图中对查询信息进行查询,获得并展现的查询结果符合用户的查询意图、准确性更高,解决了现有技术中对复杂查询信息的地图查询准确性较低的技术问题,提高了地图查询的准确性。
附图说明
图1为本申请实施例提供的一种信息查询方法的流程示意图;
图2为本申请实施例提供的一种信息查询装置的示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
在本申请实施例提供的技术方案中,通过兴趣词标注及标注识别,来获得查询信息的查询类型,以获得用户在地图中的查询意图,根据查询类型在地图中进行查询,以提高地图查询的准确性,解决现有技术中复杂查询信息的地图查询准确性较低的技术问题。
下面结合附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细的阐述。
实施例
本申请实施例在地图中进行信息查询之前建立预设词库,用于进行分词及兴趣词标注。当然,本实施例提供的一种信息查询方法的分词及标注并不限于使用预设词库,也可以采用现有技中已有的兴趣词词库、已有的分词词典等。预设词库包括多种类型的词库,每一种类型的词库中包含对应类型的兴趣词。预设词库中的兴趣词类型包括道路词、后缀词、品牌词、行政区域词、公交词、方位词、空间关系词及动词等。
建立预设词库时,可以对兴趣词词库进行分类提取;对输入法语料、地图搜索语料和/或网页搜索语料进行分类训练;根据分类提取和分类训练获得的兴趣词及兴趣词类型建立预设词库。
具体的,可以从现有的兴趣词POI(Point of Interest)词库中提取道路词、后缀词、品牌词、行政区划分词、公交词、同义词等兴趣词,对应建立预设词库中的道路词库、后缀词库、品牌词词库、行政区划分词库、公交词库、同义词库等词库。在分类提取的过程中通过收集用户对POI的点击次数建立POI的热度等级,将热度等级较高的POI提取到相应词库中,以提高对热度POI的识别准确率。也可以根据POI热度等级来更新预设词库,如在一定的时间周期内,获取预设词库中每个兴趣词的热度等级,删除热度等级低于预设等级的兴趣词,将新增的热度等级大于或等于预设等级的兴趣词添加到预设词库中。
由于POI词库的局限性,导致在对查询信息进行分词的时候存在大量的未登录词(即不在词库中无法识别的词)。为了降低未登录词的比例,本申请实施例还通过语料提取来进行兴趣词提取、分词识别及预设词库更新,提高未登录词的召回率。具体的,提取后缀词、停用词、方位词、疑问词、动词、形容词、关键词等兴趣词时,可以利用“输入法语音语料”、“输入法文本语料”、“地图搜索语音语料”、“地图搜索文本日志”、“网页搜索日志”等大规模的日志进行分类训练获得。分类训练时,可以利用TF-IDF算法来做兴趣词的提取,通过深度学习来获得兴趣词的类型。进一步,还可以在获得兴趣词后结合人工修正兴趣词的类型,提高兴趣词分类的准确性。TF-IDF算法使用统计正词频和逆词频的计算方式提取兴趣词,正词频是指词语在文章中出现的次数,正词频越大越可能是兴趣词,分数就越高;逆词频是指词语在所有文章中出现的次数,逆词频越大代表所有文章都可能出现过,是兴趣词的可能性越小,所以逆词频越大分数越低;即正词频的兴趣词出现频次与分数成正比,而逆词频的兴趣词出现频次与分数成反比。对提取到的兴趣词进行分类获得其所属类型。对分类获得的所属类型还可以通过人工核验,或者,对提取到的兴趣词进行人工标注获得其所属类型,提高分类的准确性。
基于上述实施例建立的预设词库,本申请实施例提供一种信息查询方法,应用于地图应用程序中,请参考图1,该方法包括:
S110:对用户输入的查询信息进行分词获得分词结果;
S120:对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
S130:根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
S140:根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
具体实施过程中,本说明书实施例中所述的查询信息为用户在地图应用程序中或者地图搜索框中输入的查询信息,即该查询信息主要针对地图查询。用户输入的查询信息可以是文本信息也可以是语音信息。S110可以对文本类型的查询信息直接进行分词获得分词结果,对语音类型的查询信息则可以先将语音信息转换为文本信息,再对转换获得文本信息进行分词获得分词结果。S110在进行分词时,可以采用基于词典的分词,也可以基于统计及机器学习的方法(非词典方法)进行分词,还可以基于最大匹配算法的中文文本识别系统MMSEG(A Word Identification System For Mandarin Chinese Text Based On TwoVariants Of The Maximum Matching Algorithm)来进行分词。其中,采用MMSEG和本实施例提供的分类型的预设词库,来对查询信息进行分词能够大大提高准确率、降低召回率。
通过S110获得分词结果之后,执行S120对分词结果进行兴趣词标注。进行兴趣词标注时,可以先对分词结果进行预设类型的兴趣词识别,再对分词结果中包含的预设类型的兴趣词进行标注获得标注序列。其中,所述预设类型的兴趣词为与用户查询意图相关的兴趣词,包括如下一种或多种:方位词、空间关系词、动词、道路词、品牌词等等。当然,兴趣词标注可以对分词结果中的每一个兴趣词的兴趣词标注其所属类型,最终获得一个由多个符号形成的标注序列。通过方位词、空间关系词的标注来识别多地址信息的复合查询,通过动词的标注来识别限定出行方式的查询如公交查询、导航查询。
请参考表一,为分类标注的举例。基于表一,若对查询信息“北京市海淀区学院路中国石油勘探开发研究院”进行分词标注:“北京市[s]海淀区[x]学院路[r]中国石油勘探开发研究院[k]”,得到标注序列s-x-r-k。
表一
具体实施过程中,在进行兴趣词标注时,可以先基于预设词库对分词结果进行预设类型的兴趣词识别,获得第一兴趣词及未识别词;基于输入法语料、地图搜索语料和/或网页搜索语料,对未识别词进行标注训练,获得未识别词中的第二兴趣词及第二兴趣词所属的类型;对第一兴趣词和第二兴趣词进行兴趣词标注获得标注序列。即,通过语料训练来对预设词库未识别的词进行补充识别,使得兴趣词标注尽可能的全面、准确,以提高后续S130的意图识别的准确性。
S130根据预设的标注识别规则和S120获得的标注序列,对查询信息进行意图识别。地图的查询不仅是关键词的搜索,同时也是一种更加广义的位置、路线、时间、运行时间、实时状态、距离、运行图、地形图、影像图、实景图、路况图等搜索。本实施例提供的地图查询方法,对广义上的地图搜索进行了识别和分类。
预设的标注识别规则包括根据标注序列中的标注特征来识别获得查询类型,例如,简单地址查询,可以识别获得标注序列中的标注特征,若标注序列中包含有标注特征r、v、t、h和n、a3~a11,可以认为其查询类型为简单的地址查询。预设的标注识别规则还包括根据标注序列中标注特征结构来识别获得查询类型,例如,复合查询,标注特征结构具有某某地方的某某方向的某某地方、位于某某地方里的某某单元、某某路某某学院,此类查询仅从单个的标注特征的角度来看很难得到正确的查询类型,而利用预先设定的结构句式“ka-i-kb”、i-ka-i-kb”、“ka-kb”则能够较好的得到查询类型。
下面结合表二的查询举例,对不同的查询类型及其包含的标注特征或者标注特征结构进行说明,本申请包括但不限于下属类型。
1)简单地址查询:包括简单的门牌号、道路号以及小区编号等查询,标注特征包括r、v、t、h和n、a3~a11;
2)复合地址查:不仅包括简单的门牌号、道路好以及小区编号等查询词,还包括此地址附近、周边的Poi、公交等查询词;标注特征包括r、v、t、h和n、a3~a11,k,b;
3)行政区划查询:包括省市区县镇等不同行政级别的查询词;
4)品牌类查询:具有连锁特点的品牌类型及品牌同义词;
5)类型词查询:具有类型特征及同义词;
6)道路查询:具有道路特征的查询词,包括国道、省道、快速路等;
7)公交查询:包括公交线路、公交站点及同义词等;
8)地图查询:包含有地图、影像图、实景地图等;
9)导航查询:具有从某某地方到某某地方特征的查询;
10)时间查询:具有诸如“花多久”、“需要多长时间”等关键词以及导航特征词;
11)距离查询:具有“距离”、“多少公里”等关键词以及导航特征词;
12)路况查询:包括路况及道路关键词;
13)问答查询:包括“怎么样”、“哪里”、“有没有”、“好不好”等疑问句式词;
14)简单POI查询:包含POI及POI同义词;
15)复合POI查询(Ka-kb):包含POI及POI同义词和道路、房产、公交、行政区划等;标注特征结构为Ka-Kb;
16)复合POI查询(Ka-i-kb):包含POI及POI同义词和道路、房产、公交、行政区划、方位属性词;标注特征结构为Ka-i-Kb;
17)复合POI查询(ka-kb-i):包含POI及POI同义词和道路、房产、公交、行政区划、方位属性词;标注特征结构为Ka-Kb-i。
表二
通过标注序列能够准确、快速的识别出标注特征结构,结合预设的标注识别规则能够准确性、快速的识别出查询类型,尤其是对复杂的查询信息效果尤为显著。具体实施过程中,本实施例还可以针对获得标注序列和/或获得查询类型进行人工消歧处理,消除标注错误、纠正错误的查询类型,获得处理后的标注序列和/或查询类型。
在获得查询类型之后,执行S140根据获得的查询类型在地图中对用户输入的查询信息进行查询,获取并展现查询结果。不同查询类型,查询的重点不同,例如:若查询类型为公交查询,那么重点查询公交路线;若查询类型为品牌类查询,那么重点查询地图中该品牌的位置分布;若查询类型为导航查询,则重点查询两地之间的线路及其路况;若查询类型为复合查询,一般复合查询类型的查询信息中都包含至少两个实体,根据标注序列从查询信息中的至少两个实体中获得目标实体;将目标实体作为查询目标进行地图查询,获取并展现查询结果。
下面通过三个完整的实例,来对本申请实施例的地图查询方法进行说明:
例1,假设查询信息为“北京市海淀区学院路中国石油勘探开发研究院”,对该查询信息进行分词及兴趣词标注:“北京市[s]海淀区[x]学院路[r]中国石油勘探开发研究院[k]”,获得标注序列s-x-r-k,识别获得该序列满足标注规则ka-kb,获得其查询类型是复合查询,根据该复合查询获得用户查询的目标实体即查询需求是“中国石油勘探开发研究院[k]”,根据该目标实体进行查询获得查询结果并展现。
例2,假设查询信息为“太原市晋源区南中环与旧晋祠路交叉口往东200米路南万年花城1号楼4单元1801”。在常规的查询过程中,通过提取POI的相关文本做模糊查询,但是常常会存在未能匹配的相应的查询结果,导致查询失败。在本实施例中,对此该查询先进行分词、标注处理,然后进行查询分类获取查询类型即提取查询意图,来提高查询想准确率。分词、标注处理:“太原市[c]晋源区[x]南中环[r]与[p]旧晋祠路[r]交叉口[ra1]往东[i]200[n]米[a16]路南[i]万年花城[k]1号楼[na6]4单元[na5]1801[n]”;查询分类获得查询类型:该标注序列包括“i-n-a16-i”,通过匹配此特征结构为“复合查询(ka-i-kb)”获得其查询类型为复合查询;根据其复合查询中的实体ka和kb,ka为“太原市晋源区南中环与旧晋祠路交叉口”,kb为“万年花城1号楼4单元1801”,获得目标实体即用户的查询目标kb,因此对该查询目标“万年花城1号楼4单元1801”进行地图查询获得并展现查询结果。
例3,假设查询信息为“从谷城五山镇至十堰北国际汽车贸易城不走高速”。此查询为导航类型查询,并且在用户还限定了道路类型为“不走高速”。此类查询在通常的关键字查询中很难得出正确结果。基于本实施例的地图查询方法,首先对查询词进行分词、标注处理,得到“从[l]谷城[x]五山镇[t]至[l]十堰北国际汽车贸易城[k]不走[q]高速[ra4]”,查询中包括“从***到***”的特征,获得此类查询的分类就是导航查询。对于导航查询,进一步获得标注序列中包含的动词特征即q和/或道路词后缀,在对上述查询信息进行导航查询时,根据动词特征即q和/或道路词后缀选择对应类型的道路进行导航。
在上述实施例中,通过多查询信息的兴趣词标注获得标注序列来进行意图识别获得查询类型,而非简单的兴趣词特征匹配,能够更广泛准确的识别用户的查询意图,即由查询类型来指明用户的查询意图,根据该查询类型来对查询信息进行地图查询,获得并展现的查询结果符合用户的查询意图、准确性更高,解决了现有技术中对复杂查询信息的地图查询准确性较低的技术问题,提高了地图查询的准确性。
针对上述实施例提供一种信息查询方法,本申请实施例还对应提供一种信息查询装置,请参考图2,该装置包括:
分词单元21,用于对用户输入的查询信息进行分词获得分词结果;
标注单元22,用于对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
识别单元23,用于根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
查询单元24,用于根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
作为一种可选的实施方式,所述标注单元22在进行兴趣词标注时,具体可以对所述分词结果进行预设类型的兴趣词识别,并对所述分词结果中包含的预设类型的兴趣词进行标注获得标注序列。其中,所述预设类型的兴趣词包括:方位词、空间关系词和/或动词。
作为一种可选的实施方式,所述标注单元22还用于:基于预设词库对所述分词结果进行预设类型的兴趣词识别,获得第一兴趣词及未识别词;基于输入法语料、地图搜索语料和/或网页搜索语料,对所述未识别词进行标注训练,获得所述未识别词中的第二兴趣词及所述第二兴趣词所属的类型;对所述第一兴趣词和所述第二兴趣词进行兴趣词标注获得所述标注序列。
在具体实施过程中,本实施例提供的信息查询装置还可以包括训练单元25。训练单元25用于:对兴趣词词库进行分类提取;对输入法语料、地图搜索语料和/或网页搜索语料进行分类训练;根据所述分类提取和所述分类训练获得的兴趣词及兴趣词类型建立所述预设词库,其中,所述预设词库中的兴趣词类型包括道路词、后缀词、品牌词、行政区域词、公交词、方位词、空间关系词及动词。其中,所述查询类型包括:公交查询、地址查询、导航查询、路况查询、时间查询、距离查询和/或复合查询,其中,所述复合查询对应的查询信息中包含至少两个实体。
作为一种可选的实施方式,所述查询单元24还用于:若所述查询类型为所述复合查询,根据所述标注序列从所述查询信息中的至少两个实体中获得目标实体;将所述目标实体作为查询目标进行地图查询,获取并展现查询结果。
作为一种可选的实施方式,所述分词单元21具体用于:基于最大匹配算法的中文文本识别系统对用户输入的查询信息进行分词获得分词结果。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图3是根据一示例性实施例示出的一种用于实现信息查询方法电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/展现(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个展现接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为展现和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于展现音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种信息查询方法,所述方法包括:对用户输入的查询信息进行分词获得分词结果;对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
图3是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入展现接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种信息查询方法,其特征在于,所述方法包括:
对用户输入的查询信息进行分词获得分词结果;
对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
2.如权利要求1所述的方法,其特征在于,对所述分词结果进行兴趣词标注获得标注序列,包括:
对所述分词结果进行预设类型的兴趣词识别,并对所述分词结果中包含的预设类型的兴趣词进行标注获得标注序列。
3.如权利要求2所述的方法,其特征在于,所述预设类型的兴趣词包括:方位词、空间关系词和/或动词。
4.如权利要求2所述的方法,对所述分词结果进行预设类型的兴趣词识别,包括:
基于预设词库对所述分词结果进行预设类型的兴趣词识别,获得第一兴趣词及未识别词;
基于输入法语料、地图搜索语料和/或网页搜索语料,对所述未识别词进行标注训练,获得所述未识别词中的第二兴趣词及所述第二兴趣词所属的类型;
对所述第一兴趣词和所述第二兴趣词进行兴趣词标注获得所述标注序列。
5.如权利要求2所述的方法,所述预设词库的建立方法包括:
对兴趣词词库进行分类提取;
对输入法语料、地图搜索语料和/或网页搜索语料进行分类训练;
根据所述分类提取和所述分类训练获得的兴趣词及兴趣词类型建立所述预设词库,其中,所述预设词库中的兴趣词类型包括道路词、后缀词、品牌词、行政区域词、公交词、方位词、空间关系词及动词。
6.如权利要求1~5任一所述的方法,其特征在于,所述查询类型包括:
公交查询、地址查询、导航查询、路况查询、时间查询、距离查询和/或复合查询,其中,所述复合查询对应的查询信息中包含至少两个实体。
7.如权利要求6所述的方法,其特征在于,根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果,包括:
若所述查询类型为所述复合查询,根据所述标注序列从所述查询信息中的至少两个实体中获得目标实体;
将所述目标实体作为查询目标进行地图查询,获取并展现查询结果。
8.一种信息查询装置,其特征在于,包括:
分词单元,用于对用户输入的查询信息进行分词获得分词结果;
标注单元,用于对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
识别单元,用于根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
查询单元,用于根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
9.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对用户输入的查询信息进行分词获得分词结果;
对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
对用户输入的查询信息进行分词获得分词结果;
对所述分词结果进行兴趣词标注获得标注序列,其中,所述标注序列用于表征所述分词结果中包含的每个兴趣词所属类型;
根据预设的标注识别规则和所述标注序列,对所述查询信息进行意图识别获得所述查询信息对应的查询类型;
根据所述查询类型在地图中对所述查询信息进行查询,获取并展现查询结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810621736.9A CN110609880A (zh) | 2018-06-15 | 2018-06-15 | 一种信息查询方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810621736.9A CN110609880A (zh) | 2018-06-15 | 2018-06-15 | 一种信息查询方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110609880A true CN110609880A (zh) | 2019-12-24 |
Family
ID=68888444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810621736.9A Pending CN110609880A (zh) | 2018-06-15 | 2018-06-15 | 一种信息查询方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110609880A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814077A (zh) * | 2020-06-30 | 2020-10-23 | 北京百度网讯科技有限公司 | 信息点查询方法、装置、设备和介质 |
CN112000495B (zh) * | 2020-10-27 | 2021-02-12 | 博泰车联网(南京)有限公司 | 用于兴趣点信息管理的方法、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855251A (zh) * | 2011-06-30 | 2013-01-02 | 北京百度网讯科技有限公司 | 一种需求识别的方法及装置 |
CN103258057A (zh) * | 2013-06-03 | 2013-08-21 | 北京奇虎科技有限公司 | 在电子地图界面上展示兴趣点poi的方法和装置 |
CN103605752A (zh) * | 2013-11-21 | 2014-02-26 | 武大吉奥信息技术有限公司 | 一种基于语义识别的地址匹配方法 |
CN104123319A (zh) * | 2013-04-28 | 2014-10-29 | 百度在线网络技术(北京)有限公司 | 对具有地图需求的搜索项进行解析的方法和装置 |
CN104537044A (zh) * | 2014-12-23 | 2015-04-22 | 北京奇虎科技有限公司 | 一种基于分词确定是否显示电子地图的方法与系统 |
CN105159940A (zh) * | 2015-08-03 | 2015-12-16 | 北京奇虎科技有限公司 | 挖掘地理信息的方法、装置以及服务器 |
CN107092642A (zh) * | 2017-03-06 | 2017-08-25 | 广州神马移动信息科技有限公司 | 一种信息搜索方法、设备、客户端设备及服务器 |
-
2018
- 2018-06-15 CN CN201810621736.9A patent/CN110609880A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855251A (zh) * | 2011-06-30 | 2013-01-02 | 北京百度网讯科技有限公司 | 一种需求识别的方法及装置 |
CN104123319A (zh) * | 2013-04-28 | 2014-10-29 | 百度在线网络技术(北京)有限公司 | 对具有地图需求的搜索项进行解析的方法和装置 |
CN103258057A (zh) * | 2013-06-03 | 2013-08-21 | 北京奇虎科技有限公司 | 在电子地图界面上展示兴趣点poi的方法和装置 |
CN103605752A (zh) * | 2013-11-21 | 2014-02-26 | 武大吉奥信息技术有限公司 | 一种基于语义识别的地址匹配方法 |
CN104537044A (zh) * | 2014-12-23 | 2015-04-22 | 北京奇虎科技有限公司 | 一种基于分词确定是否显示电子地图的方法与系统 |
CN105159940A (zh) * | 2015-08-03 | 2015-12-16 | 北京奇虎科技有限公司 | 挖掘地理信息的方法、装置以及服务器 |
CN107092642A (zh) * | 2017-03-06 | 2017-08-25 | 广州神马移动信息科技有限公司 | 一种信息搜索方法、设备、客户端设备及服务器 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814077A (zh) * | 2020-06-30 | 2020-10-23 | 北京百度网讯科技有限公司 | 信息点查询方法、装置、设备和介质 |
CN111814077B (zh) * | 2020-06-30 | 2024-04-05 | 北京百度网讯科技有限公司 | 信息点查询方法、装置、设备和介质 |
CN112000495B (zh) * | 2020-10-27 | 2021-02-12 | 博泰车联网(南京)有限公司 | 用于兴趣点信息管理的方法、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105701254B (zh) | 一种信息处理方法和装置、一种用于信息处理的装置 | |
WO2017076205A1 (zh) | 一种获取聊天发起句的回复提示内容的方法及装置 | |
CN109522419B (zh) | 会话信息补全方法及装置 | |
CN110062939B (zh) | 用于将静态图像转换成交互式地图的方法、系统和设备 | |
US20200326197A1 (en) | Method, apparatus, computer device and storage medium for determining poi alias | |
WO2018177316A1 (zh) | 信息识别方法、计算设备及存储介质 | |
CN110019645B (zh) | 索引库构建方法、搜索方法及装置 | |
US10838951B2 (en) | Query interpretation disambiguation | |
CN105512166B (zh) | 一种微博舆情与城市路况相映射的交通平行方法 | |
CN110781305A (zh) | 基于分类模型的文本分类方法及装置,以及模型训练方法 | |
CN111368541A (zh) | 命名实体识别方法及装置 | |
CN109961791B (zh) | 一种语音信息处理方法、装置及电子设备 | |
CN113792207A (zh) | 一种基于多层次特征表示对齐的跨模态检索方法 | |
CN111984749A (zh) | 一种兴趣点排序方法和装置 | |
CN111209354A (zh) | 一种地图兴趣点判重的方法、装置及电子设备 | |
CN112417318A (zh) | 一种兴趣点的状态确定方法、装置、电子设备及介质 | |
CN110929176A (zh) | 一种信息推荐方法、装置及电子设备 | |
CN111538830B (zh) | 法条检索方法、装置、计算机设备及存储介质 | |
EP3607274A1 (en) | Interfacing between digital assistant applications and navigation applications | |
CN111401044A (zh) | 一种标题生成方法、装置、终端设备及存储介质 | |
CN113420595A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN114880480A (zh) | 一种基于知识图谱的问答方法及装置 | |
CN110609880A (zh) | 一种信息查询方法、装置及电子设备 | |
CN114003672B (zh) | 一种道路动态事件的处理方法、装置、设备和介质 | |
US20190213646A1 (en) | Information display program, data transmission program, data-transmitting apparatus, method for transmitting data, information-providing apparatus, and method for providing information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |