CN110580271A - 数据查询方法和装置 - Google Patents

数据查询方法和装置 Download PDF

Info

Publication number
CN110580271A
CN110580271A CN201810589830.0A CN201810589830A CN110580271A CN 110580271 A CN110580271 A CN 110580271A CN 201810589830 A CN201810589830 A CN 201810589830A CN 110580271 A CN110580271 A CN 110580271A
Authority
CN
China
Prior art keywords
query
term
word
query term
term set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810589830.0A
Other languages
English (en)
Other versions
CN110580271B (zh
Inventor
吴石磊
王晓敏
林立
王斐
彭锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810589830.0A priority Critical patent/CN110580271B/zh
Publication of CN110580271A publication Critical patent/CN110580271A/zh
Application granted granted Critical
Publication of CN110580271B publication Critical patent/CN110580271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了数据查询方法和装置。该方法的一具体实施方式包括:响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合;获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给所述用户。实现了利用查找出的可用于获取地图数据的查询词语集合去替换包含可省略词语的用户输入的查询式进行查询,查询出相应的地图数据,将地图数据推送给用户。从而,在诸如用户自行添加兴趣点的相关名称中不存在的词语的情况下,依然可以查询到用户期望获取的地图数据推送给用户。

Description

数据查询方法和装置
技术领域
本申请涉及计算机领域,具体涉及电子地图领域,尤其涉及数据查询方法和装置。
背景技术
根据用户输入的与兴趣点相关的查询式,查询出相应的地图数据,是电子地图服务中最为常用的功能。在经常出现的诸如查询式中包含用户自行添加兴趣点的相关名称中不存在的词语的情况下,会导致查询式无法与预先存储的用于获取地图数据的词语集合匹配,进而导致无法获取相应的地图数据而向用户返回地图数据。
发明内容
本申请实施例提供了数据查询方法和装置。
第一方面,本申请实施例提供了数据查询方法,该方法包括:响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合,其中,分词词语集合通过对用户输入的查询式进行分词得到,查询词语集合为预先存储的对应有地图数据的词语集合,可省略的词语为无法与分词词语集合中的其他的词语进行组合得到查询词语集合的词语,预设条件包括:包括至少部分分词词语集合中的不可省略的词语;当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合;获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给所述用户。
第二方面,本申请实施例提供了数据查询装置,该装置包括:判断单元,被配置为响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合,其中,分词词语集合通过对用户输入的查询式进行分词得到,查询词语集合为预先存储的对应有地图数据的词语集合,可省略的词语为无法与分词词语集合中的其他的词语进行组合得到查询词语集合的词语,预设条件包括:包括至少部分分词词语集合中的不可省略的词语;确定单元,被配置为当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合;推送单元,被配置为获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给所述用户。
本申请实施例提供的数据查询方法和装置,通过响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合,其中,分词词语集合通过对用户输入的查询式进行分词得到,查询词语集合为预先存储的对应有地图数据的词语集合,可省略的词语为无法与分词词语集合中的其他的词语进行组合得到查询词语集合的词语,预设条件包括:包括至少部分分词词语集合中的不可省略的词语;当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合;获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给所述用户。实现了利用查找出的可用于获取地图数据的查询词语集合去替换包含可省略词语的用户输入的查询式进行查询,查询出相应的地图数据,将地图数据推送给用户。从而,在诸如用户自行添加兴趣点的相关名称中不存在的词语的情况下,依然可以查询到用户期望获取的地图数据推送给用户。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了适于用来实现本申请的实施例的示例性系统架构;
图2示出了根据本申请的数据查询方法的一个实施例的流程图;
图3示出了根据本申请的数据查询方法的另一个实施例的流程图;
图4示出了适用于确定用于获取地图数据的查询词语集合的一个示例性结构;
图5示出了根据本申请的数据查询装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了适于用来实现本申请的实施例的示例性系统架构。
如图1所示,系统架构包括终端101、网络102、服务器103。网络102可以为有线通信网络或无线通信网络。
服务器103可以为提供电子地图服务的服务器。服务器103预先对应存储了查询词语集合和查询词语集合对应的地图数据。
终端101的用户可以在运行在终端101上的电子地图的页面上输入与兴趣点相关的查询式。终端101将与兴趣点相关的查询式发送至服务器103。服务器103可以对用户输入的查询式进行分词,得到分词词语集合。服务器103可以判断预先存储的多个查询词语集合中是否存在与分词词语集合匹配的预先存储的、对应有地图数据的查询词语集合。若存在,向用户返回匹配的查询词语集合对应的地图数据。若不存在,服务器103查找出满足预设条件的查询词语集合,将满足预设条件的查询词语集合对应的地图数据发送至终端101。终端101可以将地图数据叠加在电子地图上呈现给终端101的用户。
请参考图2,其示出了根据本申请的数据查询方法的一个实施例的流程。本申请实施例所提供的数据查询方法可以由服务器(例如图1中的服务器103)执行。该方法包括以下步骤:
步骤201,响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合。
在本实施例中,查询词语集合为预先存储的对应有地图数据的词语集合,预设条件包括:包括至少部分不可省略的词语。
在本实施例中,可以首先对用户输入的查询式进行分词,得到分词词语集合。
例如,用户输入的查询式为“奎科大厦”,进行分词之后得到奎科、大厦两个词语,分词词语集合包括奎科、大厦两个词语。
在本实施例中,可以预先在服务器存储多个查询词语集合。可以预先在服务器上将查询词语集合与地图数据对应存储。地图数据包括:位置、简介、评价等。
换言之,查询词语集合为可以查询出相应的地图数据的词组。当一个词语在一个查询词语集合中时,则可以称之为该词语对应于该查询词语集合。相应地,当多个词语均对应于一个查询词语集合时,则可以确定该查询词语集合中包含该多个词语。一个词语可以出现在多个不同的查询词语集合,相应地,一个词语可以对应多个不同的查询词语集合。
在本实施例中,在得到分词词语集合之后,可以判断分词词语集合中是否存在可省略的词语。当分词词语集合中的一个词语无法与分词词语集合中的其他的词语组成查询词语集合时,则该词语为可省略的词语,分词词语集合中除可省略的词语之外的所有词语均为不可省略的词语。在对用户输入的查询式进行分词得到分词词语集合之后,可以检测分词词语集合中是否存在可省略的词语。
例如,用户输入了与一个兴趣点奎科大厦相关的查询式“奎科科技大厦”,用户输入的查询式中包含自行添加了不存在的词语“科技”。在服务器上预先存储了包括奎科、大厦两个词语的查询词语集合,该查询词语集合对应的地图数据包括奎科大厦的位置、介绍等。由于服务器上预先存储的多个查询词语集合中并不存在包含奎科、科技、大厦三个词语的查询词语集合,因此,可以检测出“科技”为可省略的词语。
在本实施例中,可以根据分词词语集合中的词语是否均对应于相同的查询词语集合,判断分词词语集合中的词语是否为可省略的词语。
假设用户输入的查询式进行分词之后,得到词语T1、T2、T3、T4、T5、T6。当T1、T2、T3、T4、T6均对应于一个查询词语集合,即多个查询词语集合中存在由T1、T2、T3、T4、T6组成的查询词语集合,并且T5未对应于T1、T2、T3、T4、T6均对应的一个查询词语集合即多个查询词语集合中不存在T1、T2、T3、T4、T5、T6组成的查询词语集合时,可以确定T5为可省略的词语。
在本实施例中,可以在检测出分词词语集合中的可省略的词语之后,判断多个查询词语集合中是否存在满足预设条件的查询词语集合。预设条件包括:包括至少部分不可省略的词语。
例如,对用户输入的查询式进行分词之后,得到词语T1、T2、T3、T4、T5、T6,分词词语集合包括:T1、T2、T3、T4、T5、T6。确定出T5为可省略的词语,T1、T2、T3、T4、T6均对应于一个查询词语集合,换言之,该查询词语集合包含T1、T2、T3、T4、T6,同时,多个查询词语集合中不存在包含T1、T2、T3、T4、T5、T6的查询词语集合,则可以将T1、T2、T3、T4、T6均对应于的查询词语集合作为满足预设条件的查询词语集合。
在本实施例的一些可选的实现方式中,可以采用以下方式检测分词词语集合中是否存在可省略的词语。可以基于分词词语集合中的每一个词语的权重和每一个词语所在的查询词语集合的数量即每一个词语对应的查询词语集合的数量,确定分词词语集合中的起始词语。可以采用以下方式确定起始词语:判断对应的查询词语集合最少的词语的权重的次序是否小于次序阈值,词语的权重的次序为权重的从高至低排序后的次序,若是,则将该词语作为起始词语。若否,则判断对应的查询词语集合第二少的词语的权重的次序是否小于次序阈值,以此类推。在确定了起始词语之后,起始词语为不可省略的词语。换言之,起始词语为不可省略的词语。可以依次访问分词词语集合中的除了所述起始词语之外的每一个词语。当确定访问到的一个词语是否为可省略的词语时,可以判断该词语是否出现在参考查询词语集合中,确定该词语是否为可省略的词语,参考查询词语集合为包括所有在访问该词语之前确定的不可省略的词语的查询词语集合。换言之,参考查询词语集合为在访问该词语之前,已确定的所有不可省略的词语即已确定的所有不可省略的词语均对应于的查询词语集合。参考查询词语集合为包含在访问该词语之前,已确定的所有不可省略的词语的查询词语集合。参考查询词语集合的数量可以为多个,当该词语出现在任意一个参考查询词语集合中,确定该词语为不可省略的词语。参考查询词语集合并不特指某一个查询词语集合,在判断多个词语是否为可省略的词语的过程中是可更新的。
当判断一个词语是否出现在参考查询词语集合中时,可以判断该词语对应的多个查询词语集合与所有参考查询词语集合是否具有相同的查询词语集合。若是,将相同的查询词语集合作为参考查询词语集合,用于判断该词语的下一个词语是否为可省略的词语。
例如,对用户输入的查询式进行分词之后,得到词语T1、T2、T3、T4、T5、T6,分词词语集合包含T1、T2、T3、T4、T5、T6,根据对应的查询词语集合的数量、词语的权重等确定出起始词语为T1,T1为不可省略的词语。换言之,T1为不可省略的词语。访问次序为分词后除了T1之外的各个词语在查询式中的次序,依次为T2、T3、T4、T5、T6。在访问T2之前,T1对应的多个查询词语集合作为所有参考查询词语集合。当访问到T2时,判断T2对应的多个查询词语集合和参考查询词语集合是否具有相同的查询词语集合,若存在,将所有相同的查询词语集合作为所有参考查询词语集合用于继续判断T3是否为可省略的词语。当访问当T3时,可以判断T3对应的多个查询词语集合和所有参考查询词语集合是否具有相同的查询词语集合,若存在,将T3相同的查询词语集合作为所有参考查询词语集合用于继续判断T4是否为可省略的词语。
以此类推,每一次均判断当前访问到的词语对应的多个查询词语集合与所有参考查询词语集合是否具有相同的查询词语集合,确定当前访问到的词语是否为可省略的词语。
假设已经确定T1、T2、T3、T4均为不可省略的词语,T5对应的多个查询词语集合与所有包含T1、T2、T3、T4的参考查询词语集合不具有相同的查询词语集合,则确定T5为可省略词语,然后,可以继续判断T6对应的多个查询词语集合和所有包含T1、T2、T3、T4的参考查询词语集合的参考查询词语集合是否具有相同的查询词语集合。
步骤202,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合。
在本实施例中,当多个查询词语集合中存在满足预设条件的查询词语集合时,满足预设条件的查询词语集合的数量可以为多个,可以确定满足预设条件的多个查询词语集合中的用于获取地图数据的查询词语集合。
例如,用户输入了与一个兴趣点奎科大厦相关的查询式“奎科科技大厦”,用户输入的查询式中包含自行添加了不存在的词语“科技”。可以检测出“科技”为可省略的词语,“奎科”、“大厦”为不可省略的词语。当包含奎科、大厦的查询词语集合即满足预设条件的查询词语集合为多个时,可以确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合。例如,服务器预先存储了由奎科、大厦两个词语组成的查询词语集合、由奎科、大厦、东门三个词语组成的查询词语集合、由奎科、大厦、停车场三个词语组成的查询词语集合等查询词语集合,可以将由奎科、大厦两个词语组成的查询词语集合作为用于获取地图数据的查询词语集合。
步骤203,获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给用户。
在本实施例中,当多个查询词语集合中存在满足预设条件的查询词语集合,确定出满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合之后,由于查询词语集合预先与地图数据对应存储,因此,可以获取确定出的查询词语集合对应的地图数据,将确定出的查询词语集合对应的地图数据推送给用户。
例如,用户输入了与一个兴趣点奎科大厦相关的查询式“奎科科技大厦”,用户输入的查询式中包含自行添加了不存在的词语“科技”。检测出“科技”为可省略的词语,“奎科”、“大厦”为不可省略的词语。当包含奎科、大厦的查询词语集合为多个时,例如,预先存储了由奎科、大厦两个词语组成的查询词语集合、由奎科、大厦、东门三个词语组成的查询词语集合、由奎科、大厦、停车场三个词语组成的查询词语集合等查询词语集合,可以将由奎科、大厦两个词语组成的查询词语集合作为用于获取地图数据的查询词语集合。由奎科、大厦两个词语组成的查询词语集合对应的地图数据包括奎科大厦的位置、介绍等,可以将由奎科、大厦两个词语组成的查询词语集合对应的地图数据推送给用户。
请参考图3,其示出了根据本申请的数据查询方法的另一个实施例的流程。本申请实施例所提供的数据查询方法可以由服务器(例如图1中的服务器103)执行。该方法包括以下步骤:
步骤301,响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合。
在本实施例中,可以首先对用户输入的查询式进行分词,得到分词词语集合。在得到分词词语集合之后,可以判断分词词语集合中是否存在可省略的词语。可以在检测出分词词语集合中的可省略的词语之后,判断多个查询词语集合中是否存在满足预设条件的查询词语集合。预设条件包括:包括至少部分不可省略的词语。
在本实施例中,预设条件还包括:检测出的可省略的词语的数量小于或等于最大可省略数量。当检测出的一个分词词语集合中可省略的词语的数量大于最大可省略数量时,即使存在包含不可省略的词语的查询词语集合或可省略的词语全部由同义词或相应的同义的词组替换后可与不可省略的词语组成查询词语集合,但考虑到省略后或利用相应的词语替换后语义损失较大,可以确定多个查询词语集合中不存在满足预设条件的查询词语集合,相应的,不向用户返回地图数据。
在本实施例中,最大可省略数量基于省略参考信息确定,省略参考信息包括:分词词语集合中的词语的数量、查询式中的文字的数量。可以预先确定对于包含的文字的数量小于阈值的查询式,在省略词语后可返回正确的结果的情况下,包含的文字的数量小于阈值的查询式中的可省略的词语占据对查询式分词之后得到的词语的比例。例如,对于地图中的兴趣点的查询,可以按照兴趣点的类别分别统计可省略的词语的数量。对于一个类别的兴趣点,可以获取多个在查询该类别的兴趣点时在省略查询式中的部分词语的情况下返回正确的结果的、包含的文字的数量小于阈值的历史查询式。返回正确的结果可以根据用户的行为例如点击了地图数据确定。可以分别确定多个历史查询式中的每一个历史式省略的词语占据对历史查询式分词之后得到的词语的比例,然后,进而确定出平均比例,将该平均比例作为用于查询该类别的兴趣点的、包含的文字的数量小于阈值的查询式对应的平均比例。
当确定一个用户输入的查询式对应的最大可省略数量时,可以确定该查询式用于查询的兴趣点的类型,进而获取用于查询该类别的兴趣点的、包含的文字的数量小于阈值的查询式对应的平均比例。当用户输入的查询式中的文字的数量小于阈值时,可以将对查询式进行分词后得到的分词词语集合中的词语的数量与该平均比例相乘进行取整数后得到的数量作为最大可省略数量。当用户输入的查询式中的文字的数量大于阈值时,用户输入的查询式中可能存在冗余的词语,可以将分词词语集合中的词语的数量与该平均比例相乘进行取整数后得到的数量与预设数值相加得到的数量作为最大可省略数量。预设数值可以预先根据用户输入的查询式中超出文字的数量的阈值的文字占据用户输入的查询式中的文字的比例确定。
步骤302,将包含可省略的词语的同义词或相应的同义词组的查询词语集合的作为用于获取地图数据的查询词语集合。
在本实施例中,当多个查询词语集合中存在满足预设条件的查询词语集合时,满足预设条件的查询词语集合的数量可以为多个,可以确定满足预设条件的多个查询词语集合中的用于获取地图数据的查询词语集合。
在本实施例中,当满足预设条件的查询词语集合中存在包含所有不可省略的词语、可省略的词语的同义词的查询词语集合时,可以将包含所有不可省略的词语、可省略的词语的同义词的查询词语集合作为用于获取地图数据的查询词语集合。
例如,用户输入的查询式进行分词之后,得到词语T1、T2、T3、T4、T5、T6,确定T5为可省略的词语。服务器上预先存储了与T5的同义词S2,S2对应于T1、T2、T3、T4、T6均对应于的查询词语集合,即存在包含T1、T2、T3、T4、S2、T6的查询词语集合时,则可以将包含T1、T2、T3、T4、S2、T6的查询词语集合作为用于获取地图数据的查询词语集合。
在本实施例中,当满足预设条件的多个查询词语集合中存在包含由可省略的词语与至少一个不可省略的词语组成的词组的同义词组中的词语、除同义词组中的不可省略的词语之外的所有不可省略的词语的查询词语集合时,可以将包含由可省略的词语与至少一个不可省略的词语组成的词组的同义词组中的词语、除同义词组中的不可省略的词语之外的所有不可省略的词语的查询词语集合作为用于获取地图数据的查询词语集合。
例如,用户输入的查询式进行分词之后,得到词语T1、T2、T3、T4、T5、T6,确定T5为可省略的词语。服务器上预先存储了由T5、T6组成的词组的同义词组,该同义词组由词语M3、M4组成。T1、T2、T3、T4、T6均对应于的查询词语集合,S2未对应于T1、T2、T3、T4、T6均对应于的查询词语集合,则不存在包含T1、T2、T3、T4、S2、T6的查询词语集合。当T1、T2、T3、T4、M3、M4均对应于一个查询词语集合时,即存在包含T1、T2、T3、T4、M3、M4的查询词语集合,则可以将包含T1、T2、T3、T4、M3、M4的查询词语集合作为用于获取地图数据的查询词语集合。
可选地,可以首先判断满足预设条件的查询词语集合中是否存在包含所有不可省略的词语、可省略的词语的同义词的查询词语集合,当满足预设条件的查询词语集合中存在包含所有不可省略的词语、可省略的词语的同义词的查询词语集合,可以将包含所有不可省略的词语、可省略的词语的同义词的查询词语集合作为用于获取地图数据的查询词语集合,不再将其他的查询词语集合作为用于获取地图数据的查询词语集合。当满足预设条件的查询词语集合中不存在包含所有不可省略的词语、可省略的词语的同义词的查询词语集合时,可以判断断满足预设条件的查询词语集合中是否存在包含由可省略的词语与至少一个不可省略的词语组成的词组的同义词组中的词语、分词词语集合中的除了同义词组中的不可省略的词语之外的所有不可省略的词语的查询词语集合。当满足预设条件的多个查询词语集合中存在包含由可省略的词语与至少一个不可省略的词语组成的词组的同义词组中的词语、分词词语集合中的除了同义词组中的不可省略的词语之外的所有不可省略的词语的查询词语集合的查询词语集合时,可以将包含由可省略的词语与至少一个不可省略的词语组成的词组的同义词组中的词语、分词词语集合中的除了同义词组中的不可省略的词语之外的所有不可省略的词语的查询词语集合的查询词语集合作为用于获取地图数据的查询词语集合。
步骤303,获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给用户。
在本实施例中,当多个查询词语集合中存在满足预设条件的查询词语集合,确定出满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合之后,由于查询词语集合预先与地图数据对应存储,因此,可以获取确定出的查询词语集合对应的地图数据,将确定出的查询词语集合对应的地图数据推送给用户。
请参考图4,其示了适用于确定用于获取地图数据的查询词语集合的一个示例性结构。
在图4中,示出了在对查询式进行分词之后得到的分词词语集合中包含词语T1、T2、T3、T4、T5、T6时适用于确定用于获取地图数据的查询词语集合的树结构。树结构中的节点包含对查询式进行分词之后得到的分词词语集合中的词语T1、T2、T3、T4、T5、T6和逻辑节点&节点、|节点。&节点指示的逻辑运算为逻辑与计算,|节点指示的逻辑运算为逻辑或计算。服务器上预先存储了T2的同义词S1、与T3、T4构成的词组同义的包含M1、M2的词组、词语T5的同义词S2、T6的同义词S3,与T5、T6构成的词组同义的包含M3、M4的词组。相应地,树结构中的节点包含S1、M1、M2、S2、S3、M3、M4。
在本申请中,适用于确定用于获取地图数据的查询词语集合的树结构以一个&节点作为根节点,根节点下的每一个分支为二叉树。对适用于确定用于获取地图数据的查询词语集合的树结构中的节点进行遍历,可以得到树结构对应的逻辑表达式,逻辑表达式的结果即为用于获取地图数据的查询词语集合。在计算逻辑表达式的结果时,只有不可省略的词语参与计算。在对树中的节点的进行遍历时,可以对根节点下的每一个二叉树采用中序遍历的方式进行,然后,将所有二叉树的遍历结果进行根节点指示的逻辑运算即逻辑与运算,即可得到逻辑表达式。
在适用于确定用于获取地图数据的查询词语集合的树结构中,词语与逻辑节点的连接关系的构建过程如下:对于没具有同义词并且不能与其他词语组成词组的单个词语,可以直接与根节点连接。对于具有同义词并且不能与其他词语组成词组的单个词语,单个词语和其同义词均与一个|节点连接,单个词语和其同义词均连接的一个|节点与根节点连接。对于可组成词组的并且均无同义词的多个词语,多个词语均与一个&节点连接,若多个词语组成的词组具有同义词组,该同义的词组中的每一个词语均与多个词语均连接的一个&节点处于同一层的相邻的一个&节点连接,多个词语均连接的一个&节点与该相邻的&节点均与一个|节点连接,该|节点与根节点连接。对于可组成词组的并且至少一个词语具有同义词的多个词语,多个词语中具有同义词的词语和其同义词均与一个|节点连接,每一个具有同义词的词语和其同义词均连接的一个|节点均与一个&节点连接,多个词语中不具有同义词的词语均与该&节点连接。若该多个词语组成的词组具有同义词组,该同义词组中的每一个词语均与该&节点处于同一层的相邻的&节点连接,该&节点与该相邻的&节点均与一个|节点连接,该|节点与根节点连接。
对于对查询式进行分词之后得到的分词词语集合中包含词语T1、T2、T3、T4、T5、T6,树结构中的词语与逻辑节点之间的连接关系的建立过程如下:由于T1没具有同义词,因此,T1直接和作为根节点的&节点401连接。由于T2具有同义词S1,因此,T2与S1均与一个|节点连接。同理,T5与S2均与一个|节点连接、T6与S3均与一个|节点连接。由于T3、T4可构成词组,T3、T4均与一个&节点连接,同理,M1、M2均与一个&节点连接,M3、M4均与一个&节点连接。T5、T6各自连接的一个|节点均与一个&节点连接。
假设T1为起始词语,依次访问T2、T3、T4、T5、T6之后,确定T1、T2、T3、T4、T6均为不可省略的词语,T5为可省略的词语,即存在由T1、T2、T3、T4、T6组成的查询词语集合,而不存在由T1、T2、T3、T4、T5、T6组成的查询词语集合。
可以首先查找到与T5连接的|节点连接的T5的同义词S2,判断S2是否为可省略的词语。当确定预先存储的多个查询词语集合中存在T1、T2、T3、T4、S2、T6均对应于的查询词语集合即存在由T1、T2、T3、T4、S2、T6组成的查询词语集合时,可以确定T5的同义词S2为不可省略的词语。相应地,可以得到树结构对应的逻辑表达式的结果,树结构对应的逻辑表达式的结果即为T1、T2、T3、T4、S2、T6均对应于的查询词语集合即由T1、T2、T3、T4、S2、T6组成的查询词语集合。可以将T1、T2、T3、T4、S2、T6均对应于的查询词语集合作为用于获取地图数据的查询词语集合,不再将其他的查询词语集合作为用于获取地图数据的查询词语集合,可以将T1、T2、T3、T4、S2、T6均对应于的查询词语集合对应的地图数据返回给用户。
当确定不存在T1、T2、T3、T4、S2、T6均对应于的查询词语集合即确定不存在由T1、T2、T3、T4、S2、T6组成的查询词语集合时,可以继续查找到M3、M4。当确定预先存储的多个查询词语集合中存在T1、T2、T3、T4、M3、M4均对应于的查询词语集合即存在由T1、T2、T3、T4、M3、M4组成的查询词语集合时,可以确定M3、M4为不可省略的词语。相应地,可以得到树结构对应的逻辑表达式的结果,树结构对应的逻辑表达式的结果即为T1、T2、T3、T4、M3、M4均对应于的查询词语集合即由T1、T2、T3、T4、M3、M4组成的查询词语集合。可以将T1、T2、T3、T4、M3、M4均对应于的查询词语集合作为用于获取地图数据的查询词语集合,不再将其他的查询词语集合作为用于获取地图数据的查询词语集合,可以将T1、T2、T3、T4、M3、M4均对应于的查询词语集合对应的地图数据返回给用户。
当确定不存在T1、T2、T3、T4、M3、M4均对应于的查询词语集合时,可以将T5标记为可省略一次,可以将T1、T2、T3、T4、T6均对应于的查询词语集合可以作为用于获取地图数据的查询词语集合,可以将T1、T2、T3、T4、T6均对应于的查询词语集合对应的地图数据返回给用户。
请参考图5,作为对上述各图所示方法的实现,本申请提供了一种数据查询装置的一个实施例,该装置实施例与图2所示的方法实施例相对应。
如图5所示,本实施例的数据查询装置包括:判断单元501,确定单元502,推送单元503。其中,判断单元501被配置为响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合,其中,分词词语集合通过对用户输入的查询式进行分词得到,查询词语集合为预先存储的对应有地图数据的词语集合,可省略的词语为无法与分词词语集合中的其他的词语进行组合得到查询词语集合的词语,预设条件包括:包括至少部分分词词语集合中的不可省略的词语;确定单元502被配置为当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合;推送单元503被配置为获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给所述用户。
在本实施例的一些可选的实现方式中,数据查询装置还包括:第一查询词语集合确定单元,被配置为将满足预设条件的查询词语集合中的第一查询词语集合作为用于获取地图数据的查询词语集合,第一查询词语集合包括:所有不可省略的词语、可省略的词语的同义词。
在本实施例的一些可选的实现方式中,数据查询装置还包括:第二查询词语集合确定单元,被配置为将满足预设条件的查询词语集合中的第二查询词语集合作为用于获取地图数据的查询词语集合,第二查询词语集合包括:由可省略的词语与至少一个不可省略的词语组成的词组的同义词组中的词语、除同义词组中的不可省略的词语之外的所有不可省略的词语。
在本实施例的一些可选的实现方式中,数据查询装置还包括:词语确定单元,被配置为基于分词词语集合中的每一个词语的权重和每一个词语所在的查询词语集合的数量,确定分词词语集合中的起始词语,其中,所述起始词语为不可省略的词语;依次访问分词词语集合中的除了所述起始词语之外的每一个词语,对于访问到的每一个词语,基于词语是否出现在参考查询词语集合中,确定词语是否为可省略的词语,其中,参考查询词语集合为在访问所述词语之前确定的包括所有已确定的不可省略的词语的查询词语集合。
在本实施例的一些可选的实现方式中,预设条件还包括:检测出的可省略的词语的数量小于或等于最大可省略数量,其中,最大可省略数量基于省略参考信息确定,省略参考信息包括:分词词语集合中的词语的数量、查询式中的文字的数量。
图6示出了适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
如图6所示,计算机系统包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有计算机系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:输入部分606;输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,本申请的实施例中描述的过程可以被实现为计算机程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包括用于执行流程图所示的方法的指令。该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。
本申请还提供了一种服务器,该服务器可以配置有一个或多个处理器;存储器,用于存储一个或多个程序,一个或多个程序中可以包含用以执行上述实施例中描述的操作的指令。当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述实施例中描述的操作。
本申请还提供了一种计算机可读介质,该计算机可读介质可以是服务器中所包括的;也可以是单独存在,未装配入服务器中。上述计算机可读介质承载有一个或者多个程序,当一个或者多个程序被服务器执行时,使得服务器:响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合,其中,分词词语集合通过对用户输入的查询式进行分词得到,查询词语集合为预先存储的对应有地图数据的词语集合,可省略的词语为无法与分词词语集合中的其他的词语进行组合得到查询词语集合的词语,预设条件包括:包括至少部分分词词语集合中的不可省略的词语;当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合;获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给所述用户。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被消息执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由消息执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行消息。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机消息的组合来实现。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种数据查询方法,包括:
响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合,其中,分词词语集合通过对用户输入的查询式进行分词得到,查询词语集合为预先存储的对应有地图数据的词语集合,可省略的词语为无法与分词词语集合中的其他的词语进行组合得到查询词语集合的词语,预设条件包括:包括至少部分分词词语集合中的不可省略的词语;
当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合;
获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给所述用户。
2.根据权利要求1所述的方法,当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合包括:
将满足预设条件的查询词语集合中的第一查询词语集合作为用于获取地图数据的查询词语集合,第一查询词语集合包括:所有不可省略的词语、可省略的词语的同义词。
3.根据权利要求1所述的方法,当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合包括:
将满足预设条件的查询词语集合中的第二查询词语集合作为用于获取地图数据的查询词语集合,第二查询词语集合包括:由可省略的词语与至少一个不可省略的词语组成的词组的同义词组中的词语、除同义词组中的不可省略的词语之外的所有不可省略的词语。
4.根据权利要求1-3之一所述的方法,所述方法还包括:
基于分词词语集合中的每一个词语的权重和每一个词语所在的查询词语集合的数量,确定分词词语集合中的起始词语,其中,所述起始词语为不可省略的词语;
依次访问分词词语集合中的除了所述起始词语之外的每一个词语,对于访问到的每一个词语,基于词语是否出现在参考查询词语集合中,确定词语是否为可省略的词语,其中,参考查询词语集合为在访问所述词语之前确定的包括所有已确定的不可省略的词语的查询词语集合。
5.根据权利要求4所述的方法,预设条件还包括:检测出的可省略的词语的数量小于或等于最大可省略数量,其中,最大可省略数量基于省略参考信息确定,省略参考信息包括:分词词语集合中的词语的数量、查询式中的文字的数量。
6.一种数据查询装置,包括:
判断单元,被配置为响应于检测出分词词语集合中的可省略的词语,判断多个查询词语集合中是否存在满足预设条件的查询词语集合,其中,分词词语集合通过对用户输入的查询式进行分词得到,查询词语集合为预先存储的对应有地图数据的词语集合,可省略的词语为无法与分词词语集合中的其他的词语进行组合得到查询词语集合的词语,预设条件包括:包括至少部分分词词语集合中的不可省略的词语;
确定单元,被配置为当多个查询词语集合中存在满足预设条件的查询词语集合时,确定满足预设条件的查询词语集合中的用于获取地图数据的查询词语集合;
推送单元,被配置为获取确定出的查询词语集合对应的地图数据,将获取到的地图数据推送给所述用户。
7.根据权利要求6所述的装置,所述装置还包括:
第一查询词语集合确定单元,被配置为将满足预设条件的查询词语集合中的第一查询词语集合作为用于获取地图数据的查询词语集合,第一查询词语集合包括:所有不可省略的词语、可省略的词语的同义词。
8.根据权利要求6所述的装置,所述装置还包括:
第二查询词语集合确定单元,被配置为将满足预设条件的查询词语集合中的第二查询词语集合作为用于获取地图数据的查询词语集合,第二查询词语集合包括:由可省略的词语与至少一个不可省略的词语组成的词组的同义词组中的词语、除同义词组中的不可省略的词语之外的所有不可省略的词语。
9.根据权利要求6-8之一所述的装置,所述装置还包括:
词语确定单元,被配置为基于分词词语集合中的每一个词语的权重和每一个词语所在的查询词语集合的数量,确定分词词语集合中的起始词语,其中,所述起始词语为不可省略的词语;依次访问分词词语集合中的除了所述起始词语之外的每一个词语,对于访问到的每一个词语,基于词语是否出现在参考查询词语集合中,确定词语是否为可省略的词语,其中,参考查询词语集合为在访问所述词语之前确定的包括所有已确定的不可省略的词语的查询词语集合。
10.根据权利要求9所述的装置,预设条件还包括:检测出的可省略的词语的数量小于或等于最大可省略数量,其中,最大可省略数量基于省略参考信息确定,省略参考信息包括:分词词语集合中的词语的数量、查询式中的文字的数量。
11.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其特征在于,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201810589830.0A 2018-06-08 2018-06-08 数据查询方法和装置 Active CN110580271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810589830.0A CN110580271B (zh) 2018-06-08 2018-06-08 数据查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810589830.0A CN110580271B (zh) 2018-06-08 2018-06-08 数据查询方法和装置

Publications (2)

Publication Number Publication Date
CN110580271A true CN110580271A (zh) 2019-12-17
CN110580271B CN110580271B (zh) 2022-05-24

Family

ID=68810191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810589830.0A Active CN110580271B (zh) 2018-06-08 2018-06-08 数据查询方法和装置

Country Status (1)

Country Link
CN (1) CN110580271B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957828A (zh) * 2009-07-20 2011-01-26 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法和装置
CN103853769A (zh) * 2012-12-03 2014-06-11 北京百度网讯科技有限公司 一种地图查询请求处理方法及装置
CN104424177A (zh) * 2013-08-26 2015-03-18 高德软件有限公司 一种抽取核心词的方法及装置
CN106503231A (zh) * 2016-10-31 2017-03-15 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN107609192A (zh) * 2017-10-12 2018-01-19 北京京东尚科信息技术有限公司 一种搜索引擎的补充搜索方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957828A (zh) * 2009-07-20 2011-01-26 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法和装置
CN103853769A (zh) * 2012-12-03 2014-06-11 北京百度网讯科技有限公司 一种地图查询请求处理方法及装置
CN104424177A (zh) * 2013-08-26 2015-03-18 高德软件有限公司 一种抽取核心词的方法及装置
CN106503231A (zh) * 2016-10-31 2017-03-15 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN107609192A (zh) * 2017-10-12 2018-01-19 北京京东尚科信息技术有限公司 一种搜索引擎的补充搜索方法和装置

Also Published As

Publication number Publication date
CN110580271B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN108038183B (zh) 结构化实体收录方法、装置、服务器和存储介质
CN109189991B (zh) 重复视频识别方法、装置、终端及计算机可读存储介质
CN106874492B (zh) 搜索方法和装置
CN106844341B (zh) 基于人工智能的新闻摘要提取方法及装置
CN110321466B (zh) 一种基于语义分析的证券资讯查重方法及系统
CN108959370B (zh) 一种基于知识图谱中实体相似度的社区发现方法及装置
CN111382212B (zh) 关联地址获取方法、装置、电子设备及存储介质
US8332379B2 (en) System and method for identifying content sensitive authorities from very large scale networks
US20130311507A1 (en) Representing Incomplete and Uncertain Information in Graph Data
CN105302807B (zh) 一种获取信息类别的方法和装置
CN111125521A (zh) 一种信息推荐方法、装置、设备及存储介质
CN112559709A (zh) 基于知识图谱的问答方法、装置、终端以及存储介质
CN110598109A (zh) 一种信息推荐方法、装置、设备及存储介质
CN112395880B (zh) 结构化三元组的纠错方法、装置、计算机设备及存储介质
CN110580271B (zh) 数据查询方法和装置
CN113761311A (zh) 信息检索方法、装置、服务器和可读存储介质
CN111061927B (zh) 数据处理方法、装置及电子设备
CN114580354B (zh) 基于同义词的信息编码方法、装置、设备和存储介质
CN111813916A (zh) 一种智能问答方法、装置、计算机设备和介质
CN115203758B (zh) 一种数据安全存储方法、系统及云平台
CN113032534A (zh) 对话文本的分类方法和电子设备
CN111831685A (zh) 一种查询语句的处理方法、训练模型的方法、装置及设备
CN114911814A (zh) 一种基于知识资源库更新的咨询服务方法及系统
CN113779029A (zh) 一种数据查询的方法及装置
CN109426358B (zh) 信息输入方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant