CN111767477A - 一种检索方法、装置、电子设备和存储介质 - Google Patents

一种检索方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN111767477A
CN111767477A CN202010567194.9A CN202010567194A CN111767477A CN 111767477 A CN111767477 A CN 111767477A CN 202010567194 A CN202010567194 A CN 202010567194A CN 111767477 A CN111767477 A CN 111767477A
Authority
CN
China
Prior art keywords
query word
poi
target
segment
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010567194.9A
Other languages
English (en)
Other versions
CN111767477B (zh
Inventor
杨维
范淼
卓安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010567194.9A priority Critical patent/CN111767477B/zh
Publication of CN111767477A publication Critical patent/CN111767477A/zh
Application granted granted Critical
Publication of CN111767477B publication Critical patent/CN111767477B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种检索方法、装置、电子设备和存储介质,涉及人工智能及电子地图智能搜索领域。具体实现方案为:接收客户端发送的目标查询词片段;获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据对应关系确定目标查询词片段对应的目标POI;将目标POI返回给客户端,以使客户端将目标POI进行显示,以供用户通过触发操作对显示的任一目标POI发起检索。本申请实施例,提升了获取召回结果的效率,避免因为采用在线召回而引入杂质,可提升召回POI的准确性。

Description

一种检索方法、装置、电子设备和存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及人工智能及电子地图智能搜索领域,具体涉及一种检索方法、装置、电子设备和存储介质。
背景技术
框检索提示在地图兴趣点(POI)搜索领域非常重要,能够在用户输入查询词的部分片段后,就能够召回该用户的POI列表,使得用户不需要输入查询词的完整片段,就可提前点击POI列表中的目标POI进行详情查看和导航操作,缩短满足用户需求的步骤和时间。例如,用户要查询海洋公园,用户在搜索框中输入海洋后,在搜索框下显示召回的关于海洋的部分POI,用户可以从中选择点击海洋公园这一POI,实现对海洋公园发起检索。
目前框检索提示普遍采用语义召回,即在线检索时将用户输入的查询词的片段进行向量化后,输入预先训练得到的神经网络模型,根据神经网络模型的输出获得POI列表。但是这种方案存在一定的缺陷:在线的神经网络模型,复杂度过高,获得召回结果的效率和准确度都较低,并且对服务器会带来压力。
发明内容
本申请实施例提供一种检索方法、装置、电子设备和存储介质,以达到提高召回POI的准确性以及提升检索效率的目的。
第一方面,本申请实施例提供了一种检索方法,包括:
接收客户端发送的目标查询词片段;
获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据对应关系确定目标查询词片段对应的目标POI;
将目标POI返回给客户端,以使客户端将目标POI进行显示。
第二方面,本申请实施例还提供了一种检索装置,包括:
接收模块,用于接收客户端发送的目标查询词片段;
查询模块,用于获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据对应关系确定目标查询词片段对应的目标POI;
返回模块,用于将目标POI返回给客户端,以使客户端将目标POI进行显示。
第三方面,本申请实施例还提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请任意实施例的检索方法。
第四方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本申请任意实施例的检索方法。
上述申请中的实施例具有如下优点或有益效果:根据预先建立的查询词片段与兴趣点POI之间的对应关系,确定用户输入的目标查询词片段所对应的目标POI,也即根据离线建立的对应关系召回目标查询词片段对应的POI,避免了通过在线神经网络模型预测用户需要的POI,提升了获取召回结果的效率,而且根据建立的对应关系召回POI,避免因为采用在线召回而引入杂质,由此提升了召回POI的准确性。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的检索方法的流程示意图;
图2是根据本申请第二实施例的检索方法的流程示意图;
图3是根据本申请第三实施例的检索方法的流程示意图;
图4是根据本申请第四实施例的检索方法的流程示意图;
图5是根据本申请第五实施例的检索装置的结构示意图;
图6是用来实现本申请实施例的检索方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请第一实施例的检索的方法的流程示意图,本实施例可适用于地图搜索的情况。该方法可由一种检索装置来执行,该装置采用软件和/或硬件的方式实现,优选是配置于电子设备中,例如移动终端或计算机设备。参见图1,检索的方法具体如下:
S101、接收客户端发送的目标查询词片段。
其中,目标查询词片段由当前用户通过客户端的检索框输入的,可选的,目标查询词片段为单个字、词或拼音。
S102、获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据对应关系确定目标查询词片段对应的目标POI。
本申请实施例中,通过离线建立查询词片段与兴趣点POI之间的对应关系,进而基于对应关系召回目标查询词片段对应的目标POI,其中,预先建立的查询词片段与兴趣点POI之间的对应关系被存储在redis缓存中,示例性的,对应关系按照“查询词片段-兴趣点POI”的形式存储。可选的,本申请实施例采用旁路缓存模式,在接收到客户端发送的目标查询词片段后,从redis缓存获取对应关系,进而基于对应关系确定目标查询词片段对应的目标POI,示例性的,将用户输入的目标查询词片段依次与缓存中的各个对应关系进行匹配,根据匹配结果确定对应的目标POI。在此需要说明的是,根据离线建立的对应关系召回目标查询词片段对应的POI,避免了通过在线神经网络模型预测用户需要的POI,提升了获取召回结果的效率,而且预先建立的对应关系中不存在杂质,因此从对应关系中召回目标POI,不会引入杂质,由此保证了召回POI的准确性。而且,因为采用旁路缓存模式,相当于多一个并发队列,对系统平均响应时间无影响。
在一种可选的实施方式中,可基于用户历史检索行为数据预先建立查询词片段与兴趣点POI之间的对应关系,由此建立的对应关系更符合用户习惯,利用该对应关系召回目标,可以保证召回准确性,而且能够保证用户在输入更短的查询词片段即可召回需要的目标POI,提升检索的效率。
S103、将目标POI返回给客户端,以使客户端将目标POI进行显示。
在根据对应关系得到目标POI后,将目标POI返回客户端,在客户端的检索框对应的提示框中显示目标POI,进而用户可以根据提示框中显示的目标POI,选择触发自己需要的POI以实现对该POI发起检索,其中,提示框可选的位于检索框的下方。
本申请实施例中,根据预先建立的查询词片段与兴趣点POI之间的对应关系,确定用户输入的目标查询词片段对应的目标POI,也即根据离线建立的对应关系召回目标查询词片段对应的POI,避免了通过在线神经网络模型预测用户需要的POI,提升了获取召回结果的效率,而且根据建立的对应关系召回POI,避免因为采用在线召回而引入杂质,由此提升了召回POI的准确性。
图2是根据本申请第二实施例的检索方法的流程示意图,本实施例在上述实施例的基础上进一步进行优化,增加了具体根据用户历史行为建立查询词片段和POI对应关系的操作。如图2所示,该方法具体包括如下:
S201、获取查询词日志文件和点击行为日志文件。
为了保证建立的查询词片段与POI对应关系更符合用户习惯,可利用用户的历史行为数据建立对应关系,其中,用户的历史行为包括输入行为和点击行为。而要分析用户的历史行为,需要相应的获取查询词日志文件和点击行为日志文件,其中,查询词日志文件中记录有用户历史输入的查询词片段,点击行为日志文件中记录有用户对历史显示的POI进行点击的点击行为数据。示例性的,选择历史100天内查询词日志文件和点击行为日志文件。
S202、通过对查询词日志文件和点击行为日志文件进行数据挖掘,建立查询词片段与POI之间的对应关系。
其中,任一查询词片段对应的POI是在用户历史输入该任一查询词片段后,用户在历史显示的POI中所点击的POI。在对获取的两种日志文件进行数据挖掘时,可选的,根据加密的用户标识和时间戳对两个系统日志进行大数据排序聚合,组成用户连续输入并点击的连续日志片段,进而基于连续日志片段建立查询词片段和POI之间的对应关系,也即是建立查询词片段和POI的索引。由此基于用户的历史行为,建立查询词片段和POI的对应关系,更加符合用户习惯,利用该对应关系召回目标POI时,可以保证召回的POI的准确性。
进一步的,本申请实施例中,连续输入的多个查询词片段对应相同的POI,示例性的,用户连续输入的查询词片段包括b、ba、bai,点击的POI为百度大厦,则连续输入的查询词片段b、ba、bai都对应百度大厦POI。在此需要说明的是,由于多个连续的查询词片段对应同一个POI,则基于多个查询词片段与POI建立对应关系后,用户只需输入很短的一个查询词片段即可召回其对应的POI,提升了召回POI的效率。
进一步的,在得到连续日志片段以后,为了避免基于连续日志片段构建对应关系时引入杂质,需要对连续日志片段进行过滤。可选的,针对重复的连续日志片段,进行删除操作,保留一个即可;将连续日志片段中时间戳大于指定时间(例如60秒)的子片段过滤掉,不算在该片段内;若连续日志片段最后的子片段和目标POI不存在前缀关系(字符串子集),则过滤掉最后的子片段。需要说明的是,通过对连续日志片段的过滤,可以避免构建的对应关系中引入杂质,进而保证召回POI的准确性。
S203、接收客户端发送的目标查询词片段。
S204、获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据对应关系确定目标查询词片段对应的目标POI。
S205、将目标POI返回给客户端,以使客户端将目标POI进行显示。
本申请实施例中,通过对查询词日志文件和点击行为日志文件进行数据挖掘,以建立查询词片段与POI的对应关系,更加符合用户习惯,利用该对应关系召回目标POI时,可以保证召回的目标POI的准确性。
图3是本申请第三实施例的检索方法的流程示意图,本实施例在上述实施例的基础上进一步进行优化,增加了对建立的对应关系进行过滤的操作。如图3所示,该方法具体包括如下:
S301、获取查询词日志文件和点击行为日志文件。
S302、通过对查询词日志文件和点击行为日志文件进行数据挖掘,建立查询词片段与POI之间的对应关系。
通过S301-S302建立查询词片段与POI的对应关系之后,为了保证对应关系的质量,需要对建立的对应关系进行过滤。可选的,过滤操作参见S303-S304。
S303、确定建立的各对应关系对应的出现频次,和/或建立的各对应关系中的查询词片段与对应POI之间的语义相似度。
其中,各对应关系的出现频次代表了用户利用对应关系中的查询词片段查询对应POI的次数,因此统计查询各个POI的次数作为该POI所属对应关系的出现次数。确定建立的各对应关系中的查询词片段与对应POI之间的语义相似度时,可选的,基于深度学习训练来确定。具体的,配置神经网络模型,对海量样本(即大量的查询词片段及其对应POI)进行训练,离线预测查询词片段与对应POI之间的匹配相似度。需要说明的是,由于离线使用神经网络模型计算匹配度,一方面能够挖掘出隐含的共现数据,另一方面离线计算方式这里可以应用复杂的网络结构,提供更好的效果,避免线上计算复杂度过高带来平响问题。在此需要说明的是,建立的对应关系的出现频次和对应关系中的查询词片段与对应POI之间的语义相似度,作为该对应关系的内容进行存储。例如,对应关系以键值对KEY-VALUE的形式进行存储,其中,KEY值为查询词片段,VALUE值包括POI、出现频次和语义相似度。本申请实施例种,对应关系以KEY-VALUE的形式进行存储,可以保证后续根据对应关系确定目标查询词对应的目标POI时,可以快速对目标查询词与对应关系进行匹配操作,进而提升召回目标POI的效率。
S304、根据出现频次和/或语义相似度,对建立的各对应关系执行过滤操作。
可选的,预先设置一个出现频次阈值和语义相似度阈值,如果一个对应关系中的出现频次低于预设出现频次阈值,和/或该对应关系中的语义相似度低于预设的语义相似度阈值,则过滤掉该对应关系。
在此需要说明的是,通过出现频次和/或语义相似度,对建立的各对应关系执行过滤操作,删除部分不准确的对应关系,以保证建立的对应关系的质量,进而保证利用该对应关系召回的目标POI的准确性。
S305、接收客户端发送的目标查询词片段。
S306、获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据对应关系确定目标查询词片段对应的目标POI;
S307、根据各目标POI对应的出现频次,和/或各目标POI与目标查询词片段之间的语义相似度,对各目标POI进行筛选,以将筛选出的目标POI返回给客户端。
在根据对应关系确定目标查询词片段对应的目标POI后,如果确定的目标POI数量众多,为了保证召回的目标POI的准确性,也即为了准确召回用户需要的POI,在返回目标POI之前,需要对确定的目标POI进行筛选。
可选的,由于目标POI对应的出现频次越高,则表明该目标POI是用户需要的POI的概率越大,因此,可以按照各目标POI对应的出现频次,对各目标POI进行排序,选出频次最高的N个目标POI返回,其中N可以为预先设定的正整数。
可选的,各目标POI与目标查询词片段之间的语义相似度越大,表明该目标POI是用户需要的概率越大。因此,还可以按照各目标POI与目标查询词片段之间的语义相似度,对各目标POI进行排序,选出频次最高的N个目标POI返回,其中N可以为预先设定的正整数。
在另一种可选的实施方式中,可同时根据目标POI出现频次,以及目标POI与目标查询词片段的语义相似度,确定N个目标POI。可选的,预先设置出现频次的权重,语义相似度权重,进而根据目标POI出现频次、出现频次权重、语义相似度、语义相似度权重,计算各目标POI对应的分值,根据分值大小进行排序,选出分值最高的N个目标POI。
在此需要说明的是,根据对应关系确定目标查询词片段对应的目标POI后,如果确定的目标POI数量较少,还可以并行的采用现有技术进行召回,并将召回的目标POI与通过S301-S307确定的目标POI作为最终确定的目标POI。可选的,为了保证返回的POI的质量,按照所有目标POI的语义相似度和/或出现频次进行排序,选出N个语义相似度和/或出现频次较大的目标POI作为最终待返回的目标POI。
S308、使客户端将目标POI进行显示。
本申请实施例中,根据出现频次和/或语义相似度,对建立的各对应关系执行过滤,可以保证建立的对应关系的质量,避免引入杂质。而且,在确定目标POI时,通过各目标POI对应的出现频次,和/或各目标POI与目标查询词片段之间的语义相似度,对各目标POI进行筛选,保证最终返回给用户的POI能够满足用户需求,也即保证了召回目标POI的准确性。
图4是本申请第四实施例的检索方法的流程示意图,本实施例在上述实施例的基础上进一步进行优化,增加了对建立的对应关系进行过滤的操作。如图4所示,该方法具体包括如下:
S401、获取查询词日志文件和点击行为日志文件。
S402、通过对查询词日志文件和点击行为日志文件进行数据挖掘,建立查询词片段与POI之间的对应关系。
S403、对用户输入建立的对应关系中的查询词片段时,所使用的输入法进行预测,获得各查询词片段对应的预测输入法。
由于用户历史行为中,用户基于不同的输入法输入的一个查询词片段后,点击的POI可能不同,使得基于此构建的两个对应关系中,查询词片段相同,但对应的POI不同。因此需要对用户输入建立的对应关系中的查询词片段时,所使用的输入法进行预测,得到各查询词片段对应的预测输入法。
在一种可选的实施方式中,对用户输入建立的对应关系中的查询词片段时,所使用的输入法进行预测,包括:
若连续输入的查询词片段不包含拼音字母,并且前后汉字长度相等且笔画数递增,则预测用户输入查询词片段时所使用的输入法为笔画输入法;比如,笔画:钅钓钓一钓十钓士钓巧钓场。
若连续输入的查询词片段包含拼音,并且连续输入的拼音片段不存在前缀关系(字符串子集),以及将连续输入的拼音片段映射到九宫格之后存在前缀关系,则预测用户输入查询词片段时所使用的输入法为九宫格输入法;比如,九宫格:lag kaisg laishunkaishun开顺。
若连续输入的查询词片段包含拼音,并且连续输入的拼音片段存在前缀关系,则预测用户输入查询词片段时所使用的输入法为拼音输入法。比如,拼音:j jiaojiaotongju交通局。
通过上述三种方式,可预测用户输入建立的对应关系中的查询词片段时,所使用的输入法。进一步的,可基于确定的各个对应关系中的查询词片段对应预测输入法,确定各个用户标识对应的习惯使用输入法。示例性的,如果一个用户标识对应的多条对应关系,确定每条对应关系中的查询词片对应的预测输入法类型,通计各类预测输入法出现的次数,将出现次数最多的预测输入法作为该用户标识对应习惯使用输入法,进而建立用户标识和用户习惯使用输入法的对应关系并存储。可选的,以键值对KEY-VALUE的形式进行存储,其中,KEY值为用户标识,VALUE值为用户习惯输入法。需要说明的是,通过上述方式可以准确的预测出用户输入建立的对应关系中的查询词片段时,所使用的输入法,进而预测用户输入习惯,保证后续根据用户输入习惯准确召回POI。
S404、接收客户端发送的目标查询词片段。
S405、获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据对应关系确定目标查询词片段对应的目标POI。
S406、根据预先建立的用户标识与习惯使用输入法的对应关系,确定输入目标查询词片段的当前用户对应的习惯使用输入法。
其中,建立的用户标识与习惯使用输入法的对应关系的过程参见上述,在此不再赘述。确定输入目标查询词片段的当前用户对应的习惯使用输入法时,可选的,将当前用户标识与建立的对应关系(用户标识与习惯使用输入法的对应关系)进行匹配,根据匹配结果确定当前用户的习惯使用输入法。
S407、判断当前用户对应的习惯使用输入法与各目标POI对应的查询词片段的预测输入法是否一致,根据判断结果对各目标POI进行筛选,以将筛选出的目标POI返回给客户端。
通过判断当前用户对应的习惯使用输入法与各目标POI对应的查询词片段的预测输入法是否一致,对目标POI进行筛选,例如,若某一目标POI对应的查询词片段的预测输入法与当前用户对应的习惯使用输入法不一致,则将该目标POI舍弃,由此可以避免因输入法不同使得召回的目标POI不是用户需要的,进而保证召回的目标POI的准确性。
S408、使客户端将目标POI进行显示,以供用户通过触发操作对显示的任一目标POI发起检索。
进一步的,本申请实施例中,对应关系中还包括当前用户所在位置;
相应的,根据对应关系确定目标查询词片段对应的目标POI,包括:
根据对应关系,确定目标查询词片段和当前用户的所在位置对应的目标POI。
由于不同的城市可能存在相同名称的POI,因此需要结合当前用户所在位置确定目标查询词片段对应的目标POI,以避免召回名称相同,但地理位置不同的POI,提升召回目标POI的准确性。
图5是根据本申请第五实施例的检索装置的结构示意图,本实施例可适用于的地图搜索的情况。如图5所示,该装置500具体包括:
接收模块501,用于接收客户端发送的目标查询词片段;
查询模块502,用于获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据对应关系确定目标查询词片段对应的目标POI;
返回模块503,用于将目标POI返回给客户端,以使客户端将目标POI进行显示。
在上述实施例的基础上,可选的,装置还包括:
日志获取模块,用于获取查询词日志文件和点击行为日志文件;其中,查询词日志文件中记录有用户历史输入的查询词片段,点击行为日志文件中记录有用户对历史显示的POI进行点击的点击行为数据;
对应关系构建模块,用于通过对查询词日志文件和点击行为日志文件进行数据挖掘,建立查询词片段与POI之间的对应关系,其中,任一查询词片段对应的POI是在用户历史输入该任一查询词片段后,用户在历史显示的POI中所点击的POI。
在上述实施例的基础上,可选的,在对应关系中,连续输入的多个查询词片段对应相同的POI。
在上述实施例的基础上,可选的,装置还包括:
确定模块,用于确定建立的各对应关系对应的出现频次,和/或建立的各对应关系中的查询词片段与对应POI之间的语义相似度;
过滤模块,用于根据出现频次和/或语义相似度,对建立的各对应关系执行过滤操作。
在上述实施例的基础上,可选的,装置还包括:
第一筛选模块,用于根据各目标POI对应的出现频次,和/或各目标POI与目标查询词片段之间的语义相似度,对各目标POI进行筛选,以将筛选出的目标POI返回给客户端。
在上述实施例的基础上,可选的,装置还包括:
输入法预测模块,用于对用户输入建立的对应关系中的查询词片段时,所使用的输入法进行预测,获得各查询词片段对应的预测输入法;
相应的,装置还包括:
输入法偏好确定模块,用于根据预先建立的用户标识与习惯使用输入法的对应关系,确定输入目标查询词片段的当前用户对应的习惯使用输入法;
第二筛选模块,用于判断当前用户对应的习惯使用输入法与各目标POI对应的查询词片段的预测输入法是否一致,根据判断结果对目标POI进行筛选,以将筛选出的目标POI返回给客户端。
在上述实施例的基础上,可选的,输入法预测模块具体用于:
若连续输入的查询词片段不包含拼音字母,并且前后汉字长度相等且笔画数递增,则预测用户输入查询词片段时所使用的输入法为笔画输入法;
若连续输入的查询词片段包含拼音,并且连续输入的拼音片段不存在前缀关系,以及将连续输入的拼音片段映射到九宫格之后存在前缀关系,则预测用户输入查询词片段时所使用的输入法为九宫格输入法;
若连续输入的查询词片段包含拼音,并且连续输入的拼音片段存在前缀关系,则预测用户输入查询词片段时所使用的输入法为拼音输入法。
在上述实施例的基础上,可选的,对应关系中还包括当前用户所在位置;
相应的,查询模块还用于:
根据对应关系,确定目标查询词片段和当前用户的所在位置对应的目标POI。
在上述实施例的基础上,可选的,对应关系以键值对KEY-VALUE的形式进行存储。
本申请实施例提供的资源的访问控制装置400可执行本申请任意实施例提供的检索方法,具备执行方法相应的功能模块和有益效果。本实施例中未详尽描述的内容可以参考本申请任意方法实施例中的描述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是根据本申请实施例的检索方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的检索方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的检索方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的检索方法对应的程序指令/模块(例如,附图5所示的接收模块501、查询模块502、返回模块503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的检索方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据实现本申请实施例的检索方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至实现本申请实施例的检索方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现本申请实施例的检索方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与实现本申请实施例的检索方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,根据预先建立的查询词片段与兴趣点POI之间的对应关系,确定用户输入的目标查询词片段对应的目标POI,也即根据离线建立的对应关系召回目标查询词片段对应的POI,避免了通过在线神经网络模型预测用户需要的POI,提升了获取召回结果的效率,而且根据建立的对应关系召回POI,避免因为采用在线召回而引入杂质,由此提升了召回POI的准确性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (20)

1.一种检索方法,包括:
接收客户端发送的目标查询词片段;
获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据所述对应关系确定所述目标查询词片段对应的目标POI;
将所述目标POI返回给所述客户端,以使所述客户端将所述目标POI进行显示。
2.根据权利要求1所述的方法,其中,在接收客户端发送的目标查询词片段之前,所述方法还包括:
获取查询词日志文件和点击行为日志文件;其中,所述查询词日志文件中记录有用户历史输入的查询词片段,所述点击行为日志文件中记录有用户对历史显示的POI进行点击的点击行为数据;
通过对所述查询词日志文件和点击行为日志文件进行数据挖掘,建立查询词片段与POI之间的对应关系,其中,任一查询词片段对应的POI是在用户历史输入该任一查询词片段后,所述用户在历史显示的POI中所点击的POI。
3.根据权利要求2所述的方法,其中,在所述对应关系中,连续输入的多个查询词片段对应相同的POI。
4.根据权利要求2所述的方法,其中,在建立查询词片段与POI之间的对应关系之后,所述方法还包括:
确定建立的各对应关系对应的出现频次,和/或建立的各对应关系中的查询词片段与对应POI之间的语义相似度;
根据所述出现频次和/或所述语义相似度,对建立的各对应关系执行过滤操作。
5.根据权利要求4所述的方法,其中,在将所述目标POI返回给所述客户端之前,所述方法还包括:
根据各目标POI对应的出现频次,和/或各目标POI与所述目标查询词片段之间的语义相似度,对各目标POI进行筛选,以将筛选出的目标POI返回给客户端。
6.根据权利要求2所述的方法,其中,在建立查询词片段与POI之间的对应关系之后,所述方法还包括:
对用户输入建立的对应关系中的查询词片段时,所使用的输入法进行预测,获得各查询词片段对应的预测输入法;
相应的,在将所述目标POI返回给所述客户端之前,还包括:
根据预先建立的用户标识与习惯使用输入法的对应关系,确定输入所述目标查询词片段的当前用户对应的习惯使用输入法;
判断所述当前用户对应的习惯使用输入法与各所述目标POI对应的查询词片段的预测输入法是否一致,根据判断结果对各所述目标POI进行筛选,以将筛选出的目标POI返回给客户端。
7.根据权利要求6所述的方法,其中,对用户输入建立的对应关系中的查询词片段时,所使用的输入法进行预测,包括:
若连续输入的查询词片段不包含拼音字母,并且前后汉字长度相等且笔画数递增,则预测用户输入查询词片段时所使用的输入法为笔画输入法;
若连续输入的查询词片段包含拼音,并且连续输入的拼音片段不存在前缀关系,以及将连续输入的拼音片段映射到九宫格之后存在前缀关系,则预测用户输入查询词片段时所使用的输入法为九宫格输入法;
若连续输入的查询词片段包含拼音,并且连续输入的拼音片段存在前缀关系,则预测用户输入查询词片段时所使用的输入法为拼音输入法。
8.根据权利要求1所述的方法,其中,所述对应关系中还包括当前用户所在位置;
相应的,根据所述对应关系确定所述目标查询词片段对应的目标POI,包括:
根据所述对应关系,确定所述目标查询词片段和当前用户的所在位置对应的目标POI。
9.根据权利要求1-8中任一项所述的方法,其中,所述对应关系以键值对KEY-VALUE的形式进行存储。
10.一种检索装置,包括:
接收模块,用于接收客户端发送的目标查询词片段;
查询模块,用于获取预先建立的查询词片段与兴趣点POI之间的对应关系,根据所述对应关系确定所述目标查询词片段对应的目标POI;
返回模块,用于将所述目标POI返回给所述客户端,以使所述客户端将所述目标POI进行显示。
11.根据权利要求10所述的装置,其中,所述装置还包括:
日志获取模块,用于获取查询词日志文件和点击行为日志文件;其中,所述查询词日志文件中记录有用户历史输入的查询词片段,所述点击行为日志文件中记录有用户对历史显示的POI进行点击的点击行为数据;
对应关系构建模块,用于通过对所述查询词日志文件和点击行为日志文件进行数据挖掘,建立查询词片段与POI之间的对应关系,其中,任一查询词片段对应的POI是在用户历史输入该任一查询词片段后,所述用户在历史显示的POI中所点击的POI。
12.根据权利要求11所述的装置,其中,在所述对应关系中,连续输入的多个查询词片段对应相同的POI。
13.根据权利要求11所述的装置,其中,所述装置还包括:
确定模块,用于确定建立的各对应关系对应的出现频次,和/或建立的各对应关系中的查询词片段与对应POI之间的语义相似度;
过滤模块,用于根据所述出现频次和/或所述语义相似度,对建立的各对应关系执行过滤操作。
14.根据权利要求13所述的装置,其中,所述装置还包括:
第一筛选模块,用于根据各目标POI对应的出现频次,和/或各目标POI与所述目标查询词片段之间的语义相似度,对各目标POI进行筛选,以将筛选出的目标POI返回给客户端。
15.根据权利要求11所述的装置,其中,所述装置还包括:
输入法预测模块,用于对用户输入建立的对应关系中的查询词片段时,所使用的输入法进行预测,获得各查询词片段对应的预测输入法;
相应的,所述装置还包括:
输入法偏好确定模块,用于根据预先建立的用户标识与习惯使用输入法的对应关系,确定输入所述目标查询词片段的当前用户对应的习惯使用输入法;
第二筛选模块,用于判断所述当前用户对应的习惯使用输入法与各所述目标POI对应的查询词片段的预测输入法是否一致,根据判断结果对目标POI进行筛选,以将筛选出的目标POI返回给客户端。
16.根据权利要求15所述的装置,其中,输入法预测模块具体用于:
若连续输入的查询词片段不包含拼音字母,并且前后汉字长度相等且笔画数递增,则预测用户输入查询词片段时所使用的输入法为笔画输入法;
若连续输入的查询词片段包含拼音,并且连续输入的拼音片段不存在前缀关系,以及将连续输入的拼音片段映射到九宫格之后存在前缀关系,则预测用户输入查询词片段时所使用的输入法为九宫格输入法;
若连续输入的查询词片段包含拼音,并且连续输入的拼音片段存在前缀关系,则预测用户输入查询词片段时所使用的输入法为拼音输入法。
17.根据权利要求10所述的装置,其中,所述对应关系中还包括当前用户所在位置;
相应的,查询模块还用于:
根据所述对应关系,确定所述目标查询词片段和当前用户的所在位置对应的目标POI。
18.根据权利要求10-17中任一项所述的装置,其中,所述对应关系以键值对KEY-VALUE的形式进行存储。
19.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的检索方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的检索方法。
CN202010567194.9A 2020-06-19 2020-06-19 一种检索方法、装置、电子设备和存储介质 Active CN111767477B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010567194.9A CN111767477B (zh) 2020-06-19 2020-06-19 一种检索方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010567194.9A CN111767477B (zh) 2020-06-19 2020-06-19 一种检索方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN111767477A true CN111767477A (zh) 2020-10-13
CN111767477B CN111767477B (zh) 2023-07-28

Family

ID=72721351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010567194.9A Active CN111767477B (zh) 2020-06-19 2020-06-19 一种检索方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN111767477B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343089A (zh) * 2021-06-11 2021-09-03 北京完美赤金科技有限公司 用户召回方法及装置、设备
CN113360537A (zh) * 2021-06-04 2021-09-07 北京百度网讯科技有限公司 信息查询方法、装置、电子设备和介质
CN117725324A (zh) * 2024-02-08 2024-03-19 腾讯科技(深圳)有限公司 地图搜索方法及装置、电子设备、存储介质、程序产品

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014146550A1 (zh) * 2013-03-18 2014-09-25 百度在线网络技术(北京)有限公司 地图搜索的搜索建议方法、装置、计算机存储介质和设备
CN105183787A (zh) * 2015-03-24 2015-12-23 北京搜狗科技发展有限公司 一种信息输入方法和装置
CN107491518A (zh) * 2017-08-15 2017-12-19 北京百度网讯科技有限公司 一种搜索召回方法和装置、服务器、存储介质
CN108241690A (zh) * 2016-12-26 2018-07-03 北京搜狗信息服务有限公司 一种数据处理方法和装置、一种用于数据处理的装置
CN110362749A (zh) * 2019-07-15 2019-10-22 北京百度网讯科技有限公司 搜索结果召回方法、装置、服务器和介质
CN110765262A (zh) * 2019-09-24 2020-02-07 北京嘀嘀无限科技发展有限公司 Poi文本的检索方法、装置及电子设备
US20200081908A1 (en) * 2018-09-10 2020-03-12 Baidu Online Network Technology (Beijing) Co., Ltd. Internet text mining-based method and apparatus for judging validity of point of interest
CN110929125A (zh) * 2019-11-15 2020-03-27 腾讯科技(深圳)有限公司 搜索召回方法、装置、设备及其存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014146550A1 (zh) * 2013-03-18 2014-09-25 百度在线网络技术(北京)有限公司 地图搜索的搜索建议方法、装置、计算机存储介质和设备
CN105183787A (zh) * 2015-03-24 2015-12-23 北京搜狗科技发展有限公司 一种信息输入方法和装置
CN108241690A (zh) * 2016-12-26 2018-07-03 北京搜狗信息服务有限公司 一种数据处理方法和装置、一种用于数据处理的装置
CN107491518A (zh) * 2017-08-15 2017-12-19 北京百度网讯科技有限公司 一种搜索召回方法和装置、服务器、存储介质
US20200081908A1 (en) * 2018-09-10 2020-03-12 Baidu Online Network Technology (Beijing) Co., Ltd. Internet text mining-based method and apparatus for judging validity of point of interest
CN110362749A (zh) * 2019-07-15 2019-10-22 北京百度网讯科技有限公司 搜索结果召回方法、装置、服务器和介质
CN110765262A (zh) * 2019-09-24 2020-02-07 北京嘀嘀无限科技发展有限公司 Poi文本的检索方法、装置及电子设备
CN110929125A (zh) * 2019-11-15 2020-03-27 腾讯科技(深圳)有限公司 搜索召回方法、装置、设备及其存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈龙斌;: "移动互联网环境下用户搜索行为及需求的变迁", 电脑编程技巧与维护, no. 16 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360537A (zh) * 2021-06-04 2021-09-07 北京百度网讯科技有限公司 信息查询方法、装置、电子设备和介质
CN113360537B (zh) * 2021-06-04 2024-01-12 北京百度网讯科技有限公司 信息查询方法、装置、电子设备和介质
CN113343089A (zh) * 2021-06-11 2021-09-03 北京完美赤金科技有限公司 用户召回方法及装置、设备
CN117725324A (zh) * 2024-02-08 2024-03-19 腾讯科技(深圳)有限公司 地图搜索方法及装置、电子设备、存储介质、程序产品
CN117725324B (zh) * 2024-02-08 2024-05-24 腾讯科技(深圳)有限公司 地图搜索方法及装置、电子设备、存储介质、程序产品

Also Published As

Publication number Publication date
CN111767477B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN111177551B (zh) 确定搜索结果的方法、装置、设备和计算机存储介质
CN111767477B (zh) 一种检索方法、装置、电子设备和存储介质
CN111667054A (zh) 生成神经网络模型的方法、装置、电子设备以及存储介质
CN111709247A (zh) 数据集处理方法、装置、电子设备和存储介质
CN111753914A (zh) 模型优化方法和装置、电子设备及存储介质
CN111222058B (zh) 查询自动补全的方法、装置、设备和计算机存储介质
CN111241427B (zh) 查询自动补全的方法、装置、设备和计算机存储介质
CN111666462B (zh) 地理位置的推荐方法、装置、设备和计算机存储介质
CN112559870A (zh) 多模型融合方法、装置、电子设备和存储介质
US11468236B2 (en) Method and apparatus for performing word segmentation on text, device, and medium
CN112329453B (zh) 样本章节的生成方法、装置、设备以及存储介质
CN111241810A (zh) 标点预测方法及装置
CN112084150A (zh) 模型训练、数据检索方法,装置,设备以及存储介质
CN111539224A (zh) 语义理解模型的剪枝方法、装置、电子设备和存储介质
CN111782975A (zh) 一种检索方法、装置和电子设备
CN113127669A (zh) 广告配图方法、装置、设备和存储介质
CN112232089B (zh) 语义表示模型的预训练方法、设备和存储介质
CN112699314A (zh) 热点事件确定方法、装置、电子设备及存储介质
CN111461306B (zh) 特征评估的方法及装置
CN112100480A (zh) 搜索方法、装置、设备及存储介质
CN112579897A (zh) 信息搜索方法和装置
CN112052410A (zh) 地图兴趣点更新方法和装置
CN112819497A (zh) 转化率预测方法、装置、设备和存储介质
CN111274497A (zh) 社区推荐及模型训练方法、装置、电子设备及存储介质
CN111881255A (zh) 同义文本获取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant