CN110647537A - 数据搜索方法、装置及存储介质 - Google Patents

数据搜索方法、装置及存储介质 Download PDF

Info

Publication number
CN110647537A
CN110647537A CN201910906027.XA CN201910906027A CN110647537A CN 110647537 A CN110647537 A CN 110647537A CN 201910906027 A CN201910906027 A CN 201910906027A CN 110647537 A CN110647537 A CN 110647537A
Authority
CN
China
Prior art keywords
target
search
intention
searching
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910906027.XA
Other languages
English (en)
Inventor
高翔
刘金财
于向丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201910906027.XA priority Critical patent/CN110647537A/zh
Publication of CN110647537A publication Critical patent/CN110647537A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种数据搜索方法、装置及存储介质,该方法包括:通过在接收目标终端发送的搜索指令之前,预先根据获取的用户信息从数据库的全量数据中提取出与用户信息相关的目标数据集,并根据用户信息确定预测搜索意图;进一步地,在接收目标终端发送的搜索指令之后,对搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据目标分词以及预测搜索意图对搜索内容进行意图分析处理得到目标搜索意图;进一步地,根据目标搜索意图以及目标分词对目标数据集进行搜索,得到与目标意图以及目标分词相匹配的目标搜索结果,并向目标终端返回目标搜索结果,以使目标终端向用户输出目标搜索结果。本申请实施例的搜索效率较高。

Description

数据搜索方法、装置及存储介质
技术领域
本申请涉及计算机网络技术领域,尤其涉及一种数据搜索方法、装置及存储介质。
背景技术
随着计算机网络技术的发展,搜索引擎的使用越来越普遍。用户可以通过搜索引擎进行信息查询。
现有的搜索方式中,当用户输入搜索内容并点击搜索按钮时,根据搜索内容对数据库的全量数据进行搜索。但是随着业务扩展和/或用户量的增多,数据库的数据量会大大增加,因此,现有的搜索方式的搜索效率较低。
发明内容
本申请实施例提供一种数据搜索方法、装置及存储介质,解决了现有技术中搜索效率较低的技术问题。
第一方面,本申请实施例提供一种数据搜索方法,包括:
获取目标终端对应的用户信息;其中,该用户信息包括以下至少一项:用户的操作行为数据、用户的属性数据;
根据该用户信息从数据库中提取出与该用户信息相关的目标数据集,并根据该用户信息确定预测搜索意图;
接收该目标终端发送的搜索指令;其中,该搜索指令为该用户向该目标终端输入的;
对该搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据该目标分词以及该预测搜索意图对该搜索内容进行意图分析处理得到目标搜索意图;
根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果;
向该目标终端返回该目标搜索结果,以使该目标终端向该用户输出该目标搜索结果。
在一种可能的实现方式中,该根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果,包括:
根据该目标搜索意图剔除该目标数据集中与该目标搜索意图不匹配的数据,得到目标搜索数据集;
根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的目标搜索结果。
在一种可能的实现方式中,该根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的目标搜索结果,包括:
根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的多个搜索结果以及每个该搜索结果对应的匹配度;
根据每个该搜索结果对应的匹配度,从该多个搜索结果中确定出该目标搜索结果。
在一种可能的实现方式中,该根据每个该搜索结果对应的匹配度,从该多个搜索结果中确定出该目标搜索结果,包括:
根据匹配度从高到低的顺序对该多个搜索结果进行排序,得到匹配度序列;
将位于该匹配度序列中的前面预设数量个搜索结果作为该目标搜索结果。
在一种可能的实现方式中,该根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果之前,该方法还包括:
对该目标数据集进行意图分析处理。
第二方面,本申请实施例提供一种数据搜索装置,包括:
获取模块,用于获取目标终端对应的用户信息;其中,该用户信息包括以下至少一项:用户的操作行为数据、用户的属性数据;
第一处理模块,用于根据该用户信息从数据库中提取出与该用户信息相关的目标数据集,并根据该用户信息确定出预测搜索意图;
接收模块,用于接收该目标终端发送的搜索指令;其中,该搜索指令为该用户向该目标终端输入的;
第二处理模块,用于对该搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据该目标分词以及该预测搜索意图对该搜索内容进行意图分析处理得到目标搜索意图;
搜索模块,用于根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果;
发送模块,用于向该目标终端返回该目标搜索结果,以使该目标终端向该用户输出该目标搜索结果。
在一种可能的实现方式中,该搜索模块,包括:
剔除单元,用于根据该目标搜索意图剔除该目标数据集中与该目标搜索意图不匹配的数据,得到目标搜索数据集;
搜索单元,用于根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的目标搜索结果。
在一种可能的实现方式中,该搜索单元具体用于:
根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的多个搜索结果以及每个该搜索结果对应的匹配度;
根据每个该搜索结果对应的匹配度,从该多个搜索结果中确定出该目标搜索结果。
在一种可能的实现方式中,该搜索单元具体用于:
根据匹配度从高到低的顺序对该多个搜索结果进行排序,得到匹配度序列;
将位于该匹配度序列中的前面预设数量个搜索结果作为该目标搜索结果。
在一种可能的实现方式中,该装置还包括:
第三处理模块,用于对该目标数据集进行意图分析处理。
第三方面,本申请实施例提供一种服务器,包括:存储器和处理器;
其中,该存储器,用于存储程序指令;
该处理器,用于调用并执行该存储器中存储的程序指令,当该处理器执行该存储器存储的程序指令时,该服务器用于执行上述第一方面的任一实现方式所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得计算机执行上述第一方面的任一实现方式所述的方法。
本申请实施例提供的数据搜索方法、装置及存储介质,本申请实施例提供的数据搜索方法、装置及存储介质,通过在接收目标终端发送的搜索指令之前,预先根据获取的用户信息从数据库的全量数据中提取出与该用户信息相关的目标数据集,并根据该用户信息确定预测搜索意图;进一步地,在接收目标终端发送的搜索指令之后,对该搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据该目标分词以及该预测搜索意图对该搜索内容进行意图分析处理得到目标搜索意图;进一步地,根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果,并向该目标终端返回该目标搜索结果,以使该目标终端向该用户输出该目标搜索结果。可见,相对于现有技术中在接收到搜索指令后对数据库的全量数据进行搜索的方式,本申请实施例中,一方面通过在接收到搜索指令之前预先从数据库的全量数据中提取出与用户信息相关的目标数据集,以便于在接收到搜索指令之后可以直接对该目标数据集进行搜索,从而可以提高搜索效率;另一方面,通过在接收到搜索指令之前预先根据用户信息确定出该用户的预测搜索意图,以便于在接收到搜索指令之后可以结合该预测搜索意图准确地分析出目标搜索意图,从而有利于提高目标搜索结果的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用场景示意图;
图2为本申请一实施例提供的数据搜索方法的流程示意图;
图3为本申请实施例提供的确定目标数据集的流程示意图;
图4为本申请实施例提供的确定目标搜索结果的部分流程示意图;
图5为本申请实施例提供的数据搜索装置的结构示意图;
图6为本申请实施例提供的服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先,对本申请实施例所涉及的应用场景和部分词汇进行介绍。
图1为本申请实施例提供的应用场景示意图,如图1所示,本申请实施例提供的应用场景中可以包括但不限于:至少一个目标终端(安装有具有搜索功能的应用程序),以及该应用程序对应的服务器。为了便于描述,图1中以至少一个目标终端包括目标终端A和目标终端B为例进行示出的。
本申请实施例中,用户可以通过对应的目标终端(例如目标终端A)中的该应用程序所提供的输入接口输入搜索指令,进而该目标终端向该应用程序对应的服务器发送该搜索指令,以使该服务器根据该搜索指令中携带的搜索内容进行搜索,并将得到的目标搜索结果返回给该目标终端,以便该目标终端输出给用户。
需要说明的是,该服务器在接收到该搜索指令之前会预先从数据库的全量数据中提取出与该目标终端所对应的用户信息相关的目标数据集,以便于在接收到该搜索指令之后可以直接对该目标数据集进行搜索,从而可以提高搜索效率。另一方面,该服务器在接收到该搜索指令之前还会预先根据该目标终端所对应的用户信息确定出该用户的预测搜索意图,以便于在接收到该搜索指令之后可以结合该预测搜索意图准确地分析出目标搜索意图,从而有利于提高目标搜索结果的准确性。
本申请实施例中涉及的具有搜索功能的应用程序可以包括但不限于:电信运营商客服应用程序。
本申请实施例中涉及的目标终端可以包括但不限于以下至少一项:台式机、电脑一体机、笔记本电脑、掌上电脑、平板电脑、手机。
本申请实施例中涉及的数据搜索装置可以为该服务器中的装置。示例性地,本申请实施例中涉及的数据搜索装置或服务器,可以通过软件和/或硬件实现。
本申请实施例中涉及的用户信息可以包括以下至少一项:用户的操作行为数据、用户的属性数据。其中,用户的操作行为数据用于指示用户对各网页的历史操作行为,用户的属性数据用于指示用户的基本信息。
示例性地,用户的属性数据可以包括但不限于以下至少一项:用户登录的位置信息、用户的搜索权限信息、用户接入电话的基础信息(例如电话号码、套餐信息等)。
随着计算机网络技术的发展,搜索引擎作为能够快速定位信息的主要手段,成为各个知识系统不可缺少的技术。例如,搜索引擎在电信运营商客服系统中也扮演重要角色。
现有的搜索方式中,当用户输入搜索内容并点击搜索按钮时,根据搜索内容对数据库的全量数据进行搜索。但是随着业务扩展和/或用户量的增多,数据库的数据量会大大增加,因此,现有的搜索方式的搜索效率较低。
本申请实施例提供的数据搜索方法、装置及存储介质,通过在接收目标终端发送的搜索指令之前,预先根据获取的用户信息从数据库的全量数据中提取出与该用户信息相关的目标数据集,并根据该用户信息确定预测搜索意图;进一步地,在接收目标终端发送的搜索指令之后,对该搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据该目标分词以及该预测搜索意图对该搜索内容进行意图分析处理得到目标搜索意图;进一步地,根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果,并向该目标终端返回该目标搜索结果,以使该目标终端向该用户输出该目标搜索结果。可见,相对于现有技术中在接收到搜索指令后对数据库的全量数据进行搜索的方式,本申请实施例中,一方面通过在接收到搜索指令之前预先从数据库的全量数据中提取出与用户信息相关的目标数据集,以便于在接收到搜索指令之后可以直接对该目标数据集进行搜索,从而可以提高搜索效率;另一方面,通过在接收到搜索指令之前预先根据用户信息确定出该用户的预测搜索意图,以便于在接收到搜索指令之后可以结合该预测搜索意图准确地分析出目标搜索意图,从而有利于提高目标搜索结果的准确性。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请一实施例提供的数据搜索方法的流程示意图。本申请实施例的执行主体可以为数据搜索装置,也可以为服务器(下述实施例中以服务器为例进行介绍)。如图2所示,本申请实施例的方法可以包括:
步骤S201、获取目标终端对应的用户信息。
本步骤中,服务器在接收到目标终端发送的搜索指令之前,预先获取该目标终端对应的用户信息;其中,该用户信息可以包括但不限于以下至少一项:用户的操作行为数据、用户的属性数据。
步骤S202、根据该用户信息从数据库中提取出与该用户信息相关的目标数据集,并根据该用户信息确定预测搜索意图。
本步骤中,服务器在接收到目标终端发送的搜索指令之前,可以采用机器学习算法预先对该用户信息进行分析得到分析结果,并根据该分析结果从数据库的全量数据中提取出与该分析结果(或该用户信息)相关的目标数据集,剔除了数据库中与该用户信息无关的数据,从而有利于后续可以直接对目标数据集进行快速地搜索。
图3为本申请实施例提供的确定目标数据集的流程示意图,如图3所示,假设用户信息包括:用户的操作行为数据和用户的属性数据,通过服务器中的机器学习调度模块将用户的操作行为数据和用户的属性数据分别分配到相应的机器学习模块分析处理,例如,将用户的操作行为数据分配到用户的操作行为数据机器学习模块进行分析处理,以及将用户的属性数据分配到用户的属性数据机器学习模块进行分析处理。进一步地,服务器根据各机器学习模块的分析结果以及对应的权重,从数据库的全量数据中提取出与该用户信息相关的目标数据集,从而剔除了数据库中与该用户信息无关的数据。
可以理解的是,服务器确定目标数据集时所采用的用户信息并不限于上述用户的操作行为数据和用户的属性数据,还可以根据业务需求进行相应的扩展,从而机器学习调度模块会将扩展数据进一步分配到相应的机器学习模块进行分析处理。
另外,服务器还可以采用机器学习算法预先对该用户信息进行分析确定出该用户的预测搜索意图,以便于后续结合预测搜索意图准确地分析出目标搜索意图。
示例性地,通过服务器中的机器学习模块结合自然语言处理算法预先对该用户信息进行分析确定出该用户的预测搜索意图,其中,该机器学习模块可以为通过深度学习算法和神经网络算法对电信运营商业务数据进行训练得到的。
步骤S203、接收该目标终端发送的搜索指令;其中,该搜索指令为该用户向该目标终端输入的。
本步骤中,服务器可以接收该目标终端发送的携带有搜索内容的搜索指令;其中,该搜索指令可以为该用户向该目标终端输入的。其中,具体的输入方式可以包括但不限于:语音输入、触控输入、键盘输入。
示例性地,当该用户通过该目标终端中具有搜索功能的应用程序所提供的输入接口输入搜索指令时,该目标终端会向该服务器(即该应用程序对应的服务器)发送该搜索指令,进而该服务器会接收该目标终端发送的该搜索指令。
步骤S204、对该搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据该目标分词以及该预测搜索意图对该搜索内容进行意图分析处理得到目标搜索意图。
本步骤中,服务器可以采用机器学习算法对该搜索指令中携带的搜索内容进行分词处理得到目标分词;进一步地,服务器可以结合该目标分词以及该预测搜索意图采用机器学习算法对该搜索内容进行意图分析处理得到目标搜索意图。可见,本申请实施例中,在目标分词的基础上,服务器进一步结合了上述步骤S202中预先确定的预测搜索意图来对该搜索内容进行意图分析处理,从而可以准确地确定出目标搜索意图。
步骤S205、根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果。
本步骤中,服务器可以根据上述步骤S204中所确定的该目标搜索意图以及该目标分词,对上述步骤S202中所确定的该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果。可见,相对于现有技术中对数据库的全量数据进行搜索的方式,本申请实施例中,只需根据该目标搜索意图以及该目标分词对预先确定的目标数据集进行搜索,从而搜索效率较高。
可选地,本申请实施例中,该服务器可以在上述步骤S205之前预先采用机器学习算法对该目标数据集进行意图分析处理,为该目标数据集中的各数据添加了意图标签,以便于后续进行意图匹配。
对应地,本步骤中,该服务器可以根据该目标搜索意图与该目标数据集中各数据对应的意图标签进行对比,剔除该目标数据集中与该目标搜索意图不匹配的数据(例如,意图标签与该目标搜索意图不一致的数据),从而得到目标搜索数据集(即与该目标搜索意图匹配的数据)。进一步地,该服务器可以根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的目标搜索结果。
本申请实施例的下述部分对“根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的目标搜索结果”的可实现方式进行介绍。
示例性地,该服务器可以根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的多个搜索结果以及每个该搜索结果对应的匹配度。其中,任一搜索结果对应的匹配度用于指示该搜索结果与该目标分词相匹配的程度,例如,匹配度可以包括但不限于:置信度。
例如,假设该目标分词包括分词1、该目标搜索数据集中的知识数据1、知识数据2和知识数据3中包括分词1,则该服务器可以根据该分词1对该目标搜索数据集进行搜索,得到包含有该分词1的知识数据1和知识数据1所对应的匹配度、知识数据2和知识数据2所对应的匹配度,知识数据3和知识数据3所对应的匹配度。其中,本申请实施例中涉及的知识数据可以包括但不限于:文章内容或网页内容。
进一步地,该服务器可以根据每个搜索结果对应的匹配度进行排序,然后从该多个搜索结果中确定出该目标搜索结果。示例性地,该服务器可以根据匹配度从高到低的顺序对该多个搜索结果进行排序得到匹配度序列,然后将位于该匹配度序列中的前面预设数量个搜索结果作为该目标搜索结果。
例如,假设该预设数量为2,该目标分词包括分词1,包含有该分词1的多个搜索结果包括:知识数据1、知识数据2和知识数据3,且知识数据1所对应的匹配度大于知识数据3所对应的匹配度,知识数据3所对应的匹配度大于知识数据2所对应的匹配度,则该服务器可以根据匹配度从高到低的顺序对该多个搜索结果进行排序得到匹配度序列(知识数据1->知识数据3->知识数据2),然后将位于该匹配度序列中的前面2个搜索结果(即知识数据1和知识数据3)作为该目标搜索结果。
需要说明的是,该服务器还可以根据匹配度从低到高的顺序对该多个搜索结果进行排序得到匹配度序列,然后将位于该匹配度序列中的末尾预设数量个搜索结果作为该目标搜索结果。
图4为本申请实施例提供的确定目标搜索结果的部分流程示意图,如图4所示,该服务器在接收目标终端发送的搜索指令之前,预先根据用户信息从数据库的全量数据中提取出与该用户信息相关的目标数据集,并根据该用户信息确定预测搜索意图,另外还通过该服务器中的意图生成机器学习模块结合自然语言处理算法对该目标数据集进行意图分析处理以使目标数据集中的每个数据都分配有对应的意图标签(例如,知识数据1对应的意图标签为意图a,意图c;知识数据2对应的意图标签为意图a,意图b;知识数据3对应的意图标签为意图e,意图h)。
进一步地,该服务器在接收目标终端发送的搜索指令之后,通过该服务器中的意图生成机器学习模块结合自然语言处理算法对该搜索指令中携带的搜索内容进行分词处理得到目标分词(例如分词1,分词2),并根据该目标分词以及该预测搜索意图对该搜索内容进行意图分析处理得到目标搜索意图(例如,意图a)。
进一步地,该服务器可以根据该目标搜索意图(例如,意图a)剔除该目标数据集中与该目标搜索意图不匹配的数据(例如知识数据3)得到目标搜索数据集,并根据该目标分词(例如分词1和分词2)对该目标搜索数据集进行搜索,得到包含有该目标分词的多个搜索结果以及每个搜索结果对应的置信度(例如,知识数据1和知识数据1所对应的置信度、知识数据2和知识数据2所对应的置信度)。
进一步地,该服务器可以根据每个搜索结果对应的匹配度进行排序(例如,假设知识数据1所对应的置信度1大于知识数据2所对应的置信度2,且按照置信度由大到小顺序排序,则知识数据1位于知识数据2之前),然后从该多个搜索结果中确定出该目标搜索结果(例如,假设预设数量为2,则确定该目标搜索结果包括知识数据1和知识数据2)。
步骤S206、向该目标终端返回该目标搜索结果,以使该目标终端向该用户输出该目标搜索结果。
本步骤中,该服务器可以向该目标终端返回该目标搜索结果,以使该目标终端向该用户输出该目标搜索结果。其中,若该目标搜索结果中包括多个知识数据,则该目标终端可以按照该目标搜索结果中各知识数据的顺序,以列表形式将各知识数据展示给该用户,以便该用户进行选择。应理解的是,该目标终端还可以采用其它形式将各知识数据展示给该用户。
本申请实施例中,该服务器在接收目标终端发送的搜索指令之前,预先根据获取的用户信息从数据库的全量数据中提取出与该用户信息相关的目标数据集,并根据该用户信息确定预测搜索意图;进一步地,该服务器在接收目标终端发送的搜索指令之后,对该搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据该目标分词以及该预测搜索意图对该搜索内容进行意图分析处理得到目标搜索意图;进一步地,该服务器根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果,并向该目标终端返回该目标搜索结果,以使该目标终端向该用户输出该目标搜索结果。可见,相对于现有技术中在接收到搜索指令后对数据库的全量数据进行搜索的方式,本申请实施例中,一方面通过在接收到搜索指令之前预先从数据库的全量数据中提取出与用户信息相关的目标数据集,以便于在接收到搜索指令之后可以直接对该目标数据集进行搜索,从而可以提高搜索效率;另一方面,通过在接收到搜索指令之前预先根据用户信息确定出该用户的预测搜索意图,以便于在接收到搜索指令之后可以结合该预测搜索意图准确地分析出目标搜索意图,从而有利于提高目标搜索结果的准确性。
图5为本申请实施例提供的数据搜索装置的结构示意图。如图5所示,本申请实施例提供的数据搜索装置50可以包括:获取模块501、第一处理模块502、接收模块503、第二处理模块504、搜索模块505以及发送模块506。
其中,获取模块501,用于获取目标终端对应的用户信息;其中,该用户信息包括以下至少一项:用户的操作行为数据、用户的属性数据;
第一处理模块502,用于根据该用户信息从数据库中提取出与该用户信息相关的目标数据集,并根据该用户信息确定出预测搜索意图;
接收模块503,用于接收该目标终端发送的搜索指令;其中,该搜索指令为该用户向该目标终端输入的;
第二处理模块504,用于对该搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据该目标分词以及该预测搜索意图对该搜索内容进行意图分析处理得到目标搜索意图;
搜索模块505,用于根据该目标搜索意图以及该目标分词对该目标数据集进行搜索,得到与该目标意图以及该目标分词相匹配的目标搜索结果;
发送模块506,用于向该目标终端返回该目标搜索结果,以使该目标终端向该用户输出该目标搜索结果。
在一种可能的实现方式中,该搜索模块505,包括:
剔除单元,用于根据该目标搜索意图剔除该目标数据集中与该目标搜索意图不匹配的数据,得到目标搜索数据集;
搜索单元,用于根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的目标搜索结果。
在一种可能的实现方式中,该搜索单元具体用于:
根据该目标分词对该目标搜索数据集进行搜索,得到包含有该目标分词的多个搜索结果以及每个该搜索结果对应的匹配度;
根据每个该搜索结果对应的匹配度,从该多个搜索结果中确定出该目标搜索结果。
在一种可能的实现方式中,该搜索单元具体用于:
根据匹配度从高到低的顺序对该多个搜索结果进行排序,得到匹配度序列;
将位于该匹配度序列中的前面预设数量个搜索结果作为该目标搜索结果。
在一种可能的实现方式中,该数据搜索装置50还包括:
第三处理模块,用于对该目标数据集进行意图分析处理。
本申请实施例提供的数据搜索装置,可以用于执行本申请上述数据搜索方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本申请实施例提供的服务器的结构示意图。如图6所示,本申请实施例提供的服务器60可以包括:存储器601和处理器602。
其中,该存储器601,用于存储程序指令;
该处理器602,用于调用并执行该存储器601中存储的程序指令,当该处理器602执行该存储器601存储的程序指令时,该服务器60用于执行本申请上述数据搜索方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得计算机执行本申请上述数据搜索方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (12)

1.一种数据搜索方法,其特征在于,包括:
获取目标终端对应的用户信息;其中,所述用户信息包括以下至少一项:用户的操作行为数据、用户的属性数据;
根据所述用户信息从数据库中提取出与所述用户信息相关的目标数据集,并根据所述用户信息确定预测搜索意图;
接收所述目标终端发送的搜索指令;其中,所述搜索指令为所述用户向所述目标终端输入的;
对所述搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据所述目标分词以及所述预测搜索意图对所述搜索内容进行意图分析处理得到目标搜索意图;
根据所述目标搜索意图以及所述目标分词对所述目标数据集进行搜索,得到与所述目标意图以及所述目标分词相匹配的目标搜索结果;
向所述目标终端返回所述目标搜索结果,以使所述目标终端向所述用户输出所述目标搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标搜索意图以及所述目标分词对所述目标数据集进行搜索,得到与所述目标意图以及所述目标分词相匹配的目标搜索结果,包括:
根据所述目标搜索意图剔除所述目标数据集中与所述目标搜索意图不匹配的数据,得到目标搜索数据集;
根据所述目标分词对所述目标搜索数据集进行搜索,得到包含有所述目标分词的目标搜索结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标分词对所述目标搜索数据集进行搜索,得到包含有所述目标分词的目标搜索结果,包括:
根据所述目标分词对所述目标搜索数据集进行搜索,得到包含有所述目标分词的多个搜索结果以及每个所述搜索结果对应的匹配度;
根据每个所述搜索结果对应的匹配度,从所述多个搜索结果中确定出所述目标搜索结果。
4.根据权利要求3所述的方法,其特征在于,所述根据每个所述搜索结果对应的匹配度,从所述多个搜索结果中确定出所述目标搜索结果,包括:
根据匹配度从高到低的顺序对所述多个搜索结果进行排序,得到匹配度序列;
将位于所述匹配度序列中的前面预设数量个搜索结果作为所述目标搜索结果。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据所述目标搜索意图以及所述目标分词对所述目标数据集进行搜索,得到与所述目标意图以及所述目标分词相匹配的目标搜索结果之前,所述方法还包括:
对所述目标数据集进行意图分析处理。
6.一种数据搜索装置,其特征在于,包括:
获取模块,用于获取目标终端对应的用户信息;其中,所述用户信息包括以下至少一项:用户的操作行为数据、用户的属性数据;
第一处理模块,用于根据所述用户信息从数据库中提取出与所述用户信息相关的目标数据集,并根据所述用户信息确定出预测搜索意图;
接收模块,用于接收所述目标终端发送的搜索指令;其中,所述搜索指令为所述用户向所述目标终端输入的;
第二处理模块,用于对所述搜索指令中携带的搜索内容进行分词处理得到目标分词,并根据所述目标分词以及所述预测搜索意图对所述搜索内容进行意图分析处理得到目标搜索意图;
搜索模块,用于根据所述目标搜索意图以及所述目标分词对所述目标数据集进行搜索,得到与所述目标意图以及所述目标分词相匹配的目标搜索结果;
发送模块,用于向所述目标终端返回所述目标搜索结果,以使所述目标终端向所述用户输出所述目标搜索结果。
7.根据权利要求6所述的装置,其特征在于,所述搜索模块,包括:
剔除单元,用于根据所述目标搜索意图剔除所述目标数据集中与所述目标搜索意图不匹配的数据,得到目标搜索数据集;
搜索单元,用于根据所述目标分词对所述目标搜索数据集进行搜索,得到包含有所述目标分词的目标搜索结果。
8.根据权利要求7所述的装置,其特征在于,所述搜索单元具体用于:
根据所述目标分词对所述目标搜索数据集进行搜索,得到包含有所述目标分词的多个搜索结果以及每个所述搜索结果对应的匹配度;
根据每个所述搜索结果对应的匹配度,从所述多个搜索结果中确定出所述目标搜索结果。
9.根据权利要求8所述的装置,其特征在于,所述搜索单元具体用于:
根据匹配度从高到低的顺序对所述多个搜索结果进行排序,得到匹配度序列;
将位于所述匹配度序列中的前面预设数量个搜索结果作为所述目标搜索结果。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述装置还包括:
第三处理模块,用于对所述目标数据集进行意图分析处理。
11.一种服务器,其特征在于,包括:存储器和处理器;
其中,所述存储器,用于存储程序指令;
所述处理器,用于调用并执行所述存储器中存储的程序指令,当所述处理器执行所述存储器存储的程序指令时,所述服务器用于执行如权利要求1-5中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-5中任一项所述的方法。
CN201910906027.XA 2019-09-24 2019-09-24 数据搜索方法、装置及存储介质 Pending CN110647537A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910906027.XA CN110647537A (zh) 2019-09-24 2019-09-24 数据搜索方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910906027.XA CN110647537A (zh) 2019-09-24 2019-09-24 数据搜索方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN110647537A true CN110647537A (zh) 2020-01-03

Family

ID=68992520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910906027.XA Pending CN110647537A (zh) 2019-09-24 2019-09-24 数据搜索方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110647537A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625706A (zh) * 2020-05-22 2020-09-04 北京百度网讯科技有限公司 信息检索方法、装置、设备及存储介质
CN114154072A (zh) * 2021-12-08 2022-03-08 北京度友信息技术有限公司 检索方法、装置、电子设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164447A (zh) * 2011-12-14 2013-06-19 阿里巴巴集团控股有限公司 一种搜索目标信息的方法及装置
CN105159937A (zh) * 2015-08-03 2015-12-16 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105224661A (zh) * 2015-09-30 2016-01-06 北京奇虎科技有限公司 会话式的信息搜索方法及装置
CN106708887A (zh) * 2015-11-17 2017-05-24 镇江诺尼基智能技术有限公司 一种意图驱动的产品搜索系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164447A (zh) * 2011-12-14 2013-06-19 阿里巴巴集团控股有限公司 一种搜索目标信息的方法及装置
CN105159937A (zh) * 2015-08-03 2015-12-16 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105224661A (zh) * 2015-09-30 2016-01-06 北京奇虎科技有限公司 会话式的信息搜索方法及装置
CN106708887A (zh) * 2015-11-17 2017-05-24 镇江诺尼基智能技术有限公司 一种意图驱动的产品搜索系统和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625706A (zh) * 2020-05-22 2020-09-04 北京百度网讯科技有限公司 信息检索方法、装置、设备及存储介质
CN114154072A (zh) * 2021-12-08 2022-03-08 北京度友信息技术有限公司 检索方法、装置、电子设备以及存储介质

Similar Documents

Publication Publication Date Title
CN109408526B (zh) Sql语句生成方法、装置、计算机设备及存储介质
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
CN106776544B (zh) 人物关系识别方法及装置和分词方法
CN107657048B (zh) 用户识别方法及装置
CN110069698B (zh) 信息推送方法和装置
CN111176996A (zh) 测试用例生成方法、装置、计算机设备及存储介质
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
CN107885717B (zh) 一种关键词提取方法及装置
CN111159334A (zh) 用于房源跟进信息处理的方法及系统
JP2022510818A (ja) 改良されたデータマッチングのためのデータレコードの字訳
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
CN110647537A (zh) 数据搜索方法、装置及存储介质
CN115392235A (zh) 字符匹配方法、装置、电子设备及可读存储介质
CN107871055B (zh) 一种数据分析方法和装置
CN106919593B (zh) 一种搜索的方法和装置
CN112148841B (zh) 一种对象分类以及分类模型构建方法和装置
CN112749258A (zh) 数据搜索的方法和装置、电子设备和存储介质
CN115563515B (zh) 文本相似性检测方法、装置、设备及存储介质
CN115858742A (zh) 问题文本扩充方法、装置、设备及存储介质
CN115374849A (zh) 企业相关专利检索方法、装置、设备及介质
CN111859148A (zh) 主题的提取方法、装置、设备及计算机可读存储介质
CN113204697A (zh) 一种搜索方法、装置、电子设备及存储介质
CN111753548A (zh) 信息获取方法及装置、计算机存储介质、电子设备
CN112148855A (zh) 一种智能客服问题检索方法、终端以及存储介质
CN112015773A (zh) 知识库的检索方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200103

RJ01 Rejection of invention patent application after publication