CN113360743A - 查询数据过滤方法、装置、计算机设备和存储介质 - Google Patents

查询数据过滤方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113360743A
CN113360743A CN202110780666.3A CN202110780666A CN113360743A CN 113360743 A CN113360743 A CN 113360743A CN 202110780666 A CN202110780666 A CN 202110780666A CN 113360743 A CN113360743 A CN 113360743A
Authority
CN
China
Prior art keywords
query
data
data filtering
historical
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110780666.3A
Other languages
English (en)
Inventor
徐律冠
罗欢
刘叶楠
余芸
姜唯
陈文平
彭钦青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical Southern Power Grid Digital Grid Research Institute Co Ltd
Priority to CN202110780666.3A priority Critical patent/CN113360743A/zh
Publication of CN113360743A publication Critical patent/CN113360743A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种查询数据过滤方法、装置、计算机设备和存储介质。所述方法包括:接收携带查询关键词的数据查询请求,获取与查询关键词对应的初始查询结果,基于查询关键词,确定数据过滤条件,然后,根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。本申请提供的方案,不再单一地依赖查询关键字推送查询结果,而是根据查询关键词确定数据过滤条件,根据数据过滤条件对初始查询结果进行了过滤,过滤掉不符合用户查询需求的查询结果,快速推送符合用户查询需求的查询结果,从而降低了用户的查询工作量,提高了查询效率。

Description

查询数据过滤方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据处理技术领域,特别是涉及一种查询数据过滤方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的快速发展,个性化查询成为各大查询引擎的主要目标之一,其主要依据是用户点击数据建立的用户模型,刻画出用户兴趣特征,以此来完成个性化查询。个性化查询的主要目标是根据用户兴趣不同,为不同用户返回满足其需要的个性化排序列表。
目前,主流的个性化算法是基于文本内容进行分析,即通过比较用户兴趣与文档相似度来对结果进行重排,具体过程通常是首先在查询引擎中直接键入查询关键字,然后在查询引擎返回的众多查询结果中,选择用户当前所需要的查询结果。但是这种单一地依赖查询关键字来获取查询结果的方式,获得的查询结果不仅数量很大,而且往往包含许多与用户查询需求不相符的查询结果,不能很好地匹配用户当前的查询需要,使得用户需要进行多次查询,计算机需要多次进行检索,才能推送出符合用户需求的数据。
综上所述,现有的数据查询方式存在查询效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种提高查询效率的查询数据过滤方法、装置、计算机设备和存储介质。
一种查询数据过滤方法,所述方法包括:
接收数据查询请求,数据查询请求携带查询关键词;
获取与查询关键词对应的初始查询结果;
基于查询关键词,确定数据过滤条件;
根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。
在一个实施例中,基于查询关键词,确定数据过滤条件包括:
根据查询关键词,从已存的用户操作数据中提取与查询关键词相关联的历史查询结果;
基于历史查询结果,确定数据过滤条件。
在一个实施例中,基于历史查询结果,确定数据过滤条件包括:
对历史查询结果进行分类处理,得到分类后的历史查询结果;
对分类后的历史查询结果进行特征提取,得到目标特征词;
根据目标特征词,构建特征向量;
基于特征向量,确定数据过滤条件。
在一个实施例中,对历史查询结果进行分类处理,得到分类后的历史查询结果包括:
计算历史查询结果与查询关键词的关键词匹配数量和/或相似度;
根据关键词匹配数量和/或相似度,对历史查询结果进行分类处理,得到分类后的历史查询结果。
在一个实施例中,基于历史查询结果,确定数据过滤条件包括:
提取历史查询结果的查询特征词;
统计查询特征词的查询频率、并根据查询频率对查询特征词进行排序,确定用户查询偏好数据;
根据用户查询偏好数据,确定数据过滤条件。
在一个实施例中,对分类后的历史查询结果进行特征提取,得到目标特征词包括:
从分类后的历史查询结果中删除查询关键词,得到目标查询结果;
提取目标查询结果中的特征词;
对提取后的特征词进行数量统计、并排序,得到目标特征词。
在一个实施例中,对提取后的特征词进行数量统计、并排序,得到目标特征词之后,还包括:
根据目标特征词的排序值,确定目标特征词的得分;
推送携带目标特征词的得分的用户反馈意见收集界面配置数据至用户终端;
接收用户终端反馈的用户反馈数据,根据用户反馈数据调整目标特征词的得分。
一种查询数据过滤装置,所述装置包括:
请求接收模块,用于接收数据查询请求,所述数据查询请求携带查询关键词;
数据查询模块,用于获取与所述查询关键词对应的初始查询结果;
过滤条件确定模块,用于基于所述查询关键词,确定数据过滤条件;
数据过滤模块,用于根据所述数据过滤条件对所述初始查询结果进行过滤,推送过滤后的目标查询结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收数据查询请求,数据查询请求携带查询关键词;
获取与查询关键词对应的初始查询结果;
基于查询关键词,确定数据过滤条件;
根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收数据查询请求,数据查询请求携带查询关键词;
获取与查询关键词对应的初始查询结果;
基于查询关键词,确定数据过滤条件;
根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。
上述查询数据过滤方法、装置、计算机设备和存储介质,接收携带查询关键词的数据查询请求,获取与查询关键词对应的初始查询结果,基于查询关键词,确定数据过滤条件,然后,根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。上述方法,不再单一地依赖查询关键字推送查询结果,而是根据查询关键词确定数据过滤条件,根据数据过滤条件对初始查询结果进行了过滤,过滤掉不符合用户查询需求的查询结果,快速推送符合用户查询需求的查询结果,从而降低了用户的查询工作量,提高了查询效率。
附图说明
图1为一个实施例中查询数据过滤方法的应用环境图;
图2为一个实施例中查询数据过滤方法的流程示意图;
图3为一个实施例中确定数据过滤条件步骤的流程示意图;
图4为另一个实施例中确定数据过滤条件步骤的流程示意图;
图5为一个实施例中查询数据过滤装置的结构框图;
图6为另一个实施例中查询数据过滤装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的查询数据过滤方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与部署有搜索引擎的服务器104进行通信。具体的,可以是用户于用户终端的搜索引擎进行数据查询,于搜索引擎的输入框输入查询关键词,发送携带查询关键词的数据查询请求至服务器104,服务器104接收数据查询请求,获取与查询关键词对应的初始查询结果,基于查询关键词,确定数据过滤条件,根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种查询数据过滤方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,接收数据查询请求,数据查询请求携带查询关键词。
具体实施时,可以是用户于用户终端的搜索引擎进行数据查询,于搜索引擎的输入框输入查询关键词,发送携带查询关键词的数据查询请求至服务器。
步骤204,获取与查询关键词对应的初始查询结果。
实际应用中,实际应用中,为了查找到最符合需求的数据,用户可能会多次输入查询关键词,并且调整查询关键词。在用户每次的搜索过程中,会记录下用户输入的搜索关键字,以及在本轮搜索中,用户动调整的关键词和不变的关键词。并且,包括用户感兴趣点击的信息例如搜索结果和题目,也会进行记录。本实施例中,当接收到数据查询请求后,便会记录该查询关键词,根据该查询关键词进行网页搜索,从互联网上采集与查询关键词相应的信息,得到初始查询结果。
步骤206,基于查询关键词,确定数据过滤条件。
实际应用中,使用的查询关键词的数量越少,查询的范围越大,检索出的查询结果数量越多,反之,查询关键词的数量越多,查询范围越小,检索出的查询结果数量越少,结果越贴近用户需求。其中,包含较多冗余的查询结果,因此,可根据查询关键词,自动确定与查询关键词相关联的关键词,得到数据过滤条件,增加查询关键词的数量,缩小检索范围数据。本实施例中,当得到初始查询结果后,为了筛选出最接近用户查询需求的查询结果,需要对初始查询结果进行过滤。具体实施时,可以是根据查询关键词确定数据过滤条件,设置数据过滤条件,以对初始查询结果进行过滤。包括分析查询关键词,以及与该查询关键词相关联的关键词,设置数据过滤条件。例如,用户输入的查询关键词为“java api调用”,那么在搜索过程中,会记录下来关键词主体,譬如为“java api”,用户再次调整查询关键词,例如“java调用api接口实例”或者“java实现接口的方法”,再次记录调整查询关键词,然后,根据查询关键词和相关联的调整查询关键词,设置数据过滤条件。还可以是根据查询关键词,获取相关联的历史查询结果,根据历史查询结果,确定数据过滤条件。本实施例中,数据过滤条件可以是设置相应的数据过滤指标或数据过滤标签。
步骤208,根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。
确定数据过滤条件后,可以根据数据过滤条件对初始查询结果进行过滤,过滤掉与查询关键词不相符的查询结果,然后,将过滤后的查询结果推送至用户终端。
上述查询数据过滤方法中,接收携带查询关键词的数据查询请求,获取与查询关键词对应的初始查询结果,基于查询关键词,确定数据过滤条件,然后,根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。上述方法,不再单一地依赖查询关键字推送查询结果,根据查询关键词,确定数据过滤条件,根据数据过滤条件对初始查询结果进行了过滤,过滤掉不符合用户查询需求的查询结果,快速推送出符合用户查询需求的查询结果,从而降低了用户的查询工作量,提高了查询效率。
在一个实施例中,步骤206包括:
步骤226,根据查询关键词,从已存的用户操作数据中提取与查询关键词相关联的历史查询结果;
步骤246,基于历史查询结果,确定数据过滤条件。
用户操作数据即指用户进行搜索时所产生的数据,包括用户历史搜索记录,具体的,包括用户点击打开的文档数据、查询关键词以及针对查询关键词查找出的查询结果。具体实施时,每次的数据搜索,都会设置相应的数据过滤条件进行数据过滤。与查询关键词相关联的历史查询结果包括相同的查询关键词的历史查询关键词以及与该历史查询关键词对应的历史查询结果,还包括与查询关键词相关或相似的相似查询关键词以及与相似查询关键词对应的历史查询结果。例如,本次用户输入的查询关键词为“java api”,在用户历史搜索记录中,包含历史查询关键词“java api调用”或者“api调用”。可通过相似度计算和关键词,从已存的用户操作数据中提取出““java api调用”或者“api调用””对应点的历史查询结果,然后分析提取出的历史查询结果,确定数据过滤条件。本实施例中,根据与查询关键词相关联的历史查询结果确定数据过滤条件,能够分析用户感兴趣的搜索内容,贴近用户需求。
如图3所示,在一个实施例中,步骤246包括:
步骤256,对历史查询结果进行分类处理,得到分类后的历史查询结果;
步骤266,对分类后的历史查询结果进行特征提取,得到目标特征词;
步骤276,根据目标特征词,构建特征向量;
步骤286,基于特征向量,确定数据过滤条件。
目标特征词即指能够表征用户兴趣喜好的特征词,包括搜索特征词或搜索关键字。承接上一实施例,基于历史查询结果,确定数据过滤条件可以是比较每条历史查询结果与查询关键词的匹配程度或相似度,根据匹配程度或相似度对历史查询结果进行分类,得到分类后的历史查询结果,使得比较相似的历史查询结果被分为一组。然后,对每类历史查询结果进行特征数据提取,得到目标特征词,然后将超过预设相似度阈值的目标特征词进行合并,得到特征向量,基于特征向量,确定数据过滤条件。
如图4所示,在一个实施例中,步骤256包括:步骤258,计算历史查询结果与查询关键词的关键词匹配数量和/或相似度,根据关键词匹配数量和/或相似度,对历史查询结果进行分类处理,得到分类后的历史查询结果。
具体实施时,评估历史查询结果与查询关键词的匹配程度可以是计算历史查询结果与查询关键词的关键词匹配数量和/或相似度。查询关键词的数量可以是多个,统计每次查找出的历史查询结果,与查询关键词的关键词匹配数量,例如,本次的查询关键词的数为4个,包括“java、调用、api和接口实例”,历史查询结果可能包括查询关键词中的一个或多个关键词,即与查询关键词的关键词匹配数量可能是一个或两个。因此,根据关键词匹配数量,对历史查询结果进行分类,得到关键词匹配数量分别为“1”、“2”、“3”和/或“4”对应分组的历史查询结果。或者,计算历史查询结果与查询关键词的相似度,将相似度划分为多个相似度区间,根据相似度区间,对历史查询结果进行分类。
如图4所示,在另一个实施例中,步骤266包括:步骤268,从分类后的历史查询结果中删除查询关键词,得到目标查询结果,提取目标查询结果中的特征词,对提取后的特征词进行数量统计、并排序,得到目标特征词。
具体实施时,历史查询结果中特征词出现次数最多的,无疑是查询关键词,因此,为了进一步分析出用作过滤标签的特征词,同时减少数据处理量,可以从分类后的历史查询结果中删除查询关键词,得到目标查询结果。然后,提取出目标查询结果中除查询关键词之外的特征词,进行对提取出的特征词进行出现次数统计,并且,根据每个提取出的特征词的出现次数,按照由多到少的顺序对特征词进行排序,得到目标特征词。本实施例中,通过对特征词进行统计和排序,便于进行用户兴趣建模和个性化排序。
在一个实施例中,基于历史查询结果,确定数据过滤条件还包括:步骤296,提取历史查询结果的查询特征词,统计查询特征词的查询频率、并根据查询频率对查询特征词进行排序,确定用户查询偏好数据,根据用户查询偏好数据,确定数据过滤条件。
具体实施时,用户每次输入的查询关键词可以分为“固定的查询关键词”(即主体关键词)以及“调整的查询关键词”(即调整关键词),显而易见,固定关键词的查询频率应是最高的,根据该固定的查询关键词,能基本确定用户想要查询的目标是什么。故,可提取历史查询结果的查询特征词,统计每个查询特征词的出现频率,包括用户搜索过程中感兴趣点击查看的数据中所包含的特征词都在提取范围内。在统计出查询特征词的查询频率后,可根据查询频率的大小对查询特征词进行排序,根据排序后的特征词便能总结出用户查询偏好数据即用户偏好,根据该用户查询偏好数据,确定数据过滤条件,以便实现能够根据用户的喜好进行个性化推荐。
在一个实施例中,对提取后的特征词进行数量统计、并排序,得到目标特征词之后,还包括:根据目标特征词的排序值,确定目标特征词的得分;推送携带目标特征词的得分的用户反馈意见收集界面配置数据至用户终端;接收用户终端反馈的用户反馈数据,根据用户反馈数据调整目标特征词的得分。
实际应用中,对于目标特征词的提取和数据过滤条件是一个不断优化调整的过程,可以是根据用户的反馈数据进行优化调整。具体实施时,可以是根据排序值对目标特征词进行打分,如,取排名前十的特征词,分差为10分,设置排名前十的特征词对应的得分为100、90、80,…,10分,然后,推送携带该得分的用户反馈意见收集界面配置数据至用户终端,用户终端显示对应的用户反馈意见收集界面,供用户输入反馈数据,具体的,若用户对目标特征词的得分有不同看法,认为不能表征用户查询偏好数据或用户意图的目标特征词其得分较高且排列在前,可对特征词的得分进行降分处理,对于能够表征用户查询偏好数据或用户意图的目标特征词,而其得分较低排列在后的情况,可以对该得分进行加分处理。如此,根据用户反馈数据,进一步调整目标特征词的得分,以便在下一次搜索过程中,优先根据目标特征词分值高进行网页搜索,推荐相应的查询结果,并对待推荐的查询结果进行排序,实现个性化排序推荐。
应该理解的是,虽然上述实施例涉及的各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述实施例涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种查询数据过滤装置,包括:请求接收模块510、数据查询模块520、过滤条件确定模块530和数据过滤模块540,其中:
请求接收模块510,用于接收数据查询请求,所述数据查询请求携带查询关键词。
数据查询模块520,用于获取与所述查询关键词对应的初始查询结果。
过滤条件确定模块530,用于基于所述查询关键词,确定数据过滤条件。
数据过滤模块540,用于根据所述数据过滤条件对所述初始查询结果进行过滤,推送过滤后的目标查询结果。
上述查询数据过滤装置,接收携带查询关键词的数据查询请求,获取与查询关键词对应的初始查询结果,基于查询关键词,确定数据过滤条件,然后,根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。上述装置,不再单一地依赖查询关键字推送查询结果,根据查询关键词,确定数据过滤条件,根据数据过滤条件对初始查询结果进行了过滤,过滤掉不符合用户查询需求的查询结果,快速推送符合用户查询需求的查询结果,从而降低了用户的查询工作量,提高了查询效率。
在一个实施例中,过滤条件确定模块530还用于根据查询关键词,从已存的用户操作数据中提取与查询关键词相关联的历史查询结果,基于历史查询结果,确定数据过滤条件。
在一个实施例中,过滤条件确定模块530包括数据分类单元532,用于对历史查询结果进行分类处理,得到分类后的历史查询结果;特征数据提取单元534,用于对分类后的历史查询结果进行特征提取,得到目标特征词;特征向量构建单元536,用于根据目标特征词,构建特征向量;数据过滤条件确定单元538,用于基于特征向量,确定数据过滤条件。
在一个实施例中,数据分类单元532还用于计算历史查询结果与查询关键词的关键词匹配数量和/或相似度;根据关键词匹配数量和/或相似度,对历史查询结果进行分类处理,得到分类后的历史查询结果。
在一个实施例中,过滤条件确定模块530还用于提取历史查询结果的查询特征词;统计查询特征词的查询频率、并根据查询频率对查询特征词进行排序,确定用户查询偏好数据;根据用户查询偏好数据,确定数据过滤条件。
在一个实施例中,特征数据提取单元534还用于从分类后的历史查询结果中删除查询关键词,得到目标查询结果;提取目标查询结果中的特征词;对提取后的特征词进行数量统计、并排序,得到目标特征词。
如图6所示,在一个实施例中,装置还包括反馈数据处理模块550,用于根据目标特征词的排序值,确定目标特征词的得分;推送携带目标特征词的得分的用户反馈意见收集界面配置数据至用户终端;接收用户终端反馈的用户反馈数据,根据用户反馈数据调整目标特征词的得分。
关于查询数据过滤装置的具体实施例可以参见上文中对于查询数据过滤方法的实施例,在此不再赘述。上述查询数据过滤装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户操作数据、查询关键词等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种查询数据过滤方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收数据查询请求,数据查询请求携带查询关键词;获取与查询关键词对应的初始查询结果;基于查询关键词,确定数据过滤条件;根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据查询关键词,从已存的用户操作数据中提取与查询关键词相关联的历史查询结果;基于历史查询结果,确定数据过滤条件。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对历史查询结果进行分类处理,得到分类后的历史查询结果;对分类后的历史查询结果进行特征提取,得到目标特征词;根据目标特征词,构建特征向量;基于特征向量,确定数据过滤条件。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:计算历史查询结果与查询关键词的关键词匹配数量和/或相似度;根据关键词匹配数量和/或相似度,对历史查询结果进行分类处理,得到分类后的历史查询结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:提取历史查询结果的查询特征词;统计查询特征词的查询频率、并根据查询频率对查询特征词进行排序,确定用户查询偏好数据;根据用户查询偏好数据,确定数据过滤条件。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从分类后的历史查询结果中删除查询关键词,得到目标查询结果;提取目标查询结果中的特征词;对提取后的特征词进行数量统计、并排序,得到目标特征词。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据目标特征词的排序值,确定目标特征词的得分;推送携带目标特征词的得分的用户反馈意见收集界面配置数据至用户终端;接收用户终端反馈的用户反馈数据,根据用户反馈数据调整目标特征词的得分。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤接收数据查询请求,数据查询请求携带查询关键词;获取与查询关键词对应的初始查询结果;基于查询关键词,确定数据过滤条件;根据数据过滤条件对初始查询结果进行过滤,推送过滤后的目标查询结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据查询关键词,从已存的用户操作数据中提取与查询关键词相关联的历史查询结果;基于历史查询结果,确定数据过滤条件。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对历史查询结果进行分类处理,得到分类后的历史查询结果;对分类后的历史查询结果进行特征提取,得到目标特征词;根据目标特征词,构建特征向量;基于特征向量,确定数据过滤条件。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算历史查询结果与查询关键词的关键词匹配数量和/或相似度;根据关键词匹配数量和/或相似度,对历史查询结果进行分类处理,得到分类后的历史查询结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:提取历史查询结果的查询特征词;统计查询特征词的查询频率、并根据查询频率对查询特征词进行排序,确定用户查询偏好数据;根据用户查询偏好数据,确定数据过滤条件。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从分类后的历史查询结果中删除查询关键词,得到目标查询结果;提取目标查询结果中的特征词;对提取后的特征词进行数量统计、并排序,得到目标特征词。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据目标特征词的排序值,确定目标特征词的得分;推送携带目标特征词的得分的用户反馈意见收集界面配置数据至用户终端;接收用户终端反馈的用户反馈数据,根据用户反馈数据调整目标特征词的得分。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种查询数据过滤方法,其特征在于,所述方法包括:
接收数据查询请求,所述数据查询请求携带查询关键词;
获取与所述查询关键词对应的初始查询结果;
基于所述查询关键词,确定数据过滤条件;
根据所述数据过滤条件对所述初始查询结果进行过滤,推送过滤后的目标查询结果。
2.根据权利要求1所述的查询数据过滤方法,其特征在于,所述基于所述查询关键词,确定数据过滤条件包括:
根据所述查询关键词,从已存的用户操作数据中提取与所述查询关键词相关联的历史查询结果;
基于所述历史查询结果,确定数据过滤条件。
3.根据权利要求2所述的查询数据过滤方法,其特征在于,所述基于所述历史查询结果,确定数据过滤条件包括:
提取所述历史查询结果的查询特征词;
统计所述查询特征词的查询频率、并根据查询频率对所述查询特征词进行排序,确定用户查询偏好数据;
根据所述用户查询偏好数据,确定数据过滤条件。
4.根据权利要求2所述的查询数据过滤方法,其特征在于,所述基于所述历史查询结果,确定数据过滤条件包括:
对所述历史查询结果进行分类处理,得到分类后的历史查询结果;
对分类后的历史查询结果进行特征提取,得到目标特征词;
根据所述目标特征词,构建特征向量;
基于所述特征向量,确定数据过滤条件。
5.根据权利要求4所述的查询数据过滤方法,其特征在于,所述对所述历史查询结果进行分类处理,得到分类后的历史查询结果包括:
计算所述历史查询结果与所述查询关键词的关键词匹配数量和/或相似度;
根据所述关键词匹配数量和/或所述相似度,对所述历史查询结果进行分类处理,得到分类后的历史查询结果。
6.根据权利要求4所述的查询数据过滤方法,其特征在于,所述对分类后的历史查询结果进行特征提取,得到目标特征词包括:
从所述分类后的历史查询结果中删除所述查询关键词,得到目标查询结果;
提取所述目标查询结果中的特征词;
对提取后的特征词进行数量统计、并排序,得到目标特征词。
7.根据权利要求6所述的查询数据过滤方法,其特征在于,所述对提取后的特征词进行数量统计、并排序,得到目标特征词之后,还包括:
根据所述目标特征词的排序值,确定所述目标特征词的得分;
推送携带所述目标特征词的得分的用户反馈意见收集界面配置数据至用户终端;
接收所述用户终端反馈的用户反馈数据,根据所述用户反馈数据调整所述目标特征词的得分。
8.一种查询数据过滤装置,其特征在于,所述装置包括:
请求接收模块,用于接收数据查询请求,所述数据查询请求携带查询关键词;
数据查询模块,用于获取与所述查询关键词对应的初始查询结果;
过滤条件确定模块,用于基于所述查询关键词,确定数据过滤条件;
数据过滤模块,用于根据所述数据过滤条件对所述初始查询结果进行过滤,推送过滤后的目标查询结果。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110780666.3A 2021-07-09 2021-07-09 查询数据过滤方法、装置、计算机设备和存储介质 Pending CN113360743A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110780666.3A CN113360743A (zh) 2021-07-09 2021-07-09 查询数据过滤方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110780666.3A CN113360743A (zh) 2021-07-09 2021-07-09 查询数据过滤方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113360743A true CN113360743A (zh) 2021-09-07

Family

ID=77539007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110780666.3A Pending CN113360743A (zh) 2021-07-09 2021-07-09 查询数据过滤方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113360743A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置
CN104484380A (zh) * 2014-12-09 2015-04-01 百度在线网络技术(北京)有限公司 个性化搜索方法及装置
CN105320706A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 搜索结果的处理方法和装置
CN107346316A (zh) * 2016-05-06 2017-11-14 北京搜狗科技发展有限公司 一种搜索方法、装置及电子设备
CN107562750A (zh) * 2016-06-30 2018-01-09 百度在线网络技术(北京)有限公司 一种用于提供搜索结果的方法和装置
CN112749238A (zh) * 2020-12-30 2021-05-04 北京金堤征信服务有限公司 搜索排序方法、装置、电子设备以及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置
CN105320706A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 搜索结果的处理方法和装置
CN104484380A (zh) * 2014-12-09 2015-04-01 百度在线网络技术(北京)有限公司 个性化搜索方法及装置
CN107346316A (zh) * 2016-05-06 2017-11-14 北京搜狗科技发展有限公司 一种搜索方法、装置及电子设备
CN107562750A (zh) * 2016-06-30 2018-01-09 百度在线网络技术(北京)有限公司 一种用于提供搜索结果的方法和装置
CN112749238A (zh) * 2020-12-30 2021-05-04 北京金堤征信服务有限公司 搜索排序方法、装置、电子设备以及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN112732883B (zh) 基于知识图谱的模糊匹配方法、装置和计算机设备
WO2021098648A1 (zh) 文本推荐方法、装置、设备及介质
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
US10152479B1 (en) Selecting representative media items based on match information
US7797265B2 (en) Document clustering that applies a locality sensitive hashing function to a feature vector to obtain a limited set of candidate clusters
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
WO2017000610A1 (zh) 一种网页分类的方法和装置
WO2017097231A1 (zh) 话题处理方法及装置
KR20150036117A (ko) 쿼리 확장
CN112052387B (zh) 一种内容推荐方法、装置和计算机可读存储介质
JP2013504118A (ja) クエリのセマンティックパターンに基づく情報検索
CN107943792B (zh) 一种语句分析方法、装置及终端设备、存储介质
CN111475725B (zh) 用于搜索内容的方法、装置、设备和计算机可读存储介质
CN113297457B (zh) 一种高精准性的信息资源智能推送系统及推送方法
TWI571756B (zh) 用以分析瀏覽記錄及其文件之方法及其系統
US9552415B2 (en) Category classification processing device and method
CN112818230B (zh) 内容推荐方法、装置、电子设备和存储介质
CN112560444A (zh) 文本处理方法、装置、计算机设备和存储介质
CN116975314B (zh) 一种电子档案智能查询方法与系统
CN112732927A (zh) 基于知识图谱的内容相似性分析方法和装置
CN110598126B (zh) 基于行为习惯的跨社交网络用户身份识别方法
CN116610853A (zh) 搜索推荐方法、搜索推荐系统、计算机设备及存储介质
AU2018313274B2 (en) Diversity evaluation in genealogy search
CN108509449B (zh) 一种信息处理的方法及服务器
CN110162535B (zh) 用于执行个性化的搜索方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210907

RJ01 Rejection of invention patent application after publication