CN114817690A - 一种数据搜索方法及系统 - Google Patents

一种数据搜索方法及系统 Download PDF

Info

Publication number
CN114817690A
CN114817690A CN202210738088.1A CN202210738088A CN114817690A CN 114817690 A CN114817690 A CN 114817690A CN 202210738088 A CN202210738088 A CN 202210738088A CN 114817690 A CN114817690 A CN 114817690A
Authority
CN
China
Prior art keywords
search
historical
keywords
user
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210738088.1A
Other languages
English (en)
Inventor
杨增平
戴隆星
杨历
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Yizhijian Technology Co ltd
Original Assignee
Jiangxi Yizhijian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Yizhijian Technology Co ltd filed Critical Jiangxi Yizhijian Technology Co ltd
Priority to CN202210738088.1A priority Critical patent/CN114817690A/zh
Publication of CN114817690A publication Critical patent/CN114817690A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据搜索方法及系统,该方法包括获取当前搜索引擎中的用户信息;在搜索历史数据库中查找出与每一用户账号对应的历史搜索数据;根据每一用户账号对应的历史搜索关键词生成与每一用户账号对应的搜索建议数据库,并根据每一历史搜索关键词的搜索频率的大小构建出对应的搜索列表;当接收到用户输入的实际搜索关键词时,判断搜索建议数据库中是否存在与实际搜索关键词匹配的历史搜索关键词;若是,则根据匹配出的若干历史搜索关键词在搜索列表中的排序依次生成对应的搜索建议。通过上述方式能够基于每个用户的搜索历史来提供出对应的搜索建议,从而能够使不同的用户均能够获取到符合自身搜索习惯的搜索建议。

Description

一种数据搜索方法及系统
技术领域
本发明涉及数据处理技术领域,特别涉及一种数据搜索方法及系统。
背景技术
随着网络技术的快速发展,当今社会迎来了信息爆炸时代。面对网络上的海量数据,搜索引擎技术是解决信息过剩最常用的方法。搜索引擎技术是通过网络爬虫抓取网络上的大量数据,进行序列化存储,建立索引库,然后利用前段搜索页面,对用户输入的关键词进行分词处理和匹配检索,而后将符合条件的推荐信息按照一定的排序方式进行展现,供用户选择。
在实际搜索的过程中,需要用户在搜索框中输入搜索关键词,而部分普通用户不愿意输入太长或者过于复杂的关键词。因此,为了能使用户尽快完成关键词的输入,节省用户的输入成本,在用户输入关键词的部分内容后,网页会采用提供搜索建议的方式,在自动下拉栏中提供若干个建议的关键词供用户选择,从而不需要用户手动输入完整的长关键词,还能在一定程度上纠正用户输入的错别字或拼写错误,为用户提供了方便的搜索操作。
然而,现有技术对于不同用户输入的相同关键词,大部分只能给出相同的搜索建议,并不能针对不同用户的个性化差异给出不同的搜索建议,从而降低了用户的使用体验。
发明内容
基于此,本发明的目的是提供一种数据搜索方法及系统,以解决现有技术对于不同用户输入的相同关键词,大部分只能给出相同的搜索建议,并不能针对不同用户的个性化差异给出不同的搜索建议,导致降低了用户使用体验的问题。
本发明实施例第一方面提出了一种数据搜索方法,所述方法包括:
获取当前搜索引擎中的用户信息,所述用户信息包括若干用户账号;
在搜索历史数据库中查找出与每一所述用户账号对应的历史搜索数据,所述历史搜索数据包括若干历史搜索关键词;
根据每一所述用户账号对应的历史搜索关键词生成与每一所述用户账号对应的搜索建议数据库,并根据每一所述历史搜索关键词的搜索频率的大小构建出对应的搜索列表,所述搜索列表中的若干历史搜索关键词按照搜索频率的大小逐级递减进行排序;
当接收到用户输入的实际搜索关键词时,判断所述搜索建议数据库中是否存在与所述实际搜索关键词匹配的历史搜索关键词;
若判断到所述搜索建议数据库中存在若干与所述实际搜索关键词匹配的历史搜索关键词,则根据匹配出的若干历史搜索关键词在所述搜索列表中的排序依次生成对应的搜索建议;
其中,计算每一所述历史搜索关键词的搜索频率的大小的算法为:
P=Si×K÷T
其中,P表示所述搜索频率,且P∈(0,0.5),K表示搜索系数,Si表示所述历史搜索关键词在第i小时的搜索次数,T表示搜索时间,且Si=A+B×S,其中,A的取值为1或者0,当A为1时,表示用户使用关键词,当A为0时,表示用户未使用关键词,B表示修正系数,且B∈(0.5,1),S表示搜索次数。
本发明的有益效果是:通过首先获取到当前搜索引擎中的用户信息;再在搜索历史数据库中查找出与每一所述用户账号对应的历史搜索数据;并根据每一所述用户账号对应的历史搜索关键词生成与每一所述用户账号对应的搜索建议数据库,并根据每一所述历史搜索关键词的搜索频率的大小构建出对应的搜索列表;进一步的,当接收到用户输入的实际搜索关键词时,判断所述搜索建议数据库中是否存在与所述实际搜索关键词匹配的历史搜索关键词;若是,则只需要根据匹配出的若干历史搜索关键词在所述搜索列表中的排序依次生成对应的搜索建议。通过上述方式能够基于每个用户的搜索历史来提供出对应的搜索建议,从而能够使学术背景不同以及兴趣各异的用户均能够获取到符合自身搜索习惯的搜索建议,进而大幅提升了用户的使用体验。
优选的,所述方法还包括:
当接收到用户输入的实际搜索关键词时,根据预设若干搜索字段分别计算出所述实际搜索关键词映射到若干所述搜索字段的匹配概率,并基于匹配概率最高的搜索字段生成对应的搜索建议。
优选的,所述方法还包括:
若判断到所述搜索建议数据库中不存在与所述实际搜索关键词匹配的历史搜索关键词,则在预设通用搜索数据库中匹配出与所述实际搜索关键词对应的通用搜索关键词,并根据所述通用搜索关键词生成对应的搜索建议。
本发明实施例第二方面提出了一种数据搜索系统,所述系统包括:
获取模块,用于获取当前搜索引擎中的用户信息,所述用户信息包括若干用户账号;
查找模块,用于在搜索历史数据库中查找出与每一所述用户账号对应的历史搜索数据,所述历史搜索数据包括若干历史搜索关键词;
构建模块,用于根据每一所述用户账号对应的历史搜索关键词生成与每一所述用户账号对应的搜索建议数据库,并根据每一所述历史搜索关键词的搜索频率的大小构建出对应的搜索列表,所述搜索列表中的若干历史搜索关键词按照搜索频率的大小逐级递减进行排序;
判断模块,用于当接收到用户输入的实际搜索关键词时,判断所述搜索建议数据库中是否存在与所述实际搜索关键词匹配的历史搜索关键词;
第一执行模块,用于若判断到所述搜索建议数据库中存在若干与所述实际搜索关键词匹配的历史搜索关键词,则根据匹配出的若干历史搜索关键词在所述搜索列表中的排序依次生成对应的搜索建议;
其中,计算每一所述历史搜索关键词的搜索频率的大小的算法为:
P=Si×K÷T
其中,P表示所述搜索频率,且P∈(0,0.5),K表示搜索系数,Si表示所述历史搜索关键词在第i小时的搜索次数,T表示搜索时间,且Si=A+B×S,其中,A的取值为1或者0,当A为1时,表示用户使用关键词,当A为0时,表示用户未使用关键词,B表示修正系数,且B∈(0.5,1),S表示搜索次数。
其中,上述数据搜索系统中,所述数据搜索系统还包括映射模块,所述映射模块具体用于:
当接收到用户输入的实际搜索关键词时,根据预设若干搜索字段分别计算出所述实际搜索关键词映射到若干所述搜索字段的匹配概率,并基于匹配概率最高的搜索字段生成对应的搜索建议。
其中,上述数据搜索系统中,所述数据搜索系统还包括第二执行模块,所述第二执行模块具体用于:
若判断到所述搜索建议数据库中不存在与所述实际搜索关键词匹配的历史搜索关键词,则在预设通用搜索数据库中匹配出与所述实际搜索关键词对应的通用搜索关键词,并根据所述通用搜索关键词生成对应的搜索建议。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1为本发明第一实施例提供的数据搜索方法的流程图;
图2为本发明第二实施例提供的数据搜索系统的结构框图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请参阅图1,所示为本发明第一实施例提供的数据搜索方法,本实施例提供的数据搜索方法通过上述方式能够基于每个用户的搜索历史来提供出对应的搜索建议,从而能够使学术背景不同以及兴趣各异的用户均能够获取到符合自身搜索习惯的搜索建议,进而大幅提升了用户的使用体验。
具体的,本实施例提供的数据搜索方法具体包括以下步骤:
步骤S10,获取当前搜索引擎中的用户信息,所述用户信息包括若干用户账号;
具体的,在本实施例中,首先需要说明的是,本实施例提供的数据搜索方法主要应用于搜索引擎与搜索服务器之间,其中,搜索引擎安装于计算机中,该计算机能够与上述搜索服务器之间建立通讯连接,以完成两者之间的数据交互。
具体的,在本步骤中,可以理解的是,当用户使用上述搜索引擎进行数据的搜索时,每个用户均需要事先在该搜索引擎中注册一个属于自身的用户账号,且每个用户账号都是唯一的。
因此,在本步骤中,需要说明的是,为了能够准确的在当前搜索引擎中推荐给用户需要的搜索建议,本步骤会首先通过上述搜索服务器获取到当前搜索引擎中已经存储好的用户信息,具体的,该用户信息包括若干已经存储好的用户账号。
步骤S20,在搜索历史数据库中查找出与每一所述用户账号对应的历史搜索数据,所述历史搜索数据包括若干历史搜索关键词;
进一步的,在本步骤中,需要说明的是,在通过上述步骤获取到当前搜索引擎中的用户信息之后,上述搜索服务器会基于获取到的用户信息在其内部预先建立好的搜索历史数据库中查找出与当前用户信息中的每个用户账号对应的历史搜索数据,即本步骤会获取到每个用户账号在上述搜索引擎中已经搜索过的历史搜索数据,优选的,在本实施例中,该历史搜索数据包括每个用户账号在上述搜索引擎中搜索过的历史搜索关键词。另外,该历史搜索数据还可以包括历史搜索关键句或者历史搜索关键段。
步骤S30,根据每一所述用户账号对应的历史搜索关键词生成与每一所述用户账号对应的搜索建议数据库,并根据每一所述历史搜索关键词的搜索频率的大小构建出对应的搜索列表,所述搜索列表中的若干历史搜索关键词按照搜索频率的大小逐级递减进行排序;
具体的,在本步骤中,需要说明的是,在实际的搜索过程中,每个用户账号均会产生一定的历史搜索数据,而该历史搜索数据则包括一定数量的历史搜索关键词,例如“汽车”、“房屋”“地址”以及“天气”等历史搜索关键词。
进一步的,在本步骤中,上述搜索服务器会基于获取到的若干个用户账号,以及每个用户账号对应的若干个历史搜索关键词根据预设好的程序生成与上述每个用户账号对应的搜索建议数据库。
在此基础之上,本步骤会进一步计算出每个用户账号对应的每个历史搜索关键词的搜索频率的大小,更进一步的,本步骤还会根据每个历史搜索关键词分别计算出来的搜索频率的大小构建出与每个用户账号对应的搜索列表,具体的,该搜索列表中的若干历史搜索关键词按照搜索频率的大小逐级递减进行排序。
其中,计算每一所述历史搜索关键词的搜索频率的大小的算法为:
P=Si×K÷T
其中,P表示所述搜索频率,且P∈(0,0.5),K表示搜索系数,Si表示所述历史搜索关键词在第i小时的搜索次数,T表示搜索时间,且Si=A+B×S,其中,A的取值为1或者0,当A为1时,表示用户使用关键词,当A为0时,表示用户未使用关键词,B表示修正系数,且B∈(0.5,1),S表示搜索次数。
例如,当前是7月1日,取前30天的用户搜索数据作为生成搜索建议数据库的依据,则所选取历史时间段为 6月1日-6月30日,那么i=1则对应的是6月1日这一天,而i的最大值为i=30。计算出后,就可以用作在当前日期生成搜索建议的依据。
步骤S40,当接收到用户输入的实际搜索关键词时,判断所述搜索建议数据库中是否存在与所述实际搜索关键词匹配的历史搜索关键词;
进一步的,在本步骤中,需要说明的是,在通过上述步骤分别获取到与每个用户账号对应的搜索建议数据库以及搜索列表之后,本实施例提供的数据搜索方法才能够正式的实施。
具体的,在本步骤中,需要说明的是,在上述搜索引擎实际的使用过程中,当上述搜索服务器通过该搜索引擎接收到当前用户输入的实际搜索关键词时,当前搜索服务器会立即判断通过上述步骤构建出的搜索建议数据库中是否存在与当前实时输入的实际搜索关键词匹配的历史搜索关键词,并对应执行步骤S50。
步骤S50,若判断到所述搜索建议数据库中存在若干与所述实际搜索关键词匹配的历史搜索关键词,则根据匹配出的若干历史搜索关键词在所述搜索列表中的排序依次生成对应的搜索建议;
最后,在本步骤中,需要说明的是,若上述搜索服务器判断到当前搜索建议数据库中存在若干个与用户输入的实际搜索关键词匹配的历史搜索关键词时,则当前搜索服务器会依据匹配出的若干历史搜索关键词在与当前用户账号对应的搜索列表中的排序依次生成对应的搜索建议,从而能够使最接近的搜索建议呈现在离搜索框最近的地方,使用户能够清楚的获取到准确的搜索建议。
另外,在本实施例中,还需要指出的是,对应的,该方法还包括:
若判断到所述搜索建议数据库中不存在与所述实际搜索关键词匹配的历史搜索关键词,则在预设通用搜索数据库中匹配出与所述实际搜索关键词对应的通用搜索关键词,并根据所述通用搜索关键词生成对应的搜索建议,从而可以有效的避免生成不了搜索建议。
另外,在本实施例中,还需要指出的是,上述方法还包括:
当接收到用户输入的实际搜索关键词时,根据预设若干搜索字段分别计算出所述实际搜索关键词映射到若干所述搜索字段的匹配概率,并基于匹配概率最高的搜索字段生成对应的搜索建议。
具体的,在本实施例中,需要说明的是,为了能够多维度的给用户提供搜索建议,本实施例还会在上述搜索服务器中预先存储若干个搜索字段,例如“今天的天气”、“路上是否拥堵”以及“哪里有美食”等搜索字段。
进一步的,当搜索服务器获取到用户输入的实际搜索关键词时,当前搜索服务器会在其内部根据预设好的若干搜索字段分别计算出当前实际搜索关键词映射到当前若干搜索字段中的匹配概率,并将匹配概率最高的搜索字段生成对应的搜索建议。例如实际搜索关键词中出现“美食”,则将“哪里有美食”的搜索字段推荐给用户,以作为搜索建议。
使用时,通过首先获取到当前搜索引擎中的用户信息;再在搜索历史数据库中查找出与每一所述用户账号对应的历史搜索数据;并根据每一所述用户账号对应的历史搜索关键词生成与每一所述用户账号对应的搜索建议数据库,并根据每一所述历史搜索关键词的搜索频率的大小构建出对应的搜索列表;进一步的,当接收到用户输入的实际搜索关键词时,判断所述搜索建议数据库中是否存在与所述实际搜索关键词匹配的历史搜索关键词;若是,则只需要根据匹配出的若干历史搜索关键词在所述搜索列表中的排序依次生成对应的搜索建议。通过上述方式能够基于每个用户的搜索历史来提供出对应的搜索建议,从而能够使学术背景不同以及兴趣各异的用户均能够获取到符合自身搜索习惯的搜索建议,进而大幅提升了用户的使用体验。
需要说明的是,上述的实施过程只是为了说明本申请的可实施性,但这并不代表本申请的数据搜索方法只有上述唯一一种实施流程,相反的,只要能够将本申请的数据搜索方法实施起来,都可以被纳入本申请的可行实施方案。
综上,本发明上述实施例提供的数据搜索方法通过上述方式能够基于每个用户的搜索历史来提供出对应的搜索建议,从而能够使学术背景不同以及兴趣各异的用户均能够获取到符合自身搜索习惯的搜索建议,进而大幅提升了用户的使用体验。
请参阅图2,所示为本发明第二实施例提供的数据搜索系统,所述系统包括:
获取模块12,用于获取当前搜索引擎中的用户信息,所述用户信息包括若干用户账号;
查找模块22,用于在搜索历史数据库中查找出与每一所述用户账号对应的历史搜索数据,所述历史搜索数据包括若干历史搜索关键词;
构建模块32,用于根据每一所述用户账号对应的历史搜索关键词生成与每一所述用户账号对应的搜索建议数据库,并根据每一所述历史搜索关键词的搜索频率的大小构建出对应的搜索列表,所述搜索列表中的若干历史搜索关键词按照搜索频率的大小逐级递减进行排序;
判断模块42,用于当接收到用户输入的实际搜索关键词时,判断所述搜索建议数据库中是否存在与所述实际搜索关键词匹配的历史搜索关键词;
第一执行模块52,用于若判断到所述搜索建议数据库中存在若干与所述实际搜索关键词匹配的历史搜索关键词,则根据匹配出的若干历史搜索关键词在所述搜索列表中的排序依次生成对应的搜索建议;
其中,计算每一所述历史搜索关键词的搜索频率的大小的算法为:
P=Si×K÷T
其中,P表示所述搜索频率,且P∈(0,0.5),K表示搜索系数,Si表示所述历史搜索关键词在第i小时的搜索次数,T表示搜索时间,且Si=A+B×S,其中,A的取值为1或者0,当A为1时,表示用户使用关键词,当A为0时,表示用户未使用关键词,B表示修正系数,且B∈(0.5,1),S表示搜索次数。
其中,上述数据搜索系统中,所述数据搜索系统还包括映射模块62,所述映射模块62具体用于:
当接收到用户输入的实际搜索关键词时,根据预设若干搜索字段分别计算出所述实际搜索关键词映射到若干所述搜索字段的匹配概率,并基于匹配概率最高的搜索字段生成对应的搜索建议。
其中,上述数据搜索系统中,所述数据搜索系统还包括第二执行模块72,所述第二执行模块72具体用于:
若判断到所述搜索建议数据库中不存在与所述实际搜索关键词匹配的历史搜索关键词,则在预设通用搜索数据库中匹配出与所述实际搜索关键词对应的通用搜索关键词,并根据所述通用搜索关键词生成对应的搜索建议。
综上所述,本发明上述实施例提供的数据搜索方法及系统通过上述方式能够基于每个用户的搜索历史来提供出对应的搜索建议,从而能够使学术背景不同以及兴趣各异的用户均能够获取到符合自身搜索习惯的搜索建议,进而大幅提升了用户的使用体验。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种数据搜索方法,其特征在于,所述方法包括:
获取当前搜索引擎中的用户信息,所述用户信息包括若干用户账号;
在搜索历史数据库中查找出与每一所述用户账号对应的历史搜索数据,所述历史搜索数据包括若干历史搜索关键词;
根据每一所述用户账号对应的历史搜索关键词生成与每一所述用户账号对应的搜索建议数据库,并根据每一所述历史搜索关键词的搜索频率的大小构建出对应的搜索列表,所述搜索列表中的若干历史搜索关键词按照搜索频率的大小逐级递减进行排序;
当接收到用户输入的实际搜索关键词时,判断所述搜索建议数据库中是否存在与所述实际搜索关键词匹配的历史搜索关键词;
若判断到所述搜索建议数据库中存在若干与所述实际搜索关键词匹配的历史搜索关键词,则根据匹配出的若干历史搜索关键词在所述搜索列表中的排序依次生成对应的搜索建议;
其中,计算每一所述历史搜索关键词的搜索频率的大小的算法为:
P=Si×K÷T
其中,P表示所述搜索频率,且P∈(0,0.5),K表示搜索系数,Si表示所述历史搜索关键词在第i小时的搜索次数,T表示搜索时间,且Si=A+B×S,其中,A的取值为1或者0,当A为1时,表示用户使用关键词,当A为0时,表示用户未使用关键词,B表示修正系数,且B∈(0.5,1),S表示搜索次数。
2.根据权利要求1所述的数据搜索方法,其特征在于:所述方法还包括:
当接收到用户输入的实际搜索关键词时,根据预设若干搜索字段分别计算出所述实际搜索关键词映射到若干所述搜索字段的匹配概率,并基于匹配概率最高的搜索字段生成对应的搜索建议。
3.根据权利要求1所述的数据搜索方法,其特征在于:所述方法还包括:
若判断到所述搜索建议数据库中不存在与所述实际搜索关键词匹配的历史搜索关键词,则在预设通用搜索数据库中匹配出与所述实际搜索关键词对应的通用搜索关键词,并根据所述通用搜索关键词生成对应的搜索建议。
4.一种数据搜索系统,其特征在于,所述系统包括:
获取模块,用于获取当前搜索引擎中的用户信息,所述用户信息包括若干用户账号;
查找模块,用于在搜索历史数据库中查找出与每一所述用户账号对应的历史搜索数据,所述历史搜索数据包括若干历史搜索关键词;
构建模块,用于根据每一所述用户账号对应的历史搜索关键词生成与每一所述用户账号对应的搜索建议数据库,并根据每一所述历史搜索关键词的搜索频率的大小构建出对应的搜索列表,所述搜索列表中的若干历史搜索关键词按照搜索频率的大小逐级递减进行排序;
判断模块,用于当接收到用户输入的实际搜索关键词时,判断所述搜索建议数据库中是否存在与所述实际搜索关键词匹配的历史搜索关键词;
第一执行模块,用于若判断到所述搜索建议数据库中存在若干与所述实际搜索关键词匹配的历史搜索关键词,则根据匹配出的若干历史搜索关键词在所述搜索列表中的排序依次生成对应的搜索建议;
其中,计算每一所述历史搜索关键词的搜索频率的大小的算法为:
P=Si×K÷T
其中,P表示所述搜索频率,且P∈(0,0.5),K表示搜索系数,Si表示所述历史搜索关键词在第i小时的搜索次数,T表示搜索时间,且Si=A+B×S,其中,A的取值为1或者0,当A为1时,表示用户使用关键词,当A为0时,表示用户未使用关键词,B表示修正系数,且B∈(0.5,1),S表示搜索次数。
5.根据权利要求4所述的数据搜索系统,其特征在于:所述数据搜索系统还包括映射模块,所述映射模块具体用于:
当接收到用户输入的实际搜索关键词时,根据预设若干搜索字段分别计算出所述实际搜索关键词映射到若干所述搜索字段的匹配概率,并基于匹配概率最高的搜索字段生成对应的搜索建议。
6.根据权利要求4所述的数据搜索系统,其特征在于:所述数据搜索系统还包括第二执行模块,所述第二执行模块具体用于:
若判断到所述搜索建议数据库中不存在与所述实际搜索关键词匹配的历史搜索关键词,则在预设通用搜索数据库中匹配出与所述实际搜索关键词对应的通用搜索关键词,并根据所述通用搜索关键词生成对应的搜索建议。
CN202210738088.1A 2022-06-28 2022-06-28 一种数据搜索方法及系统 Pending CN114817690A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210738088.1A CN114817690A (zh) 2022-06-28 2022-06-28 一种数据搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210738088.1A CN114817690A (zh) 2022-06-28 2022-06-28 一种数据搜索方法及系统

Publications (1)

Publication Number Publication Date
CN114817690A true CN114817690A (zh) 2022-07-29

Family

ID=82523103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210738088.1A Pending CN114817690A (zh) 2022-06-28 2022-06-28 一种数据搜索方法及系统

Country Status (1)

Country Link
CN (1) CN114817690A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631929A (zh) * 2013-12-09 2014-03-12 江苏金智教育信息技术有限公司 一种用于搜索的智能提示的方法、模块和系统
CN108874827A (zh) * 2017-05-12 2018-11-23 北京搜狗科技发展有限公司 一种搜索方法及相关装置
CN110413872A (zh) * 2019-01-21 2019-11-05 北京京东尚科信息技术有限公司 用于展示信息的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631929A (zh) * 2013-12-09 2014-03-12 江苏金智教育信息技术有限公司 一种用于搜索的智能提示的方法、模块和系统
CN108874827A (zh) * 2017-05-12 2018-11-23 北京搜狗科技发展有限公司 一种搜索方法及相关装置
CN110413872A (zh) * 2019-01-21 2019-11-05 北京京东尚科信息技术有限公司 用于展示信息的方法和装置

Similar Documents

Publication Publication Date Title
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
CN109063221B (zh) 基于混合策略的查询意图识别方法和装置
CN109815487B (zh) 文本质检方法、电子装置、计算机设备及存储介质
CN102483745B (zh) 共同选择图像分类
EP1363206A2 (en) Systems and methods for authoritativeness grading, estimation and sorting of documents in large heterogeneous document collections
US20090319449A1 (en) Providing context for web articles
US20100191758A1 (en) System and method for improved search relevance using proximity boosting
CN110968800B (zh) 一种信息推荐方法、装置、电子设备及可读存储介质
CN104933100A (zh) 关键词推荐方法和装置
CN113722478B (zh) 多维度特征融合相似事件计算方法、系统及电子设备
CN108959550B (zh) 用户关注点挖掘方法、装置、设备及计算机可读介质
CN109063171B (zh) 基于语义的资源匹配方法
CN113343091A (zh) 面向产业和企业的科技服务推荐计算方法、介质及程序
US20100250522A1 (en) Using ontology to order records by relevance
EP1363208A2 (en) Systems and methods for authoritativeness grading, estimation and sorting of documents in large heterogeneous document collections
CN117150107A (zh) 基于知识图谱的推荐方法、装置、计算机设备及存储介质
CN114817690A (zh) 一种数据搜索方法及系统
CN110929526A (zh) 样本生成方法、装置以及电子设备
US10467530B2 (en) Searching text via function learning
CN106934007B (zh) 关联信息的推送方法及装置
CN112835882B (zh) 信息预测方法、装置、电子设备和存储介质
CN105893397A (zh) 一种视频推荐方法及装置
CN114741608A (zh) 基于用户画像的新闻推荐方法、装置、设备及存储介质
CN110222156B (zh) 发现实体的方法和装置、电子设备、计算机可读介质
CN112507189A (zh) 基于BiLSTM-CRF模型的金融用户画像信息提取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220729