CN111914154B - 一种智能搜索导向系统及方法 - Google Patents
一种智能搜索导向系统及方法 Download PDFInfo
- Publication number
- CN111914154B CN111914154B CN202010743794.6A CN202010743794A CN111914154B CN 111914154 B CN111914154 B CN 111914154B CN 202010743794 A CN202010743794 A CN 202010743794A CN 111914154 B CN111914154 B CN 111914154B
- Authority
- CN
- China
- Prior art keywords
- search
- keyword
- frequency
- word bank
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90324—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种智能搜索导向系统及方法,其中,智能搜索导向系统包括:关键词获取模块,用于获取用户搜索的搜索关键词;搜索词库,用于存储各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;查询比对模块,用于将搜索关键词在搜索词库中进行搜索比对,确定搜索关键词的搜索频次或出现频次最高的目标版块类别;版块判断模块,用于判断用户是否在目标版块类别中搜索关键词;搜索提示模块,用于当判定用户未在目标版块类别中搜索关键词时,提示用户至目标版块类别中进行搜索。通过本申请,方便用户及时定位至正确的版块类别中进行搜索,智能指导用户进行更精准地搜索。
Description
技术领域
本申请涉及数据分析领域,尤其涉及一种智能搜索导向系统及方法。
背景技术
搜索引擎是一种对网络数据进行搜索、提取、组织、处理并提供检索服务的工具,目前存在商业搜索引擎和站内搜索引擎两大搜索阵营。其中,面对信息海量化发展现状,站内搜索因其针对性强,在一定的检索范围内的便利性,更能满足用户的检索需求,并为后续研究用户行为提供来源保障。而如何使网络用户快捷、准确和有效地定位自己需要的信息一直是大中型专业网站的难题。专业类的门户网站,栏目众多,信息多达几十万条,而且信息不会像一般的社会新闻,过时就很少有人关注,大量早期信息仍然有学术价值、也仍然可能有阅读量。专业网站丰富的内容吸引了大量的专业用户,但由于网站信息量指数级增长,用户想要快速定位到所需资源非常困难,所以亟需研究智能搜索导向技术。
发明内容
本申请提供了一种智能搜索导向系统及方法,用以帮助用户快速定位至正确的版块类别中进行搜索查询,通过关键词推荐的方式智能地指导用户进行更精准地搜索。具体的,本发明的技术方案如下:
一方面,本申请公开了一种智能搜索导向系统,包括:
关键词获取模块,用于获取用户搜索的搜索关键词;
搜索词库,用于存储各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;
查询比对模块,用于将所述搜索关键词在所述搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别;
版块判断模块,用于判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;
搜索提示模块,用于当判定所述用户未在所述目标版块类别中搜索所述搜索关键词时,提示所述用户至所述目标版块类别中进行搜索。
优选地,所述智能搜索导向系统还包括:新增模块,用于当所述搜索关键词在所述搜索词库中未比对上时,在所述搜索词库中新增所述搜索关键词。
优选地,所述新增模块包括:
搜索频次新增子模块,用于在所述搜索词库中新增所述搜索关键词;获取所述用户搜索所述搜索关键词所在的版块类别,并记录所述搜索关键词在所述版块类别的搜索频次;或
出现频次新增子模块,用于在所述搜索词库中新增所述搜索关键词;将所述搜索关键词在各版块类别中分别进行搜索,获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
优选地,所述智能搜索导向系统中,所述搜索词库还存储有:同义词典、近义词典及同音词典;所述查询比对模块包括:
词典查找子模块,用于根据所述同义词典,获取所述搜索关键词的同义词;
关键词查找子模块,用于在所述搜索词库中查询所述搜索关键词及所述搜索关键词的同义词;
排序记录子模块,用于当查询到所述搜索词库中存在所述搜索关键词或所述搜索关键词的同义词时,将查询结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
所述词典查找子模块,还用于当判定所述搜索词库中未存在所述搜索关键词或所述搜索关键词的同义词时,根据所述近义词典,获取所述搜索关键词的近义词;
所述关键词查找子模块,还用于在所述搜索词库中查询是否存在所述搜索关键词的近义词;
所述排序记录子模块,还用于当查询到所述搜索词库中存在所述搜索关键词的近义词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
所述词典查找子模块,还用于当判定所述搜索词库中未存在所述搜索关键词、所述搜索关键词的同义词、或所述搜索关键词的近义词时,根据所述同音词典,获取所述搜索词关键词的同音词;
所述排序记录子模块,还用于当查询到所述搜索词库中存在所述搜索关键词的同音词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别。
优选地,所述智能搜索导向系统还包括:搜索频次更新模块或出现频次更新模块;其中:
所述搜索频次更新模块,用于确定所述用户搜索所述搜索关键词所在的最终版块类别,并在所述搜索词库中,将所述搜索关键词在所述最终版块类别的搜索次数加一;
所述出现频次更新模块包括:
关键词确定子模块,用于当各版块类别中每新增一篇数据信息时,确定所述数据信息涉及的关键词;并通过所述查询比对模块在所述搜索词库中查询所述数据信息涉及的关键词;
频次更新子模块,用于当所述搜索词库中存在对应的搜索关键词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;当所述搜索词库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
或所述出现频次更新模块包括:
关键词判断子模块,用于当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;
统计计算子模块,用于当判定所述数据信息涉及所述搜索词库中的搜索关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出现频次加一;或,获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述对应关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所属的版块类别的出现频次中。
优选地,所述搜索词库,还用于存储所述用户的自身搜索浏览信息,所述自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息及对应的浏览时长;所述智能搜索导向系统还包括:
所述查询比对模块,还用于在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;
信息获取模块,用于当查询到所述自身搜索浏览信息中有与所述搜索关键词匹配的关键词时,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
时长判断模块,用于判断获取的浏览时长中,是否存在大于参考时长的浏览时长;
所述搜索提示模块,还用于当判定存在大于参考时长的浏览时长时,将所述对应的版块类别作为目标版块类别推荐给所述用户;或将浏览时长大于参考时长的浏览的数据信息作为目标数据信息,推荐给所述用户;
所述查询比对模块,还用于当判定不存在大于参考时长的浏览时长时,将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别。
优选地,所述智能搜索导向系统还包括:
时长计算模块,用于统计浏览的每篇数据信息的字数,并结合参考浏览速度,计算出每篇数据信息的参考时长;
所述时长判断模块,还用于比较每篇数据信息的参考时长与实际的浏览时长的大小;
所述时长计算模块,还用于在确定所述浏览时长大于所述参考时长时,计算所述浏览时长与所述参考时长的差值;
所述搜索提示模块,还用于当所述浏览时长与所述参考时长的差值处于预设的差值范围时,将对应的数据信息所在的版块类别作为目标版块类别推荐给所述用户;或将所述对应的数据信息作为目标数据信息,推荐给所述用户。
优选地,所述智能搜索导向系统应用于专业领域数据库或专业领域网站的搜索。
另一方面,本申请还公开了一种智能搜索导向方法,包括:
获取用户搜索的搜索关键词;
将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别;所述搜索词库中存储有各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;
判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;
当判定所述用户未在所述目标版块类别中搜索所述搜索关键词时,提示所述用户至所述目标版块类别中进行搜索。
优选地,所述智能搜索导向方法还包括:
当所述搜索关键词在所述搜索词库中未比对上时,在所述搜索词库中新增所述搜索关键词;其具体包括:
当所述搜索词库中新增所述搜索关键词,且在所述搜索词库中存储的各搜索关键词在各版块类别中的频次为搜索频次时;获取所述用户搜索所述搜索关键词所在的版块类别,并记录所述搜索关键词在所述版块类别的搜索频次;
当所述搜索词库中新增所述搜索关键词,且所述搜索词库中存储的各搜索关键词在各版块类别中的频次为出现频次时;将所述搜索关键词在各版块类别中分别进行搜索,获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
优选地,所述将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别具体包括:
根据预存的同义词典,获取所述搜索关键词的同义词;
在所述搜索词库中查询是否存在所述搜索关键词或所述搜索关键词的同义词;
当查询到所述搜索词库中存在所述搜索关键词或所述搜索关键词的同义词时,将查询结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
当判定所述搜索词库中未存在所述搜索关键词或所述搜索关键词的同义词时,根据预存的近义词典,获取所述搜索关键词的近义词;
在所述搜索词库中查询是否存在所述搜索关键词的近义词;
当查询到所述搜索词库中存在所述搜索关键词的近义词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
当判定所述搜索词库中未存在所述搜索关键词、所述搜索关键词的同义词、或所述搜索关键词的近义词时,根据预存的同音词典,获取所述搜索词关键词的同音词;
当查询到所述搜索词库中存在所述搜索关键词的同音词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别。
优选地,所述智能搜索导向方法还包括:
更新所述搜索词库中各搜索关键词在各版块类别的搜索次数或出现次数;其具体包括:
确定所述用户搜索所述搜索关键词所处的最终版块类别,并在所述搜索词库中,将所述搜索关键词在所述最终版块类别的搜索次数加一;
或,
当各版块类别中每新增一篇数据信息时,确定所述数据信息涉及的关键词;
在所述搜索词库中查询所述数据信息涉及的关键词;
当所述搜索词库中存在对应的搜索关键词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
当所述搜索词库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
或,
当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;
当判定所述数据信息涉及所述搜索词库中的搜索关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出现频次加一;或获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述搜索关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所属的版块类别的出现频次中。
优选地,所述搜索词库,还用于存储所述用户的自身搜索浏览信息,所述自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息及对应的浏览时长;在步骤将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别之前还包括:
在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;
当查询到所述自身搜索浏览信息中有与所述搜索关键词匹配的关键词时,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
判断获取的浏览时长中,是否存在大于参考时长的浏览时长;
当判定存在大于参考时长的浏览时长时,将所述对应的版块类别作为目标版块类别推荐给所述用户;或将浏览时长大于参考时长的浏览的数据信息作为目标数据信息推荐给所述用户;
当判定不存在大于参考时长的浏览时长时,将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别。
本发明至少具备以下任意一项或多项技术效果:
(1)本申请采用搜索词库存储搜索关键词及其在各版块类别中的频次,一旦获取到到用户的搜索的关键词后,便可及时进行比对,查看该关键词是否在搜索词库中存在,若存在,则可直接查看其在各版块类别的频次(搜索频次或出现频次),提醒用户至频次最高的版块类别中进行搜索。对于频次最高的版块类别,则最有可能含有用户需要的信息,最有可能是与用户输入的关键词相关度最大的版块类别。因此,采用本申请可帮助用户及时定位至正确的版块类别中进行搜索,智能指导用户进行更精准地搜索。
(2)本申请中,对于用户输入的搜索关键词,若搜索词库中不存在,则会新增入搜索词库中,从而使得搜索词库更加完善。此外,搜索词库也会在每次搜索结束后进行更新,或者在新增数据信息时及时更新,从而确保后续的搜索导向的精确性。
(3)本申请中,设置了同义词典、近义词典和同音词典,从而减少了对用户输入关键词的限制,根据用户输入的关键词,在搜索词库中进行比对时,也更准确和智能化。
(4)本申请中,搜索词库中存储的各搜索关键词在各版块类别的频次,可以是搜索频次,即用户在该版块类别的搜索次数,这一般相对专业网站而言会较为准确,专业网站一般提供给专业的人员进行查看,大部分人员较为容易直接定位至正确的版块类别中进行搜索,而对于少部分用户而言,如果自身无法确定去哪个版块类别搜索,则可通过本方案来获取到当前输入的搜索关键词,在哪个版块类别被搜索的最多,从而帮助该用户定位至对应的版块类别。如果不采用搜索频次,则还可以采用出现频次,该方案则并不受用户搜索行为的影响,而更多的是与数据文献自身相关,出现频次最高的版块类别,则一般为涉及当前输入的关键词的数据资料最多的版块类别。从另一方面,也说明了该出现频次最高的版块类别与当前输入的关键词最为相关。
(5)本申请中,搜索词库除了存储有各搜索关键词在各版块类别的总的搜索频次或出现频次外,还会存储注册用户自身搜索浏览信息,在获取到用户当前输入的搜索关键词后,会优先与自身搜索浏览信息进行比对,看其中是否有与该搜索关键词匹配的关键词,如果有的话,则再进一步获取该关键词对应的版块类别,及与该关键词相关的浏览的数据信息和对应的浏览时长,判断是否存在超过对应参考时长的浏览时长,若有,则说明该用户可能花费了较多时间去浏览阅读,可能是该用户想要的资料信息,那么可以将该浏览时长对应的浏览的数据信息推荐给用户,或者将对应的关键词所在的版块类别作为目标版块类别推荐给用户,从而帮助用户快速导向正确的版块类别或数据信息。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请智能搜索导向系统的一个实施例的结构框图;
图2为本申请智能搜索导向系统的另一实施例的结构框图;
图3为本申请智能搜索导向方法的一个实施例的流程图;
图4为本申请智能搜索导向方法的另一实施例的流程图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部份实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
本申请实施例一提供了一种智能搜索导向系统,具体的,如图1所示,包括:
关键词获取模块100,用于获取用户搜索的搜索关键词;
具体的,比如用户输入搜索词“心脑血管”,那么“心脑血管”便可以作为搜索关键词。当然,如果用户输入的是一段文本,则关键词获取模块100则需要对该段文本进行分词,并从中提取出关键词来。此外,搜索关键词也不仅限于一个,可以是一个或多个搜索关键词,若是多个搜索关键词,则后续分别对每个搜索关键词来进行搜索比对。
搜索词库200,用于存储各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;
具体的,搜索词库200用来存储大量搜索关键词,尤其对于专业领域,比如在医学领域,医学专业术语或医学常用语等都可以作为搜索关键词,搜索词库中除了存储有大量搜索关键词外,还存储有每个搜索关键词在各个板块的频次(搜索频次或出现频次),我们以某医学网站站内搜索为例,该医学网站搜索词库中,存储有大量医学搜索关键词,同时还记录了每个医学搜索关键词在每个版块类别中的搜索频次(即搜索次数);版块类别为网站设置的各栏目版块,比如某专业的生物医药学网站,其设置了“医药产业”、“制药”、“生物研究”、“转化医学”、“医疗健康”等版块,当然,每个版块也还可以再细分成几个小类别。设置不同的版块类别,可以将信息进行分类展示。又比如,某临床医生发展平台,该网站内根据科室的不同设置了不同的版块类别,比如设的“心血管科”、“消化科”、“精神心理科”、“神经科”、“儿科”、“口腔科”、“康复科”、“皮肤科”等等,而搜索词库200则存储了每个科室里可能涉及的搜索关键词,当然,同一个搜索关键词,可能会涉及到多个科室,因此,除了存储有搜索关键词外,还存储有每个搜索关键词在各科室(版块类别)的搜索频次或出现频次(即每个搜索关键词在各版块类别的搜索次数或在各版块类别的出现的数量)。
查询比对模块300,用于将所述搜索关键词在所述搜索词库200中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别;
具体的,获取到用户输入的搜索关键词后,则可将该搜索关键词在搜索词库中进行比对,看是否可以在搜索词库中查找到相匹配的搜索词关键词,如果有查找到匹配的搜索关键词,则再进一步查看其在各版块类别的搜索频次或出现频次,并将搜索频次或出现频次最高的版块类别作为目标版块类别。当然,本申请方案中,频次要求保持一致性,即若采用搜索频次,则全部采用搜索频次来选取目标版块类别,若采用出现频次,则全部采用出现频次来选取目标版块类别。当然,特殊情况下,如果搜索频次相同,则可再参考出现频次,选取出现频次更高的版块类别作为目标版块类别。
版块判断模块400,用于判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;
具体的,选取出了目标版块类别后,再看该用户当前是否在目标版块类别中进行搜索,如果是的话,则无需提醒,如果不是的话,则需要进行后续的导向提醒。因为选取出来的目标版块类别是最可能正确的版块类别,也就是说该版块类别最有可能涵盖有用户想要查找的信息资料。
搜索提示模块500,用于当判定所述用户未在所述目标版块类别中搜索所述搜索关键词时,提示所述用户至所述目标版块类别中进行搜索。
具体的,如果判断出用户当前不是在目标版块类别中搜索该搜索关键词,则会智能提醒用户前往目标版块类别中进行搜索。比如,弹出对话框,让用户自行选择是否前往目标版块类别进行搜索查询,如果用户选择“是”,则直接跳往对应的目标版块类别中,呈现给用户该目标版块类别关于该搜索关键词的搜索结果。
本实施例的技术方案,对于普通用户而言,是非常有帮助的,因为很多普通用户在查找信息资料时,往往并不清楚应该在哪个版块类别中进行搜索,而如果一个一个版块去进行搜索的话则会大大浪费时间。而如果进行全网站搜索的话,一方面信息量可能比较大,另一方面,可能很多并不是用户需要的信息也会呈现排序在前面,用户往往要翻好几页可能才找到自己想要的信息资料,而采用本实施例的技术方案,特别是专业领域的网站,则可帮助用户快速定位至正确的版块类别中进行搜索查询。
本申请的另一个系统实施例,如图2所示,在上述实施例的基础上,还包括:
新增模块600,用于当所述搜索关键词在所述搜索词库中未比对上时,在所述搜索词库中新增所述搜索关键词。
具体的,如果用户当前搜索的搜索关键词在搜索词库中未找到,那么则可以将其新增到搜索词库中。新增模块包括:
搜索频次新增子模块,用于在所述搜索词库中新增所述搜索关键词;获取所述用户搜索所述搜索关键词所在的版块类别,并记录所述搜索关键词在所述版块类别的搜索频次;
具体的,比如用户在“心脑血管”版块类别中搜索“颈动脉斑块”,而如果该搜索词库中没有该搜索关键词的话,则会将该搜索关键词“颈动脉斑块”增加到搜索词库中,并记录“颈动脉斑块”在“心脑血管”版块类别的搜索频次:1次。
当然,如果采用出现频次的话,则新增模块包括:
出现频次新增子模块,用于在所述搜索词库中新增所述搜索关键词;将所述搜索关键词在各版块类别中分别进行搜索,获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
具体的,我们同样以用户在“心脑血管”版块类别中搜索“颈动脉版块”为例,如果也同样未在搜索词库中找到对应的搜索关键词,那么便会将该搜索关键词“颈动脉斑块”新增到搜索词库中,再将该搜索关键词在全网搜索,并分别统计该搜索关键词在各个版块类别分别出现在多少篇文献资料中。最后,将统计结果记录在搜索词库中,以供后续系统就“颈动脉斑块”这一搜索关键词,帮助用户进行快速定位至最信息最多最全的版块。
本发明系统的另一实施例,在上述任一系统实施例的基础上,所述智能搜索导向系统还包括:同义词典710、近义词典720及同音词典730;所述查询比对模块300包括:
词典查找子模块310,用于根据所述同义词典710,获取所述搜索关键词的同义词;
关键词查找子模块320,用于在所述搜索词库200中查询所述搜索关键词及所述搜索关键词的同义词;
排序记录子模块330,用于当查询到所述搜索词库200中存在所述搜索关键词或所述搜索关键词的同义词时,将查询结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
所述词典查找子模块310,还用于当判定所述搜索词库200中未存在所述搜索关键词或所述搜索关键词的同义词时,根据所述近义词典720,获取所述搜索关键词的近义词;
所述关键词查找子模块320,还用于在所述搜索词库200中查询是否存在所述搜索关键词的近义词;
所述排序记录子模块330,还用于当查询到所述搜索词库200中存在所述搜索关键词的近义词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
所述词典查找子模块310,还用于当判定所述搜索词库200中未存在所述搜索关键词、所述搜索关键词的同义词、或所述搜索关键词的近义词时,根据所述同音词典730,获取所述搜索词关键词的同音词;
所述排序记录子模块330,还用于当查询到所述搜索词库200中存在所述搜索关键词的同音词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别。
具体的,本实施例中,对于用户输入的搜索关键词,可能会存在不同名称但实质表示同一东西((比如,“剖宫产”、“刨腹产”、“剖腹产”等实际都是表示“剖宫产”),或者相近的东西(同样具有参考价值),还可能用户输入时笔误输错了关键词中的某个字。对于这些情况,本实施例中增加了同义词典、近义词典、及同音词典。在实际使用中,首先系统获取到用户输入的关键词后,便会通过同义词典查找该关键词的同义词,然后再将该用户输入的关键词及其同义词在搜索词库中进行查询比对,看是否有对应的搜索关键词,如果有则将记录的频次(搜索关键词在各版块类别的搜索频次或者出现频次)按照从高到低的顺序进行排序,选取排序最靠前的版块类别作为目标版块类别,提醒用户前往查询。当然,如果还是不存在对应的搜索关键词,则再在近义词典中查找用户输入的关键词的近义词,然后再将该近义词在搜索词库中再进行查询比对,看是否可以找到相应的搜索关键词,同样如果查询到了的话,则按照记录的频次高低进行排序,选取排序最靠前的版块类别作为目标版块类别。如果还是没找到,则再通过同音词典,查看是否存在与用户输入的关键词同音的词语,如果找到了,便再在搜索词库中搜索与该同音词匹配的搜索关键词,同样将查询结果按照记录频次高低进行排序,选取频次最高的版块类别作为目标版块类别,提示用户是否前往该目标版块类别进行查询。当然,如果在同音词典中也还是没有找到同音的词语或者找到的同音词未存储在搜索词库中,也就是说用户输入的搜索关键词,在搜索词库中找不到,且其同义词、近义词、同音词也都查询不到结果的话,则不提示用户,直接将该搜索的关键词在用户当前查询的版块进行搜索查询,并在当前版块类别中,显示关于该关键词的搜索结果。此外,再将该搜索的关键词新增至搜索词库中。
更佳的,所述搜索词库还具备自动联想、自动在线抓取功能,将获取的用户关键词进行相似扩充,扩充后,搜索词库包括了相似、相近的本领域词汇;其中,相似和相近词汇,主要用于提示用户是否输错、是否是要检索的内容,相近词汇除了用于提示用于提示外,还可以作为领域知识点的提示。
将搜索的关键词新增至搜索词库中,除了新增搜索关键词外,还要记录该搜索关键词的频次。具体的,需记录搜索关键词的搜索频次或者出现频次。
本申请的另一实施例,在上述任一实施例的基础上,本实施例的智能搜索导向系统还包括搜索频次更新模块810或出现频次更新模块820;其中:
所述搜索频次更新模块810,用于确定所述用户搜索所述搜索关键词所在的最终版块类别,并在所述搜索词库中,将所述搜索关键词在所述最终版块类别的搜索次数加一;
比如,用户接受了系统的智能导向建议,最终前往目标版块类别A查询搜索关键词a,那么查询结束后,便会在搜索词库中更新搜索关键词a在版块类别A的搜索次数:在原搜索频次基础上加1。如果用户没有接受系统的智能导向建议,还是在当前的版块类别B上查询关键词a,那么查询结束后,系统还是会在搜索词库中更新关键词a在版块类别B的搜索次数:在原搜索频次基础上加1。
所述出现频次更新模块820包括:
关键词确定子模块,用于当各版块类别中每新增一篇数据信息时,确定所述数据信息涉及的关键词;并通过所述查询比对模块在所述搜索词库中查询所述数据信息涉及的关键词;
具体的,每一篇数据文献都可以根据其中的内容提取出该数据文献的关键词,当然,每篇数据信息的关键词可以为一个,也可以为多个。查询的网站内,每新增一篇数据信息,便需要先根据该数据信息的内容进行关键词的提取,具体的,根据全文内容或者根据文章的摘要内容提取关键词,可以采用现有技术,此次不再展开赘述。获取到新增数据信息涉及的关键词信息后,便再在搜索词库中进行查询,查看搜索词库中是否已存在这些关键词。
频次更新子模块,用于当所述搜索词库中存在对应的搜索关键词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;当所述搜索词库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
具体的,如果搜索词库中已经存在新增数据信息涉及的一些关键词,那么便直接将已存在的匹配的搜索关键词在相应的版块类别(新增的数据信息所属的版块类别)的出现频次加一。而对于在搜索词库中匹配不到的关键词,则直接在该搜索词库中新增,当然,除了新增该关键词外,还需要记录该新增的关键词在对应的版块类别(新增的数据信息所属的版块类别)的出现频次:一次(原来为0次,新增后加一,则为一次)。
上述的出现频次更新模块,是根据新增数据信息的关键词来确定的,而如果无法获取到新增数据信息的关键词,那么又如何更新呢?本实施例除了给出上述的出现频次更新方案外,还可以采用下述的出现频次更新,具体的,所述出现频次更新模块包括:
关键词判断子模块,用于当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;
具体的,比如版块类别X新增一篇数据文献,那么便在搜索词库中查找版块类别X含有的所有搜索关键词,然后再看新增的数据文献中是否存在查找到的这些搜索关键词之中的任意一个或多个。值得注意的是,搜索词库中,可以按照搜索关键词来查看各搜索关键词,及其在各版块类别的频次,也可以按照版块类别来查看,各版块类别中涉及的各搜索关键词及其频次。
统计计算子模块,用于当判定所述数据信息涉及所述搜索词库中的搜索关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出现频次加一;或,获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述对应关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所属的版块类别的出现频次中。
具体的,如果该新增的数据文献中,含有搜索词库中版块类别X中的搜索关键词m,则再该搜索词库中将关键词m在版块类别X的出现频次加1。
更佳的,本实施例还可根据搜索关键词在新增的数据信息中的具体位置及出现次数来更新搜索词库中在相应版块类别的出现频次。搜索关键词在数据信息的哪部分出现及出现多少次都会影响到该数据文献是否与该搜索关键词的相关度。因此,本实施例中,根据搜索关键词出现在数据信息的位置的不同而设定了不同的权重,比如,出现在标题的权重最高,摘要次之,其它地方则更次之。具体的,比如,搜索关键词m在新增的数据信息的摘要中出现一次,在全文内容中出现5次。那么我们便会根据预先设定的摘要权重和全文权重,计算搜索关键词m在该新增的数据信息的本次频次值:1*摘要权重+5*全文权重。如果在搜索词库中,该搜索关键词m在版块类别X的出现频次为S,那么新增该数据文献后,该搜索关键词m在版块类别X的出现频次则更新为S+本次频次值(1*摘要权重+5*全文权重)。
较佳的,上述任一实施例中的智能搜索导向系统应用于专业领域数据库或专业领域网站的搜索。专业领域,比如医学领域、建筑领域等等。由于专业领域有较为专业的术语或用语,因此,搜索关键词较好设定和查询,采用本方案的系统也更为适用,也更精准。
本申请系统的另一实施例,在上述任一实施例的基础上,所述搜索词库,还用于存储所述用户的自身搜索浏览信息,所述自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息及对应的浏览时长;所述智能搜索导向系统还包括:
所述查询比对模块,还用于在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;
信息获取模块,用于当查询到所述自身搜索浏览信息中有与所述搜索关键词匹配的关键词时,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
时长判断模块,用于判断获取的浏览时长中,是否存在大于参考时长的浏览时长;
所述搜索提示模块,还用于当判定存在大于参考时长的浏览时长时,将所述对应的版块类别作为目标版块类别推荐给所述用户;或将浏览时长大于参考时长的浏览的数据信息作为目标数据信息,推荐给所述用户;
所述查询比对模块,还用于当判定不存在大于参考时长的浏览时长时,将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别。
本实施例,我们以某网站为例,该网站的搜索词库中存储有很多搜索关键词在网站各个版块类别的搜索频次(或者出现频次);此外,对于每个注册的用户而言,还会存储用户自身的搜索浏览记录,比如用户搜索的关键词,或者用户浏览的一类数据信息的关键词等等,每个关键词至少对应一个版块类别,每个关键词还关联到对应的浏览过的与该关键词相关的数据信息。若用户当前在该网站某版块查询一搜索关键词,那么首先该网站后台系统会先将该搜索关键词与搜索词库中存储的预设时间段内的(比如近一周)该用户的自身搜索浏览数据信息进行比对,看该用户是否历史搜索过相关关键词或浏览过与该关键词相关的文献数据等;如果有的话,则再看浏览时长是否超过参考时长,一般超过参考时长的话,则说明用户可能比较感兴趣,或者浏览的内容是他想要的内容。而如果浏览的时长未超出参考时长,则说明浏览的内容不是用户想要找的内容。因此,对于判断出浏览时长超过参考时长的情况下,则会直接引导用户前往之前浏览的数据信息或对应的版块类别;而对于浏览时长未超出参考时长的情况,则如实施例一中一样,再从搜索词库中找搜索关键词在各版块类别的搜索频次或出现频次(即该网站统计的访问查询该搜索关键词的总的搜索频次或该网站中关于该搜索关键词的出现频次),按照搜索频次或出现频次的高低排序,推荐频次最高的目标版块类别给用户,指引用户前往该目标版块类别查询。
进一步的,在上面实施例的基础上,所述智能搜索导向系统还包括:
时长计算模块,用于统计浏览的每篇数据信息的字数,并结合参考浏览速度,计算出每篇数据信息的参考时长;
所述时长判断模块,还用于比较每篇数据信息的参考时长与实际的浏览时长的大小;
所述时长计算模块,还用于在确定所述浏览时长大于所述参考时长时,计算所述浏览时长与所述参考时长的差值;
所述搜索提示模块,还用于当所述浏览时长与所述参考时长的差值处于预设的差值范围时,将对应的数据信息所在的版块类别作为目标版块类别推荐给所述用户;或将所述对应的数据信息作为目标数据信息,推荐给所述用户。
具体的,每篇数据信息由于篇幅大小不一,那么对应的参考时长也不一样,在获取到关键词对应的版块类别、浏览的数据信息和对应的浏览时长之后,则会进一步统计每篇数据信息的字数,然后再结合参考浏览速度,计算出参考浏览时长。对于参考浏览速度可以是按照广大用户的平均浏览速度,比如一般用户的浏览速度为400字/分钟;当然,还可以根据用户的不同设定不同的参考浏览速度,比如有的用户浏览速度比较快,可以达到800字/分钟,那么则可设定该用户的参考浏览速度为800字/分钟。每个用户的参考浏览速度可以用户自行设定,也可通过浏览测试后系统设定。
获取到参考浏览时长后,则再计算出用户实际浏览该篇数据信息的浏览时长与对应的参考浏览时长的差值,然后再判定该差值是否处于预设的差值范围内,因为,如果差值太大的话,则可能存在用户有其它事情离开,该数据信息被打开,但是用户由于在做其它事情去了而实际并没有在浏览,因此,设定一个预设的差值范围,则可有效筛选出这些不符合实际的浏览时长,提高了最终的推荐信息的准确度。
基于相同的技术构思,本申请还公开了一种智能搜索导向方法,该智能搜索导向方法可适用于上述任一智能搜索导向系统,具体的,如图3所示,包括:
S101,获取用户搜索的搜索关键词;
S102,将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别;所述搜索词库中存储有各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;
S103,判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;
S104,当判定所述用户未在所述目标版块类别中搜索所述搜索关键词时,提示所述用户至所述目标版块类别中进行搜索。
本发明方法的另一实施例,在上述方法实施例中的基础上,所述智能搜索导向方法还包括:
当所述搜索关键词在所述搜索词库中未比对上时,在所述搜索词库中新增所述搜索关键词;具体包括:
当所述搜索词库中新增所述搜索关键词,且在所述搜索词库中存储的各搜索关键词在各版块类别中的频次为搜索频次时;获取所述用户搜索所述搜索关键词所在的版块类别,并记录所述搜索关键词在所述版块类别的搜索频次;
当所述搜索词库中新增所述搜索关键词,且所述搜索词库中存储的各搜索关键词在各版块类别中的频次为出现频次时;将所述搜索关键词在各版块类别中分别进行搜索,获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
本发明方法的另一实施例,如图4所示,包括:
S201,获取用户搜索的搜索关键词;
S202,根据预存的同义词典,获取所述搜索关键词的同义词;
S203,在搜索词库中查询是否存在所述搜索关键词或所述搜索关键词的同义词;若是,进入步骤S204,否则进入步骤S205;
S204,将查询结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;执行步骤S210;
S205,根据预存的近义词典,获取所述搜索关键词的近义词;
S206,在所述搜索词库中查询是否存在所述搜索关键词的近义词;若是,进入步骤S204,否则,进入步骤S207;
S207,根据预存的同音词典,获取所述搜索词关键词的同音词;
S208,在所述搜索词库中查询是否存在所述搜索关键词的同音词;若是,进入步骤S204,否则,进入步骤S209;
S209,在所述搜索词库中新增所述搜索关键词,并记录所述搜索关键词在当前版块类别的频次;
S210,判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;若否,进入步骤S211;
S211,提示所述用户至所述目标版块类别中进行搜索。
本实施例中,增加了同义词典、近义词典、及同音词典的搜索关键词查找判断步骤。在实际使用中,首先系统获取到用户输入的关键词后,便会通过同义词典查找该关键词的同义词,然后再将该用户输入的关键词及其同义词在搜索词库中进行查询比对,看是否有对应的搜索关键词,如果有则将记录的频次(搜索关键词在各版块类别的搜索频次或者出现频次)按照从高到低的顺序进行排序,选取排序最靠前的版块类别作为目标版块类别,提醒用户前往查询。当然,如果还是不存在对应的搜索关键词,则再在近义词典中查找用户输入的关键词的近义词,然后再将该近义词在搜索词库中再进行查询比对,看是否可以找到相应的搜索关键词,同样如果查询到了的话,则按照记录的频次高低进行排序,选取排序最靠前的版块类别作为目标版块类别。如果还是没找到,则再通过同音词典,查看是否存在与用户输入的关键词同音的词语,如果找到了,便再在搜索词库中搜索与该同音词匹配的搜索关键词,同样将查询结果按照记录频次高低进行排序,选取频次最高的版块类别作为目标版块类别,提示用户是否前往该目标版块类别进行查询。当然,如果在同音词典中也还是没有找到同音的词语或者找到的同音词未存储在搜索词库中,也就是说用户输入的搜索关键词,在搜索词库中找不到,且其同义词、近义词、同音词也都查询不到结果的话,则不提示用户,直接将该搜索的关键词在用户当前查询的版块进行搜索查询,并在当前版块类别中,显示关于该关键词的搜索结果。此外,再将该搜索的关键词新增至搜索词库中。
将搜索的关键词新增至搜索词库中,除了新增搜索关键词外,还要记录该搜索关键词的频次。本实施例中所提到的频次可以是搜索频次,也可以是出现频次,但要注意的是前后一致性,即若采用搜索频次,则整个实施过程均采用搜索频次,若采用出现频次,则整个实施过程均采用出现频次。
此外,在上述任一实施例的基础上,还包括步骤:更新搜索词库中各搜索关键词在各版块类别的频次;具体包括更新搜索频次或者出现频次,具体如下:
1、更新所述搜索词库中各搜索关键词在各版块类别的搜索次数;
确定所述用户搜索所述搜索关键词所处的最终版块类别,并在所述搜索词库中,将所述搜索关键词在所述最终版块类别的搜索次数加一;
2、更新所述搜索词库中各搜索关键词在各版块类别的搜索次数或出现次数;具体又可以通过以下三种方式进行更新:
(1)当各版块类别中每新增一篇数据信息时,确定所述数据信息涉及的关键词;在所述搜索词库中查询所述数据信息涉及的关键词;当所述搜索词库中存在对应的搜索关键词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;当所述搜索词库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
(2)当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;当判定所述数据信息涉及所述搜索词库中的搜索关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出现频次加一;
(3)当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;当判定所述数据信息涉及所述搜索词库中的搜索关键词时,获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述搜索关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所属的版块类别的出现频次中。
本申请的另一方法实施例,包括如下:
S301,记录用户在不同模块中搜索关键词,并记录在“搜索词库”中,搜索词库中有搜索的关键词,所属的类别,搜索的次数。
S302,当新的用户发起新的搜索时,先将用户搜索的关键词,在“搜索词库”进行比对;
S303,如果词汇不存在,则进行记录。
S304,如果词汇存在,则按搜索次数的频数高低排序,确定该搜索词库很有可能属于频数量高的模块。
S305,如果该用户确实在该模块中搜索,则不进行提醒,直接进行搜索。
S306,如果该用户搜索不在该模块,则进行提醒,是否是搜索“频数最高的模块”的信息,给用户自动提示,方便用户及时定位到正确的搜索模块中。
通过本实施例,可以智能指导用户进行更精准地搜索。
上述任一实施例中的智能搜索导向方法可应用于专业领域数据库或专业领域网站的搜索。专业领域,比如医学领域、建筑领域等等。由于专业领域有较为专业的术语或用语,因此,搜索关键词较好设定和查询,采用本方案也更为适用,更精准。
本申请的最后一个方法实施例,在上述任一实施例的基础上,搜索词库除了存储有各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;还存储有用户的自身搜索浏览信息,该自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息及对应的浏览时长;其中,关键词与版块类别存在对应关系,浏览的数据信息按照关键词的不同进行分类存储(相当于数据信息的标签便是对应的关键词)。本实施例方法流程包括:
S401,获取用户搜索的搜索关键词;
S402,在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;若是,进入步骤S403,否则,进入步骤S406;
S403,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
S404,判断获取的浏览时长中,是否存在大于参考时长的浏览时长;若是,进入步骤S405,否则,进入步骤S406;
S405,将所述对应的版块类别作为目标版块类别推荐给所述用户;或将浏览时长大于参考时长的浏览的数据信息作为目标数据信息推荐给所述用户;
S406将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别;
S407,判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;若是,则不提示,否则,进入步骤S408;
S408,提示所述用户至所述目标版块类别中进行搜索。
本实施例中,搜索词库除了存储有各搜索关键词在各版块类别的总的搜索频次或出现频次外,还会存储注册用户自身搜索浏览信息,在获取到用户当前输入的搜索关键词后,会优先与自身搜索浏览信息进行比对,看其中是否有与该搜索关键词匹配的关键词,如果有的话,则再进一步获取该关键词对应的版块类别,及与该关键词相关的浏览的数据信息和对应的浏览时长,判断是否存在超过参考时长的浏览时长,若有,则说明该用户可能花费了较多时间去浏览阅读,可能是该用户想要的资料信息,那么可以将该浏览时长对应的浏览的数据信息推荐给用户,或者将对应的关键词所在的版块类别作为目标版块类别推荐给用户,从而帮助用户快速导向正确的版块类别或数据信息。
较佳的,在上述方法实施例的基础上,本实施例增加了参考时长的计算步骤,具体的,包括如下流程:
S501,获取用户搜索的搜索关键词;
S502,在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;若是,进入步骤S503,否则,进入步骤S508;
S503,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
S504,统计浏览的每篇数据信息的字数,并结合参考浏览速度,计算出每篇数据信息的参考时长;
S505,比较每篇数据信息的参考时长与实际的浏览时长的大小;
S506,当确定所述浏览时长大于所述参考时长时,计算所述浏览时长与所述参考时长的差值;
S507,当所述浏览时长与所述参考时长的差值处于预设的差值范围时,将对应的数据信息所在的版块类别作为目标版块类别推荐给所述用户;或将所述对应的数据信息作为目标数据信息,推荐给所述用户;
S508将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别;
S509,判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;若是,则不提示,否则,进入步骤S510;
S510,提示所述用户至所述目标版块类别中进行搜索。
具体的,鉴于每篇数据信息篇幅不同,全文字数不一样,那么对应的参考时长也不一样,在获取到关键词对应的版块类别、浏览的数据信息和对应的浏览时长之后,则会进一步统计每篇数据信息的字数,然后再结合参考浏览速度,计算出参考浏览时长。获取到参考浏览时长后,则再计算出用户实际浏览该篇数据信息的浏览时长与对应的参考浏览时长的差值,然后再判定该差值是否处于预设的差值范围内,因为,如果差值太大的话,则可能存在用户有其它事情离开,该数据信息被打开,但是用户由于在做其它事情去了而实际并没有在浏览,因此,设定一个预设的差值范围,则可有效筛选出这些不符合实际的浏览时长,提高了最终的推荐信息的准确度。
本发明的方法实施例与本发明的系统实施例相对应,本发明的系统实施例的技术细节同样适用于本发明的方法实施例,为减少重复,不再赘述。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (11)
1.一种智能搜索导向系统,其特征在于,包括:
关键词获取模块,用于获取用户搜索的搜索关键词;
搜索词库,用于存储各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;
查询比对模块,用于将所述搜索关键词在所述搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别,在确定所述目标版块类别时,若采用搜索频次,则全部采用搜索频次来选取所述目标版块类别,若采用出现频次,则全部采用出现频次来选取所述目标版块类别,若搜索频次相同,则再参考出现频次,选取出现频次更高的版块类别作为所述目标版块类别;
版块判断模块,用于判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;
搜索提示模块,用于当判定所述用户未在所述目标版块类别中搜索所述搜索关键词时,提示所述用户至所述目标版块类别中进行搜索;
还包括:搜索频次更新模块或出现频次更新模块;其中:
所述搜索频次更新模块,用于确定所述用户搜索所述搜索关键词所在的最终版块类别,并在所述搜索词库中,将所述搜索关键词在所述最终版块类别的搜索次数加一;
所述出现频次更新模块包括:
关键词确定子模块,用于当各版块类别中每新增一篇数据信息时,确定所述数据信息涉及的关键词;并通过所述查询比对模块在所述搜索词库中查询所述数据信息涉及的关键词;
频次更新子模块,用于当所述搜索词库中存在对应的搜索关键词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;当所述搜索词库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
或所述出现频次更新模块包括:
关键词判断子模块,用于当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;
统计计算子模块,用于当判定所述数据信息涉及所述搜索词库中的搜索关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出现频次加一;或,获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述对应关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所属的版块类别的出现频次中。
2.根据权利要求1所述的一种智能搜索导向系统,其特征在于,还包括:
新增模块,用于当所述搜索关键词在所述搜索词库中未比对上时,在所述搜索词库中新增所述搜索关键词。
3.根据权利要求2所述的一种智能搜索导向系统,其特征在于,所述新增模块包括:
搜索频次新增子模块,用于在所述搜索词库中新增所述搜索关键词;获取所述用户搜索所述搜索关键词所在的版块类别,并记录所述搜索关键词在所述版块类别的搜索频次;或
出现频次新增子模块,用于在所述搜索词库中新增所述搜索关键词;将所述搜索关键词在各版块类别中分别进行搜索,获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
4.根据权利要求1所述的一种智能搜索导向系统,其特征在于,所述搜索词库还存储有:同义词典、近义词典及同音词典;所述查询比对模块包括:
词典查找子模块,用于根据所述同义词典,获取所述搜索关键词的同义词;
关键词查找子模块,用于在所述搜索词库中查询所述搜索关键词及所述搜索关键词的同义词;
排序记录子模块,用于当查询到所述搜索词库中存在所述搜索关键词或所述搜索关键词的同义词时,将查询结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
所述词典查找子模块,还用于当判定所述搜索词库中未存在所述搜索关键词或所述搜索关键词的同义词时,根据所述近义词典,获取所述搜索关键词的近义词;
所述关键词查找子模块,还用于在所述搜索词库中查询是否存在所述搜索关键词的近义词;
所述排序记录子模块,还用于当查询到所述搜索词库中存在所述搜索关键词的近义词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
所述词典查找子模块,还用于当判定所述搜索词库中未存在所述搜索关键词、所述搜索关键词的同义词、或所述搜索关键词的近义词时,根据所述同音词典,获取所述搜索词关键词的同音词;
所述排序记录子模块,还用于当查询到所述搜索词库中存在所述搜索关键词的同音词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别。
5.根据权利要求1所述的一种智能搜索导向系统,其特征在于,所述搜索词库,还用于存储所述用户的自身搜索浏览信息,所述自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息及对应的浏览时长;所述智能搜索导向系统还包括:
所述查询比对模块,还用于在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;
信息获取模块,用于当查询到所述自身搜索浏览信息中有与所述搜索关键词匹配的关键词时,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
时长判断模块,用于判断获取的浏览时长中,是否存在大于参考时长的浏览时长;
所述搜索提示模块,还用于当判定存在大于参考时长的浏览时长时,将所述对应的版块类别作为目标版块类别推荐给所述用户;或将浏览时长大于参考时长的浏览的数据信息作为目标数据信息,推荐给所述用户;
所述查询比对模块,还用于当判定不存在大于参考时长的浏览时长时,将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别。
6.根据权利要求5所述的一种智能搜索导向系统,其特征在于,还包括:
时长计算模块,用于统计浏览的每篇数据信息的字数,并结合参考浏览速度,计算出每篇数据信息的参考时长;
所述时长判断模块,还用于比较每篇数据信息的参考时长与实际的浏览时长的大小;
所述时长计算模块,还用于在确定所述浏览时长大于所述参考时长时,计算所述浏览时长与所述参考时长的差值;
所述搜索提示模块,还用于当所述浏览时长与所述参考时长的差值处于预设的差值范围时,将对应的数据信息所在的版块类别作为目标版块类别推荐给所述用户;或将所述对应的数据信息作为目标数据信息,推荐给所述用户。
7.根据权利要求1-6任一项所述的一种智能搜索导向系统,其特征在于,所述智能搜索导向系统应用于专业领域数据库或专业领域网站的搜索。
8.一种智能搜索导向方法,其特征在于,包括:
获取用户搜索的搜索关键词;
将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别;所述搜索词库中存储有各搜索关键词,及各搜索关键词在各版块类别的搜索频次或出现频次;在确定所述目标版块类别时,若采用搜索频次,则全部采用搜索频次来选取所述目标版块类别,若采用出现频次,则全部采用出现频次来选取所述目标版块类别,若搜索频次相同,则再参考出现频次,选取出现频次更高的版块类别作为所述目标版块类别;
判断所述用户是否在所述目标版块类别中搜索所述搜索关键词;
当判定所述用户未在所述目标版块类别中搜索所述搜索关键词时,提示所述用户至所述目标版块类别中进行搜索;
还包括:
更新所述搜索词库中各搜索关键词在各版块类别的搜索次数或出现次数;具体包括:
确定所述用户搜索所述搜索关键词所处的最终版块类别,并在所述搜索词库中,将所述搜索关键词在所述最终版块类别的搜索次数加一;
或,
当各版块类别中每新增一篇数据信息时,确定所述数据信息涉及的关键词;
在所述搜索词库中查询所述数据信息涉及的关键词;
当所述搜索词库中存在对应的搜索关键词时,将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
当所述搜索词库中不存在对应的搜索关键词时,在所述搜索词库中新增所述关键词作为搜索关键词,并将所述搜索关键词在所述数据信息所属的版块类别的出现频次加一;
或,
当各版块类别中每新增一篇数据信息时,判断所述数据信息是否涉及所述搜索词库中的相应版块类别的搜索关键词;
当判定所述数据信息涉及所述搜索词库中的搜索关键词时,在所述搜索词库中,将涉及的搜索关键词在所述数据信息所属的版块类别的出现频次加一;或获取涉及的搜索关键词在所述数据信息中出现的位置及次数,根据预设的不同位置的权重信息,结合所述搜索关键词在所述数据信息中出现的位置、及不同位置出现的次数,计算所述搜索关键词本次频次值,并在所述搜索词库中,增加本次频次值至所述搜索关键词在所述数据信息所属的版块类别的出现频次中。
9.根据权利要求8所述的一种智能搜索导向方法,其特征在于,还包括:
当所述搜索关键词在所述搜索词库中未比对上时,在所述搜索词库中新增所述搜索关键词;具体包括:
当所述搜索词库中新增所述搜索关键词,且在所述搜索词库中存储的各搜索关键词在各版块类别中的频次为搜索频次时;获取所述用户搜索所述搜索关键词所在的版块类别,并记录所述搜索关键词在所述版块类别的搜索频次;
当所述搜索词库中新增所述搜索关键词,且所述搜索词库中存储的各搜索关键词在各版块类别中的频次为出现频次时;将所述搜索关键词在各版块类别中分别进行搜索,获取并记录出现所述搜索关键词的版块类别,及对应的出现频次。
10.根据权利要求8所述的一种智能搜索导向方法,其特征在于,所述搜索词库还存储有:同义词典、近义词典及同音词典;所述将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别具体包括:
根据预存的同义词典,获取所述搜索关键词的同义词;
在所述搜索词库中查询是否存在所述搜索关键词或所述搜索关键词的同义词;
当查询到所述搜索词库中存在所述搜索关键词或所述搜索关键词的同义词时,将查询结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
当判定所述搜索词库中未存在所述搜索关键词或所述搜索关键词的同义词时,根据预存的近义词典,获取所述搜索关键词的近义词;
在所述搜索词库中查询是否存在所述搜索关键词的近义词;
当查询到所述搜索词库中存在所述搜索关键词的近义词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别;
当判定所述搜索词库中未存在所述搜索关键词、所述搜索关键词的同义词、或所述搜索关键词的近义词时,根据预存的同音词典,获取所述搜索词关键词的同音词;
当查询到所述搜索词库中存在所述搜索关键词的同音词时,将搜索结果按照记录的频次高低进行排序,将记录的频次最高的版块类别作为目标版块类别。
11.根据权利要求8所述的一种智能搜索导向方法,其特征在于,所述搜索词库,还用于存储所述用户的自身搜索浏览信息,所述自身搜索浏览信息包括:关键词、浏览的版块类别、浏览的数据信息及对应的浏览时长;
在步骤将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别之前还包括:
在所述搜索词库中查询预设时间段内的自身搜索浏览信息中是否有与所述搜索关键词匹配的关键词;
当查询到所述自身搜索浏览信息中有与所述搜索关键词匹配的关键词时,获取所述关键词对应的版块类别,浏览的数据信息和对应的浏览时长;
判断获取的浏览时长中,是否存在大于参考时长的浏览时长;
当判定存在大于参考时长的浏览时长时,将所述对应的版块类别作为目标版块类别推荐给所述用户;或将浏览时长大于参考时长的浏览的数据信息作为目标数据信息推荐给所述用户;
当判定不存在大于参考时长的浏览时长时,将所述搜索关键词在搜索词库中进行搜索比对,确定所述搜索关键词的搜索频次或出现频次最高的目标版块类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010743794.6A CN111914154B (zh) | 2020-07-29 | 2020-07-29 | 一种智能搜索导向系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010743794.6A CN111914154B (zh) | 2020-07-29 | 2020-07-29 | 一种智能搜索导向系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111914154A CN111914154A (zh) | 2020-11-10 |
CN111914154B true CN111914154B (zh) | 2021-11-05 |
Family
ID=73287667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010743794.6A Active CN111914154B (zh) | 2020-07-29 | 2020-07-29 | 一种智能搜索导向系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111914154B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221004A (zh) * | 2021-05-21 | 2021-08-06 | 珠海金山网络游戏科技有限公司 | 一种关键词展示方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101179472A (zh) * | 2007-05-31 | 2008-05-14 | 腾讯科技(深圳)有限公司 | 一种网络资源搜索方法及搜索系统 |
CN102222295A (zh) * | 2010-04-13 | 2011-10-19 | 维鹏信息技术(上海)有限公司 | 一种在自助终端上自助购物的控制方法及控制装置 |
CN103455499A (zh) * | 2012-05-29 | 2013-12-18 | 北京百度网讯科技有限公司 | 移动终端中根据搜索词自动匹配搜索类型的方法及系统 |
CN104268287A (zh) * | 2014-10-21 | 2015-01-07 | 中国建设银行股份有限公司 | 一种搜索提示方法及装置 |
US20150278376A1 (en) * | 2014-04-01 | 2015-10-01 | Baidu (China) Co., Ltd. | Method and apparatus for presenting search result |
CN110222265A (zh) * | 2019-05-28 | 2019-09-10 | 深圳市轱辘汽车维修技术有限公司 | 一种信息推送的方法、系统、用户终端及服务器 |
CN110413734A (zh) * | 2019-07-25 | 2019-11-05 | 万达信息股份有限公司 | 一种医疗服务的智能搜索系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017035705A1 (zh) * | 2015-08-28 | 2017-03-09 | 深圳市世强先进科技有限公司 | 一种智能搜索系统及方法 |
-
2020
- 2020-07-29 CN CN202010743794.6A patent/CN111914154B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101179472A (zh) * | 2007-05-31 | 2008-05-14 | 腾讯科技(深圳)有限公司 | 一种网络资源搜索方法及搜索系统 |
CN102222295A (zh) * | 2010-04-13 | 2011-10-19 | 维鹏信息技术(上海)有限公司 | 一种在自助终端上自助购物的控制方法及控制装置 |
CN103455499A (zh) * | 2012-05-29 | 2013-12-18 | 北京百度网讯科技有限公司 | 移动终端中根据搜索词自动匹配搜索类型的方法及系统 |
US20150278376A1 (en) * | 2014-04-01 | 2015-10-01 | Baidu (China) Co., Ltd. | Method and apparatus for presenting search result |
CN104268287A (zh) * | 2014-10-21 | 2015-01-07 | 中国建设银行股份有限公司 | 一种搜索提示方法及装置 |
CN110222265A (zh) * | 2019-05-28 | 2019-09-10 | 深圳市轱辘汽车维修技术有限公司 | 一种信息推送的方法、系统、用户终端及服务器 |
CN110413734A (zh) * | 2019-07-25 | 2019-11-05 | 万达信息股份有限公司 | 一种医疗服务的智能搜索系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111914154A (zh) | 2020-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997678B2 (en) | Systems and methods for image searching of patent-related documents | |
US8566177B2 (en) | User supplied and refined tags | |
KR100295354B1 (ko) | 문서 정보 검색 시스템 | |
US8527506B2 (en) | Media discovery and playlist generation | |
JP4637969B1 (ja) | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 | |
CN101223525B (zh) | 关系网络 | |
US8661031B2 (en) | Method and apparatus for determining the significance and relevance of a web page, or a portion thereof | |
US7792813B2 (en) | Presenting result items based upon user behavior | |
US20040049499A1 (en) | Document retrieval system and question answering system | |
CN106446071B (zh) | 信息处理装置及方法 | |
CN109857938B (zh) | 基于企业信息的搜索方法、搜索装置及计算机存储介质 | |
GB2350712A (en) | Document processor and recording medium | |
EP1616276A2 (en) | System and method for navigating through websites and like information sources | |
CN111506727B (zh) | 文本内容类别获取方法、装置、计算机设备和存储介质 | |
JP2020135891A (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
CN109857853B (zh) | 基于电子书的搜索方法、电子设备及计算机存储介质 | |
JP2009245041A (ja) | 文書評価支援方法及びシステム | |
CN111914154B (zh) | 一种智能搜索导向系统及方法 | |
Wahyudi et al. | Topic modeling of online media news titles during covid-19 emergency response in Indonesia using the latent dirichlet allocation (LDA) algorithm | |
US20120191725A1 (en) | Document ranking system with user-defined continuous term weighting | |
JP2008065417A (ja) | 連想語群検索装置、システム及びコンテンツマッチ型広告システム | |
KR20100068964A (ko) | 연관 질의어 추천 장치 및 방법 | |
JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
KR100312430B1 (ko) | 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법 | |
JP2732661B2 (ja) | テキスト型データベース装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |