CN111859091B - 一种基于人工智能的搜索结果的聚合方法及装置 - Google Patents

一种基于人工智能的搜索结果的聚合方法及装置 Download PDF

Info

Publication number
CN111859091B
CN111859091B CN202010704057.5A CN202010704057A CN111859091B CN 111859091 B CN111859091 B CN 111859091B CN 202010704057 A CN202010704057 A CN 202010704057A CN 111859091 B CN111859091 B CN 111859091B
Authority
CN
China
Prior art keywords
recommendation
vowel
page
attribute
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010704057.5A
Other languages
English (en)
Other versions
CN111859091A (zh
Inventor
张伟
徐志峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Academy Of Sciences Yida Information Technology Co ltd
Original Assignee
Shandong Academy Of Sciences Yida Technology Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Academy Of Sciences Yida Technology Consulting Co ltd filed Critical Shandong Academy Of Sciences Yida Technology Consulting Co ltd
Priority to CN202010704057.5A priority Critical patent/CN111859091B/zh
Publication of CN111859091A publication Critical patent/CN111859091A/zh
Application granted granted Critical
Publication of CN111859091B publication Critical patent/CN111859091B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人工智能的搜索结果的聚合方法,从交互界面接收用户输入的查询词;判断所述用户输入的查询词的属性,所述查询词的属性包括元音属性和非元音属性;基于所述查询词的属性选择对应的推荐方式,所述推荐方式包括在索引基础上进行检索推荐的推荐方式和在非索引基础上进行推荐的推荐方式;通过所述推荐结果得到页面列表,并对所述页面列表进行处理得到最终推荐页面列表,也即搜索结果的聚合;本发明利用查询词中的元音元素进行获得推荐结果并聚合对应的页面推荐,在查询词不完整的情况下通过查询词的元音元素来进行页面推荐和聚合,得到高质量的搜索结果。

Description

一种基于人工智能的搜索结果的聚合方法及装置
技术领域
本发明涉及一种搜索方式,更具体地说,它涉及一种基于元音的搜索结果的聚合方法。
背景技术
随着互联网的普及,互联网上的信息也越来越丰富,现在人们通过搜索引擎可以便捷的获取自己想要的信息。用户可以自行设置检索词,从而搜索引擎根据检索词进行检索,将检索结果返回给用户。
所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。
无论采用什么类型的搜索引擎,都需要提供一个用户输入的查询词,存在这样一种情况,用户输入的查询词并非完整例如不完整拼音和汉字的混合,缺乏完整的查询词作为搜索的起点,只能提取查询词中的部分作为搜索的依据,导致这样一种情况下的搜索质量不高。
发明内容
本发明提供一种利用查询词中的第一属性直接推荐页面的基于人工智能的搜索结果的聚合方法,解决相关技术中用户输入的查询词不完整导致搜索质量不高的技术问题。
根据本发明的一个方面,提供了一种基于人工智能的搜索结果的聚合方法,包括以下步骤:
从交互界面接收用户输入的查询词;
判断所述用户输入的查询词的属性,所述查询词的属性包括第一属性和第二属性;
基于所述查询词的属性选择对应的推荐方式,所述推荐方式包括在索引基础上进行检索推荐的推荐方式和在非索引基础上进行推荐的推荐方式;
如果判断的所述查询词的属性为第二属性,则选择所述在索引基础上进行检索推荐的推荐方式得到推荐结果;
如果判断的所述查询词的属性为第一属性,则选择所述在非索引基础上进行推荐的推荐方式得到推荐结果;
通过所述推荐结果得到页面列表,并对所述页面列表进行处理得到最终推荐页面列表,也即搜索结果的聚合。
查询词的属性通过以下方式判断:第二属性的查询词是一个元音字母或一个汉字;
第一属性的查询词中包含一个以上的元音字母和一个以上的汉字;
所述在索引基础上进行检索推荐是基于检索数据库得到推荐结果,所述检索数据库中包含多个索引元音字母,索引元音字母的索引下包含多个与其具有预定关系的推荐词以及多个与其具有预定关系的推荐页面;
所述索引元音字母与所述推荐词的预定关系是:
所述索引元音字母与所述推荐词的首个字的元音字母相同;
所述索引元音字母与所述推荐页面的预定关系是:所述推荐页面是用户输入第一个字的元音与所述索引元音字母相同的词语时首次点击最多的页面;
所述在非索引基础上进行检索推荐包括:
从第一属性的所述检索词中提取元音字母,得到一个排序的元音字母组;
从元音检索库中提取元音路径,元音路径上的元音节点数量与从第一属性的所述检索词中提取元音字母的数量相同;
从所述元音路径中筛选出所述元音节点与所述排序的元音字母组中的元音一一对应的所述元音路径作为最终元音路径;
提取所述最终元音路径所指向的推荐词作为推荐结果。
进一步地,所述推荐结果为推荐词,通过推荐词获得与其关联的页面即可得到页面列表。
进一步地,所述推荐结果为推荐页面,直接将推荐页面汇总得到页面列表。
根据本发明的另一个方面,提供了一种基于人工智能的搜索结果的聚合装置,包括用户交互界面单元、查询词属性判断单元、推荐方式选择单元、推荐查询单元、第二属性词推荐单元、第一属性词推荐单元、页面列表生成单元和筛选单元,
用户交互界面用于接收用户输入的查询词,并将筛选单元筛选的最终推荐页面列表显示给用户;
查询词属性判断单元用于判断用户交互界面所接收的查询词的属性;
推荐方式选择单元用于根据查询词的属性选择推荐方式,并发送对应的推荐请求到推荐查询单元;
推荐查询单元用于根据推荐方式选择单元的推荐请求启动第二属性词推荐单元或第一属性词推荐单元;
第二属性词推荐单元在索引基础上进行检索推荐得到推荐结果,并发送到推荐查询单元;
第一属性词推荐单元在非索引基础上进行推荐得到推荐结果,并发送到推荐查询单元;
页面列表生成单元根据推荐查询单元的推荐结果生成对应的页面列表;
筛选单元用于对页面列表生成单元生成的页面列表筛选得到最终推荐页面列表;
所述在索引基础上进行检索推荐是基于检索数据库得到推荐结果,所述检索数据库中包含多个索引元音字母,索引元音字母的索引下包含多个与其具有预定关系的推荐词以及多个与其具有预定关系的推荐页面;
所述索引元音字母与所述推荐词的预定关系是:
所述索引元音字母与所述推荐词的首个字的元音字母相同;
所述索引元音字母与所述推荐页面的预定关系是:所述推荐页面是用户输入第一个字的元音与所述索引元音字母相同的词语时首次点击最多的页面;
所述在非索引基础上进行检索推荐包括:
从第一属性的所述检索词中提取元音字母,得到一个排序的元音字母组;
从元音检索库中提取元音路径,元音路径上的元音节点数量与从第一属性的所述检索词中提取元音字母的数量相同;
从所述元音路径中筛选出所述元音节点与所述排序的元音字母组中的元音一一对应的所述元音路径作为最终元音路径;
提取所述最终元音路径所指向的推荐词作为推荐结果。
进一步地,所述页面列表生成单元包括推荐结果判断单元、页面提取单元和页面列表输出单元,所述推荐结果判断单元对推荐结果进行判断,如果所述推荐结果为推荐词,所述页面提取单元从页面存储数据库中提取关联的页面,并发送到列表输出单元,如果所述推荐结果为页面,直接发送到列表输出单元,所述列表输出单元对所述页面制表得到页面列表。
进一步地,所述第二属性词推荐单元通过检索数据读取单元从检索数据库中提取信息。
进一步地,所述第一属性词推荐单元通过元音检索数据读取单元从元音检索库中提取信息。
本发明的有益效果在于:本发明利用查询词中的元音元素进行获得推荐结果并聚合对应的页面推荐,在查询词不完整的情况下通过查询词的元音元素来进行页面推荐和聚合,得到高质量的搜索结果。
本发明基于查询词的元音元素推荐,可对不同语种的混合查询词进行推荐,克服语种含义障碍。
附图说明
图1是本发明实施例的基于人工智能的搜索结果的聚合方法的流程图;
图2是本发明实施例的行走机构的检索数据库的索引表示意图;
图3是本发明实施例的元音检索库中存在多个元音路径的示意图;
图4是本发明实施例的基于人工智能的搜索结果的聚合装置的模块示意图一;
图5是本发明实施例的基于人工智能的搜索结果的聚合装置的模块示意图二;
图6是本发明实施例的页面列表生成单元的模块示意图。
图中:用户交互界面单元110、查询词属性判断单元120、推荐方式选择单元130、推荐查询单元140、第二属性词推荐单元150、第一属性词推荐单元160、页面列表生成单元170、筛选单元180、检索数据读取单元151、元音检索数据读取单元161、推荐结果判断单元171、页面提取单元172、页面列表输出单元173。
具体实施方式
现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
在本实施例中提供了一种基于人工智能的搜索结果的聚合方法,如图1所示是根据本发明的基于人工智能的搜索结果的聚合方法的流程图,如图所示,该流程包括以下步骤:
步骤100,从交互界面接收用户输入的查询词;
步骤200,判断用户输入的查询词的属性,所述查询词的属性包括第一属性和第二属性;
步骤300,基于查询词的属性选择对应的推荐方式,推荐方式包括在索引基础上进行检索推荐和在非索引基础上进行推荐;
查询词的属性通过以下方式判断:第二属性的查询词是一个元音字母(元音字母包含单元音字母和双元音字母,相邻的两个元音字母视为一个双元音字母)或一个汉字;例如a、ao、你、汉。
第一属性的查询词中包含一个以上的元音字母(相邻的两个元音字母视为一个元音字母)和一个以上的汉字;例如a我、ado是。
步骤400,如果判断的查询词的属性为第二属性,则选择在索引基础上进行检索推荐的推荐方式得到推荐结果;
步骤500,如果判断的查询词的属性为第一属性,则选择在非索引基础上进行推荐的推荐方式得到推荐结果;
步骤600,通过推荐结果得到页面列表,并对页面列表进行处理得到最终推荐页面列表,也即搜索结果的聚合。最终推荐页面列表可选的仍然通过所述交互界面进行显示。
最终推荐页面列表为多个具有一定排序的页面。
在索引基础上进行检索推荐是基于检索数据库得到推荐结果,检索数据库中包含多个索引元音字母,索引元音字母的索引下包含多个与其具有预定关系的推荐词以及多个与其具有预定关系的推荐页面;
索引元音字母与推荐词的预定关系可选但不限于:
A、索引元音字母与推荐词的首个字的元音字母相同;
B、索引元音字母与推荐词的至少一个字的元音字母相同;
索引元音字母与推荐页面的预定关系是:推荐页面是用户输入第一个字的元音与索引元音字母相同的词语时首次点击最多的页面。
检索数据库的字可选但不限于:汉字、英语单词;
检索数据库的词可选但不限于:汉语词、英文单词、汉字与英文单词的组合、汉语词与英文单词的组合。
检索数据库的建立可以是基于过往的检索记录信息统计之后得到的如图2所示的索引表(图中页面仅作为示例,并非代表真实页面)。
检索数据库可以基于用户输入查询词之间的检索记录信息进行更新,以保持减速数据库的时效性。
第二属性的查询词在索引基础上进行检索推荐包括:
提取第二属性的查询词的首个元音字母作为索引元音字母在检索数据库中检索对应的推荐词和/或推荐页面。
例如ap我,以a作为索引元音字母。
在索引基础上进行检索推荐的推荐方法的推荐结果包含两种:推荐词和推荐页面;
第一属性的检索词在非索引基础上进行推荐包括:
从第一属性的检索词中提取元音字母,得到一个排序的元音字母组;
从元音检索库中提取元音路径,元音路径上的元音节点数量与从第一属性的检索词中提取元音字母的数量相同;
从元音路径中筛选出元音节点与排序的元音字母组中的元音一一对应的元音路径作为最终元音路径;
提取最终元音路径所指向的推荐词作为推荐结果;
如图3所示元音检索库中存在多个元音路径,
图中“Q”表示元音路径的起始点,“Z”表示元音路径的终点,“Q”与“Z”之间有若干个元音节点。
以第一个元音节点的元音字母开始结合辅音得到推荐词的第一个字,以另一个元音节点的元音字母开始结合辅音得到推荐词的第二个字;依次形成一个元音路径,并指向一个终点“Z”,终点“Z”指向至少一个的推荐词。
图2中从推荐词的元音字母顺序来看,“安全”的元音字母是“a”和“ua”,“挖土机”的元音字母是“a”、“u”和“i”,“洒水”的元音字母是“a”和“ui”;
“安全”、“挖土机”、“洒水”和“瓦图图”均是以元音字母是“a”作为第一个字的元音字母;
但是不同的是在“安全”是在元音字母“a”之后输入元音字母“ua”;
“挖土机”是在元音字母“a”之后输入元音字母“u”;
“洒水”是在元音字母“a”之后输入元音字母“ui”;
“安全”、“挖土机”、“洒水”是在元音字母“a”之后开始分离;
“挖土机”是在元音字母“a”之后输入元音字母“u”,之后输入元音字母“i”,“瓦图图”是在元音字母“a”之后输入元音字母“u”,之后输入元音字母“u”,“挖土机”与“瓦图图”是在元音字母“u”之后开始分离;
因此,排序的元音字母组对应的元音路径能够指向不同的推荐词。
基于上述两种推荐结果得到页面列表的方式存在各种方式,本发明根据具体的应用领域可以适应性的进行选择,在本实施例中提供了两种可选的方式:
实施例一
推荐结果为推荐词,通过推荐词获得与其关联的页面即可得到页面列表。
与推荐词关联的页面可以是页面包含的内容标签包含该推荐词。
也可以通过在页面存储数据库中进行以下检索,具体包括以下步骤:
每个页面具有至少一个内容标签,提取内容标签与推荐词相同的页面;
例如旅游地图页面具有“旅游”内容标签,旅游产品页面同样具有“旅游”内容标签,旅游酒店页面同样具有“旅游”内容标签;
因此根据推荐词可能包含的多个具体需求,为了最大可能匹配中用户的需求,本发明实施例进一步对初步提取的页面进行处理。
对提取的页面进行分析,得到页面的需求标签以及页面与需求标签的匹配度;
从页面的元素信息中,提取出分类特征,这里所说的元素信息包括题目、摘要、页面正文内容和/或网络地址;进而根据分类特征,在页面所属领域下,进行需求分类,以在该领域所对应的需求标签中,确定页面所匹配的需求标签,并计算页面与所确定出的需求标签的匹配程度。
一般来说,用户在每一个领域下,均有一些惯用的需求,从而使得每一领域均对应了多个常用的需求标签。在页面对应的领域下,从这些需求标签中确定匹配的需求标签,能够使得需求标签在较大程度上与页面匹配,也就是说,需求标签能够较为准确地指示页面所能满足的用户需求。
采用离线系统进行离线的数据挖掘,以对历史搜索所采用的检索词按照领域进行分析,得到各个领域对应的需求标签,生成用于记录各个领域对应的需求标签的标签词典。
预先从展现日志和点击日志中获取历史搜索所采用的检索词,构成检索词集合,进而按照领域,对检索词集合中的检索词进行分类,得到各领域中常用的检索词。在这些领域内,对这些常用的检索词进行语法分析和词汇答案类型分析(Lexical Answer Type,LAT)提取出检索词中所隐含的需求词。通过对这些需求词进行统计分析,当然为了进一步提高准确度还可以进行人工校对,以便生成各个领域对应的需求标签。将各个领域对应的需求标签记录到标签词典中具体地推荐词和页面对应于上述的各个领域中的一个;
在页面所属领域内,对页面进行需求分析,以从标签词典中所记录的该领域对应的需求标签中,确定该页面所匹配中的需求标签。
具体地,在确定页面所属领域之后,可以在前述标签词典所记录的该领域对应的需求标签基础上,参考人工智能中的多分类问题的解决方法,从页面的题目、摘要、网络地址等各种元信息中提取出分类特征,输入分类模型,在该领域对应的需求标签中确定匹配的需求标签。
计算页面与所确定出的需求标签的匹配程度。
具体地,在确定出页面的需求标签之后,还需要对该页面满足该标签所指示需求的能力进行评估,将评估结果作为页面与所确定出的需求标签的匹配程度。作为一种可能的实现方式,在对该页面满足该标签所指示需求的能力进行评估时,可以依据以下三点:首先,为页面的题目、摘要和页面内容的一致性;其次,为页面的题目和摘要的文字质量;最后,为搜索引擎的点击日志中,该页面在历史搜索中被点击的情况。
生成记录各页面所匹配需求的标签,以及页面与标签所指示需求的匹配程度的索引库。
基于页面的需求标签以及页面与需求标签的匹配度,对步骤101中提取的页面中筛选得到页面列表。具体的推荐词根据查询标签词典得到一个需求标签,以该需求标签为基准根据页面的需求标签以及页面与需求标签的匹配度进行筛选。
具体地,以预设指标为依据,根据页面所匹配需求的标签,以及页面与需求匹配的程度,从步骤101中提取的页面中筛选得到页面列表,筛选出的页面所匹配的需求应当尽量多元化,从而能够最大程度涵盖用户的需求,提高与用户需求的匹配程度。
如何能够使得目标页面所匹配的需求应当尽量多元化,本步骤中具体可以通过指标的设置来进行保证。作为一种可能的实现方式,预设指标包括:具有同一标签的目标页面数量高于第一阈值;和/或,所选择出的目标页面所匹配需求的标签数量高于第二阈值;和/或所选择出的目标页面与所述需求标签的匹配程度高于第三阈值。
这三项指标分别对应了三个方面的限制条件,第一方面为满足每一方面需求的目标页面数量应尽量较多,第二方面为每一目标页面所能满足的需求应尽量较多,第三方面为目标页面应尽可能契合与其所能满足的需求。通过这三个方面的限制,能够选择出最大程度涵盖用户的需求的目标页面列表。
实施例二
推荐结果为推荐页面,直接将推荐页面汇总得到页面列表。
实施例一和实施例二中得到的页面列表可以进行混合得到一个新的页面列表处理得到最终推荐页面列表。
在索引基础上进行检索推荐的推荐方式得到的推荐结果对应的页面列表进行处理得到最终推荐页面列表包括:
在索引基础上进行检索推荐的推荐方式得到的推荐结果对应的页面列表经过
基于协同过滤推荐或基于图模型的推荐或基于关联规则的推荐得到最终推荐页面列表。
例如,在索引基础上进行检索推荐的推荐方式得到的推荐结果对应的页面列表经过基于协同过滤推荐得到最终推荐页面列表包括:
提取用户的特征向量和特征-页面相关矩阵;
对特征-页面相关矩阵进行处理,删除特征-页面相关矩阵中不属于在索引基础上进行检索推荐的推荐方式得到的推荐结果对应的页面列表的页面,得到处理后的特征-页面相关矩阵。
基于用户的特征向量和处理后的特征-页面相关矩阵得到最终推荐页面列表。
用户的特征向量和特征-页面相关矩阵是预先存储于用户推荐数据库中,是通过现有的机器学习方法利用用户行为数据得到的,并预存于用户推荐数据库中。因此采用删除特征-页面相关矩阵中不属于在索引基础上进行检索推荐的推荐方式得到的推荐结果对应的页面列表的页面的方式来避免多余页面的推荐。
在本实施例中提供了一种基于人工智能的搜索结果的聚合装置1000,如图4所示是根据本发明的基于人工智能的搜索结果的聚合装置1000的模块图,如图4所示,一种基于人工智能的搜索结果的聚合装置1000,包括用户交互界面单元110、查询词属性判断单元120、推荐方式选择单元130、推荐查询单元140、第二属性词推荐单元150、第一属性词推荐单元160、页面列表生成单元170和筛选单元180,
用户交互界面用于接收用户输入的查询词,并将筛选单元180筛选的最终推荐页面列表显示给用户;
查询词属性判断单元120用于判断用户交互界面所接收的查询词的属性;
推荐方式选择单元130用于根据查询词的属性选择推荐方式,并发送对应的推荐请求到推荐查询单元140;
推荐查询单元140用于根据推荐方式选择单元130的推荐请求启动第二属性词推荐单元150或第一属性词推荐单元160;
第二属性词推荐单元150在索引基础上进行检索推荐得到推荐结果,并发送到推荐查询单元140;
第一属性词推荐单元160在非索引基础上进行推荐得到推荐结果,并发送到推荐查询单元140;
页面列表生成单元170根据推荐查询单元140的推荐结果生成对应的页面列表;
筛选单元180用于对页面列表生成单元170生成的页面列表筛选得到最终推荐页面列表。
查询词属性判断单元120判断用户交互界面所接收的查询词的属性包括:查询词的属性通过以下方式判断:第二属性的查询词中包含一个元音字母(元音字母包含单元音字母和双元音字母,相邻的两个元音字母视为一个双元音字母)或一个汉字;例如a、ao、你、汉。
第一属性的查询词中包含至少一个元音字母(相邻的两个元音字母视为一个元音字母)和至少一个汉字;例如a我、ado是。
推荐方式选择单元130根据查询词的属性选择推荐方式包括:如果判断的查询词的属性为第二属性,则选择在索引基础上进行检索推荐的推荐方式;
如果判断的查询词的属性为第一属性,则选择在非索引基础上进行推荐的推荐方式;
页面列表生成单元170根据推荐查询单元140的推荐结果生成对应的页面列表包括:推荐结果为推荐词,通过推荐词获得与其关联的页面即可得到页面列表;推荐结果为推荐页面,直接将推荐页面汇总得到页面列表;
如图6所示,更为具体的页面列表生成单元170包括推荐结果判断单元171、页面提取单元172和页面列表输出单元173,推荐结果判断单元171对推荐结果进行判断,如果推荐结果为推荐词,页面提取单元172从页面存储数据库中提取关联的页面,并发送到列表输出单元173,如果推荐结果为推荐页面,直接发送到列表输出单元173,列表输出单元173对页面制表得到页面列表。
页面存储数据库中存储页面数据,页面数据包含页面的元素信息,包括题目、摘要、页面正文内容和/或网络地址。
第二属性词推荐单元150在索引基础上进行检索推荐是基于检索数据库得到推荐结果,检索数据库中包含多个索引元音字母,索引元音字母的索引下包含多个与其具有预定关系的推荐词以及多个与其具有预定关系的推荐页面;
索引元音字母与推荐词的预定关系可选但不限于:
A、索引元音字母与推荐词的首个字的元音字母相同;
B、索引元音字母与推荐词的至少一个字的元音字母相同;
索引元音字母与推荐页面的预定关系是:推荐页面是用户输入第一个字的元音与索引元音字母相同的词语时首次点击最多的页面。
检索数据库的字可选但不限于:汉字、英语单词;
检索数据库的词可选但不限于:汉语词、英文单词、汉字与英文单词的组合、汉语词与英文单词的组合。
检索数据库的建立可以是基于过往的检索记录信息统计之后得到的如图2所示的索引表。
第一属性词推荐单元160在非索引基础上进行推荐包括:
从第一属性的检索词中提取元音字母,得到一个排序的元音字母组;
从元音检索库中提取元音路径,元音路径上的元音节点数量与从第一属性的检索词中提取元音字母的数量相同;
从元音路径中筛选出元音节点与排序的元音字母组中的元音一一对应的元音路径作为最终元音路径;
提取最终元音路径所指向的推荐词作为推荐结果。
如图5所示,第二属性词推荐单元150通过检索数据读取单元151从检索数据库中提取信息;
第一属性词推荐单元160通过元音检索数据读取单元161从元音检索库中提取信息。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (7)

1.一种基于人工智能的搜索结果的聚合方法,其特征在于,包括以下步骤:
从交互界面接收用户输入的查询词;
判断所述用户输入的查询词的属性,所述查询词的属性包括第一属性和第二属性;
基于所述查询词的属性选择对应的推荐方式,所述推荐方式包括在索引基础上进行检索推荐的推荐方式和在非索引基础上进行推荐的推荐方式;
如果判断的所述查询词的属性为第二属性,则选择所述在索引基础上进行检索推荐的推荐方式得到推荐结果;
如果判断的所述查询词的属性为第一属性,则选择所述在非索引基础上进行推荐的推荐方式得到推荐结果;
通过所述推荐结果得到页面列表,并对所述页面列表进行处理得到最终推荐页面列表,也即搜索结果的聚合;
查询词的属性通过以下方式判断:第二属性的查询词是一个元音字母或一个汉字;
第一属性的查询词中包含一个以上的元音字母和一个以上的汉字;
所述在索引基础上进行检索推荐是基于检索数据库得到推荐结果,所述检索数据库中包含多个索引元音字母,索引元音字母的索引下包含多个与其具有预定关系的推荐词以及多个与其具有预定关系的推荐页面;
所述索引元音字母与所述推荐词的预定关系是:
所述索引元音字母与所述推荐词的首个字的元音字母相同;
所述索引元音字母与所述推荐页面的预定关系是:所述推荐页面是用户输入第一个字的元音与所述索引元音字母相同的词语时首次点击最多的页面;
所述在非索引基础上进行推荐包括:
从第一属性的所述检索词中提取元音字母,得到一个排序的元音字母组;
从元音检索库中提取元音路径,元音路径上的元音节点数量与从第一属性的所述检索词中提取元音字母的数量相同;
从所述元音路径中筛选出所述元音节点与所述排序的元音字母组中的元音一一对应的所述元音路径作为最终元音路径;
提取所述最终元音路径所指向的推荐词作为推荐结果。
2.根据权利要求1所述的一种基于人工智能的搜索结果的聚合方法,其特征在于,所述推荐结果为推荐词,通过推荐词获得与其关联的页面即可得到页面列表。
3.根据权利要求1所述的一种基于人工智能的搜索结果的聚合方法,其特征在于,所述推荐结果为推荐页面,直接将推荐页面汇总得到页面列表。
4.一种基于人工智能的搜索结果的聚合装置,其特征在于,包括用户交互界面单元、查询词属性判断单元、推荐方式选择单元、推荐查询单元、第二属性词推荐单元、第一属性词推荐单元、页面列表生成单元和筛选单元,
用户交互界面用于接收用户输入的查询词,并将筛选单元筛选的最终推荐页面列表显示给用户;
查询词属性判断单元用于判断用户交互界面所接收的查询词的属性;
推荐方式选择单元用于根据查询词的属性选择推荐方式,并发送对应的推荐请求到推荐查询单元;
推荐查询单元用于根据推荐方式选择单元的推荐请求启动第二属性词推荐单元或第一属性词推荐单元;
第二属性词推荐单元在索引基础上进行检索推荐得到推荐结果,并发送到推荐查询单元;
第一属性词推荐单元在非索引基础上进行推荐得到推荐结果,并发送到推荐查询单元;
页面列表生成单元根据推荐查询单元的推荐结果生成对应的页面列表;
筛选单元用于对页面列表生成单元生成的页面列表筛选得到最终推荐页面列表;
所述在索引基础上进行检索推荐是基于检索数据库得到推荐结果,所述检索数据库中包含多个索引元音字母,索引元音字母的索引下包含多个与其具有预定关系的推荐词以及多个与其具有预定关系的推荐页面;
所述索引元音字母与所述推荐词的预定关系是:
所述索引元音字母与所述推荐词的首个字的元音字母相同;
所述索引元音字母与所述推荐页面的预定关系是:所述推荐页面是用户输入第一个字的元音与所述索引元音字母相同的词语时首次点击最多的页面;
所述在非索引基础上进行推荐包括:
从第一属性的所述检索词中提取元音字母,得到一个排序的元音字母组;
从元音检索库中提取元音路径,元音路径上的元音节点数量与从第一属性的所述检索词中提取元音字母的数量相同;
从所述元音路径中筛选出所述元音节点与所述排序的元音字母组中的元音一一对应的所述元音路径作为最终元音路径;
提取所述最终元音路径所指向的推荐词作为推荐结果。
5.根据权利要求4所述的一种基于人工智能的搜索结果的聚合装置,其特征在于,所述页面列表生成单元包括推荐结果判断单元、页面提取单元和页面列表输出单元,所述推荐结果判断单元对推荐结果进行判断,如果所述推荐结果为推荐词,所述页面提取单元从页面存储数据库中提取关联的页面,并发送到列表输出单元,如果所述推荐结果为页面,直接发送到列表输出单元,所述列表输出单元对所述页面制表得到页面列表。
6.根据权利要求4或5所述的一种基于人工智能的搜索结果的聚合装置,其特征在于,所述第二属性词推荐单元通过检索数据读取单元从检索数据库中提取信息。
7.根据权利要求4或5所述的一种基于人工智能的搜索结果的聚合装置,其特征在于,所述第一属性词推荐单元通过元音检索数据读取单元从元音检索库中提取信息。
CN202010704057.5A 2020-07-21 2020-07-21 一种基于人工智能的搜索结果的聚合方法及装置 Active CN111859091B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010704057.5A CN111859091B (zh) 2020-07-21 2020-07-21 一种基于人工智能的搜索结果的聚合方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010704057.5A CN111859091B (zh) 2020-07-21 2020-07-21 一种基于人工智能的搜索结果的聚合方法及装置

Publications (2)

Publication Number Publication Date
CN111859091A CN111859091A (zh) 2020-10-30
CN111859091B true CN111859091B (zh) 2021-06-04

Family

ID=73001571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010704057.5A Active CN111859091B (zh) 2020-07-21 2020-07-21 一种基于人工智能的搜索结果的聚合方法及装置

Country Status (1)

Country Link
CN (1) CN111859091B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113010776B (zh) * 2021-03-03 2022-12-09 昆明理工大学 一种基于Monroe规则的元搜索排序Top-k聚合方法
CN113127736A (zh) * 2021-04-14 2021-07-16 华世界数字科技(深圳)有限公司 一种基于搜索历史记录的分类推荐方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101416179A (zh) * 2006-04-06 2009-04-22 Nhn公司 用来向每个用户提供调整推荐字的系统和方法及记录用来执行上述方法的程序的计算机可读记录介质
CN101884041A (zh) * 2007-11-30 2010-11-10 雅虎公司 使能经由消息传输对缩写搜索项进行搜索
CN103092860A (zh) * 2011-11-02 2013-05-08 中国移动通信集团四川有限公司 搜索提示信息生成方法及装置
CN103678362A (zh) * 2012-09-13 2014-03-26 深圳市世纪光速信息技术有限公司 搜索方法及系统
CN106570116A (zh) * 2016-11-01 2017-04-19 北京百度网讯科技有限公司 基于人工智能的搜索结果的聚合方法及装置
CN107590214A (zh) * 2017-08-30 2018-01-16 腾讯科技(深圳)有限公司 搜索关键词的推荐方法、装置及电子设备
CN110069610A (zh) * 2019-03-16 2019-07-30 平安科技(深圳)有限公司 基于Solr的检索方法、装置、设备和存储介质
US10402432B1 (en) * 2014-06-25 2019-09-03 Google Llc Search suggestions based on native application history
US20200142994A1 (en) * 2018-11-07 2020-05-07 Adobe Inc. Guided content discovery in visual search
WO2020101989A1 (en) * 2018-11-15 2020-05-22 Microsoft Technology Licensing, Llc Expanding search engine capabilities using ai model recommendations

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100409241C (zh) * 2006-09-20 2008-08-06 网易有道信息技术(北京)有限公司 一种基于搜索引擎的信息检索方法及检索系统
JP2009140287A (ja) * 2007-12-07 2009-06-25 Alpine Electronics Inc 検索結果表示装置
CN101770478B (zh) * 2008-12-26 2013-04-24 高德信息技术有限公司 数据检索方法、数据检索装置及嵌入式终端
CN107132931B (zh) * 2017-04-27 2020-07-17 上海梅斯医药科技有限公司 一种搜索方法及服务器

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101416179A (zh) * 2006-04-06 2009-04-22 Nhn公司 用来向每个用户提供调整推荐字的系统和方法及记录用来执行上述方法的程序的计算机可读记录介质
CN101884041A (zh) * 2007-11-30 2010-11-10 雅虎公司 使能经由消息传输对缩写搜索项进行搜索
CN103092860A (zh) * 2011-11-02 2013-05-08 中国移动通信集团四川有限公司 搜索提示信息生成方法及装置
CN103678362A (zh) * 2012-09-13 2014-03-26 深圳市世纪光速信息技术有限公司 搜索方法及系统
US10402432B1 (en) * 2014-06-25 2019-09-03 Google Llc Search suggestions based on native application history
CN106570116A (zh) * 2016-11-01 2017-04-19 北京百度网讯科技有限公司 基于人工智能的搜索结果的聚合方法及装置
CN107590214A (zh) * 2017-08-30 2018-01-16 腾讯科技(深圳)有限公司 搜索关键词的推荐方法、装置及电子设备
US20200142994A1 (en) * 2018-11-07 2020-05-07 Adobe Inc. Guided content discovery in visual search
WO2020101989A1 (en) * 2018-11-15 2020-05-22 Microsoft Technology Licensing, Llc Expanding search engine capabilities using ai model recommendations
CN110069610A (zh) * 2019-03-16 2019-07-30 平安科技(深圳)有限公司 基于Solr的检索方法、装置、设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"元搜索中基于日志和语料的查询推荐模型的研究与实现";刘佳薇;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190215(第02期);I138-2388 *

Also Published As

Publication number Publication date
CN111859091A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111753060B (zh) 信息检索方法、装置、设备及计算机可读存储介质
CN109726274B (zh) 问题生成方法、装置及存储介质
CN108280155B (zh) 基于短视频的问题检索反馈方法、装置及其设备
CN104834729B (zh) 题目推荐方法和题目推荐装置
CN110390052B (zh) 搜索推荐方法、ctr预估模型的训练方法、装置及设备
CN107491655B (zh) 基于机器学习的肝脏疾病信息智能咨询系统
CN113535963B (zh) 一种长文本事件抽取方法、装置、计算机设备及存储介质
CN110888990A (zh) 文本推荐方法、装置、设备及介质
US7567954B2 (en) Sentence classification device and method
US20060095852A1 (en) Information storage and retrieval
CN110321291A (zh) 测试案例智能提取系统及方法
CN111324771B (zh) 视频标签的确定方法、装置、电子设备及存储介质
US20040107221A1 (en) Information storage and retrieval
CN111291210A (zh) 图像素材库生成方法、图像素材推荐方法及相关装置
CN111859091B (zh) 一种基于人工智能的搜索结果的聚合方法及装置
CN104268148A (zh) 一种基于时间串的论坛页面信息自动抽取方法及系统
US11520835B2 (en) Learning system, learning method, and program
CN115203338A (zh) 一种标签及标签实例推荐方法
CN114443847A (zh) 文本分类、文本处理方法、装置、计算机设备及存储介质
CN114222000B (zh) 信息推送方法、装置、计算机设备和存储介质
CN115017271B (zh) 用于智能生成rpa流程组件块的方法及系统
CN106570116B (zh) 基于人工智能的搜索结果的聚合方法及装置
CN116049376A (zh) 一种信创知识检索回复的方法、装置和系统
CN115203206A (zh) 数据内容搜索方法、装置、计算机设备及可读存储介质
CN116303983A (zh) 一种关键词推荐方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 811, 8th Floor, Zone A, Chengchuang Building, No. 2350 Kaifeng Road, Jinan Area, China (Shandong) Pilot Free Trade Zone, Jinan City, Shandong Province, 250000

Patentee after: Shandong Academy of Sciences Yida Information Technology Co.,Ltd.

Country or region after: China

Address before: Room 303, block B, Yinhe building, 2008 Xinluo street, Jinan area, China (Shandong) pilot Free Trade Zone, Jinan City, Shandong Province

Patentee before: Shandong Academy of Sciences Yida Technology Consulting Co.,Ltd.

Country or region before: China

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20201030

Assignee: Shandong Academy of Sciences Yida Technology Consulting Co.,Ltd.

Assignor: Shandong Academy of Sciences Yida Information Technology Co.,Ltd.

Contract record no.: X2024980011869

Denomination of invention: A method and device for aggregating search results based on artificial intelligence

Granted publication date: 20210604

License type: Common License

Record date: 20240815