CN110334282A - 一种基于人工智能的网站浏览器 - Google Patents

一种基于人工智能的网站浏览器 Download PDF

Info

Publication number
CN110334282A
CN110334282A CN201910642276.2A CN201910642276A CN110334282A CN 110334282 A CN110334282 A CN 110334282A CN 201910642276 A CN201910642276 A CN 201910642276A CN 110334282 A CN110334282 A CN 110334282A
Authority
CN
China
Prior art keywords
user
module
result
search
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910642276.2A
Other languages
English (en)
Inventor
任强
马宗保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University
Original Assignee
Xian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University filed Critical Xian University
Priority to CN201910642276.2A priority Critical patent/CN110334282A/zh
Publication of CN110334282A publication Critical patent/CN110334282A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人工智能的网站浏览器,包括用户录入模块,用于接收用户录入的要搜索的信息;搜索引擎模块,用于搜索用户录入模块中用户的要搜索的信息和关键词提取模块中的主题通过搜索引擎进行搜索,将得到的搜索结果存放在结果暂存模块中;结果暂存模块,用于存储搜索引擎搜到的搜索结果;关键词提取模块,提取出用户搜索结果中每一条搜索结果的主题,统计每一个相同主题的数量,将数量达到设定数量的主题送入搜索引擎模块分别进行搜索;聚合分发模块,用于将搜索结果进行聚合分发呈现给用户。本发明根据用户录入的文字进行搜索,并在搜索结果中提取出关键词后对提取的关键词进行二次搜索,并将所有的搜索结果根据相关性对用户进行显示。

Description

一种基于人工智能的网站浏览器
技术领域
本发明涉及计算机领域,特别涉及一种基于人工智能的网站浏览器。
背景技术
人们在使用浏览器的时候,一般都会根据自己的需求在网上搜索相关的网页进行浏览,但是大多数用户都会遇到的一个问题就是,对自己准备浏览的事物并不是非常了解,然而目前的浏览器所带的搜索引擎都是根据关键词进行的检索,这样在用户不了解自己准备浏览的事物的时候,很容易不清楚关键词是什么,因此不能进行有效的搜索,这样就不会得到有效的搜索结果。
发明内容
本发明的目的是克服上述现有技术中存在的问题,提供一种基于人工智能的网站浏览器,根据用户录入的文字进行搜索,并在搜索结果中提取出关键词后对提取的关键词进行二次搜索,并将所有的搜索结果根据相关性对用户进行显示。
为此,本发明提供一种基于人工智能的网站浏览器,包括:
用户录入模块,用于接收用户录入的要搜索的信息。
搜索引擎模块,用于将用户录入模块中用户录入的要搜索的信息通过搜索引擎进行搜索,将得到的用户搜索结果存放在结果暂存模块中。用于搜索关键词提取模块中的主题,将得到的系统搜索结果存放在结果暂存模块中。
结果暂存模块,用于存储搜索引擎搜到的用户搜索结果。用于存储搜索引擎搜到的系统搜索结果。
关键词提取模块,提取出用户搜索结果中每一条搜索结果的主题,统计每一个相同主题的数量,将数量达到设定数量的主题送入搜索引擎模块分别进行搜索。
聚合分发模块,用于在结果暂存模块中同时具有用户搜索结果和系统搜索结果时,将用户搜索结果和系统搜索结果进行聚合分发,呈现给用户。
较佳地,所述聚合分发模块包括:
结果排序模块,用于根据设定的比例将用户搜索结果和系统搜索结果进行排序。
结果显示模块,用于将结果排序模块中排序好的用户搜索结果和系统搜索结果显示给用户。
较佳地,所述结果排序模块将用户录入模块中用户录入的要搜索的信息设定用户主题基数,将关键词提取模块中要送入搜索引擎模块的主题根据数量得到系统主题基数,再根据设定的比列将用户主题基数和系统主题基数整合为显示比例,并将用户搜索结果和系统搜索结果按照显示比例进行排序。
较佳地,所述用户搜索结果和系统搜索结果穿插进行排序。
较佳地,所述用户录入模块包括文本录入和语音录入,所述文本录入通过文本框接收用户录入的文字信息,所述语音录入通过语音识别器接收用户录入的语音信息,并语音识别器将用户语音信息转换的用户文字信息接收。
较佳地,所述关键词提取模块根据所涉主题数量的多少以降序的方法对主题进行排序,将设定序号前的主题送入所述搜索引擎模块分别进行搜索。
本发明提供的一种基于人工智能的网站浏览器,具有如下有益效果:
1、根据用户录入的文字进行搜索,并在搜索结果中提取出关键词后对提取的关键词进行二次搜索,并将所有的搜索结果根据相关性对用户进行显示;
2、根据相关度的比例进行对用户进行显示,使得用户在使用的时候,可以更快的找到自己想要找到的内容,提升用户的体验;
3、将系统搜索结果和用户搜索结果进行穿插的显示,使得用户看到的内容更加符合预期的内容,同时即便用户表达的不准确,也可以将用户的想要得到的内容显示在最上端。
附图说明
图1为本发明提供的一种基于人工智能的网站浏览器的系统连接示意框图。
具体实施方式
下面结合附图,对本发明的多个具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
实施例1
本实施例提供了一种基于人工智能的网站浏览器,通过基本的必要技术特征实现本发明的发明目的。
具体的,如图1所示,本发明实施例提供了一种基于人工智能的网站浏览器,包括:
用户录入模块,用于接收用户录入的要搜索的信息。
在实际中,用户录入模块是有文本框提供用户的输入,在文本框的傍边有搜索按钮,当用户在文本框输入完毕后,按下搜索按钮,按下搜索按钮,表示录入完毕,请求搜素。此时,接收用户在文本框录入的信息,并进入搜索引擎模块提供搜索服务。
搜索引擎模块,用于将用户录入模块中用户录入的要搜索的信息通过搜索引擎进行搜索,将得到的用户搜索结果存放在结果暂存模块中。用于搜索关键词提取模块中的主题,将得到的系统搜索结果存放在结果暂存模块中。
搜索引擎模块的功能主要是用来在互联网中进行检索,得到与录入的信息相关的信息。在本发明中,搜索引擎模块首先对用户录入模块中用户录入的要搜索的信息通过搜索引擎进行搜索,此时对得到用户搜索结果并将其存放在结果暂存模块中。在这之后,还要将搜索关键词提取模块中的主题,将得到的系统搜索结果存放在结果暂存模块中,即得到与用户录入的信息相关的信息搜索的结果。
结果暂存模块,用于存储搜索引擎搜到的用户搜索结果。用于存储搜索引擎搜到的系统搜索结果。
结果暂存模块提供了该浏览器的存储功能,也是缓存的功能,具体的,是将搜索引擎模块在互联网上搜索出来的全部搜索结果,包括用户搜索结果和系统搜索结果,全部存储在该结果存储模块中,同时定期的进行清理,以提高浏览器的运行效果。
关键词提取模块,提取出用户搜索结果中每一条搜索结果的主题,统计每一个相同主题的数量,将数量达到设定数量的主题送入搜索引擎模块分别进行搜索。
在关键词提取模块中,使用LDA主题提取模型提取出用户搜索结果中每一条搜索结果的主题,然后统计这些结果的主题,根据每一个主题的数量由大到小的进行排序,然后将数量达到设定数量的主题送入搜索引擎模块分别进行二次搜索。举一个例子,比如浏览器要求达到的主题的数量是5个,浏览器提取出用户搜索结果中第一主题的搜索结果有8个,第二主题的搜索结果有2个,第三主题的搜索结果有4个,第四主题的搜索结果有5个,第五主题的搜索结果有2个,则将第一主题和第四主题全部送入搜索引擎模块并分别进行搜索。
聚合分发模块,用于在结果暂存模块中同时具有用户搜索结果和系统搜索结果时,将用户搜索结果和系统搜索结果进行聚合分发,呈现给用户。
聚合分发模块是在结果暂存模块中同时具有用户搜索结果和系统搜索结果时,即已经结束了二次搜索的时候,将搜索的结果对用户进行显示。所述聚合分发,意思为将若干条用户搜索结果和系统搜索结果进行合并,在将合并的用户搜索结果和系统搜索结果分发给用户,最终在用户端进行显示。
综上,本发明为了使得用户得到的搜索结果更加的准确,对用户的录入进行二次搜索,如果用户的录入非常精准,则在关键词提取模块中得到的主题会非常的精准,则二次搜索的搜索量会大幅度减小,如果用户的录入不精准,则会在关键词提取模块中得到相关的主题,在根据结果多的主题进行二次搜索,并将搜索的结果显示给用户,使得用户得到的结果更加的精准。
实施例2
本实施例是基于实施例1并对实施例1中的实施方案进行优化,使得本实施例在运行的过程中更加的稳定,性能更加的良好,但是并不仅限于本实施例所描述的一种实施方式。
具体的,所述聚合分发模块包括:
结果排序模块,用于根据设定的比例将用户搜索结果和系统搜索结果进行排序。
结果排序模块将用户搜索结果和系统搜索结果根据设定的比例进行排序,一般的,使用用户搜索结果:系统搜索结果=1:1的比例进行排序,通常情况下,会显示一条用户搜索结果,在显示一条系统搜索结果,依次进行排列。
结果显示模块,用于将结果排序模块中排序好的用户搜索结果和系统搜索结果显示给用户。
结果显示模块将将结果排序模块中排序好的用户搜索结果和系统搜索结果显示给用户,按照上面的分布比例,在显示的时候,有上至下的显示每一条搜素结果,具体的,用户搜索结果和系统搜索结果穿插显示,再具体一些,最上面显示一条用户搜索结果,用户搜索结果的下方在显示一条系统搜索结果,系统搜索结果的下方在显示一条用户搜索结果,依次类推进行显示。确保用户在可以较快的观看到自己需要搜素的内容。
更具体的,所述结果排序模块将用户录入模块中用户录入的要搜索的信息设定用户主题基数,将关键词提取模块中要送入搜索引擎模块的主题根据数量得到系统主题基数,再根据设定的比列将用户主题基数和系统主题基数整合为显示比例,并将用户搜索结果和系统搜索结果按照显示比例进行排序。
详细的,该排序即是用户要搜索的信息的主题与在关键词提取模块中的主题进行对比,得到显示比例。例如,用户要搜索的信息的主题为第一主题,关键词中得到的系统主题的第一主题的搜索结果有8个,第二主题的搜索结果有2个,第三主题的搜索结果有4个,第四主题的搜索结果有5个,第五主题的搜索结果有2个,这样得到用户主题基数即为第一主题的基数为8个,由于第二主题、第三主题以及第五主题不计入,因此系统主题基数为第四主题的基数有5个,因此用户主题基数:系统主题基数=5:5=1:1。从而得到的显示比例为1:1。
更具体的,所述用户搜索结果和系统搜索结果穿插进行排序。
通过穿插进行排序确保用户在可以较快的观看到自己需要搜素的内容。以上述显示比例1:1为例,最上面显示一条用户搜索结果,用户搜索结果的下方在显示一条系统搜索结果,系统搜索结果的下方在显示一条用户搜索结果,依次类推进行显示。
具体的,所述用户录入模块包括文本录入和语音录入,所述文本录入通过文本框接收用户录入的文字信息,所述语音录入通过语音识别器接收用户录入的语音信息,并语音识别器将用户语音信息转换的用户文字信息接收。
用户录入模块提供多种用户录入的途径,使得用户的使用变得多元化,适用于各个场景,同时,提示用户的体验。
具体的,所述关键词提取模块根据所涉主题数量的多少以降序的方法对主题进行排序,将设定序号前的主题送入所述搜索引擎模块分别进行搜索。
这里详细的限定了关键词提取模块的工作步骤,通过设定序号,使得在没有主题达到设定的数量的时候,也可以进行搜索,将搜索的服务机箱进行,通常的,在该模块中设定的序号是3,将主题数量排在前3个的主题全部送入所述搜索引擎模块分别进行搜索。
综上所述,本发明公开了一种基于人工智能的网站浏览器,包括:用户录入模块,用于接收用户录入的要搜索的信息。搜索引擎模块,用于将用户录入模块中用户录入的要搜索的信息通过搜索引擎进行搜索,将得到的用户搜索结果存放在结果暂存模块中。用于搜索关键词提取模块中的主题,将得到的系统搜索结果存放在结果暂存模块中;结果暂存模块,用于存储搜索引擎搜到的用户搜索结果;用于存储搜索引擎搜到的系统搜索结果;关键词提取模块,提取出用户搜索结果中每一条搜索结果的主题,统计每一个相同主题的数量,将数量达到设定数量的主题送入搜索引擎模块分别进行搜索;聚合分发模块,用于在结果暂存模块中同时具有用户搜索结果和系统搜索结果时,将用户搜索结果和系统搜索结果进行聚合分发,呈现给用户。本发明根据用户录入的文字进行搜索,并在搜索结果中提取出关键词后对提取的关键词进行二次搜索,并将所有的搜索结果根据相关性对用户进行显示。
以上公开的仅为本发明的几个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (6)

1.一种基于人工智能的网站浏览器,其特征在于,包括
用户录入模块,用于接收用户录入的要搜索的信息;
搜索引擎模块,用于将用户录入模块中用户录入的要搜索的信息通过搜索引擎进行搜索,将得到的用户搜索结果存放在结果暂存模块中;用于搜索关键词提取模块中的主题,将得到的系统搜索结果存放在结果暂存模块中;
结果暂存模块,用于存储搜索引擎搜到的用户搜索结果;用于存储搜索引擎搜到的系统搜索结果;
关键词提取模块,提取出用户搜索结果中每一条搜索结果的主题,统计每一个相同主题的数量,将数量达到设定数量的主题送入搜索引擎模块分别进行搜索;
聚合分发模块,用于在结果暂存模块中同时具有用户搜索结果和系统搜索结果时,将用户搜索结果和系统搜索结果进行聚合分发,呈现给用户。
2.如权利要求1所述的一种基于人工智能的网站浏览器,其特征在于,所述聚合分发模块包括:
结果排序模块,用于根据设定的比例将用户搜索结果和系统搜索结果进行排序;
结果显示模块,用于将结果排序模块中排序好的用户搜索结果和系统搜索结果显示给用户。
3.如权利要求2所述的一种基于人工智能的网站浏览器,其特征在于,所述结果排序模块将用户录入模块中用户录入的要搜索的信息设定用户主题基数,将关键词提取模块中要送入搜索引擎模块的主题根据数量得到系统主题基数,再根据设定的比列将用户主题基数和系统主题基数整合为显示比例,并将用户搜索结果和系统搜索结果按照显示比例进行排序。
4.如权利要求3所述的一种基于人工智能的网站浏览器,其特征在于,所述用户搜索结果和系统搜索结果穿插进行排序。
5.如权利要求1所述的一种基于人工智能的网站浏览器,其特征在于,所述用户录入模块包括文本录入和语音录入,所述文本录入通过文本框接收用户录入的文字信息,所述语音录入通过语音识别器接收用户录入的语音信息,并语音识别器将用户语音信息转换的用户文字信息接收。
6.如权利要求1所述的一种基于人工智能的网站浏览器,其特征在于,所述关键词提取模块根据所涉主题数量的多少以降序的方法对主题进行排序,将设定序号前的主题送入所述搜索引擎模块分别进行搜索。
CN201910642276.2A 2019-07-16 2019-07-16 一种基于人工智能的网站浏览器 Pending CN110334282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910642276.2A CN110334282A (zh) 2019-07-16 2019-07-16 一种基于人工智能的网站浏览器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910642276.2A CN110334282A (zh) 2019-07-16 2019-07-16 一种基于人工智能的网站浏览器

Publications (1)

Publication Number Publication Date
CN110334282A true CN110334282A (zh) 2019-10-15

Family

ID=68145387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910642276.2A Pending CN110334282A (zh) 2019-07-16 2019-07-16 一种基于人工智能的网站浏览器

Country Status (1)

Country Link
CN (1) CN110334282A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008139568A1 (ja) * 2007-05-08 2008-11-20 Fujitsu Limited キーワード出力プログラム、キーワード出力装置およびキーワード出力方法
CN101604324A (zh) * 2009-07-15 2009-12-16 中国科学技术大学 一种基于元搜索的视频服务网站的搜索方法及系统
CN103577596A (zh) * 2013-11-15 2014-02-12 北京奇虎科技有限公司 基于当前浏览页面的关键词搜索方法及装置
CN104063454A (zh) * 2014-06-24 2014-09-24 北京奇虎科技有限公司 一种挖掘用户需求的搜索推送方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008139568A1 (ja) * 2007-05-08 2008-11-20 Fujitsu Limited キーワード出力プログラム、キーワード出力装置およびキーワード出力方法
CN101604324A (zh) * 2009-07-15 2009-12-16 中国科学技术大学 一种基于元搜索的视频服务网站的搜索方法及系统
CN103577596A (zh) * 2013-11-15 2014-02-12 北京奇虎科技有限公司 基于当前浏览页面的关键词搜索方法及装置
CN104063454A (zh) * 2014-06-24 2014-09-24 北京奇虎科技有限公司 一种挖掘用户需求的搜索推送方法和装置

Similar Documents

Publication Publication Date Title
CN102024058B (zh) 音乐推荐方法及系统
US8126897B2 (en) Unified inverted index for video passage retrieval
CN109829104A (zh) 基于语义相似度的伪相关反馈模型信息检索方法及系统
CN101458708B (zh) 检索结果聚类方法及装置
CN104021198B (zh) 基于本体语义索引的关系数据库信息检索方法及装置
CN102236677A (zh) 一种基于问答系统的信息匹配方法及系统
WO2009003124A1 (en) Media discovery and playlist generation
CN102402619A (zh) 一种搜索方法和装置
CN101853308A (zh) 一种个性化元搜索的方法及其应用终端
WO2006133050A2 (en) Relationship networks
CN109933708A (zh) 信息检索方法、装置、存储介质及计算机设备
WO2008055120A2 (en) System and method for summarizing search results
CN103294778A (zh) 一种推送资讯信息的方法及系统
CN105205689A (zh) 推荐商户的方法及系统
CN105956206A (zh) 一种基于关键词树的视频检索方法及系统
US20120136870A1 (en) Systems and methods for two stream indexing of audio content
CN104991943A (zh) 音乐搜索方法及装置
CN102163234A (zh) 一种基于纠错相关度对查询序列进行纠错的设备和方法
KR101682659B1 (ko) 키워드 기반 맞춤 뉴스 알림 방법 및 그를 위한 뉴스 검색 관리 서버
CN102789452A (zh) 类似内容提取方法
CN108427774A (zh) 一种用于内容推荐的方法和装置
CN104008180A (zh) 结构化数据与图片的关联方法与关联装置
CN110362732A (zh) 一种信息系统内容搜索的方法
CN111061954A (zh) 搜索结果排序方法、装置及存储介质
CN114547253A (zh) 一种基于知识库应用的语义搜索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191015

RJ01 Rejection of invention patent application after publication