CN110110185A - 一种提取浏览器搜索引擎的方法、设备及存储介质 - Google Patents

一种提取浏览器搜索引擎的方法、设备及存储介质 Download PDF

Info

Publication number
CN110110185A
CN110110185A CN201810041768.1A CN201810041768A CN110110185A CN 110110185 A CN110110185 A CN 110110185A CN 201810041768 A CN201810041768 A CN 201810041768A CN 110110185 A CN110110185 A CN 110110185A
Authority
CN
China
Prior art keywords
search engine
keyword
search
url
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810041768.1A
Other languages
English (en)
Inventor
陈柄汐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201810041768.1A priority Critical patent/CN110110185A/zh
Priority to PCT/CN2018/122590 priority patent/WO2019141043A1/zh
Publication of CN110110185A publication Critical patent/CN110110185A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种提取浏览器搜索引擎的方法、设备及存储介质,其中,所述方法包括:如果浏览器的当前网页具有搜索属性,确定所述当前网页的统一资源定位器URL中的第一关键词;根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接;将所述第一搜索引擎链接加入搜索引擎的界面列表;其中,所述搜索引擎的界面列表包含N个搜索引擎链接;其中,N为大于等于1的自然数。

Description

一种提取浏览器搜索引擎的方法、设备及存储介质
技术领域
本发明涉及互联网信息技术,尤其涉及一种提取浏览器搜索引擎的方法、设备及存储介质。
背景技术
搜索引擎是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。从使用者的角度来看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。对普通网民而言,搜索引擎则仅仅是一种查询工具,作为工具,使用者要了解搜索引擎的功用、性能,探讨并掌握其使用方法和技巧。利用搜索引擎的目的不同,构成了搜索引擎研究的不同群体和对搜索引擎不同角度不同侧重的研究。比如综合类的搜索,视频类的搜索,美食类的搜索。根据用户的搜索目的不同,选取的搜索引擎有区分,才能更好的得到用户想要的搜索结果。
目前使用的浏览器中的搜索引擎列表一般是由厂商预置或用户手动编辑添加的,都是固定的搜索引擎列表。其中,厂商预置的搜索引擎可选的列过于固定,用户不能自动添加。而手动编辑添加搜索引擎链接时,由于普通用户不懂得如何获取准确的搜索引擎链接,进而手动编辑添加搜索引擎并不具备易用性。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种提取浏览器搜索引擎的方法、设备及存储介质,通过动态提取出搜索引擎链接并自动添加到搜索引擎的界面列表中,用户操作方式简单。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种提取浏览器搜索引擎的方法,所述方法包括:
如果浏览器的当前网页具有搜索属性,确定所述当前网页的统一资源定位器URL中的第一关键词;
根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接;
将所述第一搜索引擎链接加入搜索引擎的界面列表;其中,所述搜索引擎的界面列表包含N个搜索引擎链接;其中,N为大于等于1的自然数。
本发明实施例提供一种嵌入式设备,所述设备至少包括:处理器和配置为存储可执行指令的存储介质,其中:
处理器配置为执行存储的可执行指令,所述可执行指令配置为执行上述的提取浏览器搜索引擎的方法。
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行上述的提取浏览器搜索引擎的方法。
本发明实施例提供了一种提取浏览器搜索引擎的方法、设备及存储介质,其中,如果浏览器的当前网页具有搜索属性,确定所述当前网页的统一资源定位器URL中的第一关键词;根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接;将所述第一搜索引擎链接加入搜索引擎的界面列表;其中,所述搜索引擎的界面列表包含N个搜索引擎链接;其中,N为大于等于1的自然数。如此,通过动态提取出搜索引擎链接并自动添加到搜索引擎的界面列表中,用户操作方式简单。
附图说明
在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。
图1为本发明实施例实现提取浏览器搜索引擎的方法的示意图;
图2为本发明实施例实现提取浏览器搜索引擎的方法的流程图;
图3为本发明实施例固定搜索引擎的示意图;
图4为本发明实施例手动添加搜索引擎的示意图;
图5为本发明实施例提取浏览器搜索引擎的方法的实现流程图;
图6为本发明实施例查表匹配的流程图;
图7为本发明实施例模拟用户搜索的流程图;
图8为本发明实施例电子设备的组成结构示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
本发明实施例提供了一种提取浏览器搜索引擎方法,图1为本发明实施例实现提取浏览器搜索引擎的方法的示意图,如图1所示,所述方法包括以下步骤:
步骤S101,如果浏览器的当前网页具有搜索属性,确定所述当前网页的统一资源定位器(Uniform Resource Locator,URL)中的第一关键词。
这里,所述浏览器的当前页面可以显示在任何能够安装浏览器的电子设备上,比如,手机,电脑等。所述搜索属性是指浏览器的当前网页具有可以使用户进行搜索的功能。比如,用户进入浏览器的当前网页,如果所述当前页面具有搜索框,而且用户在搜索框中输入文本,能够对所述文本进行搜索,则说明所述当前网页具有搜索属性。
所述第一关键词可以是所述URL中“http://”与距离所述“http://”最近的“/”之间的,经过分隔符拆分的且删除预设删除项的部分内容;或者,是所述URL中“https://”与距离所述“https://”最近的“/”之间的,经过分隔符拆分的且删除预设删除项的部分内容。比如,当前网页的URL是http://video.m.bd.com/?from=1014006a#/?_k=nxvpjb,所述URL中“http://”与距离所述“http://”最近的“/”之间的是:video.m.bd.com;经过分隔符“.”拆分后得到video m bd com;预设删除项为:m com,将video m bd com删除预设删除项m com删除之后,得到所述第一关键词为:“video”和“bd”。
步骤S102,根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接。
这里,所述第一搜索引擎链接可以理解为将所述第一关键词与预设的搜索引擎链接库中的Q个搜索引擎链接的关键词分别进行匹配,若所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同,则返回所述第M个搜索引擎链接,将所述第M个搜索引擎链接确定为第一搜索引擎链接。比如,第一关键词是“video”和“bd”,将“video”和“bd”与预设的搜索引擎链接库中搜索引擎链接的关键词进行匹配,若匹配完成,返回匹配完成的搜索引擎链接,为:http://video.m.bd.com/platapi/search?word={searchTerms}。
步骤S103,将所述第一搜索引擎链接加入搜索引擎的界面列表。
这里,所述搜索引擎的界面列表包含N个搜索引擎链接;搜索引擎的界面列表可以在浏览器主页面显示给用户,还可以在用户进行搜索的界面显示给用户。比如,用户打开浏览器在所述浏览的主页预进行搜索时,即可从弹出的搜索引擎的界面列表中选择需要的搜索引擎;或者,假如用户打开浏览器只是浏览其中的新闻页面,则不会将搜索引擎的界面列表弹出在所述新闻页面,而是当用户需要进行搜索时,在用户打开的可进行搜索的页面显示搜索引擎的界面列表。其中,N为大于等于1的自然数。所述搜索引擎的界面列表可以是浏览器设置界面中的搜索引擎列表,即所述搜索引擎的界面列表是当用户需要进行搜索时,打开浏览器,就可以从搜索引擎的界面列表中选择需要的搜索引链接,不需要再浪费时间查找需要的搜索引擎链接。比如,用户想要看视频,就直接可以在所述搜索引擎的界面列表中点击视频类的搜索引擎链接,然后输入想要看的视频,比如输入“笑傲江湖”,即可得到视频搜索“笑傲江湖的”搜索结果页。
在本发明实施例中,如果浏览器的当前网页具有搜索属性,首先,确定所述当前网页的统一资源定位器URL中的第一关键词;其次,根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接;最后,将所述第一搜索引擎链接加入搜索引擎的界面列表;其中,所述搜索引擎的界面列表包含N个搜索引擎链接;其中,N为大于等于1的自然数。如此,通过自动的将用户需要的或者感兴趣的搜索引擎链接加入搜索引擎的界面列表中,当需要使用时,直接点击列表中的搜索引擎链接即可获得相应的搜索结果,方便了用户操作,提高了手动添加搜索引擎的可用场景,大大提升了用户体验感。
在其他实施例中,所述步骤S101中如果浏览器的当前网页具有搜索属性,可以通过以下步骤实现:
步骤S11,获取所述当前网页对应的文档对象模型(Document Object Model,DOM)树。
步骤S12,如果所述DOM树中存在第一预设输入标签和第二预设输入标签,判断所述第二预设输入标签与所述第一预设输入标签是否满足第一对应关系。
这里,第一预设输入标签的类型属性是文本;第二预设输入标签的类型属性是搜索。比如,第一预设输入标签是可以输入文本的一个输入框,第二预设输入标签是“搜索一下”,点击“搜索一下”即可搜索第一预设输入标签中输入的文本。
步骤S13,如果所述第二预设输入标签与所述第一预设输入标签满足第一对应关系,确定所述当前浏览器网页具有搜索属性。
这里,所述第一对应关系用于表明当启动所述第二预设输入标签,搜索所述第一预设输入标签中包含的文本信息;即,点击第二输入标签便进行搜索第一输入标签中输入文本对应的内容。其中,所述文本信息是输入所述第一预设输入标签的文本。
在其他实施例中,所述步骤S101中确定所述当前网页的统一资源定位器URL中的第一关键词,可以通过以下步骤实现:
步骤S14,获取所述URL中的第一内容。
这里,所述第一内容可以是所述URL中的部分内容。所述步骤S14,即获取所述URL中的第一内容,包括:
获取所述URL中“http://”与距离所述“http://”最近的“/”之间的第二内容,将所述第二内容确定为所述第一内容;或者,
获取所述URL中“https://”与距离所述“https://”最近的“/”之间的第三内容,将所述第三内容确定为所述第一内容。比如,当前网页的URL是http://video.m.bd.com/?from=1014006a#/?_k=nxvpjb,“http://”与距离所述“http://”最近的“/”之间的第二内容为:video.m.bd.com。将所述第二内容作为所述第一内容。
步骤S15,根据所述第一内容中的分隔符拆分所述第一内容,得到第二关键词。
这里,所述第一内容中的分隔符一般是指第一内容中的“.”。比如,第一内容是video.m.bd.com,根据其中的“.”进行拆分得到,第二关键词:video m bd com。
步骤S16,删除所述第二关键词中与预设删除项相同的部分,得到所述第一关键词。
这里,所述预设删除项可以是“m”、“www”、“com”和“cn”。比如,第二关键词是videom bd com,删除其中的“m”和“com”得到第一关键词:video bd。
在其他实施例中,所述步骤S102,即根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接,可以通过以下步骤实现:
步骤S21,如果所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同,获取所述第M个搜索引擎链接。
这里,所述预设的搜索引擎链接库包含Q个搜索引擎链接;M、Q均为大于等于1的自然数,且M小于等于Q。所述预设的搜索引擎链接库还可以是电子设备出厂时研发人员预先设置的,比如,手机出厂时,研发人员通过大数据分析多数用户的普遍需求,将常用的30或者40个搜索引擎链接作为预设的搜索引擎链接库。但是预设的搜索引擎链接库中的搜索引擎链接只是大众普遍需要的,并不一定能够迎合每个用户的需要。所以在本发明实施例中根据用户的兴趣或不同需要,动态的将用户感兴趣的搜索引擎链接加入搜索引擎的界面列表中。所述搜素引擎的界面列表可以理解为预设的搜索引擎链接库中,展示给用户的搜索引擎链接。由于每一个客户需要的搜索引擎链接互不相同,所以在手机出厂时,设计人员不可能将预设的搜索引擎链接库中的30或者40个搜索引擎链接均展示给用户,只是将大多数用户都用得到的少数,比如三个或四个搜索引擎链接展示给用户,所述展示给用户的三个或四个搜索引擎链接即组成了搜素引擎的界面列表。
步骤S22,将所述第M个搜索引擎链接确定为所述第一关键词对应的第一搜索引擎链接。
在其他实施例中,所述步骤S102,即根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接,所述方法还可以通过以下步骤实现:
步骤S23,如果所述第一关键词与预设的搜索引擎链接库中任意一个搜索引擎链接的关键词均不相同,将第一预设字段输入第一预设输入标签。
这里,所述第一预设字段是任意的一串字符;比如“xxxx”。所述将第一预设字段输入第一预设输入标签可以是,在当前浏览器网页通过直译式脚本语言JavaScript注入的方式,将第一预设字段输入第一预设输入标签。
步骤S24,启动与所述第一预设输入标签满足第一对应关系的第二预设输入标签,搜索所述第一预设字段。
比如,在第一预设输入标签中输入“xxxx”,启动第二预设输入标签,搜索“xxxx”。
步骤S25,获取所述第一预设字段对应的URL。
这里,所述第一预设字段对应的URL,即是搜索第一预设输入标签中的内容后得到的URL,比如,在第一预设输入标签中输入“xxxx”,得到的URL为:http://video.m.bd.com/platapi/search?word=xxxx&t=1477718401624&from=1014006a。
在其他实施例中,在所述步骤S25,即获取所述第一预设字段对应的URL之后,所述方法可以通过以下步骤实现:
步骤S26,将所述第一预设字段对应的URL中的所述第一预设字段替换为第二预设字段。
这里,第二预设字段是搜索词第一预设字段的替换部分,比如第二预设字段可以是“{searchTerms}”。
步骤S27,删除所述第一预设字段对应的URL中所述第二预设字段后面的内容,得到第二搜索引擎链接。
这里,比如利用第二预设字段替换所述第一预设字段后的URL是http://video.m.bd.com/platapi/search?word={searchTerms}&t=1477718401624&fro m=1014006a,删除所述第二预设字段后面的内容,得到的第二搜索引擎链接为:http://video.m.bd.com/platapi/search?word={searchTerms}。
步骤S28,将所述第二搜索引擎链接加入搜索引擎的界面列表。
本发明实施例提供一种提取浏览器搜索引擎方法,图2为本发明实施例实现提取浏览器搜索引擎的方法的流程图,如图2所示,所述方法包括以下步骤:
步骤S201,获取所述当前网页对应的文档对象模型DOM树。
这里,所述当前网页可以是用户正在使用的浏览器的当前网页。
步骤S202,如果所述DOM树中存在第一预设输入标签和第二预设输入标签,判断所述第二预设输入标签与所述第一预设输入标签是否满足第一对应关系。
步骤S203,如果所述第二预设输入标签与所述第一预设输入标签满足第一对应关系,确定所述当前浏览器网页具有搜索属性。
这里,所述第一对应关系用于表明当启动所述第二预设输入标签,搜索所述第一预设输入标签中包含的文本信息;其中,所述文本信息是输入所述第一预设输入标签的文本。
步骤S204,获取所述URL中的第一内容。
这里,所述步骤S204,即获取所述URL中的第一内容,包括:
获取所述URL中“http://”与距离所述“http://”最近的“/”之间的第二内容,将所述第二内容确定为所述第一内容;或者,
获取所述URL中“https://”与距离所述“https://”最近的“/”之间的第三内容,将所述第三内容确定为所述第一内容。
步骤S205,根据所述第一内容中的分隔符拆分所述第一内容,得到第二关键词。
步骤S206,删除所述第二关键词中与预设删除项相同的部分,得到所述第一关键词。
步骤S207,如果所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同,获取所述第M个搜索引擎链接。
这里,如果所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同,进入步骤S208;如果所述所述第一关键词与预设的搜索引擎链接库中任意一个搜索引擎链接的关键词均不相同,则进入步骤S210;所述预设的搜索引擎链接库包含Q个搜索引擎链接;M、Q均为大于等于1的自然数,且M小于等于Q。
步骤S208,将所述第M个搜索引擎链接确定为所述第一关键词对应的第一搜索引擎链接。
步骤S209,将所述第一搜索引擎链接加入搜索引擎的界面列表。
这里,所述搜索引擎的界面列表包含N个搜索引擎链接;其中,N为大于等于1的自然数。
步骤S210,如果所述第一关键词与预设的搜索引擎链接库中任意一个搜索引擎链接的关键词均不相同,将第一预设字段输入第一预设输入标签。
这里,所述第一预设字段是任意的一串字符。所述将第一预设字段输入第一预设输入标签,包括:
在当前浏览器网页通过直译式脚本语言JavaScript注入的方式,将第一预设字段输入第一预设输入标签。
步骤S211,启动与所述第一预设输入标签满足第一对应关系的第二预设输入标签,搜索所述第一预设字段。
步骤S212,获取所述第一预设字段对应的URL。
步骤S213,将所述第一预设字段对应的URL中的所述第一预设字段替换为第二预设字段。
步骤S214,删除所述第一预设字段对应的URL中所述第二预设字段后面的内容,得到第二搜索引擎链接。
步骤S215,将所述第二搜索引擎链接加入搜索引擎的界面列表。
在本发明实施例中,通过自动的将用户需要的或者感兴趣的搜索引擎链接加入搜索引擎的界面列表中,当用户需要使用时,直接点击列表中的搜索引擎链接即可获得相应的搜索结果,方便了用户操作,提高了手动添加搜索引擎的可用场景,大大提升了用户体验感。
在相关技术中,目前使用的浏览器中的搜索引擎界面列表都是电子设备在出厂时由设计人员预置或用户手动编辑添加的。其中,设计人员预置搜索引擎界面列表有以下缺点:搜索引擎链接的可切换项过于固定,用户不能主动添加新的搜索引擎链接,缺乏使用灵活性。如图3所示,在301中的搜索引擎界面列表中用户能够选择的搜索引擎为:搜索引擎A、搜索引擎B和搜索引擎C。用户登陆浏览器之后,如果需要进行搜索,只能从搜索引擎A、搜索引擎B和搜索引擎C中选择搜索引擎,由于搜索引擎界面列表中的搜索引擎个数有限,所以用户真正需要的搜索引擎往往不能从搜索引擎界面列表中找到。
用户手动编辑添加搜索引擎的缺点是:如图4所示,要用户手动在401处输入搜索引擎网址。在图4中402包括4个搜索引擎,分别为:搜索引擎A、搜索引擎B、搜索引擎C和搜索引擎D。普通用户不知道如何获取正确的搜索引擎链接,因此手动编辑添加搜索引擎并不具备易用性。
为解决设计人员预置搜索引擎界面列表的缺点和用户手动编辑添加搜索引擎的缺点,本发明实施例提供一种提取浏览器搜索引擎的方法,可以从具有搜索属性的用户感兴趣网页中动态提取出搜索引擎链接并自动添加到搜索引擎列表中,用户操作方式简易,增加了手动添加搜索引擎的可用场景,大大提高用户体验。
本发明实施例提供的一种提取浏览器搜索引擎的装置包含四个模块,分别为:检测模块、查表匹配模块、模拟用户点击模块和构造模块。其中,各模块功能如下:
所述检测模块,用于检测DOM树,判断浏览器的当前网页是否具有搜索属性。
检测模块用于判断浏览器的当前网页是否具有搜索属性。只有存在搜索框的网页,才能提取到搜索引擎。若所浏览的网页不含有搜索入口,那么该网页不具备提取搜索引擎链接的前提条件。
判断方法如下:判断DOM树中是否存在第一预设输入标签,并且该标签对应的类型(type)属性为文本(text);和第二预设输入标签,并且该标签对应的类型(type)属性为搜索(submit)。若第一预设标签和第二预设标签均存在,并且第一预设标签和第二预设标签满足第一对应关系,确定所述当前浏览器网页具有搜索属性;其中,所述第一对应关系用于表明当启动所述第二预设输入标签,搜索所述第一预设输入标签中包含的文本信息。
查表匹配模块,用于提取当前网页URL中的第一关键词,根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接。查表匹配模块通过网页网址中的第一关键词在预置在浏览器应用里的预设的搜索引擎链接库中查表搜索,判断是否所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词完全匹配。若匹配,则可以直接返回所述第M个搜索引擎链接。无需进入模拟用户点击模块和构造模块。其中,所述预设的搜索引擎链接库包含Q个搜索引擎链接;M、Q均为大于等于1的自然数,且M小于等于Q。所述预设的搜索引擎链接库还可以是电子设备出厂时研发人员预先设置的。
这里,所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词完全匹配可以是,所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同。
模拟用户点击模块,用于在电子设备的后台模拟用户搜索操作。当在查表匹配模块中,所述第一关键词与预设的搜索引擎链接库中任意一个搜索引擎链接的关键词均不能完全匹配时,才会进入所述模拟用户点击模块。模拟用户点击模块通过JavaScript注入的方式,模拟用户在搜索框中输入“xxxx”,并且点击搜索按钮,得到返回网页的URL网址信息。
这里,所述搜索框可以是所述DOM树中存在第一预设输入标签,即用户在所述第一预设输入标签中输入“xxxx”。所述搜索按钮可以是所述DOM树中存在第二预设输入标签,即点击所述第二预设输入标签,搜索输入的“xxxx”,得到返回网页的URL网址信息。“xxxx”即是第一预设字段,表示任意的一串字符。
构造模块,用于根据返回网页URL网址生成搜索引擎链接,即将返回的网页URL网址中包含的第一预设字段“xxxx”替换为第二预设字段比如,{searchTerms},并且去掉网址中{searchTerms}之后冗余项部分,即可得到搜索引擎链接。完成当前浏览网页搜索引擎链接的动态提取。比如,返回的当前网页的URL是“http://video.m.bd.com/platapi/search?word=xxxx&t=1477718401624-&from=1014006a”。利用第二预设字段{searchTerms}替换所述第一预设字段“xxxx”后的URL是:“http://video.m.bd.com/platapi/search?word={searchTerms}&t=1477718401624&from=1014006a”,删除{searchTerms}后面的冗余项部分,得到的第二搜索引擎链接,为“http://video.m.bd.com/platapi/search?word={search Terms}”。
图5为本发明实施例提取浏览器搜索引擎的方法的实现流程图,如图5所示,所述方法包括以下步骤:
步骤S501,获取浏览器的当前网页的DOM树。
步骤S502,检测当前网页是否具有搜索属性。
这里,如果是,即为:如果当前网页具有搜索属性,则进入步骤S503;如果否,即为如果当前网页不具有搜索属性,则进入步骤S507,则在所述浏览器的当前网页弹出不支持搜索的提示信息,例如,该提示信息可以为“该网页不含有搜索功能,不支持添加文本”;对浏览器的当前网页的DOM树进行动态检测,判断当前网页是否具备搜索属性,包括:判断DOM树中是否存在第一预设输入标签,并且该标签对应的类型属性为文本。若DOM树中存在第一预设输入标签,则继续搜索判断DOM树中是否存在第二预设输入标签,并且该标签对应的类型属性为搜索。
若第一预设输入标签和第二预设输入标签均存在,且第一预设输入标签与第二预设输入标签满足第一对应关系,则可以确定当前网页具备搜索属性,可以提取搜索引擎链接。
步骤S503,判断当前网页的第一关键词是否与预设的搜索引擎里链接库匹配。
这里,所述判断当前网页的第一关键词是否与预设的搜索引擎里链接库匹配,即是判断所述第一关键词与预设的搜索引擎链接库中关键词是否相同。所述表为在应用中预设的搜索引擎链接库,所述连接库应该尽可能的包含常用的搜索引擎链接,并且依据用户对于搜索引擎的使用频率进行自上而下的排序,以便于提高匹配效率。
预设的搜索引擎链接数据库举例如下:
表1预设的搜索引擎链接数据库
在表1中,搜索引擎的排列顺序可以是自上而下的依据用户的使用频率排列,搜索标签上图中只给出了两个,可根据实际情况增加。在表1-1中所有搜索引擎链接的使用频率默认均为0,后续使用过程中会依据用户的使用习惯进行重新排序。
本实施例提供了一种根据当前网页网址中的关键词,对已存在的搜索引擎数据库进行匹配查找的方法。
例如,打开搜索引擎B的网页:此网页网址信息为:“http://video.m.b.com/?from=1014006a#/?_k=nxvpjb”。通常网址中包含搜索引擎的重要信息在“http://”与距离所述“http://”最近的“/”之间,即“video.m.b.com”,根据此处URL中的每个“.”进行拆分,即可得到三个关键词,分别为“video”、“m”、“b”、“com”,由于“m”和“com”为常规网址必备关键词,因此舍去“m”和“com”。一般剔除干扰项规则即剔除网址中的通用字段包括但不限于:www,wap,m,com,cn,只需保留“video”和“b”即可,从而得到第一关键词。从这两个关键词也可以看出,我们要提取的搜索引擎链接为搜索引擎B的搜索引擎链接。依靠两个关键词到预设的搜索引擎链接数据库中去查找匹配,若匹配到则返回搜索引擎链接,即所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同,则进入步骤S506;若所述第一关键词与预设的搜索引擎链接库中任意一个搜索引擎链接的关键词均不相同,再进入步骤S504。
步骤S504,模拟用户操作,在当前网页进行搜索得到第一预设字段对应的URL。
这里,采用通过JavaScript注入的方式,模拟用户搜索“xxxxxx”,并获取返回网页的网址URL信息模拟用户搜索“xxxx”,并获取返回网页的网址URL信息。即在第一预设输入标签中模拟用户输入“xxxx”,再模拟用户点击第二预设输入标签,搜索“xxxx”,得到“xxxx”对应的网址URL信息。比如,得到第一预设字段对应的URL:“http://video.m.b.com/platapi/search?word=xxxx&t=1477718401624&from=1014006a”。
步骤S505,构造搜索引擎链接。
这里,所述构造搜索引擎链接即是将所述第一预设字段对应的URL中的所述第一预设字段替换为第二预设字段,后得到的搜索引擎链接。所述构造搜索引擎链接可以是将步骤S504中得到的第一预设字段对应的URL中的所述第一预设字段替换为第二预设字段。
所述第一预设字段替换为第二预设字段将第一关键词:words、words、q、search_word、key、keyword、earch_key、s、p等替换为{searchTerms}等。其中,{searchTerms}是搜索词替换部分,也可用其他方式表示,此处仅作示例。如此,如果知道搜索结果返回网页的网址,即可自适应的构造相应网址的搜索引擎链接。根据这样一种思路,可以通过JavaScript注入的方式,模拟用户对当前网页中的搜索框,搜索“xxxx”,以此来得到搜索结果的网址URL。
步骤S506,获取搜索引擎链接。
这里,获取的搜索引擎链接即是第二搜索引擎链接。所述获取搜索引擎链接可以是,删除步骤S505中构造的搜索引擎链接中的所述第二预设字段后面的内容,得到第二搜索引擎链接,即获取搜索引擎链接。
步骤S507,在所述浏览器的当前网页弹出不支持搜索的提示信息。
在实施的过程中,该提示信息可以为“该网页不含有搜索功能,不支持添加文本”。
在其他实施例中,所述步骤S503,即对当前网页的第一关键词进行查表匹配,可以通过以下步骤实现:
如图6所示,所述对当前网页的第一关键词进行查表匹配包括以下步骤:
步骤S601,提取当前网页的URL中的部分字段。
这里,所述部分字段即是所述部分字段,所述步骤S601,所述提取当前网页的URL中的部分字段,包括:
截取网址中“http://”或“https://”,以及第一个出现“/”之间的部分内容,即部分字段。
步骤S602,对所述部分字段进行拆分,得到第二关键词。
这里,将步骤S601中所述的内容根据分隔符“.”进行拆分,得到所述第二关键词。
步骤S603,删除所述第二关键词中的与预设删除项相同的部分,得到第一关键词。
这里,将步骤S602中所述的拆分后的关键词进行整理剔除干扰项,即删除所述第二关键词中与预设删除项相同的部分;所述预设删除项可以是“m”、“www”、“com”、“cn”等。
步骤S604,将所述第一关键词与预设的搜索引擎数据库进行匹配。
这里,根据得到的第一关键词,在预设的搜索引擎数据库中进行匹配查找。所述预设的搜索引擎链接库包含Q个搜索引擎链接;若如果所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同,获取所述第M个搜索引擎链接;将所述第M个搜索引擎链接确定为所述第一关键词对应的第一搜索引擎链接,并将第一搜索引擎链接加入搜索引擎的界面列表。
例如,当前浏览视频网页,提取出来的网址URL为:http://video.m.b.com/?from=1014006a#/?_k=nxvpjb。可以通过以下步骤得到所述URL中的第一关键词:
1、提取网址部分字段之后得到“video.m.b.com”。
2、拆分得到“video”、“m”、“b”、“com”。
3、剔除干扰项“m”、和“com”得到“video”和“b”。
4、将“video”和“b”,和预置的预设的搜索引擎链接表中的关键词进行查询匹配,匹配顺序自上而下。若如果所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同,则返回所述第M个搜索引擎链接,即为:http://video.m.b.com/platapi/search?word={searchTerms}。
将此链接返回,即可添加到搜索引擎界面列表中,当用户把所述搜索引擎设置为默认搜索引擎之后,在地址栏输入想要搜索的视频内容,比如“笑傲江湖”,即可得到视频搜索“笑傲江湖”的结果页。
在其他实施例中,所述步骤S504,即“模拟用户操作,在当前网页进行搜索得到第一预设字段对应的URL”,可以通过以下步骤实现:
如图7所示,所述模拟用户操作,包括以下步骤:
步骤S701,在浏览器的当前网页进行JavaScript注入。
这里,比如,打开视频网页,通过JavaScript注入,后台模拟用户在搜索框中,输入“xxxx”,假如视频此处的id属性为“kw”,name属性为“word”,则执行document.getElementById(“kw”)。value=“xxxx”或document.getElementsByName(“word”).value=“xxxx”,表示在第一预设输入标签中输入“xxxx”。
步骤S702,在第一预设输入标签中输入第一预设字段。
这里,所述第一预设字段可以是任意一串字符,比如“xxxx”。在第一预设输入标签中输入第一预设字段之后,继续搜索网页DOM树中的第二预设输入标签,取出其对应的id属性,比如视频此处的id属性为“su”,执行document.getElementById(“u”).click()操作,即可通过JavaScript脚本触发第二预设输入标签按钮,进行搜索动作。
步骤S703,启动第二预设输入标签。
这里,所述第二预设输入标签与所述第一预设输入标签满足第一对应关系。即点击第二预设输入标签即搜索第一预设输入标签中输入的文本。
步骤S704,获取第一预设字段对应的URL。
本发明实施例提供一种提取浏览器搜索引擎的设备,图8为本发明实施例电子设备的组成结构示意图,如图8所示,所述电子设备800至少包括:处理器801和配置为存储可执行指令的存储介质802,其中:
处理器801配置为执行存储的可执行指令,所述可执行指令用于实现下面的步骤:
如果浏览器的当前网页具有搜索属性,确定所述当前网页的统一资源定位器URL中的第一关键词;
根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接;
将所述第一搜索引擎链接加入搜索引擎的界面列表;其中,所述搜索引擎的界面列表包含N个搜索引擎链接;其中,N为大于等于1的自然数。
需要说明的是,以上设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明设备实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
需要说明的是,本发明实施例中,如果以软件功能模块的形式实现上述的提取浏览器搜索引擎方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
对应地,本发明实施例提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行本发明其他实施例提供的提取浏览器搜索引擎方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种提取浏览器搜索引擎的方法,其特征在于,所述方法包括:
如果浏览器的当前网页具有搜索属性,确定所述当前网页的统一资源定位器URL中的第一关键词;
根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接;
将所述第一搜索引擎链接加入搜索引擎的界面列表;其中,所述搜索引擎的界面列表包含N个搜索引擎链接;其中,N为大于等于1的自然数。
2.根据权利要求1中所述的方法,其特征在于,所述如果浏览器的当前网页具有搜索属性,包括:
获取所述当前网页对应的文档对象模型DOM树;
如果所述DOM树中存在第一预设输入标签和第二预设输入标签,且所述第二预设输入标签与所述第一预设输入标签满足第一对应关系,确定所述当前浏览器网页具有搜索属性;其中,所述第一对应关系用于表明当启动所述第二预设输入标签,搜索所述第一预设输入标签中包含的文本信息;其中,所述文本信息是输入所述第一预设输入标签的文本。
3.根据权利要求1中所述的方法,其特征在于,所述确定所述当前网页的统一资源定位器URL中的第一关键词,包括:
获取所述URL中的第一内容;
根据所述第一内容中的分隔符拆分所述第一内容,得到第二关键词;
删除所述第二关键词中与预设删除项相同的部分,得到所述第一关键词。
4.根据权利要求1中所述的方法,其特征在于,所述根据所述第一关键词获取所述第一关键词对应的第一搜索引擎链接,包括:
如果所述第一关键词与预设的搜索引擎链接库中第M个搜索引擎链接的关键词相同,获取所述第M个搜索引擎链接;其中,所述预设的搜索引擎链接库包含Q个搜索引擎链接;M、Q均为大于等于1的自然数,且M小于等于Q;
将所述第M个搜索引擎链接确定为所述第一关键词对应的第一搜索引擎链接。
5.根据权利要求3中所述的方法,其特征在于,所述获取所述URL中的第一内容,包括:
获取所述URL中“http://”与距离所述“http://”最近的“/”之间的第二内容,将所述第二内容确定为所述第一内容;或者,
获取所述URL中“https://”与距离所述“https://”最近的“/”之间的第三内容,将所述第三内容确定为所述第一内容。
6.根据权利要求2或4中所述的方法,其特征在于,所述方法还包括:
如果所述第一关键词与预设的搜索引擎链接库中任意一个搜索引擎链接的关键词均不相同,将第一预设字段输入第一预设输入标签;其中,所述第一预设字段是任意的一串字符;
启动与所述第一预设输入标签满足第一对应关系的第二预设输入标签,搜索所述第一预设字段;
获取所述第一预设字段对应的URL。
7.根据权利要求6中所述的方法,其特征在于,在所述获取所述第一预设字段对应的URL之后,所述方法包括:
将所述第一预设字段对应的URL中的所述第一预设字段替换为第二预设字段;
删除所述第一预设字段对应的URL中所述第二预设字段后面的内容,得到第二搜索引擎链接;
将所述第二搜索引擎链接加入搜索引擎的界面列表。
8.根据权利要求6中所述的方法,其特征在于,所述将第一预设字段输入第一预设输入标签,包括:
在当前浏览器网页通过直译式脚本语言JavaScript注入的方式,将第一预设字段输入第一预设输入标签。
9.一种提取浏览器搜索引擎的设备,其特征在于,所述电子设备至少包括:处理器和配置为存储可执行指令的存储介质,其中:
处理器配置为执行存储的可执行指令,所述可执行指令配置为执行上述权利要求1至8任一项提供的提取浏览器搜索引擎的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行上述权利要求1至8任一项提供的提取浏览器搜索引擎的方法。
CN201810041768.1A 2018-01-16 2018-01-16 一种提取浏览器搜索引擎的方法、设备及存储介质 Pending CN110110185A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810041768.1A CN110110185A (zh) 2018-01-16 2018-01-16 一种提取浏览器搜索引擎的方法、设备及存储介质
PCT/CN2018/122590 WO2019141043A1 (zh) 2018-01-16 2018-12-21 提取浏览器搜索引擎的方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810041768.1A CN110110185A (zh) 2018-01-16 2018-01-16 一种提取浏览器搜索引擎的方法、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110110185A true CN110110185A (zh) 2019-08-09

Family

ID=67301616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810041768.1A Pending CN110110185A (zh) 2018-01-16 2018-01-16 一种提取浏览器搜索引擎的方法、设备及存储介质

Country Status (2)

Country Link
CN (1) CN110110185A (zh)
WO (1) WO2019141043A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990696B (zh) * 2019-11-25 2023-04-14 腾讯科技(深圳)有限公司 搜索意图推荐的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060155728A1 (en) * 2004-12-29 2006-07-13 Jason Bosarge Browser application and search engine integration
CN102982174A (zh) * 2012-12-17 2013-03-20 北京奇虎科技有限公司 一种浏览器中进行网页搜索的方法及装置
CN103631807A (zh) * 2012-08-24 2014-03-12 腾讯科技(深圳)有限公司 引擎切换重搜的方法及装置
CN103778156A (zh) * 2012-10-24 2014-05-07 阿里巴巴集团控股有限公司 数据搜索的方法和装置以及用于数据搜索的服务器
CN103955473A (zh) * 2014-03-31 2014-07-30 北京奇虎科技有限公司 一种进行搜索的方法和装置
CN104182401A (zh) * 2013-05-22 2014-12-03 腾讯科技(深圳)有限公司 在移动终端浏览器中进行搜索的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982176B (zh) * 2012-12-17 2016-10-05 北京奇虎科技有限公司 用于浏览器的搜索方法和装置
CN102982177B (zh) * 2012-12-17 2016-06-01 北京奇虎科技有限公司 一种浏览器中进行搜索的方法和装置
US20150235294A1 (en) * 2014-02-20 2015-08-20 Mogan Global Online Shopping Inc. Network searching system and searching method thereof
CN104021231B (zh) * 2014-06-26 2017-07-28 北京奇虎科技有限公司 浏览器中显示网页的方法和装置
CN105631050B (zh) * 2016-03-01 2019-09-17 国家计算机网络与信息安全管理中心 一种基于规则配置的url搜索关键词提取的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060155728A1 (en) * 2004-12-29 2006-07-13 Jason Bosarge Browser application and search engine integration
CN103631807A (zh) * 2012-08-24 2014-03-12 腾讯科技(深圳)有限公司 引擎切换重搜的方法及装置
CN103778156A (zh) * 2012-10-24 2014-05-07 阿里巴巴集团控股有限公司 数据搜索的方法和装置以及用于数据搜索的服务器
CN102982174A (zh) * 2012-12-17 2013-03-20 北京奇虎科技有限公司 一种浏览器中进行网页搜索的方法及装置
CN104182401A (zh) * 2013-05-22 2014-12-03 腾讯科技(深圳)有限公司 在移动终端浏览器中进行搜索的方法及装置
CN103955473A (zh) * 2014-03-31 2014-07-30 北京奇虎科技有限公司 一种进行搜索的方法和装置

Also Published As

Publication number Publication date
WO2019141043A1 (zh) 2019-07-25

Similar Documents

Publication Publication Date Title
CN103339623B (zh) 涉及因特网搜索的方法和设备
JP5283208B2 (ja) 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法
CN100476830C (zh) 一种网络资源检索方法及系统
CN107145496A (zh) 基于关键词将图像与内容项目匹配的方法
JP2011154668A (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
CN103064956A (zh) 用于搜索电子内容的方法、计算系统和计算机可读介质
CN105117474A (zh) 在网页的阅读模式中进行推荐信息加载的方法和装置
US8180751B2 (en) Using an encyclopedia to build user profiles
CN107784059A (zh) 用于搜索和选择图像的方法和系统以及机器可读媒体
CN107145497A (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
CN107463592A (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN104503988A (zh) 搜索方法及装置
JP2011103075A (ja) 抜粋文抽出方法
Anh et al. Extracting user requirements from online reviews for product design: A supportive framework for designers
CN106919593B (zh) 一种搜索的方法和装置
KR100455439B1 (ko) 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법
CN108681571B (zh) 基于Word2Vec的主题爬虫系统和方法
CN107766398A (zh) 用于使图像与内容项目匹配的方法、装置和数据处理系统
CN113656737A (zh) 网页内容展示方法、装置、电子设备以及存储介质
CN112380338A (zh) 一种基于历史知识库的言历图谱的可视化方法和系统
CN110110185A (zh) 一种提取浏览器搜索引擎的方法、设备及存储介质
CN107622125B (zh) 一种信息爬取方法和装置、电子设备
Kolli et al. A Novel Nlp And Machine Learning Based Text Extraction Approach From Online News Feed

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190809

RJ01 Rejection of invention patent application after publication