CN117093789A - 浏览器书签管理方法、系统及计算设备 - Google Patents

浏览器书签管理方法、系统及计算设备 Download PDF

Info

Publication number
CN117093789A
CN117093789A CN202311068980.4A CN202311068980A CN117093789A CN 117093789 A CN117093789 A CN 117093789A CN 202311068980 A CN202311068980 A CN 202311068980A CN 117093789 A CN117093789 A CN 117093789A
Authority
CN
China
Prior art keywords
bookmark
content
information
dimensional
bookmark content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311068980.4A
Other languages
English (en)
Inventor
陈弘唯
黄文兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Uniontech Software Technology Co Ltd
Original Assignee
Uniontech Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Uniontech Software Technology Co Ltd filed Critical Uniontech Software Technology Co Ltd
Priority to CN202311068980.4A priority Critical patent/CN117093789A/zh
Publication of CN117093789A publication Critical patent/CN117093789A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种浏览器书签管理方法、系统及计算设备,涉及互联网及人工智能技术领域。方法包括:响应于生成网页书签的请求,加载网页的源代码文件;利用自然语言爬虫模块,从源代码文件中提取有效信息,作为书签内容进行保存;对书签内容进行超长文本总结分析,以得到书签内容的摘要和总结;对书签内容进行向量分析,以得到向量信息;根据书签内容的摘要和总结以及向量信息,生成具有多维度信息的多维度书签。根据本发明的技术方案,通过生成网页的多维度书签,使用户可以在多维度书签中查看包括书签内容的摘要和总结、向量信息在内的多维度信息,基于向量信息能实现对书签内容的全文搜索,并且,能够监控书签内容的变化。

Description

浏览器书签管理方法、系统及计算设备
技术领域
本发明涉及互联网及人工智能技术领域,尤其涉及一种浏览器书签管理方法、浏览器书签管理系统及计算设备。
背景技术
目前,用户在使用传统的浏览器浏览网络数据时,如果想保存浏览的网页,可以基于书签对网页进行收藏,收藏时可以备注一个名称或者新建一个文件夹,以对书签进行归类整理。当用户在下次使用的时候,对于书签的筛选,则是通过打开收藏的列表进行遍历,这样耗费时间和眼力,十分不便,
可见,传统的浏览器中的书签功能并没有提供更多的信息处理和管理功能。由于传统浏览器的书签功能仅仅是保存网址,并没有对网址内容进行深入的分析和处理,因此存在以下缺陷:无法提供书签内容的摘要和总结;无法对书签内容进行向量分析以实现全文搜索;无法监控网址内容的变化并及时提醒用户。
因此,需要一种浏览器书签管理方法,以解决上述技术方案中存在的问题。
发明内容
为此,本发明提供一种浏览器书签管理方法及浏览器书签管理系统,以解决或至少缓解上面存在的问题。
根据本发明的一个方面,提供一种浏览器书签管理方法,包括:响应于生成网页书签的请求,加载所述网页的源代码文件;利用自然语言爬虫模块,从所述源代码文件中提取有效信息,作为书签内容进行保存;对所述书签内容进行超长文本总结分析,以得到书签内容的摘要和总结;对所述书签内容进行向量分析,以得到向量信息;根据所述书签内容的摘要和总结以及所述向量信息,生成具有多维度信息的多维度书签。
可选地,在根据本发明的浏览器书签管理方法中,还包括:持续监控所述网页的源代码文件;在监控到所述网页的源代码文件发生变化时,生成所述多维度信息的更新内容,并在所述多维度书签上进行提示。
可选地,在根据本发明的浏览器书签管理方法中,在所述多维度书签上进行提示,包括:在所述多维度书签的界面上显示提示更新图标;响应于对所述提示更新图标的点击操作,弹出显示有所述更新内容的悬浮框。
可选地,在根据本发明的浏览器书签管理方法中,还包括:响应于基于关键字对书签内容的搜索请求,将所述关键字与所述多维度标签的向量信息进行匹配;根据匹配结果显示对应的书签内容。
可选地,在根据本发明的浏览器书签管理方法中,对所述书签内容进行超长文本总结分析,以得到书签内容的摘要和总结,包括:将所述有效信息输入文本摘要模型进行处理,以输出书签内容的摘要和总结。
可选地,在根据本发明的浏览器书签管理方法中,对所述书签内容进行超长文本总结分析,以得到书签内容的摘要和总结,包括:对所述书签内容设置提示信息后输入大型语言模型进行处理,以输出书签内容的摘要和总结。
可选地,在根据本发明的浏览器书签管理方法中,对所述书签内容进行向量分析,包括:利用文本嵌入模型,或者调用大型语言模型的接口,来将所述书签内容转换为向量词。
可选地,在根据本发明的浏览器书签管理方法中,所述多维度信息包括:书签内容的摘要和总结、向量信息、网页基本信息、网页截图。
可选地,在根据本发明的浏览器书签管理方法中,所述有效信息包括标题、段落、链接、图片、作者、发布日期中的一种或多种。
根据本发明的一个方面,提供一种浏览器书签管理系统,部署在计算设备中,包括:浏览器,适于响应于生成网页书签的请求,加载所述网页的源代码文件;自然语言爬虫模块,适于从所述源代码文件中提取有效信息,作为书签内容进行保存;超长文本总结模块,适于对所述书签内容进行超长文本总结分析,以得到书签内容的摘要和总结;向量搜索模块,适于对所述书签内容进行向量分析,以得到向量信息;生成模块,适于根据所述书签内容的摘要和总结以及所述向量信息,生成具有多维度信息的多维度书签。
根据本发明的一个方面,提供一种计算设备,包括:至少一个处理器;存储器,存储有程序指令,其中,程序指令被配置为适于由上述至少一个处理器执行,所述程序指令包括用于执行如上所述的浏览器书签管理方法的指令。
根据本发明的一个方面,提供一种存储有程序指令的可读存储介质,当该程序指令被计算设备读取并执行时,使得该计算设备执行如上所述的浏览器书签管理方法。
根据本发明的技术方案,提供了一种浏览器书签管理方法及系统,可以生成具有多维度信息的多维度书签,以便基于多维度书签保存网页。具体地,响应于用户在请求基于书签保存网页时发送的生成网页书签的请求,加载网页的源代码文件,并利用自然语言爬虫模块,从源代码文件中提取有效信息作为书签内容进行保存。接下来,可以对书签内容进行超长文本总结分析,以得到书签内容的摘要和总结,同时可以对书签内容进行向量分析,以得到向量信息。最后,可以根据书签内容的摘要和总结以及向量信息,来生成具有多维度信息的多维度书签。这样,根据本发明生成的网页的多维度书签,用户可以在多维度书签中查看包括书签内容的摘要和总结、向量信息在内的多维度信息。并且,基于向量信息能实现对书签内容的全文搜索,提高了搜索结果准确性。此外,本发明通过持续监控网页源代码文件的变化,能够实时更新书签内容及多维度信息,并提示更新。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的浏览器书签管理系统100的示意图;
图2示出了根据本发明一个实施例的计算设备200的示意图;
图3示出了根据本发明一个实施例的浏览器书签管理方法300的流程示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的浏览器书签管理系统100的示意图。浏览器书签管理系统100可以生成具有多维度信息的多维度书签,以便基于多维度书签保存网页。
如图1所示,浏览器书签管理系统100包括浏览器110、与浏览器110耦接的自然语言爬虫模块120、与自然语言爬虫模块120耦接的超长文本总结模块130和向量搜索模块140、与超长文本总结模块130和向量搜索模块140分别耦接的生成模块150。
在一些实施例中,本发明的浏览器书签管理系统100可以部署在计算设备中。计算设备例如可以实现为桌面电脑、笔记本电脑、处理器芯片、手机、平板电脑、多媒体设备、智能可穿戴设备等,但不限于此。
在本发明的实施例中,浏览器书签管理系统100于执行本发明的浏览器书签管理方法300。本发明的浏览器书签管理方法300将在下文中详述。
在本发明的一个实施例中,浏览器书签管理系统100可以部署在如下所述的计算设备200中,使得本发明的浏览器书签管理方法300可以在计算设备200中执行。
图2示出了根据本发明一个实施例的计算设备200的示意图。如图2所示,在基本配置中,计算设备200包括至少一个处理单元202和系统存储器204。根据一个方面,取决于计算设备的配置和类型,处理单元202可以实现为处理器。系统存储器204包括但不限于易失性存储(例如,随机存取存储器)、非易失性存储(例如,只读存储器)、闪速存储器、或者这样的存储器的任何组合。根据一个方面,系统存储器204中包括操作系统205。
根据一个方面,操作系统105例如适合于控制计算设备200的操作。此外,示例结合图形库、其他操作系统、或任何其他应用程序而被实践,并且不限于任何特定的应用或系统。在图2中通过在虚线内的那些组件示出了该基本配置。根据一个方面,计算设备200具有额外的特征或功能。例如,根据一个方面,计算设备200包括额外的数据存储设备(可移动的和/或不可移动的),例如磁盘、光盘、或者磁带。这样额外的存储在图2中是由可移动存储设备209和不可移动存储设备210示出的。
如在上文中所陈述的,根据一个方面,在系统存储器204中存储有程序模块203。根据一个方面,程序模块203可以包括一个或多个应用程序,本发明不限制应用程序的类型,例如应用程序可以包括:电子邮件和联系人应用程序、文字处理应用程序、电子表格应用程序、数据库应用程序、幻灯片展示应用程序、绘画或计算机辅助应用程序、网络浏览器110应用程序等。
在根据本发明的实施例中,程序模块203中包括浏览器书签管理系统100,浏览器书签管理系统100中可以包括执行本发明的浏览器书签管理方法300的多条程序指令。
根据一个方面,可以在包括分立电子元件的电路、包含逻辑门的封装或集成的电子芯片、利用微处理器的电路、或者在包含电子元件或微处理器的单个芯片上实践示例。例如,可以经由其中在图2中所示出的每个或许多组件可以集成在单个集成电路上的片上系统(SOC)来实践示例。根据一个方面,这样的SOC设备可以包括一个或多个处理单元、图形单元、通信单元、系统虚拟化单元、以及各种应用功能,其全部作为单个集成电路而被集成(或“烧”)到芯片基底上。当经由SOC进行操作时,可以经由在单个集成电路(芯片)上与计算设备200的其他组件集成的专用逻辑来对在本文中所描述的功能进行操作。还可以使用能够执行逻辑操作(例如AND、OR和NOT)的其他技术来实践本发明的实施例,所述其他技术包括但不限于机械、光学、流体、和量子技术。另外,可以在通用计算机内或在任何其他任何电路或系统中实践本发明的实施例。
根据一个方面,计算设备200还可以具有一个或多个输入设备212,例如键盘、鼠标、笔、语音输入设备、触摸输入设备等。还可以包括输出设备214,例如显示器、扬声器、打印机等。前述设备是示例并且也可以使用其他设备。计算设备200可以包括允许与其他计算设备218进行通信的一个或多个通信连接216。合适的通信连接216的示例包括但不限于:RF发射机、接收机和/或收发机电路;通用串行总线(USB)、并行和/或串行端口。
如在本文中所使用的术语计算机可读介质包括计算机存储介质。计算机存储介质可以包括以任何用于存储信息(例如,计算机可读指示、数据结构、或程序模块)的方法或技术来实现的易失性的和非易失性的、可移动的和不可移动的介质。系统存储器204、可移动存储设备209、和不可移动存储设备210都是计算机存储介质的示例(即,存储器存储)。计算机存储介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、电可擦只读存储器(EEPROM)、闪速存储器或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光存储、盒式磁带、磁带、磁盘存储器或其他磁存储设备、或者可用于存储信息并且可以由计算设备200访问的任何其他制品。根据一个方面,任何这样的计算机存储介质都可以是计算设备200的一部分。计算机存储介质不包括载波或其他经传播的数据信号。
根据一个方面,通信介质是由计算机可读指令、数据结构、程序模块、或者经调制的数据信号(例如,载波或其他传输机制)中的其他数据实施的,并且包括任何信息传递介质。根据一个方面,术语“经调制的数据信号”描述了具有一个或多个特征集或者以将信息编码在信号中的方式改变的信号。作为示例而非限制,通信介质包括诸如有线网络或直接有线连接之类的有线介质,以及诸如声学、射频(RF)、红外线的、以及其他无线介质之类的无线介质。
在根据本发明的实施例中,计算设备200被配置为执行根据本发明的浏览器书签管理方法300。计算设备200包括一个或多个处理器、以及存储有程序指令的一个或多个可读存储介质,当程序指令被配置为由一个或多个处理器执行时,使得计算设备200执行本发明实施例中的浏览器书签管理方法300。
图3示出了根据本发明一个实施例的浏览器书签管理方法300的流程示意图。方法300适于在前述计算设备200中执行,具体可以在计算设备200的浏览器书签管理系统100中执行。通过执行本发明的浏览器书签管理方法300,可以生成具有多维度信息的多维度书签。
如图3所示,方法300始于步骤310。
在步骤310中,当用户需要基于书签保存网页时,会发送生成网页书签的请求。浏览器110可以响应于(用户在请求基于书签保存网页时发送的)生成网页书签的请求,加载该网页的源代码文件,并可以对该源代码文件进行解析。具体地,可以通过浏览器110内部接口,基于网页地址来访问网页,并下载网页的源代码文件。
随后,在步骤320中,利用自然语言爬虫模块120,从(解析后的)网页的源代码文件(例如HTML源代码文件)中提取有效信息。这里提取出的有效信息,可作为网页对应的书签内容,并进行保存。
在一些实施例中,自然语言爬虫模块120可以通过相关算法对网页的源代码文件中的广告、无用标识(包括账号登录信息、备案信息、无用分类等)进行清洗后,得到有效信息。
这里,有效信息例如可以包括网页中的标题、段落(关键段落)、链接(重要链接)、图片(主要图片)、作者、发布日期中的一种或多种。
在一个实施例中,可以编写符合提取要求的提示模板(prompt模板),输入大型语言模型,以提取并输出源代码文件中的有效信息。
在一些实施例中,自然语言爬虫模块120可作为浏览器110获得书签内容的采集预处理工具。自然语言爬虫模块120例如可以包括文本抓取单元、自然语言处理单元。其中,本文抓取单元可用于网页抓取,具体可通过浏览器110内部接口来访问网页的地址以下载网页的源代码文件,并且,可以从源代码文件中提取纯文本内容。关于内容的提取,可通过编写符合提取要求的提示模板(prompt模板),输入大型语言模型来进行提取。自然语言处理单元可用于:分词和词性标注、实体识别、情感分析、主题建模。其中,分词和词性标注具体是将文本分割成单词或词组,并识别每个单词的词性(名词、动词等)。实体识别可以识别文本中的具体实体,如人名、地名、组织名等。情感分析,即确定文本的情感倾向,例如正面、负面或中立。主题建模,即确定文本的主要主题或概念。
接着,在步骤330中,可以通过超长文本总结模块130,对(上述步骤320中获得的)书签内容进行超长文本总结分析,以分析得到书签内容的摘要和总结。
在一个实施例中,可以将书签内容输入(预训练的)文本摘要模型进行处理,以输出书签内容的摘要和总结。在一种实现方式中,文本摘要模型例如可以为summarization E模型。
在一个实施例中,通过对书签内容设置提示信息(prompt),之后,可以将设置提示信息后的书签内容输入(微调后的)大型语言模型进行处理,以输出书签内容的摘要和总结。
在执行步骤330时可以同时执行步骤340。
在步骤340中,通过向量搜索模块140,对书签内容进行向量分析,以得到书签内容的向量信息,以便基于向量信息来实现对书签内容全文的搜索。
在一个实施例中,向量搜索模块140可以利用(预训练的)文本嵌入模型,或者调用大型语言模型的(embedding)接口,来将书签内容转换为向量词,即得到书签内容的向量信息。在具体实现方式中,文本嵌入模型例如可以实现为Word2Vec或BERT。
最后,在步骤350中,通过生成模块150,可以根据书签内容的摘要和总结以及向量信息,来生成具有多维度信息的多维度书签,将该多维度标签作为网页的书签进行保存,并可以结构化输出该多维度书签,从而实现基于该多维度书签来保存网页,以便用户基于多维度书签查看多维度的网页相关信息。可以理解,多维度书签中的多维度信息包含书签内容的摘要和总结以及向量信息。
这样,根据本发明生成的具有多维度信息的多维度书签,用户可以在多维度书签中查看关于网页的多维度信息(包括但不限于内容摘要和总结以及向量信息)。
在一个实施例中,多维度信息除了可以包括书签内容的摘要和总结、向量信息,还可以包括网页基本信息、网页截图。
在一些实施例中,在通过生成模块150生成具有多维度信息的多维度书签之后,浏览器110可以持续监控网页的源代码文件是否发生变化。在监控到网页的源代码文件发生变化时,相应的书签内容也会发生变化,此时可以根据上述步骤来生成多维度信息的更新内容,以更新多维度书签,并且,可以在多维度书签上进行提示更新。例如,浏览器110在监控到网页的源代码文件发生变化时,可以加载更新后的源代码文件,并利用自然语言爬虫模块,从更新后的源代码文件中提取新的有效信息,得到新的书签内容进行保存。进而,可以对新的书签内容进行超长文本总结分析,以得到新的书签内容的摘要和总结,同时,对新的书签内容进行向量分析以得到新的向量信息。这样,可以根据新的书签内容的摘要和总结、以及新的向量信息,来得到多维度信息的更新内容,并更新多维度书签。
在一种实现方式中,浏览器110可以生成网页源代码文件的哈希值,并持续对网页源代码文件的哈希值进行监控,在监控到哈希值发生变化时,确定网页的源代码文件发生变化,进而根据上述步骤来生成多维度信息的更新内容,并在多维度书签上进行提示。
在一个实施例中,浏览器110可以利用大型语言模型来输出书签内容的更新内容。
在一种实现方式中,可以采用悬浮框的形式在多维度书签上对书签内容的更新内容进行提示。
具体地,可以在多维度书签的界面上显示提示更新图标,用户可以通过点击提示更新图标来触发弹出更新内容的悬浮框。换言之,浏览器110可以响应于用户对提示更新图标的点击操作,弹出显示有更新内容的悬浮框。
根据本发明生成的具有多维度信息的多维度书签,实现了对书签内容的向量化。在一些实施例中,用户可以基于关键字来搜索书签内容。浏览器110可以接收到用户基于关键字对书签内容的搜索请求,并响应于用于基于关键字对书签内容的搜索请求,利用向量搜索模块140来将关键字与多维度标签的向量信息(例如向量词)进行匹配,得到匹配结果(匹配到的目标向量信息),并将匹配结果返回至浏览器110。随后,浏览器110可以根据匹配结果(匹配到的目标向量信息)显示与匹配到的向量信息相对应的书签内容,从而将书签内容提供给用户。在一个具体实施例中,向量搜索模块140可以利用向量搜索引擎,来将关键字与多维度标签的向量信息(例如向量词)进行匹配,得到匹配结果。
这样,本发明通过对书签内容进行向量化,可以基于向量信息搜索来实现类似全文的搜索,提高搜索结果准确性。
在一些实施例中,在生成具有多维度信息的多维度书签之后,还可以对书签内容进行分类。具体地,浏览器110可以响应于用户对书签内容分类请求,利用向量搜索模块140来提取书签内容的向量信息(向量词),随后,向量搜索模块140可以根据向量信息对书签内容进行分类,输出分类后的书签内容,并通过调用浏览器110接口展示分类后的书签内容。
根据本发明的浏览器书签管理方法300及浏览器书签管理系统100,可以生成具有多维度信息的多维度书签,以便基于多维度书签保存网页。具体地,响应于用户在请求基于书签保存网页时发送的生成网页书签的请求,加载网页的源代码文件,并利用自然语言爬虫模块,从源代码文件中提取有效信息作为书签内容进行保存。接下来,可以对书签内容进行超长文本总结分析,以得到书签内容的摘要和总结,同时可以对书签内容进行向量分析,以得到向量信息。最后,可以根据书签内容的摘要和总结以及向量信息,来生成具有多维度信息的多维度书签。这样,根据本发明生成的网页的多维度书签,用户可以在多维度书签中查看包括书签内容的摘要和总结、向量信息在内的多维度信息。并且,基于向量信息能实现对书签内容的全文搜索,提高了搜索结果准确性。此外,本发明通过持续监控网页源代码文件的变化,能够实时更新书签内容及多维度信息,并提示更新。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,移动终端一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的浏览器书签管理方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。

Claims (12)

1.一种浏览器书签管理方法,在计算设备中执行,包括:
响应于生成网页书签的请求,加载所述网页的源代码文件;
利用自然语言爬虫模块,从所述源代码文件中提取有效信息,作为书签内容进行保存;
对所述书签内容进行超长文本总结分析,以得到书签内容的摘要和总结;
对所述书签内容进行向量分析,以得到向量信息;
根据所述书签内容的摘要和总结以及所述向量信息,生成具有多维度信息的多维度书签。
2.如权利要求1所述的方法,其中,还包括:
持续监控所述网页的源代码文件;
在监控到所述网页的源代码文件发生变化时,生成所述多维度信息的更新内容,并在所述多维度书签上进行提示。
3.如权利要求2所述的方法,其中,在所述多维度书签上进行提示,包括:
在所述多维度书签的界面上显示提示更新图标;
响应于对所述提示更新图标的点击操作,弹出显示有所述更新内容的悬浮框。
4.如权利要求1-3中任一项所述的方法,其中,还包括:
响应于基于关键字对书签内容的搜索请求,将所述关键字与所述多维度标签的向量信息进行匹配;
根据匹配结果显示对应的书签内容。
5.如权利要求1-4中任一项所述的方法,其中,对所述书签内容进行超长文本总结分析,以得到书签内容的摘要和总结,包括:
将所述有效信息输入文本摘要模型进行处理,以输出书签内容的摘要和总结。
6.如权利要求1-5中任一项所述的方法,其中,对所述书签内容进行超长文本总结分析,以得到书签内容的摘要和总结,包括:
对所述书签内容设置提示信息后输入大型语言模型进行处理,以输出书签内容的摘要和总结。
7.如权利要求1-6中任一项所述的方法,其中,对所述书签内容进行向量分析,包括:
利用文本嵌入模型,或者调用大型语言模型的接口,来将所述书签内容转换为向量词。
8.如权利要求1-7中任一项所述的方法,其中,所述多维度信息包括:书签内容的摘要和总结、向量信息、网页基本信息、网页截图。
9.如权利要求1-8中任一项所述的方法,其中,所述有效信息包括标题、段落、链接、图片、作者、发布日期中的一种或多种。
10.一种浏览器书签管理系统,部署在计算设备中,包括:
浏览器,适于响应于生成网页书签的请求,加载所述网页的源代码文件;
自然语言爬虫模块,适于从所述源代码文件中提取有效信息,作为书签内容进行保存;
超长文本总结模块,适于对所述书签内容进行超长文本总结分析,以得到书签内容的摘要和总结;
向量搜索模块,适于对所述书签内容进行向量分析,以得到向量信息;
生成模块,适于根据所述书签内容的摘要和总结以及所述向量信息,生成具有多维度信息的多维度书签。
11.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-9中任一项所述的方法的指令。
12.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-9中任一项所述方法。
CN202311068980.4A 2023-08-23 2023-08-23 浏览器书签管理方法、系统及计算设备 Pending CN117093789A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311068980.4A CN117093789A (zh) 2023-08-23 2023-08-23 浏览器书签管理方法、系统及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311068980.4A CN117093789A (zh) 2023-08-23 2023-08-23 浏览器书签管理方法、系统及计算设备

Publications (1)

Publication Number Publication Date
CN117093789A true CN117093789A (zh) 2023-11-21

Family

ID=88781729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311068980.4A Pending CN117093789A (zh) 2023-08-23 2023-08-23 浏览器书签管理方法、系统及计算设备

Country Status (1)

Country Link
CN (1) CN117093789A (zh)

Similar Documents

Publication Publication Date Title
US9323794B2 (en) Method and system for high performance pattern indexing
CN109815333B (zh) 信息获取方法、装置、计算机设备和存储介质
EP2092419B1 (en) Method and system for high performance data metatagging and data indexing using coprocessors
US9311823B2 (en) Caching natural language questions and results in a question and answer system
CN111046221B (zh) 歌曲推荐方法、装置、终端设备以及存储介质
CN111813905B (zh) 语料生成方法、装置、计算机设备及存储介质
CN110413738B (zh) 一种信息处理方法、装置、服务器及存储介质
US8661035B2 (en) Content management system and method
US20130268519A1 (en) Fact verification engine
Im et al. Linked tag: image annotation using semantic relationships between image tags
US8645384B1 (en) Updating taxonomy based on webpage
CN107301195A (zh) 生成用于搜索内容的分类模型方法、装置和数据处理系统
CN110688405A (zh) 基于人工智能的专家推荐方法、装置、终端、及介质
CN113407785B (zh) 一种基于分布式储存系统的数据处理方法和系统
JP2017220204A (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
CN112417133A (zh) 排序模型的训练方法和装置
Sivakumar Effectual web content mining using noise removal from web pages
US11182441B2 (en) Hypotheses generation using searchable unstructured data corpus
CN116755688A (zh) 组件处理方法、装置、计算机设备及存储介质
CN116521825A (zh) 一种生成文本匹配模型的方法、计算设备及存储介质
Moumtzidou et al. Discovery of environmental nodes in the web
CN117093789A (zh) 浏览器书签管理方法、系统及计算设备
Shi et al. Ontology-based code snippets management in a cloud environment
Goel A study of text mining techniques: Applications and Issues
CN113505889B (zh) 图谱化知识库的处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination