CN115098819A - 一种网页收藏方法及装置 - Google Patents

一种网页收藏方法及装置 Download PDF

Info

Publication number
CN115098819A
CN115098819A CN202210741877.0A CN202210741877A CN115098819A CN 115098819 A CN115098819 A CN 115098819A CN 202210741877 A CN202210741877 A CN 202210741877A CN 115098819 A CN115098819 A CN 115098819A
Authority
CN
China
Prior art keywords
webpage
determining
classification
target webpage
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210741877.0A
Other languages
English (en)
Inventor
杨博研
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202210741877.0A priority Critical patent/CN115098819A/zh
Publication of CN115098819A publication Critical patent/CN115098819A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例提供一种网页收藏方法及装置,该网页收藏方法包括:确定需要进行收藏的目标网页;从预设的网页类型库中确定目标网页的分类类型;根据分类类型为目标网页设置个性化标签;将设置了个性化标签的目标网页收藏至分类类型对应的收藏组中。可见,实施这种实施方式,能够对需要收藏的网页进行分类收藏,有利于提升网页收藏的便利性,从而提升了用户体验度。

Description

一种网页收藏方法及装置
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种网页收藏方法及装置。
背景技术
随着互联网的不断发展,人们能够浏览的网页越来越多,在浏览网页的过程中,通常喜欢将感兴趣的网页进行收藏,以便便于日后查看已收藏网页。现有的网页收藏方法,通常是先接收到对目标网页进行收藏的命令,将该命令中携带的目标网页的链接地址等收藏信息存储收藏夹内。然而,在实践中发现,现有方法中,将所有的网页都存储在一个收藏夹内,随着长期使用,使得收藏夹中的网页各种各样,从而导致在查看已收藏网页时,找不到需要查看的那个网页,降低了网页收藏的便利性。可见,现有方法网页收藏的便利性低,从而降低了用户体验。
发明内容
本申请实施例的目的在于提供一种网页收藏方法及装置,能够对需要收藏的网页进行分类收藏,有利于提升网页收藏的便利性,从而提升了用户体验度。
本申请实施例第一方面提供了一种网页收藏方法,包括:
确定需要进行收藏的目标网页;
从预设的网页类型库中确定所述目标网页的分类类型;
根据所述分类类型为所述目标网页设置个性化标签;
将设置了个性化标签的所述目标网页收藏至所述分类类型对应的收藏组中。
在上述实现过程中,该方法可以优先确定需要进行收藏的目标网页;然后从预设的网页类型库中确定所述目标网页的分类类型;并根据所述分类类型为所述目标网页设置个性化标签;最后再将设置了个性化标签的所述目标网页收藏至所述分类类型对应的收藏组中。可见,实施这种实施方式,能够对需要收藏的网页进行分类收藏,有利于提升网页收藏的便利性,从而提升了用户体验度。
进一步地,所述从预设的网页类型库中确定所述目标网页的分类类型,包括:
获取所述目标网页的网址信息、所述目标网页内的页面标题、所述目标网页内的页面内容;
根据所述网址信息、所述页面标题和所述页面内容进行自言语言的语义分析,得到分析结果;
根据所述分析结果从预设的网页类型库中确定所述目标网页的分类类型。
进一步地,根据所述分类类型为所述目标网页设置个性化标签,包括:
根据预存的分类关注指标库确定所述分类类型对应的关注指标;
根据所述网址信息、所述页面标题和所述页面内容确定所述关注指标的指标内容;
根据所述指标内容为所述目标网页设置个性化标签。
进一步地,在所述确定需要进行收藏的目标网页之前,所述方法还包括:
获取网页样本数据,其中,所述网页样本数据包括网页网址样本、与所述网页网址样本对应的页面标题样本、与所述网页网址样本对应的页面内容样本;
对所述网页样本数据进行自然语义分析,确定多个分类类型;
根据所述多个分类类型构建网页类型库并存储。
进一步地,在根据预存的分类关注指标库确定所述分类类型对应的关注指标之前,所述方法还包括:
根据所述网页类型库,获取每个所述分类类型的可选关注指标;
根据用户输入的针对所述可选关注指标的选择定义指令,确定每个所述分类类型对应的关注指标;
存储每个所述分类类型对应的关注指标,得到分类关注指标库。
本申请实施例第二方面提供了一种网页收藏装置,所述网页收藏装置包括:
第一确定单元,用于确定需要进行收藏的目标网页;
第二确定单元,用于从预设的网页类型库中确定所述目标网页的分类类型;
设置单元,用于根据所述分类类型为所述目标网页设置个性化标签;
收藏单元,用于将设置了个性化标签的所述目标网页收藏至所述分类类型对应的收藏组中。
在上述实现过程中,该网页收藏装置可以通过第一确定单元确定需要进行收藏的目标网页;通过第二确定单元从预设的网页类型库中确定所述目标网页的分类类型;通过设置单元来根据所述分类类型为所述目标网页设置个性化标签;通过收藏单元来将设置了个性化标签的所述目标网页收藏至所述分类类型对应的收藏组中。可见,实施这种实施方式,能够对需要收藏的网页进行分类收藏,有利于提升网页收藏的便利性,从而提升了用户体验度。
进一步地,所述第二确定单元包括:
获取子单元,用于获取所述目标网页的网址信息、所述目标网页内的页面标题、所述目标网页内的页面内容;
分析子单元,用于根据所述网址信息、所述页面标题和所述页面内容进行自言语言的语义分析,得到分析结果;
第一确定子单元,用于根据所述分析结果从预设的网页类型库中确定所述目标网页的分类类型。
进一步地,所述设置单元包括:
第二确定子单元,用于根据预存的分类关注指标库确定所述分类类型对应的关注指标;以及根据所述网址信息、所述页面标题和所述页面内容确定所述关注指标的指标内容;
设置子单元,用于根据所述指标内容为所述目标网页设置个性化标签。
进一步地,所述网页收藏装置还包括:
获取单元,用于在所述确定需要进行收藏的目标网页之前,获取网页样本数据;其中,所述网页样本数据包括网页网址样本、与所述网页网址样本对应的页面标题样本、与所述网页网址样本对应的页面内容样本;
分析单元,用于对所述网页样本数据进行自然语义分析,确定多个分类类型;
存储单元,用于根据所述多个分类类型构建网页类型库并存储。
进一步地,所述获取单元,还用于在根据预存的分类关注指标库确定所述分类类型对应的关注指标之前,根据所述网页类型库,获取每个所述分类类型的可选关注指标;
所述第二确定单元,还用于根据用户输入的针对所述可选关注指标的选择定义指令,确定每个所述分类类型对应的关注指标;
所述存储单元,还用于存储每个所述分类类型对应的关注指标,得到分类关注指标库。
本申请实施例第三方面提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行本申请实施例第一方面中任一项所述的网页收藏方法。
本申请实施例第四方面提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本申请实施例第一方面中任一项所述的网页收藏方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种网页收藏方法的流程示意图;
图2为本申请实施例提供的另一种网页收藏方法的流程示意图;
图3为本申请实施例提供的一种网页收藏装置的结构示意图;
图4为本申请实施例提供的另一种网页收藏装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
请参看图1,图1为本申请实施例提供了一种网页收藏方法的流程示意图。其中,该网页收藏方法包括:
S101、确定需要进行收藏的目标网页。
本实施例中,该方法可以根据用户的操作确定需要进行收藏的目标网页。
S102、从预设的网页类型库中确定目标网页的分类类型。
本实施例中,该方法可以通过对大小类进行划分,从而使得用户可以预自定义粒度,用来应对不同规模的页面收藏数量,或者自身对目录类别划分的喜好。并通过该种自定义确定目标网页的分类类型。
S103、根据分类类型为目标网页设置个性化标签。
本实施例中,该方法可以自动生成个性化标签,从而简化网页收藏的操作,实现真正的一键式收藏。
S104、将设置了个性化标签的目标网页收藏至分类类型对应的收藏组中。
本实施例中,用户在使用该方法之后,只需要设定一次自己对不同网页的关注点,类别划分喜好等,即可在使用时一键点击收藏,便可做到拥有条理清楚且有额外个性化信息的收藏夹。
本实施例中,每个人都会在使用浏览器的时候看到收藏夹,并经常使用收藏夹收藏一些重要的内容。但是,随着长期使用,“收藏”作为一个“轻”动作加上普遍的惰性,难免使得收藏夹必定会变得臃肿无比。然而,为了保持收藏夹内容具有清楚的条理,用户不得不经常去主动维护它,或者使用各种清理插件来对其进行相应的调整。
在本实施例中,一般的收藏夹只能记录站点地址、名称或者再多一些备注,是没有“状态”这个概念的,比如影视页面视频观看的集数,进度,文档类页面阅读的位置,做的一些标记笔记等。而本方法对网页增加了“状态”的维度,从而实现做到既收藏“形”,又收藏“神”的效果。
本实施例中,该方法的执行主体可以为计算机、服务器等计算装置,对此本实施例中不作任何限定。
在本实施例中,该方法的执行主体还可以为智能手机、平板电脑等智能设备,对此本实施例中不作任何限定。
可见,实施本实施例所描述的网页收藏方法,能够通过回归收藏键简单易用地对网页进行手长,从而实现真正的一键收藏,避免用户在使用时纠结放在哪以及一段时间段后纠结怎么整理的问题。同时,该方法还能够对网页增加了“状态”的维度,从而实现做到既收藏“形”,又收藏“神”的目的。另外,该方法还能够在有额外的个性化信息的状态后,进一步加强收藏夹的丰富度以及可用性。
实施例2
请参看图2,图2为本申请实施例提供了一种网页收藏方法的流程示意图。其中,该网页收藏方法包括:
S201、获取网页样本数据。
本实施例中,网页样本数据包括网页网址样本、与网页网址样本对应的页面标题样本、与网页网址样本对应的页面内容样本。
S202、对网页样本数据进行自然语义分析,确定多个分类类型。
本实施例中,自然语义分析对应为自然语言处理(NLP)语义分析,具体的,该自然语义分析包括文本分类、情感分析、意图识别等。
S203、根据多个分类类型构建网页类型库并存储。
本实施例中,该方法可以引入自然语言处理技术,根据网页的URL,拉取其页面内的标题,页面内容,页面文本等进行一些自然语言的语义分析,使用预训练的自然语言分类成若干大类,比如视频网站,宠物,科技,人文,生活等,然后可以再细分至二级节点等。
S204、根据网页类型库,获取每个分类类型的可选关注指标。
本实施例中,一个分类类型对应一个可选关注指标。
S205、根据用户输入的针对可选关注指标的选择定义指令,确定每个分类类型对应的关注指标。
本实施例中,该方法可以通过用户输入的选择定义指令选择想要选择的关注指标。
S206、存储每个分类类型对应的关注指标,得到分类关注指标库。
本实施例中,该方法可以对于不同类型的分进行大量分析,并在之后罗列出若干关注点供用户提前选择以及定义,比如文档类型的阅读进度,其上圈定或标记的一些笔记;视频类网站的观看集数,进度;信息查询类网站需要输入的一些信息;购物类网站页面上的一些关键字段(比如价格,库存,销量等信息)。
S207、确定需要进行收藏的目标网页。
本实施例中,该方法可以根据用户的操作确定需要进行收藏的目标网页。
S208、获取目标网页的网址信息、目标网页内的页面标题、目标网页内的页面内容。
S209、根据网址信息、页面标题和页面内容进行自言语言的语义分析,得到分析结果。
S210、根据分析结果从预设的网页类型库中确定目标网页的分类类型。
本实施例中,该方法可以通过对大小类进行划分,从而使得用户可以预自定义粒度,用来应对不同规模的页面收藏数量,或者自身对目录类别划分的喜好。并通过该种自定义确定目标网页的分类类型。
S211、根据预存的分类关注指标库确定分类类型对应的关注指标。
S212、根据网址信息、页面标题和页面内容确定关注指标的指标内容。
S213、根据指标内容为目标网页设置个性化标签。
本实施例中,该方法可以根据预存的分类关注指标库确定分类类型对应的关注指标,然后再根据网址信息、页面标题和页面内容确定关注指标的指标内容。从而使得该方法时根据指标内容为目标网页设置个性化标签的。
S214、将设置了个性化标签的所述目标网页收藏至所述分类类型对应的收藏组中。
本实施例中,该方法的执行主体可以为计算机、服务器等计算装置,对此本实施例中不作任何限定。
在本实施例中,该方法的执行主体还可以为智能手机、平板电脑等智能设备,对此本实施例中不作任何限定。
可见,实施本实施例所描述的网页收藏方法,能够通过回归收藏键简单易用地对网页进行手长,从而实现真正的一键收藏,避免用户在使用时纠结放在哪以及一段时间段后纠结怎么整理的问题。同时,该方法还能够对网页增加了“状态”的维度,从而实现做到既收藏“形”,又收藏“神”的目的。另外,该方法还能够在有额外的个性化信息的状态后,进一步加强收藏夹的丰富度以及可用性。
实施例3
请参看图3,图3为本申请实施例提供的一种网页收藏装置的结构示意图。如图3所示,该网页收藏装置包括:
第一确定单元310,用于确定需要进行收藏的目标网页;
第二确定单元320,用于从预设的网页类型库中确定目标网页的分类类型;
设置单元330,用于根据分类类型为目标网页设置个性化标签;
收藏单元340,用于将设置了个性化标签的目标网页收藏至分类类型对应的收藏组中。
本实施例中,该方法可以根据用户的操作确定需要进行收藏的目标网页。
本实施例中,该方法可以通过对大小类进行划分,从而使得用户可以预自定义粒度,用来应对不同规模的页面收藏数量,或者自身对目录类别划分的喜好。并通过该种自定义确定目标网页的分类类型。
本实施例中,该方法可以自动生成个性化标签,从而简化网页收藏的操作,实现真正的一键式收藏。
本实施例中,用户在使用该方法之后,只需要设定一次自己对不同网页的关注点,类别划分喜好等,即可在使用时一键点击收藏,便可做到拥有条理清楚且有额外个性化信息的收藏夹。
本实施例中,对于网页收藏装置的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。
可见,实施本实施例所描述的网页收藏装置,能够通过回归收藏键简单易用地对网页进行手长,从而实现真正的一键收藏,避免用户在使用时纠结放在哪以及一段时间段后纠结怎么整理的问题。同时,该装置还能够对网页增加了“状态”的维度,从而实现做到既收藏“形”,又收藏“神”的目的。另外,该装置还能够在有额外的个性化信息的状态后,进一步加强收藏夹的丰富度以及可用性。
实施例4
请参看图4,图4为本申请实施例提供的一种网页收藏装置的结构示意图。如图4所示,该网页收藏装置包括:
第一确定单元310,用于确定需要进行收藏的目标网页;
第二确定单元320,用于从预设的网页类型库中确定目标网页的分类类型;
设置单元330,用于根据分类类型为目标网页设置个性化标签;
收藏单元340,用于将设置了个性化标签的目标网页收藏至分类类型对应的收藏组中。
作为一种可选的实施方式,第二确定单元320包括:
获取子单元321,用于获取目标网页的网址信息、目标网页内的页面标题、目标网页内的页面内容;
分析子单元322,用于根据网址信息、页面标题和页面内容进行自言语言的语义分析,得到分析结果;
第一确定子单元323,用于根据分析结果从预设的网页类型库中确定目标网页的分类类型。
作为一种可选的实施方式,设置单元330包括:
第二确定子单元331,用于根据预存的分类关注指标库确定分类类型对应的关注指标;以及根据网址信息、页面标题和页面内容确定关注指标的指标内容;
设置子单元332,用于根据指标内容为目标网页设置个性化标签。
作为一种可选的实施方式,网页收藏装置还包括:
获取单元350,用于在确定需要进行收藏的目标网页之前,获取网页样本数据;其中,网页样本数据包括网页网址样本、与网页网址样本对应的页面标题样本、与网页网址样本对应的页面内容样本;
分析单元360,用于对网页样本数据进行自然语义分析,确定多个分类类型;
存储单元370,用于根据多个分类类型构建网页类型库并存储。
作为一种可选的实施方式,获取单元350,还用于在根据预存的分类关注指标库确定分类类型对应的关注指标之前,根据网页类型库,获取每个分类类型的可选关注指标;
第二确定单元320,还用于根据用户输入的针对可选关注指标的选择定义指令,确定每个分类类型对应的关注指标;
存储单元370,还用于存储每个分类类型对应的关注指标,得到分类关注指标库。
本实施例中,对于网页收藏装置的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。
可见,实施本实施例所描述的网页收藏装置,能够通过回归收藏键简单易用地对网页进行手长,从而实现真正的一键收藏,避免用户在使用时纠结放在哪以及一段时间段后纠结怎么整理的问题。同时,该装置还能够对网页增加了“状态”的维度,从而实现做到既收藏“形”,又收藏“神”的目的。另外,该装置还能够在有额外的个性化信息的状态后,进一步加强收藏夹的丰富度以及可用性。
本申请实施例提供了一种电子设备,包括存储器以及处理器,存储器用于存储计算机程序,处理器运行计算机程序以使电子设备执行本申请实施例1或实施例2中的网页收藏方法。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本申请实施例1或实施例2中的网页收藏方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种网页收藏方法,其特征在于,包括:
确定需要进行收藏的目标网页;
从预设的网页类型库中确定所述目标网页的分类类型;
根据所述分类类型为所述目标网页设置个性化标签;
将设置了个性化标签的所述目标网页收藏至所述分类类型对应的收藏组中。
2.根据权利要求1所述的网页收藏方法,其特征在于,所述从预设的网页类型库中确定所述目标网页的分类类型,包括:
获取所述目标网页的网址信息、所述目标网页内的页面标题、所述目标网页内的页面内容;
根据所述网址信息、所述页面标题和所述页面内容进行自言语言的语义分析,得到分析结果;
根据所述分析结果从预设的网页类型库中确定所述目标网页的分类类型。
3.根据权利要求2所述的网页收藏方法,其特征在于,根据所述分类类型为所述目标网页设置个性化标签,包括:
根据预存的分类关注指标库确定所述分类类型对应的关注指标;
根据所述网址信息、所述页面标题和所述页面内容确定所述关注指标的指标内容;
根据所述指标内容为所述目标网页设置个性化标签。
4.根据权利要求1所述的网页收藏方法,其特征在于,在所述确定需要进行收藏的目标网页之前,所述方法还包括:
获取网页样本数据,其中,所述网页样本数据包括网页网址样本、与所述网页网址样本对应的页面标题样本、与所述网页网址样本对应的页面内容样本;
对所述网页样本数据进行自然语义分析,确定多个分类类型;
根据所述多个分类类型构建网页类型库并存储。
5.根据权利要求2所述的网页收藏方法,其特征在于,在根据预存的分类关注指标库确定所述分类类型对应的关注指标之前,所述方法还包括:
根据所述网页类型库,获取每个所述分类类型的可选关注指标;
根据用户输入的针对所述可选关注指标的选择定义指令,确定每个所述分类类型对应的关注指标;
存储每个所述分类类型对应的关注指标,得到分类关注指标库。
6.一种网页收藏装置,其特征在于,所述网页收藏装置包括:
第一确定单元,用于确定需要进行收藏的目标网页;
第二确定单元,用于从预设的网页类型库中确定所述目标网页的分类类型;
设置单元,用于根据所述分类类型为所述目标网页设置个性化标签;
收藏单元,用于将设置了个性化标签的所述目标网页收藏至所述分类类型对应的收藏组中。
7.根据权利要求6所述的网页收藏装置,其特征在于,所述第二确定单元包括:
获取子单元,用于获取所述目标网页的网址信息、所述目标网页内的页面标题、所述目标网页内的页面内容;
分析子单元,用于根据所述网址信息、所述页面标题和所述页面内容进行自言语言的语义分析,得到分析结果;
第一确定子单元,用于根据所述分析结果从预设的网页类型库中确定所述目标网页的分类类型。
8.根据权利要求7所述的网页收藏装置,其特征在于,所述设置单元包括:
第二确定子单元,用于根据预存的分类关注指标库确定所述分类类型对应的关注指标;以及根据所述网址信息、所述页面标题和所述页面内容确定所述关注指标的指标内容;
设置子单元,用于根据所述指标内容为所述目标网页设置个性化标签。
9.一种电子设备,其特征在于,所述电子设备包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1至5中任一项所述的网页收藏方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行权利要求1至5任一项所述的网页收藏方法。
CN202210741877.0A 2022-06-27 2022-06-27 一种网页收藏方法及装置 Pending CN115098819A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210741877.0A CN115098819A (zh) 2022-06-27 2022-06-27 一种网页收藏方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210741877.0A CN115098819A (zh) 2022-06-27 2022-06-27 一种网页收藏方法及装置

Publications (1)

Publication Number Publication Date
CN115098819A true CN115098819A (zh) 2022-09-23

Family

ID=83294508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210741877.0A Pending CN115098819A (zh) 2022-06-27 2022-06-27 一种网页收藏方法及装置

Country Status (1)

Country Link
CN (1) CN115098819A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298614A (zh) * 2011-07-29 2011-12-28 百度在线网络技术(北京)有限公司 一种确定网页收藏信息的收藏分类的方法、装置和设备
CN102799610A (zh) * 2012-06-01 2012-11-28 北京奇乐客科技有限公司 网络信息收藏方法及系统
CN113282817A (zh) * 2021-05-31 2021-08-20 武汉野途电子商务有限公司 基于网页搜索引擎数据分析的网页内容智能收藏处理方法、系统及计算机存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298614A (zh) * 2011-07-29 2011-12-28 百度在线网络技术(北京)有限公司 一种确定网页收藏信息的收藏分类的方法、装置和设备
CN102799610A (zh) * 2012-06-01 2012-11-28 北京奇乐客科技有限公司 网络信息收藏方法及系统
CN113282817A (zh) * 2021-05-31 2021-08-20 武汉野途电子商务有限公司 基于网页搜索引擎数据分析的网页内容智能收藏处理方法、系统及计算机存储介质

Similar Documents

Publication Publication Date Title
US10990632B2 (en) Multidimensional search architecture
US8355997B2 (en) Method and system for developing a classification tool
US20060155728A1 (en) Browser application and search engine integration
US9767208B1 (en) Recommendations for creation of content items
US20100318526A1 (en) Information analysis device, search system, information analysis method, and information analysis program
CN108959413B (zh) 一种主题网页爬取方法及主题爬虫系统
JP2011154668A (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
WO2014161452A1 (en) System and method for pushing and distributing promotion content
AU2016228246B2 (en) System and method for concept-based search summaries
CN110990696B (zh) 搜索意图推荐的方法及装置
US20170228378A1 (en) Extracting topics from customer review search queries
KR101607468B1 (ko) 콘텐츠에 대한 키워드 태깅 방법 및 시스템
RU2562397C2 (ru) Способ и устройство для добавления адреса гиперссылки в закладку
US20080195463A1 (en) System for cost-sensitive autonomous information retrieval and extraction
US20100169318A1 (en) Contextual representations from data streams
JP4970919B2 (ja) 閲覧対象情報の評価システム、方法、およびプログラム
JP2015194955A (ja) 入札情報検索システム
US20080103882A1 (en) Method for cost-sensitive autonomous information retrieval and extraction
Wanjari et al. Automatic news extraction system for Indian online news papers
CN115098619A (zh) 资讯去重方法、装置、电子设备及计算机可读取存储介质
CN115098819A (zh) 一种网页收藏方法及装置
Souza et al. Semantic URL analytics to support efficient annotation of large scale web archives
CN111949916B (zh) 一种网页分析方法、装置、设备及存储介质
CN112989020B (zh) 信息处理方法、装置和计算机可读存储介质
Arolas et al. Uses of explicit and implicit tags in social bookmarking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination