CN104484396A - 网页信息的筛选方法和装置 - Google Patents

网页信息的筛选方法和装置 Download PDF

Info

Publication number
CN104484396A
CN104484396A CN201410771822.XA CN201410771822A CN104484396A CN 104484396 A CN104484396 A CN 104484396A CN 201410771822 A CN201410771822 A CN 201410771822A CN 104484396 A CN104484396 A CN 104484396A
Authority
CN
China
Prior art keywords
product
screening
information
product object
screening conditions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410771822.XA
Other languages
English (en)
Inventor
陈俊宏
余德乐
杨韬
赵冬玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410771822.XA priority Critical patent/CN104484396A/zh
Publication of CN104484396A publication Critical patent/CN104484396A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种网页信息的筛选方法和装置。其中,该网页信息的筛选方法包括:在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在浏览器显示的筛选后的产品对象的产品数据。本发明解决了由于文本类别由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题。

Description

网页信息的筛选方法和装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种网页信息的筛选方法和装置。
背景技术
随着网络的发展,越来越多的网络数据能够体现出使用网络的用户的习惯和喜好,但是如何通过利用上述网络数据获取用户对某类产品的意见,成为了现有分析系统努力获取成果的一个方向。其中,在现有的舆论监测分析系统中,会对不同类别的文本内容进行分类的功能,其逻辑如下:通过预先设定一组关键词,例如,关键词:“口味”就会对应的出现:“巧克力味,牛奶味,香草味”,因此当机器爬虫从互联网上抓取到文本内容时,会第一时间的查看是否涵盖上述关键词,以此来对文本内容进行分类,若包含,则将这些内容让入到“口味”这一类别中,当舆论情报监测分析系统运行时,能直接在用户界面上展示出早已分好类别的“口味”所包含的文本。即,通过分类好的类别“口味”显示用户的喜好倾向。
但上述操作存在两个问题:问题1.该类别的创建是在后端完成的(即,舆论情报监测分析系统的提供方),用户只能查看预先设定好的类别,不能根据自己的喜好增加或修改类别;问题2.分类方式过于单一,仅仅从关键字的包含情况来进行分类,不够灵活,例如,若用户需要将包含关键词XXX的,来自于微博平台的且时间为最近一个月之内的文本分为一个类。对于上述的分类方式则不能灵活的满足。
针对现有技术中文本类别由于由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种网页信息的筛选方法和装置,以解决由于文本类别由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种网页信息的筛选方法。根据本发明的网页信息的筛选方法包括:在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在浏览器显示的筛选后的产品对象的产品数据。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种网页信息的筛选装置。根据本发明的网页信息的筛选装置包括:获取模块,用于在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;设置模块,用于接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;筛选模块,用于根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;显示模块,用于在浏览器显示的筛选后的产品对象的产品数据。
根据发明实施例,通过在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在浏览器显示的筛选后的产品对象的产品数据,解决了由于文本类别由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题,达到了提升文本分类的精度的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的网页信息的筛选方法的流程图;
图2是根据本发明实施例的网页信息的筛选装置的示意图;
图3是根据本发明优选实施例的网页信息的筛选装置的示意图;
图4是根据本发明优选实施例的网页信息的筛选装置的示意图;以及
图5是根据本发明优选实施例的网页信息的筛选装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
本发明实施例提供了一种网页信息的筛选方法。
图1是根据本发明实施例的网页信息的筛选方法的流程图。如图1所示,该网页信息的筛选方法包括步骤如下:
步骤S102,在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;
具体的,本发明实施例提供的网页信息的筛选方法可以适用于终端设备,该终端设备可以为以下至少之一:智能手机、笔记本电脑、台式电脑、掌上电脑、平板电脑,通过在浏览器中加载网页页面,获取当前网页页面显示的所有产品对象的产品数据,其中,产品对象可以以多个词汇的形式显示在当前网页页面上,并且,获取的网页页面显示的所有产品对象的产品数据可以通过机器人爬虫程序,在预先确定的爬取范围内,将该爬取范围内的所有词条都进行采集,这里机器人爬虫程序可以为脚本javascript代码,且爬取范围可以是一个网站或由多个网站组成的网络平台。
由上可知,在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据可以是在一个网站或由多个网站组成的网络平台中,通过javascript代码采集该网络平台中的所有词条,该词条对应的产品对象可以为任意一类产品或信息。
步骤S104,接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;
具体的,通过接收用户输入的筛选信息,将该筛选信息组成筛选条件,本发明实施例中的筛选条件的形式可以为:通过接收用户在当前网页页面显示的产品对象的属性类型信息、来源信息和兴趣标签信息中选取的一种或多种组合得到的筛选条件。其中,接收用户输入的筛选信息中,输入的筛选信息可以为接收用户点击操作选取的筛选信息,或者接收用户随机输入的关键词组成的筛选信息。
步骤S106,根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;
具体的,结合步骤S104和步骤S102,将步骤S102中获取的网页页面显示的所有产品对象的产品数据,通过步骤S104得到的筛选条件进行筛选,得到筛选后的产品对象。
步骤S108,在浏览器显示的筛选后的产品对象的产品数据。
具体的,结合步骤S106,将步骤S106中得到的筛选后的产品对象进行显示。
通过上述步骤,在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;在浏览器显示的筛选后的产品对象的产品数据,解决了由于文本类别由舆论情报监测分析系统的提供方提供,进而产生的分类方式过于单一的问题,达到了提升文本分类的精度的效果。
由上可知,结合步骤S102至步骤S108,在构成筛选条件时,可以为以下至少三类:
类别一,假设步骤S104中的筛选条件为产品对象的属性类型信息,并且该属性类型信息为“味觉”的类别,故在当前网页的显示界面上可以通过接收用户选取的“巧克力味”、“香草味”、“牛奶味”的筛选信息,将上述筛选信息组合得到一类产品,如冰淇淋或糕点,即,冰淇淋或糕点可以为一条筛选条件,用于对步骤S102中的产品数据进行筛选;
进而得到步骤S106中筛选后的产品对象,进一步的通过步骤S108进行显示。同样的,当筛选条件为来源信息或兴趣标签信息时,方法如上,区别仅在于对应不同类型的筛选条件,筛选信息的类型也不相同,此处不再赘述。
类别二,在类别一的基础上,假设筛选条件为产品对象的属性类型信息和来源信息,其中来源信息可以为步骤S102中的产品数据所属的网站,例如,仍旧以上述举例为例,在当前网页的显示界面上可以通过接收用户选取的“巧克力味”、“香草味”、“牛奶味”的筛选信息后,通过接收用户选取的“S网站”、“W网站”、“A网站”的筛选信息后,将上述两类筛选信息进行整理,将可以分别得到“S网站”、“W网站”、“A网站”中对应“巧克力味”、“香草味”、“牛奶味”的产品数据,即,通过上述两类筛选信息组成的筛选条件;
进而得到步骤S106中的产品对象,最后在步骤S108进行显示;同样的,当筛选条件为:属性类型信息和兴趣标签信息的组合、或来源信息和兴趣标签信息的组合时,方法如上,区别仅在于对应不同类型的筛选条件的组合,筛选信息的类型的组合也不相同,此处不再赘述。
类别三,在上述的基础上,假设筛选条件为产品对象的属性类型信息、来源信息和兴趣标签信息,其中,兴趣标签信息可以为一类产品对应产生的影响,即被大众认可、不认可的信息,在判断是否被大众认可时,可以通过预先建立的分析数据库,将采集到的兴趣标签信息中大众发表的意见进行分析,在褒义词的数量大于预设阈值时,则判定为被大众认可类别;相反,当褒义词的数量小于预设阈值时,或存在至少一个贬义词时,则判定为被大众不认可。
通过结合类别二中的举例,在类别二的基础上通过条件兴趣标签信息,在接收用户输入的筛选信息时,组成的筛选条件可以为在“S网站”、“W网站”、“A网站”中对应“巧克力味”、“香草味”、“牛奶味”选择被大众认可或不认可的产品对象;
进而在步骤S106中得到筛选后的产品对象,最后在步骤S108中进行显示。
综上,本发明实施例提供的网页信息的筛选方法仅以上述举例为例进行说明,以实现本发明实施例提供的网页信息的筛选方法为准,具体不做限定。
优选的,步骤S106中,在筛选条件为网页信息的属性类型信息的情况下,其中,根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象的步骤包括:
从所有产品对象的产品数据中提取具有属性类型信息的产品对象,得到第一类文本,属性类型信息用于表征产品对象的产品类型。
具体的,依据筛选条件为网页信息的属性类型信息,对产品对象的产品数据进行筛选,得到对应产品类型的产品对象;例如,以相机为例,相机的属性类型消息可以为:S品牌广角镜头,以“S品牌广角镜头”作为筛选条件,则可以得到“S品牌广角镜头”对应的各个型号的镜头,其中,该““S品牌广角镜头”对应的各个型号的镜头”为筛选后的产品对象,该表现形式可以以文本的形式进行显示,其中文本类型可以为文字或图片。
优选的,步骤S106中,在筛选条件为网页信息的来源信息的情况下,其中,根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象的步骤包括:
从所有产品对象的产品数据中提取具有来源信息的产品对象,得到第二类文本,来源信息用于表征产品对象的产品来源类型。
具体的,依据筛选条件为网页信息的来源信息,对产品对象的产品数据进行筛选,得到对应产品类型的产品对象;例如,仍旧以相机为例,相机的来源信息可以为:D网站的广角镜头,以“D网站的广角镜头”作为筛选条件,则可以得到“D网站的广角镜头”对应的镜头,其中,该““D网站的广角镜头”对应的镜头”为筛选后的产品对象。
优选的,步骤S106中,在筛选条件为网页信息的兴趣标签信息的情况下,其中,根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象的步骤包括:
从所有产品对象的产品数据中提取具有兴趣标签信息的产品对象,得到第三类文本,兴趣标签信息用于表征产品对象对应的兴趣类型。
具体的,依据筛选条件为网页信息的兴趣标签信息,对产品对象的产品数据进行筛选,得到对应产品类型的产品对象;例如,仍旧以相机为例,相机的兴趣标签信息可以为:某镜头不好用,以“某镜头不好用”作为筛选条件,则可以得到“某镜头不好用”对应的镜头评论,其中,该““某镜头不好用”对应的镜头评论”为筛选后的产品对象。
由上可知,步骤S106的三种筛选条件可以以组合的形式得到的筛选后的产品对象,即,仍旧以相机为例进行说明,假设相机的属性类型信息为:A品牌、广角;来源信息为:D网站;兴趣标签信息为:好用、方便;通过将上述三种筛选条件进行组合则可以得到:在D网站方便好用的A品牌广角镜头,其中,“在D网站方便好用的A品牌广角镜头”将作为最终的产品对象进行显示。
优选的,步骤S104,接收用户输入的筛选信息,确定筛选条件,包括:
Step1.显示预先获取的多个关键词,关键词包括以下至少之一:类别、用途;
Step2.接收第一选取指令;
Step3.依据第一选取指令由多个关键词中选择一个或多个关键词;
Step4.通过将一个或多个关键词进行组合,构建得到产品对象的属性类型信息。
具体的,步骤S104,接收用户输入的筛选信息,确定筛选条件可以为:
假设,以相机镜头为例,相机镜头对应的关键词包括:品牌、类型、用途,其中,该品牌可以包括:A品牌、B品牌、C品牌;类型包括:广角、定焦、变焦;用途包括:人像、景像;
接收第一选取指令,假设接收到的第一选取指令选取的关键词可以为:A品牌、广角、人像;
构建得到的产品对象的属性类型信息为:A品牌的广角镜头用于拍摄人像。
优选的,步骤S104,接收用户输入的筛选信息,确定筛选条件,包括:
Step1.显示预先获取的多个条件,条件包括以下至少之一:地址、时间、内容;
Step2.接收第二选取指令;
Step3.依据第二选取指令由多个条件中选择一个或多个条件;
Step4.通过将一个或多个条件进行组合,构建得到产品对象的来源信息。
假设,仍旧以相机镜头为例,相机镜头对应的条件包括:所属网站、发布时间、内容描述,其中,该网站可以包括:D网站、E网站、F网站;发布时间包括:24小时内、一周内、一月内;内容包括:用户评论;
接收第二选取指令,假设接收到的第二选取指令选取的条件为:D网站、24小时内、用户评论;
构建得到的产品对象的来源信息为:D网站在的24小时内发布的用户评论。
上述步骤S104中产品对象的属性类型信息和来源信息,可以分别作为步骤S104中的筛选条件,或在属性类型信息的基础上结合来源信息构成筛选条件。本发明实施例以网页信息的筛选方法为准,具体不做限定。
实施例二
本发明实施例还提供了一种网页信息的筛选装置。该装置可以通过网页信息的筛选方法实现其功能。需要说明的是,本发明实施例的网页信息的筛选装置可以用于执行本发明实施例所提供的网页信息的筛选方法,本发明实施例的网页信息的筛选方法也可以通过本发明实施例所提供的网页信息的筛选装置来执行。
图2是根据本发明实施例的网页信息的筛选装置的示意图。如图2所示,该网页信息的筛选装置,包括:获取模块22、设置模块24、筛选模块26和显示模块28,其中,
获取模块22,用于在浏览器中加载网页页面,获取网页页面显示的所有产品对象的产品数据;
设置模块24,用于接收用户输入的筛选信息,确定筛选条件,其中,筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;
筛选模块26,与设置模块24建立电连接,用于根据筛选条件对所有产品对象的产品数据进行筛选,得到筛选后的产品对象;
显示模块28,与筛选模块26建立电连接,用于在浏览器显示的筛选后的产品对象的产品数据。
优选的,图3是根据本发明优选实施例的网页信息的筛选装置的示意图。如图3所示,筛选模块26,包括:
第一筛选单元261,用于在筛选条件为网页信息的属性类型信息的情况下,从所有产品对象的产品数据中提取具有属性类型信息的产品对象,得到第一类文本,属性类型信息用于表征产品对象的产品类型。
优选的,如图3所示,筛选模块26,包括:
第二筛选单元262,用于在筛选条件为网页信息的来源信息的情况下,从所有产品对象的产品数据中提取具有来源信息的产品对象,得到第二类文本,来源信息用于表征产品对象的产品来源类型。
优选的,如图3所示,筛选模块26,包括:
第三筛选单元263,用于在筛选条件为网页信息的兴趣标签信息的情况下,从所有产品对象的产品数据中提取具有兴趣标签信息的产品对象,得到第三类文本,兴趣标签信息用于表征产品对象对应的兴趣类型。
优选的,图4是根据本发明优选实施例的网页信息的筛选装置的示意图。如图4所示,设置模块24,包括:第一显示单元241、第一接收单元242、第一选取单元243和第一构建单元244,其中,
第一显示单元241,用于显示预先获取的多个关键词,关键词包括以下至少之一:类别、用途;
第一接收单元242,用于接收第一选取指令;
第一选取单元243,与第一接收单元242建立电连接,用于依据第一接收单元242接收的第一选取指令由多个关键词中选择一个或多个关键词;
第一构建单元244,与第一选取单元243建立电连接,用于通过将第一选取单元243选择的一个或多个关键词进行组合,构建得到产品对象的属性类型信息。
优选的,图5是根据本发明优选实施例的网页信息的筛选装置的示意图。如图5所示,设置模块24,包括:第二显示单元245、第二接收单元246、第二选取单元247和第二构建单元248,其中,
第二显示单元245,用于显示预先获取的多个条件,条件包括以下至少之一:地址、时间、内容;
第二接收单元246,用于接收第二选取指令;
第二选取单元247,与第二接收单元246建立电连接,用于依据第二接收单元246接收的第二选取指令由多个条件中选择一个或多个条件;
第二构建单元248,与第二选取单元247建立电连接,用于通过将第二选取单元247选择的一个或多个条件进行组合,构建得到产品对象的来源信息。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种网页信息的筛选方法,其特征在于,包括:
在浏览器中加载网页页面,获取所述网页页面显示的所有产品对象的产品数据;
接收用户输入的筛选信息,确定筛选条件,其中,所述筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;
根据所述筛选条件对所述所有产品对象的产品数据进行筛选,得到筛选后的产品对象;
在所述浏览器显示的所述筛选后的产品对象的产品数据。
2.根据权利要求1所述的方法,其特征在于,在所述筛选条件为所述网页信息的属性类型信息的情况下,其中,根据所述筛选条件对所述所有产品对象的产品数据进行筛选,得到筛选后的产品对象的步骤包括:
从所述所有产品对象的产品数据中提取具有所述属性类型信息的产品对象,得到第一类文本,所述属性类型信息用于表征产品对象的产品类型。
3.根据权利要求1所述的方法,其特征在于,在所述筛选条件为所述网页信息的来源信息的情况下,其中,根据所述筛选条件对所述所有产品对象的产品数据进行筛选,得到筛选后的产品对象的步骤包括:
从所述所有产品对象的产品数据中提取具有所述来源信息的产品对象,得到第二类文本,所述来源信息用于表征产品对象的产品来源类型。
4.根据权利要求1所述的方法,其特征在于,在所述筛选条件为所述网页信息的兴趣标签信息的情况下,其中,根据所述筛选条件对所述所有产品对象的产品数据进行筛选,得到筛选后的产品对象的步骤包括:
从所述所有产品对象的产品数据中提取具有所述兴趣标签信息的产品对象,得到第三类文本,所述兴趣标签信息用于表征产品对象对应的兴趣类型。
5.根据权利要求3述的方法,其特征在于,所述接收用户输入的筛选信息,确定筛选条件,包括:
显示预先获取的多个关键词,所述关键词包括以下至少之一:类别、用途;
接收第一选取指令;
依据所述第一选取指令由所述多个关键词中选择一个或多个关键词;
通过将所述一个或多个关键词进行组合,构建得到所述产品对象的属性类型信息。
6.根据权利要求3所述的方法,其特征在于,所述接收用户输入的筛选信息,确定筛选条件,包括:
显示预先获取的多个条件,所述条件包括以下至少之一:地址、时间、内容;
接收第二选取指令;
依据所述第二选取指令由所述多个条件中选择一个或多个条件;
通过将所述一个或多个条件进行组合,构建得到所述产品对象的来源信息。
7.一种网页信息的筛选装置,其特征在于,包括:
获取模块,用于在浏览器中加载网页页面,获取所述网页页面显示的所有产品对象的产品数据;
设置模块,用于接收用户输入的筛选信息,确定筛选条件,其中,所述筛选条件至少包括如下任意一个或多个条件:产品对象的属性类型信息、来源信息和兴趣标签信息;
筛选模块,用于根据所述筛选条件对所述所有产品对象的产品数据进行筛选,得到筛选后的产品对象;
显示模块,用于在所述浏览器显示的所述筛选后的产品对象的产品数据。
8.根据权利要求7所述的装置,其特征在于,所述筛选模块,包括:
第一筛选单元,用于在所述筛选条件为所述网页信息的属性类型信息的情况下,从所述所有产品对象的产品数据中提取具有所述属性类型信息的产品对象,得到第一类文本,所述属性类型信息用于表征产品对象的产品类型。
9.根据权利要求7所述的装置,其特征在于,所述筛选模块,包括:
第二筛选单元,用于在所述筛选条件为所述网页信息的来源信息的情况下,从所述所有产品对象的产品数据中提取具有所述来源信息的产品对象,得到第二类文本,所述来源信息用于表征产品对象的产品来源类型。
10.根据权利要求7所述的装置,其特征在于,所述筛选模块,包括:
第三筛选单元,用于在所述筛选条件为所述网页信息的兴趣标签信息的情况下,从所述所有产品对象的产品数据中提取具有所述兴趣标签信息的产品对象,得到第三类文本,所述兴趣标签信息用于表征产品对象对应的兴趣类型。
11.根据权利要求9述的装置,其特征在于,所述设置模块,包括:
第一显示单元,用于显示预先获取的多个关键词,所述关键词包括以下至少之一:类别、用途;
第一接收单元,用于接收第一选取指令;
第一选取单元,用于依据所述第一接收单元接收的所述第一选取指令由所述多个关键词中选择一个或多个关键词;
第一构建单元,用于通过将所述第一选取单元选择的所述一个或多个关键词进行组合,构建得到所述产品对象的属性类型信息。
12.根据权利要求9所述的装置,其特征在于,所述设置模块,包括:
第二显示单元,用于显示预先获取的多个条件,所述条件包括以下至少之一:地址、时间、内容;
第二接收单元,用于接收第二选取指令;
第二选取单元,用于依据所述第二接收单元接收的所述第二选取指令由所述多个条件中选择一个或多个条件;
第二构建单元,用于通过将所述第二选取单元选择的所述一个或多个条件进行组合,构建得到所述产品对象的来源信息。
CN201410771822.XA 2014-12-12 2014-12-12 网页信息的筛选方法和装置 Pending CN104484396A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410771822.XA CN104484396A (zh) 2014-12-12 2014-12-12 网页信息的筛选方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410771822.XA CN104484396A (zh) 2014-12-12 2014-12-12 网页信息的筛选方法和装置

Publications (1)

Publication Number Publication Date
CN104484396A true CN104484396A (zh) 2015-04-01

Family

ID=52758937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410771822.XA Pending CN104484396A (zh) 2014-12-12 2014-12-12 网页信息的筛选方法和装置

Country Status (1)

Country Link
CN (1) CN104484396A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423362A (zh) * 2017-06-20 2017-12-01 阿里巴巴集团控股有限公司 行业确定方法、对象获取方法和装置、客户端、服务器
CN109582412A (zh) * 2018-10-25 2019-04-05 平安科技(深圳)有限公司 产品展示方法、装置及计算机存储介质
CN109918202A (zh) * 2019-03-08 2019-06-21 上海七牛信息技术有限公司 信息处理方法、装置及存储介质
CN110728113A (zh) * 2018-06-28 2020-01-24 北京金山办公软件股份有限公司 一种电子表格的信息筛选方法、装置及终端设备
CN112488840A (zh) * 2019-09-12 2021-03-12 京东数字科技控股有限公司 信息输出方法和装置
CN113688905A (zh) * 2021-08-25 2021-11-23 中国互联网络信息中心 一种有害域名核验方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1388461A (zh) * 2001-05-29 2003-01-01 黄俊诚 商品推荐装置与电子交易的方法
US20070112838A1 (en) * 2005-06-07 2007-05-17 Anna Bjarnestam Method and system for classifying media content
CN101089843A (zh) * 2006-06-15 2007-12-19 王刘忠 一种仅针对产品或服务供需信息的搜索方法
CN101192288A (zh) * 2006-11-24 2008-06-04 王叶 产品信息发布与反馈评价系统及方法
CN101383032A (zh) * 2008-09-12 2009-03-11 金斌斌 一种能接收外部数据并进行处理的商务交易系统及方法
CN101419614A (zh) * 2008-12-03 2009-04-29 深圳市迅雷网络技术有限公司 视频资源聚类方法和装置
CN101458698A (zh) * 2007-10-22 2009-06-17 吉市有限公司 网站管理方法以及在线系统
CN101615277A (zh) * 2008-06-26 2009-12-30 阿里巴巴集团控股有限公司 一种统计数据的方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1388461A (zh) * 2001-05-29 2003-01-01 黄俊诚 商品推荐装置与电子交易的方法
US20070112838A1 (en) * 2005-06-07 2007-05-17 Anna Bjarnestam Method and system for classifying media content
CN101089843A (zh) * 2006-06-15 2007-12-19 王刘忠 一种仅针对产品或服务供需信息的搜索方法
CN101192288A (zh) * 2006-11-24 2008-06-04 王叶 产品信息发布与反馈评价系统及方法
CN101458698A (zh) * 2007-10-22 2009-06-17 吉市有限公司 网站管理方法以及在线系统
CN101615277A (zh) * 2008-06-26 2009-12-30 阿里巴巴集团控股有限公司 一种统计数据的方法和装置
CN101383032A (zh) * 2008-09-12 2009-03-11 金斌斌 一种能接收外部数据并进行处理的商务交易系统及方法
CN101419614A (zh) * 2008-12-03 2009-04-29 深圳市迅雷网络技术有限公司 视频资源聚类方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423362A (zh) * 2017-06-20 2017-12-01 阿里巴巴集团控股有限公司 行业确定方法、对象获取方法和装置、客户端、服务器
CN107423362B (zh) * 2017-06-20 2021-06-08 创新先进技术有限公司 行业确定方法、对象获取方法和装置、客户端、服务器
CN110728113A (zh) * 2018-06-28 2020-01-24 北京金山办公软件股份有限公司 一种电子表格的信息筛选方法、装置及终端设备
CN109582412A (zh) * 2018-10-25 2019-04-05 平安科技(深圳)有限公司 产品展示方法、装置及计算机存储介质
CN109918202A (zh) * 2019-03-08 2019-06-21 上海七牛信息技术有限公司 信息处理方法、装置及存储介质
CN112488840A (zh) * 2019-09-12 2021-03-12 京东数字科技控股有限公司 信息输出方法和装置
CN113688905A (zh) * 2021-08-25 2021-11-23 中国互联网络信息中心 一种有害域名核验方法及装置

Similar Documents

Publication Publication Date Title
CN104484396A (zh) 网页信息的筛选方法和装置
CN103164804B (zh) 一种个性化的信息推送方法及装置
KR101770683B1 (ko) 소셜 네트워크 정보흐름 표시방법, 장치, 서버, 프로그램 및 컴퓨터가 판독가능한 기록매체
CN101999121B (zh) 推荐信息评价装置及推荐信息评价方法
CN103914545B (zh) 搜索展现方法及装置
US8583685B2 (en) Determination of category information using multiple stages
CN104317959A (zh) 基于社交平台的数据挖掘方法及装置
CN107169834A (zh) 一种基于大数据进行购物推荐的方法和设备
CN105488233A (zh) 阅读信息推荐方法和系统
CN105512180B (zh) 一种搜索推荐方法及装置
CN110163703B (zh) 一种分类模型建立方法、文案推送方法和服务器
CN103729777A (zh) 基于图像识别技术的网络购物方法、购物装置及购物系统
CN109447713A (zh) 一种基于知识图谱的推荐方法及装置
CN103136253A (zh) 获取信息的方法和装置
TW201606533A (zh) 模組化搜尋物件架構關聯之意向式搜尋結果
US20210319500A1 (en) Method and apparatus for entering review interface
CN105653675A (zh) 一种信息推荐的方法、装置、服务器以及系统
CN103365904A (zh) 一种广告信息搜索方法和系统
TW201602814A (zh) 模組化搜尋物件架構相關強化搜尋結果
CN104504086A (zh) 网页页面的聚类方法和装置
CN106293120A (zh) 表情输入方法及移动终端
CN104102733A (zh) 搜索内容提供方法和搜索引擎
CN112100221A (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
CN104216885B (zh) 静态和动态推荐理由自动结合的推荐系统及方法
CN105991583A (zh) 一种游戏应用推荐方法、应用服务器、终端及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150401