CN103761669A - 网络爬虫技术应用在网购上的方法 - Google Patents
网络爬虫技术应用在网购上的方法 Download PDFInfo
- Publication number
- CN103761669A CN103761669A CN201310754449.2A CN201310754449A CN103761669A CN 103761669 A CN103761669 A CN 103761669A CN 201310754449 A CN201310754449 A CN 201310754449A CN 103761669 A CN103761669 A CN 103761669A
- Authority
- CN
- China
- Prior art keywords
- commodities
- commodity
- online shopping
- server
- websites
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明公开了一种网络爬虫技术应用在网购上的方法,流程如下;输入需要购买商品的名称,服务器收索购物网站的URL,服务器对输入的商品名进行分类,然后在这些网站上抓取有用的信息,对输出的商品设定限定条件后输出,通过点击商品进行购买。本发明在网络爬虫技术的基础上,优化出了一种应用与网上购物的收索引擎,它将使用者所需要的同类商品全部抓取,然后就可以对商品的价格、性能进行比较,也可以设定限定条件输出,如价格,是否需要运费等,它可以帮助我们在网上轻松的购买到便宜又好的商品,为互联网购物做出了一定的贡献,且随着网购的兴起,它将有一个很大的市场。
Description
发明领域
本发明涉及一种网购过程中的同时浏览多个网站的方法,属于收索引擎技术领域。
背景技术
网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。现在网购已经很平常了,我们在网上选购商品时往往不能同时浏览多个网站,为我们对商品的比较带来了很大的困难。为此,我将网络爬虫技术,作一定的改进,来满足我们同时浏览多个购物网站的需求。
发明内容
本发明为解决目前在网上购物时无法同时浏览多个购物网站的问题,提供一种网络爬虫技术应用在网购上的方法。本发明包括以下步骤:
步骤一:输入需要购买商品的名称;
步骤二:服务器收索购物网站的URL;
步骤三:服务器对输入的商品名进行分类,然后在这些网站上抓取有用的信息;
步骤四:对输出的商品设定限定条件后输出;
步骤五:通过点击商品进行购买。
发明效果:本发明在网络爬虫技术的基础上,优化出了一种应用与网上购物的收索引擎,它将使用者所需要的同类商品全部抓取,然后就可以对商品的价格、性能进行比较,也可以设定限定条件输出,如价格,是否需要运费等,它可以帮助我们在网上轻松的购买到便宜又好的商品,为互联网购物做出了一定的贡献,且随着网购的兴起,它将有一个很大的市场。
附图说明
图1为网络爬虫技术应用在网购上的方法流程图。
具体实施方式
具体实施方式:参见网络爬虫技术应用在网购上的方法流程图1,本实施方式由以下步骤组成:
步骤一:输入需要购买商品的名称;
步骤二:服务器收索购物网站的URL;
步骤三:服务器对输入的商品名进行分类,然后在这些网站上抓取有用的信息;
步骤四:对输出的商品设定限定条件后输出;
步骤五:通过点击商品进行购买。
服务器不断抓取物网站的URL直到获取目标网页为止,服务器对输入的商品名进行分类,然后在这些网站上抓取有用的信息,该类信息为使用者输入的同类商品,对输出的商品设定限定条件后输出,该条件为颜色,价格,是否需要运费,点击商品进行购买需要购买者操作才可以。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将发明例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (5)
1.一种网络爬虫技术应用在网购上的方法,其特征在于它由以下步骤实现:
步骤一:输入需要购买商品的名称;
步骤二:服务器收索购物网站的URL;
步骤三:服务器对输入的商品名进行分类,然后在这些网站上抓取有用的信息;
步骤四:对输出的商品设定限定条件后输出;
步骤五:通过点击商品进行购买。
2.根据权利要求书1所述网络爬虫技术应用在网购上的方法,其特征在于:步骤二中所述服务器不断抓取物网站的URL直到获取目标网页为止。
3.根据权利要求书1所述网络爬虫技术应用在网购上的方法,其特征在于:步骤三中所述服务器对输入的商品名进行分类,然后在这些网站上抓取有用的信息,该类信息为使用者输入的同类商品。
4.根据权利要求书1所述网络爬虫技术应用在网购上的方法,其特征在于:步骤四中所述对输出的商品设定限定条件后输出,该条件为颜色,价格,是否需要运费。
5.根据权利要求书1所述网络爬虫技术应用在网购上的方法,其特征在于:步骤五中所述点击商品进行购买需要购买者操作才可以。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310754449.2A CN103761669A (zh) | 2013-12-31 | 2013-12-31 | 网络爬虫技术应用在网购上的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310754449.2A CN103761669A (zh) | 2013-12-31 | 2013-12-31 | 网络爬虫技术应用在网购上的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103761669A true CN103761669A (zh) | 2014-04-30 |
Family
ID=50528903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310754449.2A Pending CN103761669A (zh) | 2013-12-31 | 2013-12-31 | 网络爬虫技术应用在网购上的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103761669A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126697A (zh) * | 2016-06-30 | 2016-11-16 | 广州市皓轩软件科技有限公司 | 一种基于Web动态信息抓取技术的详情页面自动生成方法 |
CN106504061A (zh) * | 2016-10-31 | 2017-03-15 | 沈思远 | 一种极简购物网站交互系统和方法 |
CN107808325A (zh) * | 2017-10-26 | 2018-03-16 | 广州供电局有限公司 | 多电商商品信息实时采集系统及多电商并发实时比价方法 |
US11403693B1 (en) | 2021-02-19 | 2022-08-02 | Coupang Corp. | Method, electronic device, and non-transitory computer-readable recording medium for providing information on item |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102375856A (zh) * | 2010-08-23 | 2012-03-14 | 腾讯科技(深圳)有限公司 | 一种商品搜索方法和装置 |
CN102779133A (zh) * | 2011-05-12 | 2012-11-14 | 苏州同程旅游网络科技有限公司 | 基于多平台、多供应商的搜索比价方法 |
CN102968495A (zh) * | 2012-11-29 | 2013-03-13 | 河海大学 | 搜索对比关联购物信息的垂直搜索引擎及方法 |
-
2013
- 2013-12-31 CN CN201310754449.2A patent/CN103761669A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102375856A (zh) * | 2010-08-23 | 2012-03-14 | 腾讯科技(深圳)有限公司 | 一种商品搜索方法和装置 |
CN102779133A (zh) * | 2011-05-12 | 2012-11-14 | 苏州同程旅游网络科技有限公司 | 基于多平台、多供应商的搜索比价方法 |
CN102968495A (zh) * | 2012-11-29 | 2013-03-13 | 河海大学 | 搜索对比关联购物信息的垂直搜索引擎及方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126697A (zh) * | 2016-06-30 | 2016-11-16 | 广州市皓轩软件科技有限公司 | 一种基于Web动态信息抓取技术的详情页面自动生成方法 |
CN106504061A (zh) * | 2016-10-31 | 2017-03-15 | 沈思远 | 一种极简购物网站交互系统和方法 |
CN107808325A (zh) * | 2017-10-26 | 2018-03-16 | 广州供电局有限公司 | 多电商商品信息实时采集系统及多电商并发实时比价方法 |
US11403693B1 (en) | 2021-02-19 | 2022-08-02 | Coupang Corp. | Method, electronic device, and non-transitory computer-readable recording medium for providing information on item |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104463630B (zh) | 一种基于网购保险产品特性的产品推荐方法及系统 | |
CN102541862B (zh) | 跨网站的信息显示方法及系统 | |
US10043199B2 (en) | Method, device and system for publishing merchandise information | |
US20130339337A1 (en) | Auto tagging method and system | |
CN102693271A (zh) | 一种网络信息推荐方法及系统 | |
US11416482B2 (en) | Adaptive search refinement | |
CN105740380A (zh) | 数据融合方法及系统 | |
CN104572863A (zh) | 一种产品推荐方法及系统 | |
CN103761669A (zh) | 网络爬虫技术应用在网购上的方法 | |
US11409805B2 (en) | Computer implemented system and methods for implementing a search engine access point enhanced for suggested listing navigation | |
CN106504020A (zh) | 一种基于seo的智能网络营销系统 | |
CN102629265B (zh) | 一种建立网页数据库的方法及系统 | |
CN106959949A (zh) | 一种用于推荐系统的数据结构化处理方法 | |
CN105468618A (zh) | 一种网络爬虫论文查重法 | |
CN103744944A (zh) | 网络爬虫在抓取网页或数据时再过滤的方法 | |
US20170124161A1 (en) | Presentation of digital data | |
CN108446296B (zh) | 一种信息处理方法及装置 | |
JP2014006864A (ja) | 検索語自動完成と連動するプレビューコンテンツの提供方法 | |
CN103530351A (zh) | 一种网络数据信息的搜索方法 | |
CN101017482A (zh) | 网页搜寻结果的表列最佳化方法及使用该方法的系统 | |
CN105893559A (zh) | 一种数据推送方法及装置 | |
CN105354292A (zh) | 一种页面输出方法及装置 | |
CN104050174B (zh) | 一种个性化页面生成方法及装置 | |
CN104063453A (zh) | 一种基于url分析的营销关键词提取的方法 | |
CN101169861A (zh) | 基于网络浏览行为的用户倾向性建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140430 |
|
RJ01 | Rejection of invention patent application after publication |