CN107844601A - 基于网络爬虫的招投标信息筛选系统与方法 - Google Patents
基于网络爬虫的招投标信息筛选系统与方法 Download PDFInfo
- Publication number
- CN107844601A CN107844601A CN201711185335.5A CN201711185335A CN107844601A CN 107844601 A CN107844601 A CN 107844601A CN 201711185335 A CN201711185335 A CN 201711185335A CN 107844601 A CN107844601 A CN 107844601A
- Authority
- CN
- China
- Prior art keywords
- bid
- user
- web crawlers
- information
- screening system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于网络爬虫的招投标信息筛选系统与方法,包括:用户需求参数设置模块,根据用户的需求,设置相应的参数;网络爬虫模块,利用网络爬虫对各大主流招投标信息网站的招投标项目信息进行有针对性的数据爬取;可视化模块,将爬取的招投标信息,通过简洁明了的方式展示给企业用户;招投标信息数据库,将所获取的招投标信息录入数据库,以便分析处理。通过本发明,能够快速、准确获取符合用户需求的招投标信息,可有效地节省企业用户的人力和时间成本。
Description
技术领域
本发明涉及网络爬虫技术领域,具体涉及一种基于网络爬虫的招投标信息筛选系统与方法。
背景技术
招投标,是一种国际上普遍运用的、有组织的市场交易行为,随着中国市场化进程的加速,越来越多的企业开始采用网络招标的方式进行货物采购和工程项目招标,进而扩大信息来源渠道、提高效率。而且比较偏向于信息来源正规的官网,例如中国招标网、中国招标投标协会、中国采购与招标网、中国招标周刊网、政府采购信息网、中央国家机关政府采购中心、全国人大机关采购中心等等,但是这些网站上发布的招投标信息不一定刚好满足每一家企业的需要。
面对快速发展、竞争激烈的市场经济,无论是大企业还是中小公司均不能做到独善其身,所以,无论是对销售员工而言还是公司领导而言,快速、准确又不丢标的获取最新鲜的招投标信息,就成了一个非常迫切的问题。某些企业为了解决这一问题,花费大量的人力和时间天天盯着各大招标官网并以最快的速度参与竞标。
发明内容
本发明克服了现有技术的不足,提供一种基于网络爬虫的招投标信息筛选系统与方法,用于快速、准确获取符合用户需求的招投标信息。
考虑到现有技术的上述问题,根据本发明公开的一个方面,本发明采用以下技术方案:
一种基于网络爬虫的招投标信息筛选系统,包括:
需求参数设置模块,用于根据用户的需求,设置待爬取的招投标信息的相应参数;
网络爬虫模块,用于根据用户对需求参数设置模块设定的参数,对其页面源代码进行解析,获取符合用户要求的网页内相关的信息;
可视化模块,用于展示获取到的招投标信息数据。
为了更好地实现本发明,进一步的技术方案是:
根据本发明的一个实施方案,所述需求参数设置模块设定的参数包括招投标信息的区域、时间范围和类型。
根据本发明的另一个实施方案,还包括:
招投标信息数据库,用于接收所述网络爬虫模块输入的其获取到的招投标信息数据。
根据本发明的另一个实施方案,所述招投标信息数据库记载的数据包含每次用户执行招投标信息筛选操作后的数据。
根据本发明的另一个实施方案,所述可视化模块展示的方式包括:
通过Web端进行直观展示,或通过Excel表格展示。
根据本发明的另一个实施方案,所述可视化模块展示的内容包括:
用户所设置的关键词、类型、区域和时间范围。
根据本发明的另一个实施方案,所述可视化模块展示的内容包括:
满足用户要求的招投标信息标题。
根据本发明的另一个实施方案,所述可视化模块展示的内容包括:
满足用户要求的招投标信息对应的网址超链接。
根据本发明的另一个实施方案,所述网络爬虫模块以宽度优先的模式爬取网页。
本发明还可以是:
一种基于网络爬虫的招投标信息筛选方法,包括:
用户设置待爬取的招投标信息的相应参数;
根据用户设置待爬取的招投标信息的相应参数,对网页进行爬取;
针对每一个获取到的网页,根据用户设定的参数,对其页面源代码进行解析,获取符合用户要求的网页内的相关信息;
将获取的数据输出到可视化模块进行展示。
与现有技术相比,本发明的有益效果之一是:
本发明的一种基于网络爬虫的招投标信息筛选系统与方法,能够快速、准确获取符合用户需求的招投标信息,可有效地节省企业用户的人力和时间成本。
附图说明
为了更清楚的说明本申请文件实施例或现有技术中的技术方案,下面将对实施例或现有技术的描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅是对本申请文件中一些实施例的参考,对于本领域技术人员来讲,在不付出创造性劳动的情况下,还可以根据这些附图得到其它的附图。
图1示出了根据本发明一个实施例的系统框图。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
如图1所示,图1示出了根据本发明一个实施例的系统框图,一种基于网络爬虫的招投标信息筛选系统,其利用网络爬虫技术,根据用户企业的自身需求,用户可以通过设置相应的关键词、时间和区域等参数信息,有针对性的从各大主流招标信息网站中爬取用户所需要的招投标信息(主要包括项目名称、发布时间、项目信息的具体网址等),从而有效地节省企业用户的人力和时间成本。具体方案包括:
需求参数设置模块111,用于根据用户需求,设置待爬取的招投标信息的相应参数,该设置的参数可以是关键词、时间和区域等参数信息,。
网络爬虫模块112,用于根据用户对需求参数设置模块111设定的参数,该设定的参数包括招投标信息的区域、时间范围和类型等,对其页面源代码进行解析,获取符合用户要求的网页内相关的信息。优选地,需求参数设置模块111将设置的待爬取的招投标信息网址导入,依次从各个网址开始,以宽度优先的模式爬取网页。
可视化模块113,用于展示获取到的招投标信息数据,其展示的方式包括:通过Web端进行直观展示,或通过简洁的Excel表格展示等;展示的内容包括:1)用户所设置的关键词、类型、区域和时间范围等;2)满足用户要求的招投标信息标题;3)满足用户要求的招投标信息对应的网址超链接。
招投标信息数据库100,用于接收所述网络爬虫模块112输入的其获取到的招投标信息数据,以便分析处理;该招投标信息数据库100记载的数据包含每次用户执行招投标信息筛选操作后的数据,以便于用户后续查询处理分析工作等。
对于招投标信息数据库100的录入,每次爬取的招投标信息去除已有的重复数据并录入该招投标信息数据库100。
另一实施例,一种基于网络爬虫的招投标信息筛选方法,包括:
步骤S01:用户设置待爬取的招投标信息的相应参数。
步骤S02:根据用户设置待爬取的招投标信息的相应参数,对网页进行爬取;优选地,以宽度优先的模式爬取网页。
步骤S03:针对每一个获取到的网页,根据用户设定的参数,对其页面源代码进行解析,获取符合用户要求的网页内的相关信息,如:相关招投标信息的标题与对于的网址链接。
步骤S04:将获取的数据输出到可视化模块113进行展示。
综上,本发明的基于网络爬虫的招投标项目信息获取方法,根据用户企业的自身需求,用户可以通过设置相应的关键词、时间和区域等参数信息,有针对性的从各大主流招标信息网站中爬取用户所需要的招投标信息(主要包括项目名称、发布时间、项目信息的具体网址等),从而有效地节省企业用户的人力和时间成本。
在本说明书中所谈到的“一个实施例”、“另一个实施例”、“实施例”、等,指的是结合该实施例描述的具体特征、结构或者特点包括在本申请概括性描述的至少一个实施例中。在说明书中多个地方出现同种表述不是一定指的是同一个实施例。进一步来说,结合任一实施例描述一个具体特征、结构或者特点时,所要主张的是结合其他实施例来实现这种特征、结构或者特点也落在本发明的范围内。
尽管这里参照本发明的多个解释性实施例对本发明进行了描述,但是,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。更具体地说,在本申请公开和权利要求的范围内,可以对主题组合布局的组成部件和/或布局进行多种变型和改进。除了对组成部件和/或布局进行的变型和改进外,对于本领域技术人员来说,其他的用途也将是明显的。
Claims (10)
1.一种基于网络爬虫的招投标信息筛选系统,其特征在于包括:
需求参数设置模块,用于根据用户的需求,设置待爬取的招投标信息的相应参数;
网络爬虫模块,用于根据用户对需求参数设置模块设定的参数,对其页面源代码进行解析,获取符合用户要求的网页内相关的信息;
可视化模块,用于展示获取到的招投标信息数据。
2.根据权利要求1所述的基于网络爬虫的招投标信息筛选系统,其特征在于所述需求参数设置模块设定的参数包括招投标信息的区域、时间范围和类型。
3.根据权利要求1所述的基于网络爬虫的招投标信息筛选系统,其特征在于还包括:
招投标信息数据库,用于接收所述网络爬虫模块输入的其获取到的招投标信息数据。
4.根据权利要求3所述的基于网络爬虫的招投标信息筛选系统,其特征在于所述招投标信息数据库记载的数据包含每次用户执行招投标信息筛选操作后的数据。
5.根据权利要求1所述的基于网络爬虫的招投标信息筛选系统,其特征在于所述可视化模块展示的方式包括:
通过Web端进行直观展示,或通过Excel表格展示。
6.根据权利要求1所述的基于网络爬虫的招投标信息筛选系统,其特征在于所述可视化模块展示的内容包括:
用户所设置的关键词、类型、区域和时间范围。
7.根据权利要求1所述的基于网络爬虫的招投标信息筛选系统,其特征在于所述可视化模块展示的内容包括:
满足用户要求的招投标信息标题。
8.根据权利要求1所述的基于网络爬虫的招投标信息筛选系统,其特征在于所述可视化模块展示的内容包括:
满足用户要求的招投标信息对应的网址超链接。
9.根据权利要求1所述的基于网络爬虫的招投标信息筛选系统,其特征在于所述网络爬虫模块以宽度优先的模式爬取网页。
10.一种实现如权利要求1所述系统的基于网络爬虫的招投标信息筛选方法,其特征在于包括:
用户设置待爬取的招投标信息的相应参数;
根据用户设置待爬取的招投标信息的相应参数,对网页进行爬取;
针对每一个获取到的网页,根据用户设定的参数,对其页面源代码进行解析,获取符合用户要求的网页内的相关信息;
将获取的数据输出到可视化模块进行展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711185335.5A CN107844601A (zh) | 2017-11-23 | 2017-11-23 | 基于网络爬虫的招投标信息筛选系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711185335.5A CN107844601A (zh) | 2017-11-23 | 2017-11-23 | 基于网络爬虫的招投标信息筛选系统与方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107844601A true CN107844601A (zh) | 2018-03-27 |
Family
ID=61679408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711185335.5A Pending CN107844601A (zh) | 2017-11-23 | 2017-11-23 | 基于网络爬虫的招投标信息筛选系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107844601A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020226A (zh) * | 2018-08-20 | 2019-07-16 | 中国平安人寿保险股份有限公司 | 基于大数据的数据展示方法、用户设备、存储介质及装置 |
CN110020092A (zh) * | 2018-11-20 | 2019-07-16 | 皮商云集(厦门)科技有限公司 | 基于网络爬虫的皮革行业数据中心系统 |
CN111047268A (zh) * | 2018-10-11 | 2020-04-21 | 上海汽车集团股份有限公司 | 一种投标方法及装置 |
CN112035594A (zh) * | 2019-10-29 | 2020-12-04 | 河南拓普计算机网络工程有限公司 | 招投标信息抽取结果筛选系统及方法 |
CN112685620A (zh) * | 2020-12-31 | 2021-04-20 | 山东奥邦交通设施工程有限公司 | 一种招投标信息处理方法、系统、可读存储介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999549A (zh) * | 2012-09-25 | 2013-03-27 | 金博 | 一种实现网络爬虫任务的方法 |
CN104978408A (zh) * | 2015-08-05 | 2015-10-14 | 许昌学院 | 基于Berkeley DB数据库的主题爬虫系统 |
CN105468664A (zh) * | 2015-05-12 | 2016-04-06 | 北京众标网络科技有限公司 | 一种信息采集方法及装置 |
CN105718580A (zh) * | 2016-01-25 | 2016-06-29 | 江苏国泰新点软件有限公司 | 一种提供招投标信息搜索服务的方法和装置 |
-
2017
- 2017-11-23 CN CN201711185335.5A patent/CN107844601A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999549A (zh) * | 2012-09-25 | 2013-03-27 | 金博 | 一种实现网络爬虫任务的方法 |
CN105468664A (zh) * | 2015-05-12 | 2016-04-06 | 北京众标网络科技有限公司 | 一种信息采集方法及装置 |
CN104978408A (zh) * | 2015-08-05 | 2015-10-14 | 许昌学院 | 基于Berkeley DB数据库的主题爬虫系统 |
CN105718580A (zh) * | 2016-01-25 | 2016-06-29 | 江苏国泰新点软件有限公司 | 一种提供招投标信息搜索服务的方法和装置 |
Non-Patent Citations (1)
Title |
---|
霍雨佳: "《大数据科学》", 31 July 2017 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020226A (zh) * | 2018-08-20 | 2019-07-16 | 中国平安人寿保险股份有限公司 | 基于大数据的数据展示方法、用户设备、存储介质及装置 |
CN111047268A (zh) * | 2018-10-11 | 2020-04-21 | 上海汽车集团股份有限公司 | 一种投标方法及装置 |
CN110020092A (zh) * | 2018-11-20 | 2019-07-16 | 皮商云集(厦门)科技有限公司 | 基于网络爬虫的皮革行业数据中心系统 |
CN112035594A (zh) * | 2019-10-29 | 2020-12-04 | 河南拓普计算机网络工程有限公司 | 招投标信息抽取结果筛选系统及方法 |
CN112685620A (zh) * | 2020-12-31 | 2021-04-20 | 山东奥邦交通设施工程有限公司 | 一种招投标信息处理方法、系统、可读存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107844601A (zh) | 基于网络爬虫的招投标信息筛选系统与方法 | |
CN106407208B (zh) | 一种城市管理本体知识库的构建方法及系统 | |
CN103294781B (zh) | 一种用于处理页面数据的方法与设备 | |
CN110196848B (zh) | 一种面向公共资源交易数据的清洗去重方法及其系统 | |
CN109472568A (zh) | 一种区块链交易方法、装置、管理系统、设备及存储介质 | |
CN105354770A (zh) | 一种线路类旅游产品的实时比价方法 | |
CN108335110A (zh) | 聊天信息处理方法及装置 | |
CN102456057A (zh) | 基于网上交易平台的检索方法、装置和服务器 | |
CN107862555A (zh) | 基于指数平滑的预测系统与方法 | |
CN104881817A (zh) | 一种制造业工艺数据云平台的实现方法 | |
CN116361367A (zh) | 一种高效发布招聘信息的内容识别系统及方法 | |
CN105574764A (zh) | 一种知识产权评估系统 | |
LIANG | Application of blockchain technology in smart tourism | |
CN110019252A (zh) | 信息处理的方法、装置及电子设备 | |
CN104616168A (zh) | 一种营销工具合法性校验的方法及装置 | |
WO2020173148A1 (zh) | 一种订单自动生成方法及系统、存储介质 | |
WO2015192519A1 (zh) | 竞价排名方法及装置 | |
CN106708838A (zh) | 用于流数据查询的方法和装置 | |
Chen | The development dilemma and countermeasures of Chinese cross-border e-commerce enterprises under the background of big data | |
Abbasi | E-Commerce development in Iran | |
Kong | China’s E-commerce Development and Its Implication | |
CN109670989A (zh) | 一种专利侵权提醒系统 | |
Elhenawy et al. | A heuristic algorithm for rebalancing large-scale bike sharing systems using multiple trucks | |
CN107451218B (zh) | 网评自动发布方法及装置 | |
Yang et al. | Research on Development Status and Problems of Rural E-Commerce Logistics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180327 |