CN110728418A - 一种废标率的统计方法 - Google Patents
一种废标率的统计方法 Download PDFInfo
- Publication number
- CN110728418A CN110728418A CN201910791580.3A CN201910791580A CN110728418A CN 110728418 A CN110728418 A CN 110728418A CN 201910791580 A CN201910791580 A CN 201910791580A CN 110728418 A CN110728418 A CN 110728418A
- Authority
- CN
- China
- Prior art keywords
- bid
- information
- text
- rate
- abandoning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 239000002699 waste material Substances 0.000 title claims abstract description 8
- 230000009193 crawling Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000007619 statistical method Methods 0.000 claims abstract description 6
- 230000002860 competitive effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 239000010813 municipal solid waste Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种废标率的统计方法,包括以下步骤:(1)服务器获取网络爬虫任务的配置文件和第一文本,所述配置文件内含有与从网络中爬虫与第一文本内匹配的关键词的信息;(2)服务器根据所述配置文件开启网络URL信息爬取,并将爬取的信息整合为待处理信息,服务器对所述待处理信息进行查重及删除重复内容处理后得到第二文本;(3)将所述第二文本与历史信息进行整合计算出废标公司的废标率并保存和输出。通过本发明提供的统计方法可统计废标率,用户可查看任意一家企业(包括用户自家企业)在可选时间范围内的废标率及其废标具体情况(废标原因、废标项目等),从而得出企业的投标质量,为提高各企业的投标效率及质量提供了助力效果。
Description
技术领域
本发明涉及数据处理领域,具体涉及一种废标率的统计方法。
背景技术
随着网络技术发展,互联网上存在海量的数据。然而,建筑行业信息化相比其他行业架为薄弱,信息难以实现共享。现有建筑数据查询平台多为查询为主,无法对某特定公司的历史招投标、中标以及废标信息进行统计,尤其需要对多家公司进行对比,无从下手。
发明内容
本发明的目的在于提供一种废标率的统计方法,可对公司的历史招投标、中标以及废标进行统计,有组于多方位了解某公司。
为实现上述目的,本发明采用如下技术方案:
一种废标率的统计方法,包括以下步骤:
(1)服务器获取网络爬虫任务的配置文件和第一文本,所述配置文件内含有与从网络中爬虫与第一文本内匹配的关键词的信息,所述第一文本内含有招标公示、开标公示、竞争性谈判和采购议价信息;
(2)服务器根据所述配置文件开启网络URL信息爬取,并将爬取的信息整合为待处理信息,服务器对所述待处理信息进行查重及删除重复内容处理后得到第二文本,所述第二文本内含有项目名称、参标公司名称、中标公司名称和废标公司名称;
(3)将所述第二文本与历史信息进行整合计算出废标公司的废标率并保存和输出。
进一步地,所述废标率是指某特定公司的废标次数除以总投标次数。
进一步地,所述废标率是指某特定公司的废标次数除以中标次数。
进一步地,几个公司的废标率采用同样的计算方式进行计算废标率。
进一步地,所述废标率是按照一定时间段内进行计算的。
通过本发明提供的统计方法可统计废标率,用户可查看任意一家企业(包括用户自家企业)在可选时间范围内的废标率及其废标具体情况(废标原因、废标项目等),从而得出企业的投标质量,为提高各企业的投标效率及质量提供了助力效果。
具体实施方式
实施例1
本实施例提供的一种废标率的统计方法包括以下步骤:
(1)服务器获取网络爬虫任务的配置文件和第一文本,所述配置文件内含有与从网络中爬虫与第一文本内匹配的关键词的信息,所述第一文本内含有招标公示、开标公示、竞争性谈判和采购议价信息;本步骤是为了从网络中获取与第一文本内相似的信息,具体地,在服务器中配置文件,所述配置文件含有爬取信息的任务,基于与第一文本相似的文本,所述第一文本内至少含有招标公示、开标公示、竞争性谈判、采购议价信息等招投标常用的公示信息的关键字。
(2)服务器根据所述配置文件开启网络URL信息爬取,并将爬取的信息整合为待处理信息,本步骤是获取含有第一文本内关键词箱匹配的信息,并将信息进行爬取保存为待处理。
(3)服务器对所述待处理信息进行查重及删除重复内容处理后得到第二文本,所述第二文本内含有项目名称、参标公司名称、中标公司名称和废标公司名称;本步骤是为了查找爬取的重复的信息,避免因重复导致后续的数据统计不准确的情况,将重复的信息删除后得到第二文本,并将在第二文本中获取项目名称、参标公司名称、中标公司名称和废标公司名称等信息。
(4)将所述第二文本与历史信息进行整合计算出废标公司的废标率并保存和输出;将在第二本文中获取的信息与历史信息进行整合,参标公司找到历史信息中找到该公司,并更新参标信息以及参标次数,参标次数加1;中标公司找到历史信息中找到该公司,并更新中标信息以及中标次数,中标次数加1;废标公司找到历史信息中找到该公司,并更新废标信息以及废标次数,废标次数加1。
并根据更新的参标次数、中标次数以及废标次数重新计算出废标率,所述废标率是指某特定公司的在废标次数除以总投标次数(参标次数);或者某特定公司的在废标次数除以中标次数。需要说明的是,同时对几家公司的废标率进行评判时,所述废标率计算需一致。为了公司之间的公平,所述参投标的时间按照一定时间段内采集,因此废标率也是一段时间内的废标率,通常采用近五年的招投标数据来进行评判。
所述保存的信息不仅包括更新后的数据信息还包括爬取后经过进行查重及删除重复内容处理后得到第二文本,以供后续对这家公司的中标信息或者废标信息等查询。
以上所述仅是本发明优选的实施方式,但本发明的保护范围并不局限于此,任何基于本发明所提供的技术方案和发明构思进行的改造和替换都应涵盖在本发明的保护范围内。
Claims (5)
1.一种废标率的统计方法,其特征在于包括以下步骤:
(1)服务器获取网络爬虫任务的配置文件和第一文本,所述配置文件内含有与从网络中爬虫与第一文本内匹配的关键词的信息,所述第一文本内含有招标公示、开标公示、竞争性谈判和采购议价信息;
(2)服务器根据所述配置文件开启网络URL信息爬取,并将爬取的信息整合为待处理信息,服务器对所述待处理信息进行查重及删除重复内容处理后得到第二文本,所述第二文本内含有项目名称、参标公司名称、中标公司名称和废标公司名称;
(3)将所述第二文本与历史信息进行整合计算出废标公司的废标率并保存和输出。
2.根据权利要求1所述的废标率的统计方法,其特征在于:所述废标率是指某特定公司的废标次数除以总投标次数。
3.根据权利要求1所述的废标率的统计方法,其特征在于:所述废标率是指某特定公司的废标次数除以中标次数。
4.根据权利要求2或者3所述的废标率的统计方法,其特征在于:几个公司的废标率采用同样的计算方式进行计算废标率。
5.根据权利要求1所述的废标率的统计方法,其特征在于:所述废标率是按照一定时间段内进行计算的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910791580.3A CN110728418A (zh) | 2019-08-26 | 2019-08-26 | 一种废标率的统计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910791580.3A CN110728418A (zh) | 2019-08-26 | 2019-08-26 | 一种废标率的统计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110728418A true CN110728418A (zh) | 2020-01-24 |
Family
ID=69217133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910791580.3A Pending CN110728418A (zh) | 2019-08-26 | 2019-08-26 | 一种废标率的统计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110728418A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114648393A (zh) * | 2022-05-19 | 2022-06-21 | 四川隧唐科技股份有限公司 | 一种应用于招投标的数据挖掘方法、系统及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015194955A (ja) * | 2014-03-31 | 2015-11-05 | 株式会社ナビット | 入札情報検索システム |
CN107590236A (zh) * | 2017-09-09 | 2018-01-16 | 杭州数立方征信有限公司 | 一种面向建筑施工企业的大数据采集方法和系统 |
CN108415969A (zh) * | 2018-02-08 | 2018-08-17 | 湖南慧集网络科技有限责任公司 | 一种招标信息检索分析方法及系统 |
CN109002508A (zh) * | 2018-07-01 | 2018-12-14 | 东莞市华睿电子科技有限公司 | 一种基于网络爬虫的文本信息爬取方法 |
CN110046984A (zh) * | 2019-03-01 | 2019-07-23 | 安徽省优质采科技发展有限责任公司 | 企业信用评级系统及评价方法 |
-
2019
- 2019-08-26 CN CN201910791580.3A patent/CN110728418A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015194955A (ja) * | 2014-03-31 | 2015-11-05 | 株式会社ナビット | 入札情報検索システム |
CN107590236A (zh) * | 2017-09-09 | 2018-01-16 | 杭州数立方征信有限公司 | 一种面向建筑施工企业的大数据采集方法和系统 |
CN108415969A (zh) * | 2018-02-08 | 2018-08-17 | 湖南慧集网络科技有限责任公司 | 一种招标信息检索分析方法及系统 |
CN109002508A (zh) * | 2018-07-01 | 2018-12-14 | 东莞市华睿电子科技有限公司 | 一种基于网络爬虫的文本信息爬取方法 |
CN110046984A (zh) * | 2019-03-01 | 2019-07-23 | 安徽省优质采科技发展有限责任公司 | 企业信用评级系统及评价方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114648393A (zh) * | 2022-05-19 | 2022-06-21 | 四川隧唐科技股份有限公司 | 一种应用于招投标的数据挖掘方法、系统及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106530188B (zh) | 在线叫车服务平台中司机的接单概率评价方法和装置 | |
CN100520776C (zh) | 模糊重复的鲁棒检测器 | |
US7318056B2 (en) | System and method for performing click stream analysis | |
CN104572889B (zh) | 一种搜索词推荐方法、装置和系统 | |
CN102541893B (zh) | 关键词分析方法及装置 | |
US20130297619A1 (en) | Social media profiling | |
WO2004081709A3 (en) | Employment management tool and method | |
CN107122481B (zh) | 新闻热度实时在线预测方法 | |
US20050267940A1 (en) | System and method for managing an online social network | |
CN1233801A (zh) | 消息代理装置、方法及计算机程序产品 | |
CN104917627B (zh) | 一种用于大型服务器集群的日志集群扫描与分析方法 | |
US7472095B2 (en) | Methods and apparatus for automatic classification of text messages into plural categories | |
US20050228642A1 (en) | Efficient capitalization through user modeling | |
CN1755682A (zh) | 使用点击距离对搜索结果分级的系统和方法 | |
US20110314009A1 (en) | Method and Device for Extracting Characteristic Relation Circle From Network | |
CN106447371A (zh) | 一种网页广告的推荐方法和装置 | |
CN112347377A (zh) | Ip地址段查找方法与业务调度方法、装置、电子设备 | |
CN112800286B (zh) | 用户关系链的构建方法、装置及电子设备 | |
CN102904918B (zh) | 网络媒介信息的展示处理方法和系统 | |
CN110728418A (zh) | 一种废标率的统计方法 | |
US7844601B2 (en) | Quality of service feedback for technology-neutral data reporting | |
US20110093867A1 (en) | System and Method for Optimizing Event Predicate Processing | |
CN108694213A (zh) | 日志文件的生成方法、检索方法及装置 | |
CN109828970B (zh) | 一种信息处理方法、装置及电子设备 | |
CN110807702A (zh) | 贷后信息的管理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200124 |