CN110728418A - 一种废标率的统计方法 - Google Patents

一种废标率的统计方法 Download PDF

Info

Publication number
CN110728418A
CN110728418A CN201910791580.3A CN201910791580A CN110728418A CN 110728418 A CN110728418 A CN 110728418A CN 201910791580 A CN201910791580 A CN 201910791580A CN 110728418 A CN110728418 A CN 110728418A
Authority
CN
China
Prior art keywords
bid
information
text
rate
abandoning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910791580.3A
Other languages
English (en)
Inventor
余定杰
余佳骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Interconnection Large Data Technology Co Ltd
Original Assignee
Chengdu Interconnection Large Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Interconnection Large Data Technology Co Ltd filed Critical Chengdu Interconnection Large Data Technology Co Ltd
Priority to CN201910791580.3A priority Critical patent/CN110728418A/zh
Publication of CN110728418A publication Critical patent/CN110728418A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/08Auctions

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种废标率的统计方法,包括以下步骤:(1)服务器获取网络爬虫任务的配置文件和第一文本,所述配置文件内含有与从网络中爬虫与第一文本内匹配的关键词的信息;(2)服务器根据所述配置文件开启网络URL信息爬取,并将爬取的信息整合为待处理信息,服务器对所述待处理信息进行查重及删除重复内容处理后得到第二文本;(3)将所述第二文本与历史信息进行整合计算出废标公司的废标率并保存和输出。通过本发明提供的统计方法可统计废标率,用户可查看任意一家企业(包括用户自家企业)在可选时间范围内的废标率及其废标具体情况(废标原因、废标项目等),从而得出企业的投标质量,为提高各企业的投标效率及质量提供了助力效果。

Description

一种废标率的统计方法
技术领域
本发明涉及数据处理领域,具体涉及一种废标率的统计方法。
背景技术
随着网络技术发展,互联网上存在海量的数据。然而,建筑行业信息化相比其他行业架为薄弱,信息难以实现共享。现有建筑数据查询平台多为查询为主,无法对某特定公司的历史招投标、中标以及废标信息进行统计,尤其需要对多家公司进行对比,无从下手。
发明内容
本发明的目的在于提供一种废标率的统计方法,可对公司的历史招投标、中标以及废标进行统计,有组于多方位了解某公司。
为实现上述目的,本发明采用如下技术方案:
一种废标率的统计方法,包括以下步骤:
(1)服务器获取网络爬虫任务的配置文件和第一文本,所述配置文件内含有与从网络中爬虫与第一文本内匹配的关键词的信息,所述第一文本内含有招标公示、开标公示、竞争性谈判和采购议价信息;
(2)服务器根据所述配置文件开启网络URL信息爬取,并将爬取的信息整合为待处理信息,服务器对所述待处理信息进行查重及删除重复内容处理后得到第二文本,所述第二文本内含有项目名称、参标公司名称、中标公司名称和废标公司名称;
(3)将所述第二文本与历史信息进行整合计算出废标公司的废标率并保存和输出。
进一步地,所述废标率是指某特定公司的废标次数除以总投标次数。
进一步地,所述废标率是指某特定公司的废标次数除以中标次数。
进一步地,几个公司的废标率采用同样的计算方式进行计算废标率。
进一步地,所述废标率是按照一定时间段内进行计算的。
通过本发明提供的统计方法可统计废标率,用户可查看任意一家企业(包括用户自家企业)在可选时间范围内的废标率及其废标具体情况(废标原因、废标项目等),从而得出企业的投标质量,为提高各企业的投标效率及质量提供了助力效果。
具体实施方式
实施例1
本实施例提供的一种废标率的统计方法包括以下步骤:
(1)服务器获取网络爬虫任务的配置文件和第一文本,所述配置文件内含有与从网络中爬虫与第一文本内匹配的关键词的信息,所述第一文本内含有招标公示、开标公示、竞争性谈判和采购议价信息;本步骤是为了从网络中获取与第一文本内相似的信息,具体地,在服务器中配置文件,所述配置文件含有爬取信息的任务,基于与第一文本相似的文本,所述第一文本内至少含有招标公示、开标公示、竞争性谈判、采购议价信息等招投标常用的公示信息的关键字。
(2)服务器根据所述配置文件开启网络URL信息爬取,并将爬取的信息整合为待处理信息,本步骤是获取含有第一文本内关键词箱匹配的信息,并将信息进行爬取保存为待处理。
(3)服务器对所述待处理信息进行查重及删除重复内容处理后得到第二文本,所述第二文本内含有项目名称、参标公司名称、中标公司名称和废标公司名称;本步骤是为了查找爬取的重复的信息,避免因重复导致后续的数据统计不准确的情况,将重复的信息删除后得到第二文本,并将在第二文本中获取项目名称、参标公司名称、中标公司名称和废标公司名称等信息。
(4)将所述第二文本与历史信息进行整合计算出废标公司的废标率并保存和输出;将在第二本文中获取的信息与历史信息进行整合,参标公司找到历史信息中找到该公司,并更新参标信息以及参标次数,参标次数加1;中标公司找到历史信息中找到该公司,并更新中标信息以及中标次数,中标次数加1;废标公司找到历史信息中找到该公司,并更新废标信息以及废标次数,废标次数加1。
并根据更新的参标次数、中标次数以及废标次数重新计算出废标率,所述废标率是指某特定公司的在废标次数除以总投标次数(参标次数);或者某特定公司的在废标次数除以中标次数。需要说明的是,同时对几家公司的废标率进行评判时,所述废标率计算需一致。为了公司之间的公平,所述参投标的时间按照一定时间段内采集,因此废标率也是一段时间内的废标率,通常采用近五年的招投标数据来进行评判。
所述保存的信息不仅包括更新后的数据信息还包括爬取后经过进行查重及删除重复内容处理后得到第二文本,以供后续对这家公司的中标信息或者废标信息等查询。
以上所述仅是本发明优选的实施方式,但本发明的保护范围并不局限于此,任何基于本发明所提供的技术方案和发明构思进行的改造和替换都应涵盖在本发明的保护范围内。

Claims (5)

1.一种废标率的统计方法,其特征在于包括以下步骤:
(1)服务器获取网络爬虫任务的配置文件和第一文本,所述配置文件内含有与从网络中爬虫与第一文本内匹配的关键词的信息,所述第一文本内含有招标公示、开标公示、竞争性谈判和采购议价信息;
(2)服务器根据所述配置文件开启网络URL信息爬取,并将爬取的信息整合为待处理信息,服务器对所述待处理信息进行查重及删除重复内容处理后得到第二文本,所述第二文本内含有项目名称、参标公司名称、中标公司名称和废标公司名称;
(3)将所述第二文本与历史信息进行整合计算出废标公司的废标率并保存和输出。
2.根据权利要求1所述的废标率的统计方法,其特征在于:所述废标率是指某特定公司的废标次数除以总投标次数。
3.根据权利要求1所述的废标率的统计方法,其特征在于:所述废标率是指某特定公司的废标次数除以中标次数。
4.根据权利要求2或者3所述的废标率的统计方法,其特征在于:几个公司的废标率采用同样的计算方式进行计算废标率。
5.根据权利要求1所述的废标率的统计方法,其特征在于:所述废标率是按照一定时间段内进行计算的。
CN201910791580.3A 2019-08-26 2019-08-26 一种废标率的统计方法 Pending CN110728418A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910791580.3A CN110728418A (zh) 2019-08-26 2019-08-26 一种废标率的统计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910791580.3A CN110728418A (zh) 2019-08-26 2019-08-26 一种废标率的统计方法

Publications (1)

Publication Number Publication Date
CN110728418A true CN110728418A (zh) 2020-01-24

Family

ID=69217133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910791580.3A Pending CN110728418A (zh) 2019-08-26 2019-08-26 一种废标率的统计方法

Country Status (1)

Country Link
CN (1) CN110728418A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114648393A (zh) * 2022-05-19 2022-06-21 四川隧唐科技股份有限公司 一种应用于招投标的数据挖掘方法、系统及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015194955A (ja) * 2014-03-31 2015-11-05 株式会社ナビット 入札情報検索システム
CN107590236A (zh) * 2017-09-09 2018-01-16 杭州数立方征信有限公司 一种面向建筑施工企业的大数据采集方法和系统
CN108415969A (zh) * 2018-02-08 2018-08-17 湖南慧集网络科技有限责任公司 一种招标信息检索分析方法及系统
CN109002508A (zh) * 2018-07-01 2018-12-14 东莞市华睿电子科技有限公司 一种基于网络爬虫的文本信息爬取方法
CN110046984A (zh) * 2019-03-01 2019-07-23 安徽省优质采科技发展有限责任公司 企业信用评级系统及评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015194955A (ja) * 2014-03-31 2015-11-05 株式会社ナビット 入札情報検索システム
CN107590236A (zh) * 2017-09-09 2018-01-16 杭州数立方征信有限公司 一种面向建筑施工企业的大数据采集方法和系统
CN108415969A (zh) * 2018-02-08 2018-08-17 湖南慧集网络科技有限责任公司 一种招标信息检索分析方法及系统
CN109002508A (zh) * 2018-07-01 2018-12-14 东莞市华睿电子科技有限公司 一种基于网络爬虫的文本信息爬取方法
CN110046984A (zh) * 2019-03-01 2019-07-23 安徽省优质采科技发展有限责任公司 企业信用评级系统及评价方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114648393A (zh) * 2022-05-19 2022-06-21 四川隧唐科技股份有限公司 一种应用于招投标的数据挖掘方法、系统及设备

Similar Documents

Publication Publication Date Title
CN106530188B (zh) 在线叫车服务平台中司机的接单概率评价方法和装置
CN100520776C (zh) 模糊重复的鲁棒检测器
US7318056B2 (en) System and method for performing click stream analysis
CN104572889B (zh) 一种搜索词推荐方法、装置和系统
CN102541893B (zh) 关键词分析方法及装置
US20130297619A1 (en) Social media profiling
WO2004081709A3 (en) Employment management tool and method
CN107122481B (zh) 新闻热度实时在线预测方法
US20050267940A1 (en) System and method for managing an online social network
CN1233801A (zh) 消息代理装置、方法及计算机程序产品
CN104917627B (zh) 一种用于大型服务器集群的日志集群扫描与分析方法
US7472095B2 (en) Methods and apparatus for automatic classification of text messages into plural categories
US20050228642A1 (en) Efficient capitalization through user modeling
CN1755682A (zh) 使用点击距离对搜索结果分级的系统和方法
US20110314009A1 (en) Method and Device for Extracting Characteristic Relation Circle From Network
CN106447371A (zh) 一种网页广告的推荐方法和装置
CN112347377A (zh) Ip地址段查找方法与业务调度方法、装置、电子设备
CN112800286B (zh) 用户关系链的构建方法、装置及电子设备
CN102904918B (zh) 网络媒介信息的展示处理方法和系统
CN110728418A (zh) 一种废标率的统计方法
US7844601B2 (en) Quality of service feedback for technology-neutral data reporting
US20110093867A1 (en) System and Method for Optimizing Event Predicate Processing
CN108694213A (zh) 日志文件的生成方法、检索方法及装置
CN109828970B (zh) 一种信息处理方法、装置及电子设备
CN110807702A (zh) 贷后信息的管理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200124