CN112884559A - 一种围标检测方法、装置、设备及存储介质 - Google Patents
一种围标检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112884559A CN112884559A CN202110341422.5A CN202110341422A CN112884559A CN 112884559 A CN112884559 A CN 112884559A CN 202110341422 A CN202110341422 A CN 202110341422A CN 112884559 A CN112884559 A CN 112884559A
- Authority
- CN
- China
- Prior art keywords
- group
- bidding
- data
- items
- bid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000001514 detection method Methods 0.000 claims abstract description 38
- 238000007418 data mining Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000005065 mining Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 230000006399 behavior Effects 0.000 description 19
- 230000000875 corresponding effect Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Fuzzy Systems (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种围标检测方法、装置、设备及介质,包括:获取招投标历史数据,并利用数据挖掘算法对招投标历史数据进行处理,得到第一群体;基于招投标历史数据,确定出第一群体中每个群体对应的指标数据,并从第一群体中提取出指标数据满足预设条件的群体,得到第二群体;基于第二群体对待检测投标项目的投标人进行检测,以确定待检测项目是否为围标项目。本申请先利用数据挖掘算法对招投标历史数据进行数据挖掘,得到频繁抱团投标的投标人的第一群体,然后从中确定出指标数据满足预设条件的第二群体,进而根据第二群体对待检测投标项目的投标人进行检测,以确定待检测项目是否为围标项目,提高了对围标群体的检测效率,降低漏检率及误检率。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种围标检测方法、装置、设备及存储介质。
背景技术
围标行为的识别与治理工作一直是国内外招标投标领域关注的热点问题之一。国内外众多学者在优化招投标机制、完善招标投标制度的法律架构、报价策略等方面展开了大量的研究工作。招投标监管部门在围标治理实践中,也总结了许多相关经验。
然而,传统的识别手段更多地依靠招投标项目的评审专家人工判断,依赖于专家的围标识别经验是否丰富。而围标表现多样,且行为隐蔽,依靠传统识别手段很难完全发现,使得招标投标主体围标依然屡禁不止,监管部门对招投标的事后监管困难重重,围标行为的治理效果不尽如人意。
发明内容
有鉴于此,本发明的目的在于提供一种围标方法、装置、设备及存储介质,能够提高对围标群体的检测效率,降低漏检率及误检率。其具体方案如下:
本申请的第一方面提供了一种围标检测方法,包括:
获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人的群体的集合;
基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率;
基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。
可选的,所述获取招投标历史数据,包括:
获取历史招投标项目信息、参与项目的投标人信息、项目中标人信息,以得到招投标历史数据。
可选的,所述利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体,包括:
利用频繁项集挖掘算法对所述招投标历史数据进行处理,以得到第一群体。
可选的,所述利用基于频繁项集的数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体,包括:
利用所述招投标历史数据构建事务数据集;其中,所述事务数据集以所述招投标历史数据中每个招投标项目为事务、参与项目的投标人为项;
利用Apriori算法或FP-growth算法对所述事务数据集进行处理,以得到第一群体。
可选的,所述利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体之后,还包括:
判断所述第一群体中的每个群体中的投标人的数量是否在预设范围,如果否,则将该群体从所述第一群体中剔除。
可选的,所述基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体,包括:
基于所述招投标历史数据,计算出所述第一群体中每个群体中的投标人对应的抱团中标率和非抱团中标率;
判断每个群体中的全部所述抱团中标率和所述非抱团中标率是否满足预设条件,如果是,则将该群体划分至第二群体。
可选的,所述基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目,包括:
将所述第二群体中的投标人与待检测项目的投标人进行匹配,如果匹配成功,则将所述待检测项目确定为围标项目。
本申请的第二方面提供了一种围标检测装置,包括:
第一确定模块,用于获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人群体的集合;
第二确定模块,基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率;
检测模块,用于基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。
本申请的第三方面提供了一种电子设备,所述电子设备包括处理器和存储器;其中所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述围标检测方法。
本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述围标检测方法。
本申请中,先获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人的群体的集合。然后基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率。最后基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。本申请利用数据挖掘算法对招投标历史数据进行数据挖掘,得到频繁抱团投标的投标人的第一群体,然后从中确定出指标数据满足预设条件的第二群体,进而根据第二群体对待检测投标项目的投标人进行检测,以确定待检测项目是否为围标项目,提高了对围标群体的检测效率,降低漏检率及误检率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种围标检测方法流程图;
图2为本申请提供的一种基于本方案的围标检测方法执行逻辑结构图;
图3为本申请提供的一种现有的围标检测方法执行逻辑结构图;
图4为本申请提供的一种具体的围标检测方法流程图;
图5为本申请提供的一种围标检测过程中数据处理示意图;
图6为本申请提供的一种围标检测装置结构示意图;
图7为本申请提供的一种围标检测电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统的识别手段更多地依靠招投标项目的评审专家人工判断,依赖于专家的围标识别经验是否丰富。而围标表现多样,且行为隐蔽,依靠传统识别手段很难完全发现,使得招标投标主体围标依然屡禁不止,监管部门对招投标的事后监管困难重重,围标行为的治理效果不尽如人意。针对上述技术缺陷,本申请提供一种围标检测方案,利用数据挖掘算法对招投标历史数据进行数据挖掘,得到频繁抱团投标的投标人的第一群体,然后从中确定出指标数据满足预设条件的第二群体,进而根据第二群体对待检测投标项目的投标人进行检测,以确定待检测项目是否为围标项目,提高了对围标群体的检测效率,降低漏检率及误检率。
图1为本申请实施例提供的一种围标检测方法流程图。参见图1所示,该围标检测方法包括:
S11:获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人的群体的集合。
本实施例中,首先获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体,其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人的群体的集合。所述招投标历史数据包括但不限于历史招投标项目信息、参与项目的投标人信息、项目中标人信息。招投标是一种市场经济的商品经营方式,在国内外项目实施中已被广泛地采用,这种方式是在货物、工程和服务的采购行为中,招标人通过事先公布的采购要求,吸引众多的投标人按照同等条件进行平等竞争,按照规定程序并组织技术、经济和法律等方面专家对众多的投标人进行综合评审,从中择优选定项目的中标人的行为过程。招标人是指通过招标公告或投标邀请书等形式,招请具有法定条件和具有承建能力的供应商参与投标竞争的行为人。投标人是指按照招标文件的规定填写投标文件,按照招标条件编制投标报价,在招标文件限定的时间内送达招标单位,并参与开标的行为人。招标投标主体指招标人、投标人、评审专家等参与招投标过程的行为人。围标通常是指几个投标人之间相互约定,一致抬高或压低投标报价进行投标,通过限制竞争,排挤其他投标人,使某个利益相关者中标,从而谋取非法利益的手段和行为,是投标人之间横向联合的一种违法行为。例如,下述行为会被认定为围标投标:招标文件雷同,比如格式相同,字体一样,表格颜色相同;招标文件中,出错误的地方一致;投标文件的装订形式、厚薄、封面等相类似甚至相同;一家投标人的投标文件中,装订了另一家投标人名称的文件材料,如出现了另一家法定代表人或者授权代理人签名,加盖了另一家投标人公章等;投标人代表不知道公司老总的电话号码;不同投标人在开标前乘坐同一辆车前往,有说有笑,开标现场却假装不认识。
可以理解,频繁抱团进行投标的投标人的群体不一定为围标群体,但围标群体一定是频繁抱团进行投标的投标人的群体。所述数据挖掘算法对所述招投标历史数据进行处理后得到的所述第一群体是通过大数据分析获取到的经验数据,也即,所述第一群体可以认为是潜在的围标群体,进行围标的两个或两个以上投标人,是经过长期“合作”、磨合,达成了较为稳定的“同盟”(中标人并不一定是相对固定的,也有可能是轮流的,但“同盟”成员相对稳定),因此,识别围标行为的关键就是找到这样的“同盟”。
S12:基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率。
本实施例中,先基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,然后从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体,其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率。在挖掘出的频繁抱团投标人群体的基础上,根据其它指标数据辅助判断所述第一群体中的各个群体是否具有围标高风险,进一步筛选出具有围标高风险的投标人群体并输出围标高风险的投标人群体列表。
S13:基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。
本实施例中,基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。对于待检测的每个招投标项目,检测每个项目的投标人中是否包含围标高风险的投标人群体,若包含,则将项目标记为围标高风险项目。具体的,将所述第二群体中的投标人与待检测项目的投标人进行匹配,如果匹配成功,则将所述待检测项目确定为围标项目。将具有围标高风险的投标人群体与待检测的招投标项目投标人进行比对,若项目的投标人包含围标高风险的投标人群体,则将项目标记为围标高风险项目。
综上所述,本申请实施例中的围标检测方法的执行逻辑可以抽象为输入层、判断层和输出层,所述输入层主要是获取所述招投标历史数据,所述判断层主要利用模型(数据挖掘算法模型、指标数据确定及判断模型)完成围标自动检测,所述输出层对具有围标高风险的项目进行输出,具体如图2所示。相较于传统的如图3所示的依赖于招标人及项目评审专家人工经验判断围标行为的方式,本申请是实施例能建立一个招投标领域的围标检测系统,利用招投标历史数据以及大数据分析方法的方式有效招投标中的潜在围标群体,并对存在围标群体的招投标项目进行风险标记,具有如下优势:(1)避免漏判:围标表现多样,且行为隐蔽,依靠传统人工判断手段很难完全发现,而依靠大数据以及大数据分析手段能尽可能避免漏判,让围标无所遁形;(2)从事后阻止到事前预防:传统人工判断手段只能在开标现场才能识别出围标行为,一旦出现围标,则项目面临废标,前期项目开标前的准备将付诸东流,极大地浪费了招标人的时间与精力,而本发明提供的方法可以在开标前即检测本次参与投标的投标人中是否存在风险围标、群体,发现风险围标群体后招标人可以进一步结合其他调查作出相应的行动;(3)节约监管部门事后监管的人力成本:监管部门对围标的治面临着取证困难的困境,事后对围标项目的监管需要耗费大量人力通过调取数据、专家访谈等方式进行取证,而本发明提供的方法,为监管部门监管提供了新的监管思路,提供了新的证据方向,可为监管部门节约监管取证人力成本。
可见,本申请实施例先获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人的群体的集合。然后基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率。最后基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。本申请实施例利用数据挖掘算法对招投标历史数据进行数据挖掘,得到频繁抱团投标的投标人的第一群体,然后从中确定出指标数据满足预设条件的第二群体,进而根据第二群体对待检测投标项目的投标人进行检测,以确定待检测项目是否为围标项目,提高了对围标群体的检测效率,降低漏检率及误检率。
图4为本申请实施例提供的一种具体的围标检测方法流程图。参见图4所示,该围标检测方法包括:
S21:获取历史招投标项目信息、参与项目的投标人信息、项目中标人信息,以得到招投标历史数据。
S22:利用频繁项集挖掘算法对所述招投标历史数据进行处理,以得到第一群体。
本实施例中,在获取到包括历史招投标项目信息、参与项目的投标人信息、项目中标人信息的招投标历史数据后,对所述招投标历史数据进行结构化处理,然后利用频繁项集挖掘算法对所述招投标历史数据进行处理,以得到第一群体。也即将结构化处理后的数据输入基于频繁项集挖掘的频繁抱团投标群体挖掘模型,该模型会输出频繁抱团投标的投标人群体列表。所述频繁项集挖掘算法是在数据集中挖掘频繁模式的一种数据挖掘方法,所述频繁模式是指数据集中频繁出现的项集、序列或子结构。项集是指若干个项的集合。频繁项集是指支持度大于等于最小支持度(min_sup)的集合,其中,支持度是指某个集合在所有事务中出现的频率。根据频繁项集挖掘算法,挖掘出频繁抱团投标的投标人群体;
更进一步的,本实施例首先利用所述招投标历史数据构建事务数据集,其中,所述事务数据集以所述招投标历史数据中每个招投标项目为事务、参与项目的投标人为项,然后利用Apriori算法或FP-growth算法对所述事务数据集进行处理,以得到第一群体。Apriori算法和FP-growth算法是经典的频繁项集挖掘算法。Apriori算法是第一个关联规则挖掘算法,它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接与剪枝组成。FPgrowth算法利用Apriori原则,但比Apriori算法执行更快。在FPgrowth算法中,数据集存储在一个称为FP树的结构中。FP树构建完成后,可以通过查找元素项的条件基及构建条件FP树来发现频繁项集。该过程不断以更多元素作为条件重复进行,直到FP树只包含一个元素为止。对于招投标事务数据集中的每个事务,利用Apriori算法或FP-growth算法,根据设定的最小支持度,找出所有事务中包含的频繁项集,得到若干频繁项集集合。
需要说明的是,由于超过一定行为人数的投标人围标行为组织与协调的难度较大,需要对频繁项集进行筛选,使得频繁抱团投标的投标人群体的行为人数应在一定数量之内。也即,在利用数据挖掘算法对所述招投标历史数据进行处理得到第一群体之后,可以进一步判断所述第一群体中的每个群体中的投标人的数量是否在预设范围,如果否,则将该群体从所述第一群体中剔除。所述预设范围可以根据业务需求及经验值进行设定,本实施例对此不进行限定,例如,假定频繁抱团投标的投标人群体的行为人数小于等于5个,故对于步骤S22中得到的所述第一群体(频繁项集集合),需要对项集包含的项的数量作限制,只筛选出项数量小于等于5的频繁项集,形成集合,最终输出频繁抱团投标的投标人群体列表,也可以称为最终的所述第一群体,步骤S23中第二群体的获取可以基于该第一群体。
S23:基于所述招投标历史数据,计算出所述第一群体中每个群体中的投标人对应的抱团中标率和非抱团中标率,并判断每个群体中的全部所述抱团中标率和所述非抱团中标率是否满足预设条件,如果是,则将该群体划分至第二群体。
本实施例中,基于频繁项集挖掘的频繁抱团投标群体挖掘模型已经挖掘出了频繁抱团投标的投标人团体,但是仅凭借抱团投标次数较高就判断这些团体为围标团体,证据还不够充分,需要更多的指标数据来辅助证明。具体的,基于所述招投标历史数据,计算出所述第一群体中每个群体中的投标人对应的抱团中标率和非抱团中标率,并判断每个群体中的全部所述抱团中标率和所述非抱团中标率是否满足预设条件,如果是,则将该群体划分至第二群体。假设一个群体为围标群体,则该群体中存在发起企业与陪标企业,发起企业在团体中中标率相比在团体外的中标率应有一定提升(否则围标无意义),陪标企业经常参加投标却从未中标,中标率为0。按照这一假设,在挖掘出的频繁抱团投标的投标人团体中,根据抱团中标率、非抱团中标率,抱团中标率相比非抱团中标率的提升等数据,进一步筛选目标群体,缩小风险围标群体范围,避免误判。图5中罗列了步骤S22和S23中对应的两个执行模型对所述招投标历史数据的处理过程。
S24:将所述第二群体中的投标人与待检测项目的投标人进行匹配,如果匹配成功,则将所述待检测项目确定为围标项目。
本实施例中,本实施例中,关于上述步骤S24的具体过程,可以参考前述实施例中公开的相应内容,在此不再进行赘述。
下面从数据层面进一步说明本实施例中的围标检测方案的优势。
假设某地区招投标监管部门有N个工作人员,该地区一年有M个项目进行招投标,其中围标行为在项目中发生的概率为P%,每个疑似围标项目的调查取证需要的人力为Q人·天,则该地区每年招投标监管部门的对于围标的治理需要花费的时间为:M×P×Q÷N(天),耗费的人力为:M×P×Q(人·天)。在实际情况中,如果N=4,M=1000,P=5%,Q=2,按照以上公式,治理需要花费25(天),花费人力100(人·天)。
使用本发明实施例提供的围标检测方案后,可以缩小取证投标人范围,减少取证时间,只需要0.6Q人·天。则使用本方案后,该地区每年招投标监管部门的对于围标的治理需要花费的时间为:M×P×0.6Q÷N(天),耗费的人力为:M×P×0.6Q(人·天)。在实际情况中,如果N=4,M=1000,P=5%,Q=2,带入得到,使用本发明后治理需要花费15(天),花费人力60(人·天),比原来人力成本降低40%。随着地区招投标项目的增多,节约的人力成本会随之增多。
可见,本申请实施例通过全面采集招投标领域的各类数据,包括如招标项目信息、参与项目的投标人数据,项目中标人数据等,构建大数据分析环境,在此基础上创造性地将频繁项集挖掘方法运用于招投标领域中,取代传统人工经验判断方法,同时结合招标投标主体的指标数据,对潜在围标群体进一步进行筛选,帮助招投标监管部门判断招标投标主体之间是否有存在围标的行为,有效阻止围标违法事件的发生。
参见图6所示,本申请实施例还相应公开了一种围标检测装置,包括:
第一确定模块11,用于获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人群体的集合;
第二确定模块12,基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率;
检测模块13,用于基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。
可见,本申请实施例先获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人的群体的集合。然后基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率。最后基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。本申请实施例利用数据挖掘算法对招投标历史数据进行数据挖掘,得到频繁抱团投标的投标人的第一群体,然后从中确定出指标数据满足预设条件的第二群体,进而根据第二群体对待检测投标项目的投标人进行检测,以确定待检测项目是否为围标项目,提高了对围标群体的检测效率,降低漏检率及误检率。
在一些具体实施例中,所述第一确定模块11,具体包括:
获取单元,用于获取历史招投标项目信息、参与项目的投标人信息、项目中标人信息,以得到招投标历史数据;
构建单元,用于利用所述招投标历史数据构建事务数据集;其中,所述事务数据集以所述招投标历史数据中每个招投标项目为事务、参与项目的投标人为项;
数据挖掘单元,用于利用Apriori算法或FP-growth算法对所述事务数据集进行处理,以得到第一群体。
在一些具体实施例中,所述第二确定模块12,具体包括:
计算单元,用于基于所述招投标历史数据,计算出所述第一群体中每个群体中的投标人对应的抱团中标率和非抱团中标率;
划分单元,用于判断每个群体中的全部所述抱团中标率和所述非抱团中标率是否满足预设条件,如果是,则将该群体划分至第二群体。
在一些具体实施例中,所述检测模块13,具体用于将所述第二群体中的投标人与待检测项目的投标人进行匹配,如果匹配成功,则将所述待检测项目确定为围标项目。
在一些具体实施例中,所述围标检测装置还包括判断模块,用于判断所述第一群体中的每个群体中的投标人的数量是否在预设范围,如果否,则将该群体从所述第一群体中剔除。
进一步的,本申请实施例还提供了一种电子设备。图7是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图7为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的围标检测方法中的相关步骤。另外,本实施例中的电子设备20具体可以为服务器。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222及招投标历史数据223等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中海量招投标历史数据223的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的围标检测方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223可以包括电子设备20收集到的招投标历史数据。
进一步的,本申请实施例还公开了一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行时,实现前述任一实施例公开的围标检测方法步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的围标检测方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种围标检测方法,其特征在于,包括:
获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人的群体的集合;
基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率;
基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。
2.根据权利要求1所述的围标检测方法,其特征在于,所述获取招投标历史数据,包括:
获取历史招投标项目信息、参与项目的投标人信息、项目中标人信息,以得到招投标历史数据。
3.根据权利要求2所述的围标检测方法,其特征在于,所述利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体,包括:
利用频繁项集挖掘算法对所述招投标历史数据进行处理,以得到第一群体。
4.根据权利要求3所述的围标检测方法,其特征在于,所述利用基于频繁项集的数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体,包括:
利用所述招投标历史数据构建事务数据集;其中,所述事务数据集以所述招投标历史数据中每个招投标项目为事务、参与项目的投标人为项;
利用Apriori算法或FP-growth算法对所述事务数据集进行处理,以得到第一群体。
5.根据权利要求1所述的围标检测方法,其特征在于,所述利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体之后,还包括:
判断所述第一群体中的每个群体中的投标人的数量是否在预设范围,如果否,则将该群体从所述第一群体中剔除。
6.根据权利要求2所述的围标检测方法,其特征在于,所述基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体,包括:
基于所述招投标历史数据,计算出所述第一群体中每个群体中的投标人对应的抱团中标率和非抱团中标率;
判断每个群体中的全部所述抱团中标率和所述非抱团中标率是否满足预设条件,如果是,则将该群体划分至第二群体。
7.根据权利要求1至6任一项所述的围标检测方法,其特征在于,所述基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目,包括:
将所述第二群体中的投标人与待检测项目的投标人进行匹配,如果匹配成功,则将所述待检测项目确定为围标项目。
8.一种围标检测装置,其特征在于,包括:
第一确定模块,用于获取招投标历史数据,并利用数据挖掘算法对所述招投标历史数据进行处理,以得到第一群体;其中,所述第一群体为在历史招投标项目中频繁抱团进行投标的投标人群体的集合;
第二确定模块,基于所述招投标历史数据,确定出所述第一群体中每个群体对应的指标数据,并从所述第一群体中提取出所述指标数据满足预设条件的群体,以得到第二群体;其中,所述指标数据反映所述第一群体中的各个群体为围标群体的概率;
检测模块,用于基于所述第二群体对待检测投标项目的投标人进行检测,以确定所述待检测项目是否为围标项目。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;其中所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的围标检测方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至7任一项所述的围标检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110341422.5A CN112884559A (zh) | 2021-03-30 | 2021-03-30 | 一种围标检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110341422.5A CN112884559A (zh) | 2021-03-30 | 2021-03-30 | 一种围标检测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112884559A true CN112884559A (zh) | 2021-06-01 |
Family
ID=76040692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110341422.5A Pending CN112884559A (zh) | 2021-03-30 | 2021-03-30 | 一种围标检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112884559A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114297250A (zh) * | 2021-09-14 | 2022-04-08 | 山西金蝉电子商务有限公司 | 基于频数的围标团体提名算法 |
CN114399371A (zh) * | 2022-01-14 | 2022-04-26 | 广联达科技股份有限公司 | 围串标行为的检测方法、装置、计算机设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046973A (zh) * | 2019-04-17 | 2019-07-23 | 成都市审计局 | 一种基于关联关系大数据分析的围标串标检测方法 |
CN110223083A (zh) * | 2019-05-28 | 2019-09-10 | 苏州国泰新点软件有限公司 | 串通投标行为检测方法、装置、设备及存储介质 |
CN111028050A (zh) * | 2019-11-22 | 2020-04-17 | 浙江大学 | 一种基于数据驱动的异常投标行为检测评估方法及系统 |
CN112258303A (zh) * | 2020-11-16 | 2021-01-22 | 北京筑龙信息技术有限责任公司 | 围串标预警分析方法、装置、电子设备及存储介质 |
-
2021
- 2021-03-30 CN CN202110341422.5A patent/CN112884559A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046973A (zh) * | 2019-04-17 | 2019-07-23 | 成都市审计局 | 一种基于关联关系大数据分析的围标串标检测方法 |
CN110223083A (zh) * | 2019-05-28 | 2019-09-10 | 苏州国泰新点软件有限公司 | 串通投标行为检测方法、装置、设备及存储介质 |
CN111028050A (zh) * | 2019-11-22 | 2020-04-17 | 浙江大学 | 一种基于数据驱动的异常投标行为检测评估方法及系统 |
CN112258303A (zh) * | 2020-11-16 | 2021-01-22 | 北京筑龙信息技术有限责任公司 | 围串标预警分析方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
程向华等: "基于社区发现和关联规则分析的供应商围串标审计方法探索", 《中国内部审计》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114297250A (zh) * | 2021-09-14 | 2022-04-08 | 山西金蝉电子商务有限公司 | 基于频数的围标团体提名算法 |
CN114297250B (zh) * | 2021-09-14 | 2024-06-11 | 山西金蝉电子商务有限公司 | 基于频数的围标团体提名方法 |
CN114399371A (zh) * | 2022-01-14 | 2022-04-26 | 广联达科技股份有限公司 | 围串标行为的检测方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106548343B (zh) | 一种非法交易检测方法及装置 | |
CN112465011B (zh) | 基于项目研发过程的项目风险预测方法和系统 | |
CN111950738A (zh) | 机器学习模型优化效果评估方法、装置、终端及存储介质 | |
CN109886554B (zh) | 违规行为判别方法、装置、计算机设备和存储介质 | |
CN109614433A (zh) | 业务系统间数据血缘的识别方法、装置、设备及存储介质 | |
CN112884559A (zh) | 一种围标检测方法、装置、设备及存储介质 | |
CN104036360A (zh) | 一种基于磁卡考勤行为的用户数据处理系统及处理方法 | |
CN109345133B (zh) | 基于大数据和深度学习的评审方法和机器人系统 | |
CN112597238A (zh) | 基于人员信息的知识图谱构建方法、系统、设备及介质 | |
CN116307671A (zh) | 风险预警方法、装置、计算机设备、存储介质 | |
CN112818028B (zh) | 数据指标筛选方法、装置、计算机设备及存储介质 | |
CN112199417B (zh) | 基于人工智能的数据处理方法、装置、终端及存储介质 | |
Kirshners et al. | Combining clustering and a decision tree classifier in a forecasting task | |
CN115204501A (zh) | 企业评估方法、装置、计算机设备和存储介质 | |
CN114399371A (zh) | 围串标行为的检测方法、装置、计算机设备及存储介质 | |
CN114495137A (zh) | 票据异常检测模型生成方法与票据异常检测方法 | |
CN110399399B (zh) | 用户分析的方法、装置、电子设备和存储介质 | |
CN113469816A (zh) | 基于多组学技术的数字货币识别方法、系统和存储介质 | |
CN113205442A (zh) | 基于区块链的电子政务数据反馈管理方法及装置 | |
CN114092216A (zh) | 企业信贷评级方法、装置、计算机设备和存储介质 | |
CN109300025B (zh) | 基于大数据和深度学习的审计方法和机器人系统 | |
CN113743695A (zh) | 基于大数据的国际工程项目投标报价风险管理方法 | |
CN112070615B (zh) | 基于知识图谱的理财产品推荐方法及装置 | |
CN117573803B (zh) | 基于知识图谱的新客识别方法和装置 | |
CN113723775B (zh) | 一种基于电力大数据的企业及行业运营风险的评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210601 |