CN112819565B - 围标串标的检测方法、系统及存储介质 - Google Patents

围标串标的检测方法、系统及存储介质 Download PDF

Info

Publication number
CN112819565B
CN112819565B CN202110072950.5A CN202110072950A CN112819565B CN 112819565 B CN112819565 B CN 112819565B CN 202110072950 A CN202110072950 A CN 202110072950A CN 112819565 B CN112819565 B CN 112819565B
Authority
CN
China
Prior art keywords
similarity
bidding
address information
document
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110072950.5A
Other languages
English (en)
Other versions
CN112819565A (zh
Inventor
潘晓华
石祥勤
周炼
李国庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Digital Platform Technology Guangdong Co ltd
Original Assignee
China Southern Power Grid Digital Platform Technology Guangdong Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Digital Platform Technology Guangdong Co ltd filed Critical China Southern Power Grid Digital Platform Technology Guangdong Co ltd
Priority to CN202110072950.5A priority Critical patent/CN112819565B/zh
Publication of CN112819565A publication Critical patent/CN112819565A/zh
Application granted granted Critical
Publication of CN112819565B publication Critical patent/CN112819565B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0611Request for offers or quotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种围标串标的检测方法、系统及存储介质,围标串标的检测方法包括:获取所有投标方的地址信息,复制并存储所有的所述地址信息至地址数据库;将所述地址信息与所述地址数据库内的地址信息进行比较以得到比较结果;根据所述比较结果输出异常信息,或者获取所述投标方的投标文件,对所述投标文件进行相似度分析以得到投标相似度,并将所述投标相似度和预设相似度阈值进行比较以得到相似度报告。本发明通过地址信息比对和投标文件相似度分析,有效提升评标效率,能够快速识别投标方之间是否存在围标串标行为,通过地址信息可以快速识别是否未同一个编制的投标文件,通过投标文件的相似度分析可以快速识别不同投标方是否雷同。

Description

围标串标的检测方法、系统及存储介质
技术领域
本发明涉及信息处理的技术领域,尤其是涉及一种围标串标的检测方法、系统及存储介质。
背景技术
随着经济的发展,市场竞争越来越激烈。当招标方进行招标时需要收集来自各个商家的投标书,以根据每一个投标书的内容确定合作的商家,但是一些商家为了增加合作概率存在围标串标行为。
为了防止投标书出现围标串标的情况,需要人工去分析投标方上传文件IP是否雷同,且投标文件是否重复,再分析投标方之间是否存在关联企业关系,进而判断投标方是否存在围标串标行为。但是IP地址也可以通过工具篡改活经过多层代理后获取的IP地址不准确,无法准确判断投标方是否存在围标串标行为,而且采用人工的方式进行分析,一方面增加工作人员的工作量,另一方面影响了投标工作进度。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种围标串标的检测方法,能够自动化且准确地检测投标文件是否存在围标串标,使得围标串标检测简易。
本发明还提出一种围标串标的检测系统。
本发明还提出一种计算机可读存储介质。
第一方面,本发明的一个实施例提供了围标串标的检测方法,包括:
获取所有投标方的地址信息,复制并存储所有的所述地址信息至地址数据库;
将所述地址信息与所述地址数据库内的地址信息进行比较以得到比较结果;
根据所述比较结果输出异常信息,或者获取所述投标方的投标文件,对所述投标文件进行相似度分析以得到投标相似度,并将所述投标相似度和预设相似度阈值进行比较以得到相似度报告。
本发明实施例的围标串标的检测方法至少具有如下有益效果:通过地址信息比对和投标文件相似度分析,有效提升评标效率,能够快速识别投标方之间是否存在围标串标行为,通过地址信息可以快速识别是否为同一个编制的投标文件,通过投标文件的相似度分析可以快速识别不同投标方是否雷同。
根据本发明的另一些实施例的围标串标的检测方法,所述地址信息包括:IP地址信息和/或MAC地址信息。
根据本发明的另一些实施例的围标串标的检测方法,所述将所述地址信息与所述地址数据库内的地址信息进行比较以得到比较结果,包括;
将所述地址信息与所述地址数据库内的所述地址信息进行比较;
若所述地址数据库内存在一个与所述地址信息相同的所述地址信息,以得到所述比较结果为未重复;
若所述地址数据库内存在两个以上与所述地址信息相同的所述地址信息,以得到所述比较结果为重复。
根据本发明的另一些实施例的围标串标的检测方法,所述根据所述比较结果输出异常信息,或者获取所述投标方的投标文件,对所述投标文件进行相似度分析以得到投标相似度,并将所述投标相似度和预设相似度阈值进行比较以得到相似度报告,包括:
若所述比较结果为重复,则输出异常信息;
若所述比较结果为未重复,获取所述投标方的投标文件,对所述投标文件进行相似度分析以得到所述投标相似度,并将所述投标相似度和所述预设相似度阈值进行比较以得到所述相似度报告。
根据本发明的另一些实施例的围标串标的检测方法,所述对所述投标文件进行相似度分析以得到投标相似度,包括:
获取所述投标文件的标题,并根据所述标题进行分类存储至对应类别的文件数据库内;
将所述文件数据库内的所述投标文件进行拆解成章节、内容;
将所述投标文件的所述章节与同类的所述文件数据库内其他所述投标文件的所述章节进行相似度分析以得到第一相似度;
将所述投标文件的所述内容与同类的所述文件数据库内其他所述投标文件的所述内容进行相似度分析以得到第二相似度;
根据预设第一权值、预设第二权值、所述第一相似度和所述第二相似度确定所述投标相似度。
根据本发明的另一些实施例的围标串标的检测方法,所述相似度报告包括:相似度异常报告和相似度合格报告,所述将所述投标相似度和所述预设相似度阈值进行比较以得到所述相似度报告,包括:
将所述投标相似度和所述预设相似度阈值进行比较;
若所述投标相似度大于所述预设相似度阈值,得到所述相似度异常报告;
若所述投标相似度小于所述预设相似度阈值,得到所述相似度合格报告。
根据本发明的另一些实施例的围标串标的检测方法,还包括:
根据所述相似度异常报告对所述相似度异常报告对应的所述投标文件进行标记。
第二方面,本发明的一个实施例提供了围标串标的检测系统,包括:
获取模块,用于获取所有投标方的地址信息,复制并存储所有的所述地址信息至地址数据库;
比较模块,用于将所述地址信息与所述地址数据库内的地址信息进行比较以得到比较结果;
处理模块,用于根据所述比较结果输出异常信息,或者获取所述投标方的投标文件;
相似度分析模块,用于对所述投标文件进行相似度分析以得到投标相似度,将所述投标相似度和预设相似度阈值进行比较以得到相似度报告。
本发明实施例的围标串标的检测系统至少具有如下有益效果:实现了投标文件的自动化分析,而分析地址信息后也分析投标文件,以使得投标文件是否存在围标串标的检测准确。
根据本发明的另一些实施例的围标串标的检测系统,所述相似度分析模块包括:
获取单元,用于获取所述投标文件的标题,并根据所述标题进行分类存储至对应文件数据库内;
拆解单元,用于将所述文件数据库内的所述投标文件进行拆解成章节、内容;
第一相似度分析单元,用于将所述投标文件的所述章节与同类的所述文件数据库内其他所述投标文件的所述章节进行相似度分析以得到第一相似度;
第二相似度分析单元,用于将所述投标文件的所述内容与同类的所述文件数据库内其他所述投标文件的内容进行相似度分析以得到第二相似度;
计算单元,用于根据预设第一权值、预设第二权值、所述第一相似度和所述第二相似度确定投标相似度。
第三方面,本发明的一个实施例提供了计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面的围标串标的检测方法。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书以及附图中所特别指出的结构来实现和获得。
附图说明
图1是本发明实施例中围标串标的检测方法的一具体实施例流程示意图;
图2是本发明实施例中围标串标的检测方法的另一具体实施例流程示意图;
图3是本发明实施例中围标串标的检测方法的另一具体实施例流程示意图;
图4是本发明实施例中围标串标的检测方法的另一具体实施例流程示意图;
图5是本发明实施例中围标串标的检测方法的另一具体实施例流程示意图;
图6是本发明实施例中围标串标的检测方法的另一具体实施例流程示意图;
图7是本发明实施例中围标串标的检测系统的一具体实施例模块框图;
图8是本发明实施例中围标串标的检测系统的一具体实施例中相似度分析模块的模块框图。
附图标记:100、获取模块;200、比较模块;300、处理模块;400、相似度分析模块;410、获取单元;420、拆解单元;430、第一相似度分析单元;440、第二相似度分析单元;450、计算单元。
具体实施方式
以下将结合实施例对本发明的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。
在本发明实施例的描述中,如果涉及到“若干”,其含义是一个以上,如果涉及到“多个”,其含义是两个以上,如果涉及到“大于”、“小于”、“超过”,均应理解为不包括本数,如果涉及到“以上”、“以下”、“以内”,均应理解为包括本数。如果涉及到“第一”、“第二”,应当理解为用于区分技术特征,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
一般对于围标串标的检测方法主要通过分析投标方上传文件IP是否雷同,投标方之间是否存在关联企业关系等判断是否存在围标串标行为,但IP地址通常可以通过工具篡改或经过多层代理后获取不准的问题,投标方也会规避关联企业同时参与投标,从而导致不能准确识别投标方是否存在围标串标行为。
基于此,本申请公开了一种围标串标的检测方法、系统及存储介质,通过收集投标方编制文件的地址信息进行比对,同时对投标内容进行相似度分析,以准确地判断投标方是否存在围标串标的行为。
第一方面,参照图1,本发明申请公开了一种围标串标的检测方法,包括:
S100、获取所有投标方的地址信息,复制并存储所有的地址信息至地址数据库;
S200、将地址信息与地址数据库内的地址信息进行比较以得到比较结果;
S300、根据比较结果输出异常信息,或者获取投标方的投标文件,对投标文件进行相似度分析以得到投标相似度,并将投标相似度和预设相似度阈值进行比较以得到相似度报告。
在投标方进行投标文件上传时,接收到投标文件的同时获取该投标方的地址信息,然后将所有投标方的地址信息进行复制,并将复制的所有地址信息存储至地址数据库。然后将获取的每一个地址信息与地址数据库内的地址信息进行比较以得到比较结果,然后根据比较结果输出异常信息或者获取投标方的投标文件,以对投标文件进行相似度分析,然后将投标相似度与预设相似度阈值比较以得到相似度报告。因此实现了将投标方的地址信息进行比较后,再对投标方的投标文件进行分析,以准确地判断投标方是否存在围标串标的行为,且实现自动化检测,节省人力,且可以快速识别投标方之间是否存在围标串标行为。
在一些实施例中,地址信息包括:IP地址信息和/或MAC地址信息。在获取投标方的投标文件时通过编制投标文件以收集投标方的IP地址信息和/或MAC地址信息,以作为第一步围标串标分析。由于一个终端的IP地址信息或MAC地址信息都是唯一的,且一个公司只能上传一份投标文件。因此通过IP地址信息和/或MAC地址信息能够准确地判断投标方之间是否采用同一台终端发送投标文件,以检测投标方之间是否存在围标串标的行为。
参照图2,在一些实施例中,步骤S200包括:
S210、将地址信息与地址数据库内的地址信息进行比较;
S220、若地址数据库内存在一个与地址信息相同的地址信息,以得到比较结果为未重复;
S230、若地址数据库内存在一个以上与地址信息相同的地址信息,以得到比较结果为重复。
首先将所有投标方的地址复制到地址数据库,然后将每一个地址信息与地址数据库内的地址信息进行比较。如果地址数据库内只存在一个与地址信息相同的地址信息,为原本复制进去的地址信息,则证明地址信息没有重复。如果地址数据库内存在两个或两个以上与地址信息相同的地址信息,则证明同一个终端设备上传了两份以上且含两份的投标文件,则可以证明该地址信息对应的投标方存在围标串标的行为。因此,通过地址信息进行比对以判断投标方是否存在围标串标行为,可以将明显异常的投标方去掉,以实现投标的公正公平。
参照图3,在一些实施例中,步骤S300包括:
S310、若比较结果为重复,则输出异常信息;
S320、若比较结果为未重复,获取投标方的投标文件,对投标文件进行相似度分析以得到投标相似度,并将投标相似度和预设相似度阈值进行比较以得到相似度报告。
根据比较结果采取不同的措施,若比较结果为重复,则证明该投标方存在围标串标行为,则输出异常信息,以便于招标方可以清楚的知道哪一个投标方存在围标串标行为,以对该投标方进行删除,结束该地址信息对应的投标文件分析,不再对投标文件的内容进行分析。若比较结果为未重复,则证明该投标文件不存在同一个终端发送两份以上的投标文件,则需要对投标文件进行相似度分析以得到投标相似度,然后将投标相似度与预设相似度阈值比较以得到相似度报告,以进一步判断投标方是否拿相同的投标文件投标两次以上,以进一步判断该投标方是否存在围标串标的行为。
参照图4,在一些实施例中,步骤S320包括:
S321、若比较结果为未重复,获取投标方的投标文件;
S322、获取投标文件的标题,并根据标题进行分类存储至对应类别的文件数据库内;
S323、将文件数据库内的所述投标文件进行拆解成章节、内容;
S324、将投标文件的章节与同类的文件数据库内其他投标文件的章节进行相似度分析以得到第一相似度;
S325、将投标文件的内容与同类的文件数据库内其他投标文件的内容进行相似度分析以得到第二相似度;
S326、根据预设第一权值、预设第二权值、第一相似度和第二相似度确定投标相似度。
当比较结果为未重复,则证明该投标方的地址信息没有重复,则需要获取投标方的投标文件,然后根据投标文件的标题进行分类存储至对应类别的文件数据库。主要获取投标文件的标题的关键字以确定该投标文件的类别,例如投标文件的标题为“电子设备投标书”,则提取标题中的“电子设备”,然后将该投标文件存储至“电子设备”对应的文件数据库。若投标文件的标题为“电网软件投标书”,则获取“电网软件”的关键字,并将该投标文件存储至“电网软件”对应的文件数据库。将每一个投标文件存储至对应类别的文件数据库后,将投标文件拆解成章节、内容,然后将该投标文件的章节与同类文件数据库内的其他投标文件进行章节比对和分析以得到该投标文件的第一相似度,并将该投标文件的内容与同类文件数据库内其他投标文件的内容进行比对和分析以得到该投标文件的第二相似度,然后设置章节预设第一权值,设置内容预设第二权值,然后根据第一相似度、第一预设权值,第二相似度和预设第二权值确定该投标文件的相似度。因此,先对投标文件进行分类,然后将投标文件的章节、内容与同类文件数据库内的其他投标文件进行相似度分析,以快速且准确地计算出该投标文件的相似度,且节省人力,也便于进一步判断该投标文件是否存在围标串标行为。
例如,获取标题为“电网软件投标书”的投标文件,然后将该投标文件存储至“电网软件”类别的文件数据库,然后将投标文件进行拆解,以得到投标文件的章节和内容,且“电网软件”类别的文件数据库内的投标文件也拆解成章节和内容,然后将投标文件的章节和“电网软件”类别的文件数据库内其他投标文件的章节进行相似度分析,以得到第一相似度a。然后再将投标文件的内容与“电网软件”类别的文件数据库内其他投标文件的内容进行相似度分析,以得到第二相似度b。由于章节重复则会证明该投标文件存在围标串标的行为更加明显,则设置章节的预设第一权值Q1大于内容的预设第二权值Q2,然后计算该投标文件的投标相似度为Q=Q1*a+Q2*b,即可得到该投标文件的投标相似度,且该投标文件的投标相似度计算准确。
参照图5,在一些实施例中,步骤S320还包括:
S327、将投标相似度和预设相似度阈值进行比较;
S328、若投标相似度大于预设相似度阈值,得到相似度异常报告;
S329、若投标相似度小于预设相似度阈值,得到相似度合格报告。
计算出投标文件的相似度后需要判断该投标文件是否异常,因为投标文件所填写的类型是相同的,因此投标文件的章节、内容存在相似也是正常的。但是如果投标文件的章节、内容的相似度过高,则证明存在围标串标行为。每一个类别的投标文件的预设相似度阈值都是不同的,因此将投标相似度与预设相似度阈值比较。若投标相似度大于预设相似度阈值,则证明该投标文件与其他投标文件的相似度过高,该投标文件对应的投标方之间存在围标串标行为,则输出相似度异常报告,以便于招标方根据相似度异常谨慎选择该投标方,实现投标的公平公正。若投标相似度小于预设相似度阈值,则证明该投标文件与其他投标文件的相似度比较低,并未存在围标串标的行为,则输出相似度合格报告,以便于招标方可以进一步分析投标文件。
参照图6,在一些实施例中,围标串标的检测方法还包括:
S400、根据相似度异常报告对相似度异常报告对应的投标文件进行标记。
若得到相似度异常报告,则根据相似度异常报告对该相似度异常报告对应的投标文件进行标记,以便于招标方在查看招标文件时能够清楚该招标文件是否需要删除。
下面参考图1至图6以一个具体的实施例详细描述根据本发明实施例的围标串标的检测方法。值得理解的是,下述描述仅是示例性说明,而不是对发明的具体限制。
接收投标方的投标文件时获取投标方的地址信息,然后将所有投标方的地址信息复制并存储至地址数据库,然后将每个地址信息与地址数据库内的地址信息进行比对。若地址数据库内存在一个以上与地址信息相同的地址信息,得到比较结果为重复,则输出异常信息,以便于招标方清楚该投标方存在围标串标行为。若地址数据库内存储一个与地址信息相同的地址信息,得到比较结果为未重复,获取投标方的投标文件,然后获取投标文件的标题的关键字以确定该投标文件的类别。将每一个投标文件存储至对应类别的文件数据库后,将投标文件进行拆解成章节、内容,然后将该投标文件的章节与同类文件数据库内的其他投标文件进行章节比对和分析以得到该投标文件的第一相似度,并将该投标文件的内容与同类文件数据库内其他投标文件的内容进行比对和分析以得到该投标文件的第二相似度,然后计算该投标文件的投标相似度为Q=Q1*a+Q2*b,即可得到该投标文件的投标相似度。将投保相似度与预设相似度阈值比较,若投标相似度大于预设相似度阈值,输出相似度异常报告,以便于招标方根据相似度异常报告谨慎选择该投标方,实现投标的公平公正。若投标相似度小于预设相似度阈值,则输出相似度合格报告,以便于招标方可以进一步分析投标文件。则根据相似度异常报告对该相似度异常报告对应的投标文件进行标记,以将异常的投标文件进行区分出来。
第二方面,参照图7,本发明实施例还公开了一种围标串标的检测系统,包括:获取模块100、比较模块200、处理模块300、相似度分析模块400;获取模块100用于获取所有投标方的地址信息,复制并存储所有的地址信息至地址数据库;比较模块200用于将地址信息与地址数据库内的地址信息进行比较以得到比较结果;处理模块300用于根据比较结果输出异常信息,或者获取投标方的投标文件;相似度分析模块400用于对投标文件进行相似度分析以得到投标相似度,将投标相似度和预设相似度阈值进行比较以得到相似度报告。
通过先对投标方的地址信息进行采集并存储值地址数据库,再将地址信息与地址数据库内的地址信息进行比较以得到比较结果,再根据比较结果确定输出异常信息,或者获取投标方的投标文件,然后通过相似度分析模块400分析投标文件的投标相似度,再将投标相似度与预设相似度阈值比较以得到相似度报告,不仅实现了投标文件的自动化分析,而分析地址信息后也分析投标文件,以使得投标文件是否存在围标串标的检测准确。
参照图7和图8,在一些实施例中,相似度分析模块400包括:获取单元410、拆解单元420、第一相似度分析单元430、第二相似度分析单元440和计算单元450;获取单元410用于获取投标文件的标题,并根据标题进行分类存储至对应文件数据库内;拆解单元420用于将文件数据库内的投标文件进行拆解成章节、内容;第一相似度分析单元430用于将投标文件的章节与同类的文件数据库内其他投标文件的章节进行相似度分析以得到第一相似度;第二相似度分析单元440用于将投标文件的内容与同类的文件数据库内其他投标文件的内容进行相似度分析以得到第二相似度;计算单元450用于根据预设第一权值、预设第二权值、第一相似度和第二相似度确定投标相似度。
通过设置拆解单元420将投标文件拆解成章节、内容,然后第一相似度分析单元430将投标文件的章节与同类的文件数据库内的其他投标文件的章节进行相似度分析以得到第一相似度,再将投标文件的内容与同类的文件数据库内的其他投标文件的内容进行相似度分析以得到第二相似度,然后计算单元450根据预设第一权值、预设第二权值、第一相似度和第二相似度计算得到投标相似度,使得投标相似度计算准确。
第三方面,本发明实施例还公开了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行如第一方面的围标串标的检测方法。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。此外,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。

Claims (6)

1.一种围标串标的检测方法,其特征在于,包括:
获取所有投标方的地址信息,复制并存储所有投标方的所述地址信息至地址数据库;
将所述地址信息与所述地址数据库内的所述地址信息进行比较;
若所述地址数据库内存在一个与所述地址信息相同的所述地址信息,以得到比较结果为未重复;
若所述地址数据库内存在一个以上与所述地址信息相同的所述地址信息,以得到比较结果为重复;
若所述比较结果为未重复,获取所述投标方的投标文件;
获取所述投标文件的标题,并根据所述标题进行分类存储至对应类别的文件数据库内;
将所述文件数据库内的所述投标文件进行拆解成章节、内容;
将所述投标文件的所述章节与同类的所述文件数据库内其他所述投标文件的章节进行相似度分析以得到第一相似度;
将所述投标文件的所述内容与同类的所述文件数据库内其他所述投标文件的所述内容进行相似度分析以得到第二相似度;
根据预设第一权值、预设第二权值、所述第一相似度和所述第二相似度确定投标相似度;其中,所述投标相似度的计算公式为:Q=Q1*a+Q2*b,Q1为预设第一权值,Q2为预设第二权值,a为第一相似度,b为第二相似度;
将所述投标相似度和预设相似度阈值进行比较以得到相似度报告;其中,所述相似度报告包括:相似度异常报告和相似度合格报告;
对所述相似度异常报告对应的所述投标文件进行标记。
2.根据权利要求1所述的围标串标的检测方法,其特征在于,所述地址信息包括:IP地址信息和/或MAC地址信息。
3.根据权利要求2所述的围标串标的检测方法,其特征在于,所述方法还包括:
若所述比较结果为重复,则输出异常信息。
4.根据权利要求1至3任一项所述的围标串标的检测方法,其特征在于,所述将所述投标相似度和预设相似度阈值进行比较以得到相似度报告,包括:
将所述投标相似度和所述预设相似度阈值进行比较;
若所述投标相似度大于所述预设相似度阈值,得到所述相似度异常报告;
若所述投标相似度小于所述预设相似度阈值,得到所述相似度合格报告。
5.一种围标串标的检测系统,其特征在于,包括:
获取模块,用于获取所有投标方的地址信息,复制并存储所有的所述地址信息至地址数据库;
比较模块,用于将所述地址信息与所述地址数据库内的所述地址信息进行比较;若所述地址数据库内存在一个与所述地址信息相同的所述地址信息,以得到比较结果为未重复;若所述地址数据库内存在一个以上与所述地址信息相同的所述地址信息,以得到比较结果为重复;
处理模块,用于若所述比较结果为未重复,获取所述投标方的投标文件;
相似度分析模块,所述相似度分析模块包括:
获取单元,用于获取所述投标文件的标题,并根据所述标题进行分类存储至对应文件数据库内;
拆解单元,用于将所述文件数据库内的所述投标文件进行拆解成章节、内容;
第一相似度分析单元,用于将所述投标文件的所述章节与同类的所述文件数据库内其他所述投标文件的所述章节进行相似度分析以得到第一相似度;
第二相似度分析单元,用于将所述投标文件的所述内容与同类的所述文件数据库内其他所述投标文件的所述内容进行相似度分析以得到第二相似度;
计算单元,用于根据预设第一权值、预设第二权值、所述第一相似度和所述第二相似度确定投标相似度;其中,所述投标相似度的计算公式为:Q=Q1*a+Q2*b,Q1为预设第一权值,Q2为预设第二权值,a为第一相似度,b为第二相似度;
所述相似度分析模块还用于将所述投标相似度和预设相似度阈值进行比较以得到相似度报告;其中,所述相似度报告包括:相似度异常报告和相似度合格报告;对所述相似度异常报告对应的所述投标文件进行标记。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至4任一项所述的围标串标的检测方法。
CN202110072950.5A 2021-01-20 2021-01-20 围标串标的检测方法、系统及存储介质 Active CN112819565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110072950.5A CN112819565B (zh) 2021-01-20 2021-01-20 围标串标的检测方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110072950.5A CN112819565B (zh) 2021-01-20 2021-01-20 围标串标的检测方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN112819565A CN112819565A (zh) 2021-05-18
CN112819565B true CN112819565B (zh) 2023-08-08

Family

ID=75858409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110072950.5A Active CN112819565B (zh) 2021-01-20 2021-01-20 围标串标的检测方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN112819565B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538010A (zh) * 2021-07-23 2021-10-22 优材优建(青岛)电子商务科技有限公司 一种防围标预警方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034717A (zh) * 2018-06-05 2018-12-18 王振 一种识别招标过程中围标串标行为的方法
CN110377886A (zh) * 2019-06-19 2019-10-25 平安国际智慧城市科技股份有限公司 项目查重方法、装置、设备及存储介质
CN111241230A (zh) * 2019-12-31 2020-06-05 中国南方电网有限责任公司 一种基于文本挖掘识别串标风险的方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6136702B2 (ja) * 2013-07-24 2017-05-31 富士通株式会社 場所推定方法、場所推定装置および場所推定プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034717A (zh) * 2018-06-05 2018-12-18 王振 一种识别招标过程中围标串标行为的方法
CN110377886A (zh) * 2019-06-19 2019-10-25 平安国际智慧城市科技股份有限公司 项目查重方法、装置、设备及存储介质
CN111241230A (zh) * 2019-12-31 2020-06-05 中国南方电网有限责任公司 一种基于文本挖掘识别串标风险的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
论串通投标案件的侦查困境与破解思路;王昌浩;《江西警察学院学报》;20200331(第2期);第33-40页 *

Also Published As

Publication number Publication date
CN112819565A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN110851308A (zh) 一种测试方法、装置、电子设备及存储介质
CN111553137B (zh) 报告生成方法、装置、存储介质及计算机设备
CN111460773A (zh) 一种数据处理方法、装置、系统、电子设备及存储介质
CN104702492A (zh) 垃圾消息模型训练方法、垃圾消息识别方法及其装置
CN111339151B (zh) 在线考试方法、装置、设备及计算机存储介质
CN107798047A (zh) 重复工单检测方法、装置、服务器和介质
CN110851591A (zh) 一种裁判文书的质量评估方法、装置、设备及存储介质
CN111427928A (zh) 一种数据质量检测方法及装置
CN110796053A (zh) 视频检测方法、装置、电子设备及计算机可读存储介质
CN106600303A (zh) 评估广告投放合理性的方法和装置
CN112819565B (zh) 围标串标的检测方法、系统及存储介质
CN112116222A (zh) 一种工程项目招标管理方法、系统、终端设备及存储介质
CN113656354A (zh) 日志分类方法、系统、计算机设备和可读存储介质
CN117714722A (zh) 一种电商直播购物的数据分析方法及系统
CN109409091B (zh) 检测Web页面的方法、装置、设备以及计算机存储介质
CN113407411B (zh) 一种直播场景中线上数据的准确性监测装置及方法
CN112686762B (zh) 保单数据违规检测方法、装置、计算机设备及存储介质
CN114218383A (zh) 重复事件的判定方法、装置及应用
CN112488562B (zh) 一种业务实现方法及装置
CN113706056A (zh) 投标单位业绩识别预警方法、装置、设备及存储介质
CN111127043A (zh) 信用评分方法、装置、计算机设备及存储介质
CN117709858B (zh) 基于ai的多金属供应商准入数据校验方法、装置及设备
CN113220488B (zh) 基于移动终端的记录单粘贴方法及装置
CN114020643B (zh) 一种知识库测试方法及装置
CN115334201B (zh) 有效通话的筛选方法及其系统、计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 building 501, 502, 601, 602, building D, wisdom Plaza, Qiaoxiang Road, Gaofa community, Shahe street, Nanshan District, Shenzhen City, Guangdong Province

Applicant after: China Southern Power Grid Digital Platform Technology (Guangdong) Co.,Ltd.

Address before: 518000 building 501, 502, 601, 602, building D, wisdom Plaza, Qiaoxiang Road, Gaofa community, Shahe street, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: China Southern Power Grid Shenzhen Digital Power Grid Research Institute Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant