CN110992059B - 一种基于大数据的围串标行为识别分析方法 - Google Patents

一种基于大数据的围串标行为识别分析方法 Download PDF

Info

Publication number
CN110992059B
CN110992059B CN201911151844.5A CN201911151844A CN110992059B CN 110992059 B CN110992059 B CN 110992059B CN 201911151844 A CN201911151844 A CN 201911151844A CN 110992059 B CN110992059 B CN 110992059B
Authority
CN
China
Prior art keywords
network
community
bidding
edges
enterprises
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911151844.5A
Other languages
English (en)
Other versions
CN110992059A (zh
Inventor
沈晔
程受武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhaotianxia Bidding Transaction Platform Co ltd
Original Assignee
Zhejiang Zhaotianxia Bidding Transaction Platform Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Zhaotianxia Bidding Transaction Platform Co ltd filed Critical Zhejiang Zhaotianxia Bidding Transaction Platform Co ltd
Priority to CN201911151844.5A priority Critical patent/CN110992059B/zh
Publication of CN110992059A publication Critical patent/CN110992059A/zh
Application granted granted Critical
Publication of CN110992059B publication Critical patent/CN110992059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0605Supply or demand aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的围串标行为识别分析方法,该方法在于借助大数据技术建立了识别围标串标行为的分析模型‑基于复杂网络的社团检测模型,通过构造一个参与招标投标主体之间的社团关系网,该网络可以根据企业行为和诚信关系动态反馈修改权重,同时运用社团检测算法来发现其中潜在的社团关系,据此判断招标投标主体之间是否有存在围标串标的行为,具体将模型应用于查找企业投标行为复杂网络中,通过数据实验结果揭示出交易数据背后隐藏的规律,刻画出围标串标的交易轨迹和行为特点,一定程度反映出诱发围标串标行为的内在根源。

Description

一种基于大数据的围串标行为识别分析方法
技术领域
本发明涉及招投标技术领域,特别涉及一种基于大数据的围串标行为识别分析方法。
背景技术
围串标行为的研究及治理工作一直都是国内外招投标领域关注的热点问题之一。国内外针对围串标开展的对策各有千秋,各行业部门借助经济学理论、法学理论在报价策略、招投标机制以及完善传统招标投标的法律架构等方面展开了大量的研究及试点,并且各国也都通过立法或者制定管理措施等多种积极手段对围串标行为进行打击治理。然后,困于围串标动机复杂、行为隐蔽以及传统研究手段的不足,使得在围串标行为的辨识方面一直进展缓慢,制定的法律法规及政策也收效甚微。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种基于大数据的围串标行为识别分析方法,在于借助大数据技术建立了识别围标串标行为的分析模型-基于复杂网络的社团检测模型,将模型应用于查找企业投标行为复杂网络中,通过数据实验结果揭示出交易数据背后隐藏的规律,刻画出围标串标的交易轨迹和行为特点,一定程度反映出诱发围标串标行为的内在根源。
针对围标串标现象,构造一个参与招标投标主体之间的社团关系网,该网络可以根据企业行为和诚信关系动态反馈修改权重,同时运用社团检测算法来发现其中潜在的社团关系,据此判断招标投标主体之间是否有存在围标串标的行为。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种基于大数据的围串标行为识别分析方法,该方法在于借助大数据技术建立了识别围标串标行为的分析模型-基于复杂网络的社团检测模型,通过构造一个参与招标投标主体之间的社团关系网,该网络可以根据企业行为和诚信关系动态反馈修改权重,同时运用社团检测算法来发现其中潜在的社团关系,据此判断招标投标主体之间是否有存在围标串标的行为,具体包括以下步骤:
步骤1-数据选取,选取交易中心各投标人以往的招投标交易数据,数据量应大于一定条数以保证数据可分析性;
步骤2-企业间复杂关系网络的建立,以投标人参与投标情况为对象,具体以每一个企业作为顶点,将企业间一同参与投标的次数作为两个顶点之间的权重,得到企业间的招标投标关系加权复杂网络(该网络表示的是企业间一同参加投标的频繁程度);
步骤3-社团检测模型分析,对构建的关系网络进行社团检测,根据检测出的社团数量转化为复杂网络的关联矩阵,依据社团i和社团j中节点的边占网络全部边的比例、连接同一社团中节点的边占网络全部边的比例、连接到社团i中所有节点的边占网络全部边的比例等因数计算出企业间的社团关系关联度,最终根据设定的阈值以评定企业间是否具有明显的社团结构(即这些企业之间存在着很大的围标可能性)。
进一步优选为:所述数据量应大于10条,每条交易数据包含招标人(招标代理)、投标人、评标办法、报价、中标情况、地区属性、企业资质属性等39个指标。
进一步优选为:所述步骤2-企业间复杂关系网络的建立中的复杂网络可以建模为一个图,图由边和定点组成,即G=(V,E,w),V表示网络的节点集合,E表示连接的结合,w权值表示关系的强弱,路径表示由社会关系组成的“关系链”,网络簇表示由多个具有共同属性的人组成的“社团”。
进一步优选为:所述社团检测采用模块度函数(也称为Q函数),在检测的过程中,通过假设网络中检测出了k个社团,定义E是一个k阶对称矩阵,它的元素e表示连接社团i和社团j中节点的边占网络全部边的比例,矩阵E的表示连接同一社团中节点的边占网络全部边的比例,而/>表示连接到社团i中所有节点的边占网络全部边的比例,||e2||表示矩阵E所有元素之和,模块度函数Q定义如下:/>所述模块度函数Q函数值最大值为1。
进一步优选为:所述社团检測模型中同时设计有二进制蝙蝠算法,由于社团检测是离散型的组合问题,由此引入位置概念,对原算法进行离散化改进,提高了算法的收敛性和全局搜索能力。
综上所述,本发明对比于现有技术的有益效果为:本发明针对围标串标现象,通过构造一个参与招标投标主体之间的社团关系网,该网络可以根据企业行为和诚信关系动态反馈修改权重,同时运用社团检测算法来发现其中潜在的社团关系,据此判断招标投标主体之间是否有存在围标串标的行为,大数据检测出各企业间的内在关联性,降低围串标行为的发生几率。
附图说明
图1为实施例中招标投标企业的复杂网络统计信息表;
图2为实施例中复杂网络关系矩阵的结构示意图。
具体实施方案
以下结合附图对发明作进一步详细说明。
一种基于大数据的围串标行为识别分析方法,该方法在于借助大数据技术建立了识别围标串标行为的分析模型-基于复杂网络的社团检测模型,通过构造一个参与招标投标主体之间的社团关系网,该网络可以根据企业行为和诚信关系动态反馈修改权重,同时运用社团检测算法来发现其中潜在的社团关系,据此判断招标投标主体之间是否有存在围标串标的行为。
具体包括以下步骤:
步骤1-数据选取,选取交易中心各投标人以往的招投标交易数据,数据量应大于一定条数以保证数据可分析性,在现有的数据实验中得出,数据量应大于10条,并且每条交易数据包含招标人(招标代理)、投标人、评标办法、报价、中标情况、地区属性、企业资质属性等39个指标;
步骤2-企业间复杂关系网络的建立,以投标人参与投标情况为对象,具体以每一个企业作为顶点,将企业间一同参与投标的次数作为两个顶点之间的权重,得到企业间的招标投标关系加权复杂网络(该网络表示的是企业间一同参加投标的频繁程度)。
上述步骤2的关系网络构建思路如下:
首先,复杂网络可以建模为一个图,图由边和定点组成,即G=(V,E,w);V表示网络的节点集合,E表示连接的结合,w权值表示关系的强弱,路径表示由社会关系组成的“关系链”,网络簇表示由多个具有共同属性的人组成的“社团”,我们正是用图聚类的方法来检测围标现象;
然后,以每一个参与投标的企业可以看作是图中的一个顶点,参与同一项目投标的企业则认为他们中间有一条边,并且边上的权重为1;一同参与过n次投标项目的企业则认为他们之间边的权重为n-1,或者是一同参加过两次投标的企业中间连接一条边,一同参与过n次则边的权重为n-1,由此来建立企业间关系的复杂网络。
步骤3-社团检测模型分析,对构建的关系网络进行社团检测,根据检测出的社团数量转化为复杂网络的关联矩阵,依据社团i和社团j中节点的边占网络全部边的比例、连接同一社团中节点的边占网络全部边的比例、连接到社团i中所有节点的边占网络全部边的比例等因数计算出企业间的社团关系关联度,最终根据设定的阈值以评定企业间是否具有明显的社团结构(即这些企业之间存在着很大的围标可能性);
上述步骤3中的社团检测采用模块度函数(也称为Q函数),在检测的过程中,通过假设网络中检测出了k个社团,定义E是一个k阶对称矩阵,它的元素e表示连接社团i和社团j中节点的边占网络全部边的比例,矩阵E的表示连接同一社团中节点的边占网络全部边的比例,而/>表示连接到社团i中所有节点的边占网络全部边的比例,||e2||表示矩阵E所有元素之和,模块度函数Q定义如下:/>所述模块度函数Q的函数值最大值为1。
进一步优选为:社团检測模型中同时设计有二进制蝙蝠算法,由于社团检测是离散型的组合问题,由此引入位置概念,对原算法进行离散化改进,提高了算法的收敛性和全局搜索能力;
速度和位置公式离散化:
Xi(t)=Xi(t-1)Vi(t)
其中:
基于上述的围串标行为识别分析方法,下面结合一定的实验数据和实验过程进行更具体和形象的解释;
现实中,一个企业由于业务能力有限,因此在一定时间内参与投标的次数也应处于某个范围内(特殊情况除外);对复杂网络中的顶点(每个顶点代表一个企业)的度(该企业参与投标频繁程度的量化表现)进行统计,如图1所示。
由图1可看出,复杂网络中顶点的度的平均值为1315,即在正常情况下,任意企业参与招标投标的频繁程度量化值大概为1315左右,大部分顶点的度的值处于1000以内,但有少数的顶点的度超过了10000甚至有极少数顶点的度超过了20000与量化值发生较大偏离,即这些顶点所代表的企业招标投标次数过于频繁;因此,这些顶点所代表的企业极有可能是一些陪标的专业户。
进行围标的两个或两个以上投标人,是经过长期“合作”、磨合,达成了较为稳定的“同盟”(中标人并不一定是相对固定的,有可能是轮流的,但“同盟”成员相对稳定);因此,我们进行社团检测的目的就是在所构造的企业间关系网中找到这样的“同盟”,即学术上所说的社团。
经过计算得到的复杂网络的关系矩阵代表了企业间一同参加招标投标的频繁度情况,从直观上看关系矩阵,发现其中有的地方非常稠密(数值比较大),而有的地方则非常稀疏(大部分数值为0),如图2所示。
若企业间的投标行为都是独立的(即不存在围标申标行为),则得到的企业关系矩阵应该是随机分布的,即关系矩阵各处的稠密程度大致相同;但由图2可以看出,复杂网络的顶点存在着显著的社团结构,即这些顶点所代表的公司有明显的社团行为,说明这些公司之间极有可能存在围标行为。
通过社团检测算法计算,得到企业间关系的复杂网络的Q函数值为0.4863,因此企业间的关系网具有明显的社团结构(即这些企业之间存在着很大的围标可能性);若将其中检测到的社团与实际中标企业相对比,则不难发现围标发起者和陪标者。
以上所述仅是本发明的示范性实施方式,而非用于限制本发明的保护范围,本发明的保护范围由所附的权利要求确定。

Claims (5)

1.一种基于大数据的围串标行为识别分析方法,其特征在于,该方法在于借助大数据技术建立了识别围标串标行为的分析模型-基于复杂网络的社团检测模型,通过构造一个参与招标投标主体之间的社团关系网,该网络可以根据企业行为和诚信关系动态反馈修改权重,同时运用社团检测算法来发现其中潜在的社团关系,据此判断招标投标主体之间是否有存在围标串标的行为,具体包括以下步骤:
步骤1-数据选取,选取交易中心各投标人以往的招投标交易数据,数据量应大于一定条数以保证数据可分析性;
步骤2-企业间复杂关系网络的建立,以投标人参与投标情况为对象,具体以每一个企业作为顶点,将企业间一同参与投标的次数作为两个顶点之间的权重,得到企业间的招标投标关系加权复杂网络,该网络表示的是企业间一同参加投标的频繁程度;
步骤3-社团检测模型分析,对构建的关系网络进行社团检测,根据检测出的社团数量转化为复杂网络的关联矩阵,依据社团i和社团j中节点的边占网络全部边的比例、连接同一社团中节点的边占网络全部边的比例、连接到社团i中所有节点的边占网络全部边的比例等因数计算出企业间的社团关系关联度,最终根据设定的阈值以评定企业间是否具有明显的社团结构,即这些企业之间存在着很大的围标可能性。
2.根据权利要求1所述的一种基于大数据的围串标行为识别分析方法,其特征是:所述数据量应大于10条,每条交易数据包含39个指标。
3.根据权利要求1所述的一种基于大数据的围串标行为识别分析方法,其特征是:所述步骤2-企业间复杂关系网络的建立中的复杂网络可以建模为一个图,图由边和定点组成,即G=(V,E,w),V表示网络的节点集合,E表示连接的结合,w权值表示关系的强弱,路径表示由社会关系组成的“关系链”,网络簇表示由多个具有共同属性的人组成的“社团”。
4.根据权利要求1所述的一种基于大数据的围串标行为识别分析方法,其特征是:所述社团检测采用模块度函数,也称为Q函数,在检测的过程中,通过假设网络中检测出了k个社团,定义E是一个k阶对称矩阵,它的元素e表示连接社团i和社团j中节点的边占网络全部边的比例,矩阵E的表示连接同一社团中节点的边占网络全部边的比例,而表示连接到社团i中所有节点的边占网络全部边的比例,e2表示矩阵E所有元素之和,模块度函数Q定义如下:/>所述模块度函数Q的函数值最大值为1。
5.根据权利要求1所述的一种基于大数据的围串标行为识别分析方法,其特征是:所述社团检測模型中同时设计有二进制蝙蝠算法,由于社团检测是离散型的组合问题,由此引入位置概念,对原算法进行离散化改进,提高了算法的收敛性和全局搜索能力。
CN201911151844.5A 2019-11-22 2019-11-22 一种基于大数据的围串标行为识别分析方法 Active CN110992059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911151844.5A CN110992059B (zh) 2019-11-22 2019-11-22 一种基于大数据的围串标行为识别分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911151844.5A CN110992059B (zh) 2019-11-22 2019-11-22 一种基于大数据的围串标行为识别分析方法

Publications (2)

Publication Number Publication Date
CN110992059A CN110992059A (zh) 2020-04-10
CN110992059B true CN110992059B (zh) 2023-08-29

Family

ID=70085675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911151844.5A Active CN110992059B (zh) 2019-11-22 2019-11-22 一种基于大数据的围串标行为识别分析方法

Country Status (1)

Country Link
CN (1) CN110992059B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583000B (zh) * 2020-06-03 2022-07-19 南京鑫智链科技信息有限公司 围标串标行为识别方法、装置、计算机设备及存储介质
CN112258303B (zh) * 2020-11-16 2024-04-30 北京筑龙信息技术有限责任公司 围串标预警分析方法、装置、电子设备及存储介质
CN112464109A (zh) * 2020-12-11 2021-03-09 广东电网有限责任公司 一种使用关联关系分析供应商关联的查找方法及装置
CN112561703B (zh) * 2020-12-23 2022-10-25 支付宝(杭州)信息技术有限公司 基于异步网络刻画和实时特征提取的局部关系网络的刻画方法、系统
CN113918558A (zh) * 2021-11-25 2022-01-11 浙江浙能技术研究院有限公司 基于社区发现和关联规则分析的供应商紧密关系识别方法
CN115062148B (zh) * 2022-06-23 2023-06-20 广东国义信息科技有限公司 一种基于数据库的风险控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046973A (zh) * 2019-04-17 2019-07-23 成都市审计局 一种基于关联关系大数据分析的围标串标检测方法
CN110443265A (zh) * 2018-05-04 2019-11-12 北京京东尚科信息技术有限公司 一种基于社团的行为检测方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443265A (zh) * 2018-05-04 2019-11-12 北京京东尚科信息技术有限公司 一种基于社团的行为检测方法和装置
CN110046973A (zh) * 2019-04-17 2019-07-23 成都市审计局 一种基于关联关系大数据分析的围标串标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
社会网络中的团队形成问题研究综述;黄健斌;孙晓晶;周瑜;吕泽;孙鹤立;贾晓琳;;软件学报;28(04);全文 *

Also Published As

Publication number Publication date
CN110992059A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110992059B (zh) 一种基于大数据的围串标行为识别分析方法
Xu et al. Uncovering collusive spammers in Chinese review websites
Dhawan et al. Spotting collective behaviour of online frauds in customer reviews
Fei et al. Exploiting burstiness in reviews for review spammer detection
Rowe et al. Automated social hierarchy detection through email network analysis
CN113268675A (zh) 一种基于图注意力网络的社交媒体谣言检测方法和系统
CN105389505A (zh) 基于栈式稀疏自编码器的托攻击检测方法
Chen Data mining applications in e-government information security
Macskassy et al. Suspicion scoring of networked entities based on guilt-by-association, collective inference, and focused data access1
LaRock et al. Hypa: Efficient detection of path anomalies in time series data on networks
Chen et al. Community detection based on social interactions in a social network
Fraisier et al. Uncovering like-minded political communities on twitter
Gliwa et al. Models of social groups in blogosphere based on information about comment addressees and sentiments
CN116226103A (zh) 一种基于FPGrowth算法进行政务数据质量检测的方法
Cai et al. An efficient outlier detection method for data streams based on closed frequent patterns by considering anti-monotonic constraints
Cao et al. Fake reviewer group detection in online review systems
Bhat et al. OCMiner: a density-based overlapping community detection method for social networks
Blue et al. Digital footprints: your unique identity
Phillips et al. A rule and graph-based approach for targeted identity resolution on policing data
CN113222207B (zh) 基于社区结构的招投标公司网络关系预测方法及预测系统
CN115018007A (zh) 一种基于改进id3决策树的敏感数据分类方法
Zhao et al. Detecting fake reviews via dynamic multimode network
Helal et al. An efficient algorithm for community detection in attributed social networks
Kim et al. A detection of overlapping community in mobile social network
Li et al. A community discovery and TrustRank based approach for spammer ranking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant