CN115630169B - 一种基于供应商知识图谱的围串标预测方法 - Google Patents

一种基于供应商知识图谱的围串标预测方法 Download PDF

Info

Publication number
CN115630169B
CN115630169B CN202211512975.3A CN202211512975A CN115630169B CN 115630169 B CN115630169 B CN 115630169B CN 202211512975 A CN202211512975 A CN 202211512975A CN 115630169 B CN115630169 B CN 115630169B
Authority
CN
China
Prior art keywords
provider
value
surrounding
neural network
bidding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211512975.3A
Other languages
English (en)
Other versions
CN115630169A (zh
Inventor
杨新益
金日强
陈晗
杨岸涛
陈柳
傅天奕
吕含誉
陈冰
吕晓俊
徐冠华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Zhedian Tendering Consulting Co ltd
Materials Branch of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Zhedian Tendering Consulting Co ltd
Materials Branch of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Zhedian Tendering Consulting Co ltd, Materials Branch of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Zhedian Tendering Consulting Co ltd
Priority to CN202211512975.3A priority Critical patent/CN115630169B/zh
Publication of CN115630169A publication Critical patent/CN115630169A/zh
Application granted granted Critical
Publication of CN115630169B publication Critical patent/CN115630169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/061Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Neurology (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及信息技术领域,具体涉及一种基于供应商知识图谱的围串标预测方法,包括以下步骤:建立关系图谱;建立神经网络模型;经关系图谱训练,作为预测神经网络模型;建立贝叶斯预测模型;使用关系图谱训练贝叶斯预测模型;在新的招标中,依次读取每个供应商的关系图谱;分别输入预测神经网络模型和贝叶斯预测模型;添加置信权重后求和,作为新的供应商在投标中进行围串标的最终概率;若高于预设阈值,则发出告警。本发明的有益技术效果包括:借助股权信息、管理人员信息及合作业务信息,建立供应商的关系图谱,通过建立并训练预测神经网络模型及贝叶斯预测模型获得围串标概率,实现围串标的预测,有助于及时阻止围串标行为。

Description

一种基于供应商知识图谱的围串标预测方法
技术领域
本发明涉及信息技术领域,具体涉及一种基于供应商知识图谱的围串标预测方法。
背景技术
招标投标是一种能够有效促进竞争的业务合作形式。一般由若干个供应商参与投标,招标方择优选择。通常会根据供应商的价格、质量、交货期以及服务等维度进行考量。参与投标的供应商需要在指定的期限内,按照指定的格式提交投标文件。其中,围串标是一个招标投标的专业术语,也称为串通投标,它是指几个投标人之间相互约定,一致抬高或压低投标报价进行投标,通过限制竞争,排挤其他投标人,使某个利益相关者中标,从而谋取利益的手段和行为。围串标行为扰乱了市场秩序.逃避主管部门的监管,直接伤害了其它投标供应商的合法权益。参与围标的企业诚信度不高,对项目实施方案不认真研究,无合理实施措施。如果中标会对项目本身留下隐患,因此需要识别和制止围串标行为。但目前缺乏有效进行围串标行为识别的技术。
如中国专利CN114742335A,公开日为2022年7月12日,公开了一种基于大数据的电网围串标识别及处理方法,包括以下步骤:步骤(1).使用项目发标模块发布项目标书,并同时通过行为跟踪模块跟踪投标行为信息,步骤(2).获取当次投标的投标数据,通过信息分析模块分析标书信息,并对标书信息进行分类存储、标记,步骤(3).通过背景调查模块,查询投标者的工商信息,并对投标者背景进行分类对比;步骤(4).通过加权计算投标者投标行为、标书信息、投标者的综合评分,通过预警模块输出警报信息。其技术方案有效防止违规代理、一家多主体的围标、串标方式,但其技术方案难以有效识别多家提前串通投标信息,分别投标围标的方式,不能有效预警招标过程中的围串标行为。
发明内容
本发明所要解决的技术问题:目前缺乏有效识别围串标风险方案的技术问题,提出了一种基于供应商知识图谱的围串标预测方法,能够对围串标行为进行预测,有助于及时阻止围串标行为。
解决上述技术问题,本发明采用如下技术方案:一种基于供应商知识图谱的围串标预测方法,包括以下步骤:
读取供应商的商业关联关系,建立供应商关联关系的知识图谱,记为关系图谱;
建立神经网络模型,所述神经网络模型的输入为本次投标的供应商的关系图谱,输出为供应商围串标概率;
所述神经网络模型经带有围串标概率标记的关系图谱训练,作为预测神经网络模型;
建立贝叶斯预测模型,所述贝叶斯预测模型的输入为本次投标的供应商的关系图谱,输出为供应商围串标概率;
使用带有围串标概率标记的关系图谱训练贝叶斯预测模型;
在新的招标中,依次读取每个供应商的关系图谱;
将供应商的关系图谱分别输入预测神经网络模型和贝叶斯预测模型;
将预测神经网络模型和贝叶斯预测模型输出的围串标概率添加置信权重后求和,作为新的供应商在投标中进行围串标的最终概率;
若所述最终概率高于预设阈值,则发出告警,反之,则反馈新的供应商无围串标风险。
作为优选,建立关系图谱的方法包括:
获取主管部门公开的供应商股权信息和供应商管理人员信息;
根据供应商的股权信息建立供应商与其他企业的关系图谱;
根据管理人员信息将存在相同管理人员的关联企业加入供应商的关系图谱;
建立供应商与企业之间的关联距离函数,所述关联距离函数的输入为供应商与企业之间的股权信息和管理人员信息,所述距离函数的输出为供应商与企业的关联距离值;
所述关系图谱记录关联企业以及关联企业与供应商的关联距离值。
作为优选,所述关联距离函数为:关联距离值=k1*股权关联度+k2*管理人员关联度,其中股权关联度=k3*持股比例+常数c1,管理人员关联度=k4*相关管理人员数量+常数c2,所述相关管理人员指两个管理人员存在以下关系中的任一种:亲戚关系、同学关系或同事关系。
作为优选,建立关系图谱的方法还包括:
建立关联距离修正函数,所述关联距离修正函数的输入为供应商与企业之间的合作业务信息,所述关联距离修正函数的输出为供应商与企业的关联距离修正值;
所述关联距离修正函数下发给供应商,供应商与企业实施合作业务后,将与对应企业的关联距离修正值上报,同时将合作业务相关合同的哈希值上报备案。
作为优选,建立神经网络模型的方法包括:
建立神经网络模型,所述神经网络模型的输入层为预设数量个输入神经元,每个输入神经元对应一个关联距离值,所述神经网络模型是输出为存在围串标的概率;
从历史招投标数据中选择一次招投标中的一个供应商,将所述供应商的关系图谱记录的全部关联距离值升序排列后,作为输入数据,所述供应商是否存在围串标行为作为标签,输入数据及相应标签构成样本数据;
使用样本数据训练和测试所述神经网络模型,直至所述神经网络模型的预测准确率达到预设阈值。
作为优选,将供应商的关系图谱输入预测神经网络模型的方法包括:
读取供应商的关系图谱,提取关系图谱中记录的全部关联距离值;
将关联距离值升序排列后作为预测神经网络模型输入神经元的值,未对应关联距离值的输入神经元取值为预设的初始值。
作为优选,为预测神经网络模型和贝叶斯预测模型添加置信权重的方法包括以下步骤:
预测神经网络模型的置信权重记为w1,贝叶斯预测模型的置信权重记为w2,w1和w2均设置为初始值,w1的初始值记为w,w1和w2的和为1;
新的招标中,供应商的关系图谱记录的全部关联距离值升序排列后,记为关联向量;
训练预测神经网络模型的样本数据的输入数据记为训练向量;
计算关联向量与全部训练向量的向量距离的最小值d,若最小值d不大于预设阈值d0,则w1取值为预设初值,若最小值d大于预设阈值d0,则w1=k5*d0/d*w;
获得预测神经网络模型的置信权重w1后,通过计算式w2=1-w1获得贝叶斯预测模型的置信权重。
作为优选,建立贝叶斯预测模型的方法包括以下步骤:
根据供应商的关系图谱计算供应商与其他投标供应商的总关联距离值;
供应商存在围串标行为记为S事件,总关联距离值小于预设阈值记为H事件,总关联距离值不小于预设阈值记为M事件;
从历史招投标数据中选择一次招投标中的一个供应商,计算选择的供应商与其他投标供应商的总关联距离值;
选择的供应商是否存在围串标行为作为结果标签,总关联距离值与结果标签构成样本向量;
从历史招投标数据中获得多个样本向量构成样本集;
根据样本集计算概率P(H|S)、概率P(M|S)、概率P(H) 、概率P(M)和概率P(S),完成贝叶斯预测模型的构建;
进行新的招标时,选择一个供应商,计算供应商与其他投标供应商的总关联距离值;
若总关联距离值小于预设阈值,则选择的供应商存在围串标行为的概率P=P(H|S)* P(S)/ P(H),若总关联距离值不小于预设阈值,则选择的供应商存在围串标行为的概率P=P(M|S)* P(S)/ P(M)。
作为优选,计算总关联距离值的方法包括以下步骤:
设置参照距离梯度,所述参照距离梯度包括若干个升序排列的参照关联距离值;
设置总关联距离值的初始值,记为U0;
根据供应商的关系图谱,获得供应商与其他投标供应商的关联距离值,并按升序排列;
为每个关联距离值设置修正系数,记为ki,i∈[1,n],n的值为参与投标的供应商数量减1;
将升序后的关联距离值依次与对应次序的参照关联距离值对比;
若关联距离值与对应次序的参照关联距离值差值在预设范围内,则修正系数ki等于1,若关联距离值与对应次序的参照关联距离值差值超出预设范围,则进入下一步骤;
若关联距离值小于对应次序的参照关联距离值,则修正系数ki=对应参照关联距离值/关联距离值+常数c1,若关联距离值大于对应次序的参照关联距离值,则修正系数ki=对应参照关联距离值/关联距离值-常数c2;
供应商与其他投标供应商的关联距离值U=U0*∏ki 。
作为优选,由预先建立的图谱中心服务器,读取供应商的商业关联关系并建立关系图谱,招标方服务器根据投标的供应商向图谱中心服务器请求相应供应商的关系图谱,图谱中心服务器与招标方服务器建立加密通信连接,传输相应的关系图谱;
加密传输关系图谱的方法包括以下步骤:
图谱中心服务器及招标方服务器约定函数R(x)、整数B及加密秘钥更换周期T,函数R(x)的值域覆盖区间[0,B];
加密秘钥为整数,取值区间为[0,B],约定加密秘钥的初始值为V0;
每个更换周期T开始时,图谱中心服务器及招标方服务器分别计算直线y=V与函数R(x)在x轴正半轴上的第一个交点的横坐标vx,令加密秘钥V=floor(vx*10^s) mod B,其中函数floor()为向下取整函数,s为预设正整数。
本发明的有益技术效果包括:1)借助股权信息、管理人员信息及合作业务信息,建立供应商的关系图谱,通过建立并训练预测神经网络模型及贝叶斯预测模型获得围串标概率,实现围串标的预测,有助于及时阻止围串标行为;2)通过设置关联距离表征供应商之间的关联程度,即方便预测神经网络模型的训练也方便贝叶斯预测模型的训练;3)建立总关联距离值表征本次招标活动中供应商的关联关系评价,能够更为准确的识别出围串标风险;4)通过改进的总关联距离值计算方案,提高总关联距离值对供应商关联关系表征的关联度,提高围串标风险预测的准确度。
本发明的其他特点和优点将会在下面的具体实施方式、附图中详细的揭露。
附图说明
下面结合附图对本发明做进一步的说明:
图1为本发明实施例围串标预测方法流程示意图。
图2为本发明实施例建立关系图谱方法流程示意图。
图3为本发明实施例获得关联距离修正值方法流程示意图。
图4为本发明实施例建立神经网络模型方法流程示意图。
图5为本发明实施例关系图谱输入预测神经网络模型方法流程示意图。
图6为本发明实施例添加置信权重方法流程示意图。
图7为本发明实施例建立贝叶斯预测模型方法流程示意图。
图8为本发明实施例计算总关联距离值方法流程示意图。
图9为本发明实施例加密传输关系图谱方法流程示意图。
具体实施方式
下面结合本发明实施例的附图对本发明实施例的技术方案进行解释和说明,但下述实施例仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例,都属于本发明的保护范围。
在下文描述中,出现诸如术语“内”、“外”、“上”、“下”、“左”、“右”等指示方位或者位置关系仅是为了方便描述实施例和简化描述,而不是指示或暗示所指的装置或者元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在介绍本实施例技术方案之前,首先对本实施例应用的背景情况进行介绍。招标投标是一种能够实现供应商之间有效竞争的商业合作关系建立方式。通过多个参与投标的供应商之间对产品质量、价格、供货期限及相关服务的全面对比,择优选择成为招标业务合作伙伴,有效促进优质的供应商与招标方建立业务合作,促进经济发展。正因为招标投标的有益作用,从而逐渐得到了广泛的推广应用。但在实践中,也出现了各种各样的问题。尤其是其中的围标串标行为,对招标活动的损害最大,甚至使招标活动完全背离节省资金,提高产品质量的预期。
围标是一个招标投标的专业术语,也称为串通投标,它是指几个投标人之间相互约定,一致抬高或压低投标报价进行投标,通过限制竞争,排挤其他投标人,使某个利益相关者中标,从而谋取利益的手段和行为。围标行为的发起者称为围标人,参与围标行为的投标人称为陪标人。围标是不成熟的建筑招投标市场发展到一定阶段所产生的。围标成员达成攻守同盟,通常在整个围标过程中陪标人严格遵守双方合作协议要求以保证围标人能顺利中标,并对整个围标活动全过程保密。围标串标行为扰乱了市场秩序,当无标底或复合标底招标而又不采取最低价中标时,围标常常会导致中标价超出正常范围,从而加大招标人的成本。参与围标的企业诚信度不高,企业自身素质差。由于多数企业编制的投标文件着眼点仅仅放在价格上,对施工方案不认真研究,无合理应对措施。即使中标,也不大可能认真组织项目实施,会对项目本身留下隐患。因此需要坚决的遏制围标串标行为。
围标串标的形式主要有:一家投标单位为增大中标几率,邀请其他企业“陪标”以增大自己的中标几率,邀请的“陪标”单位越多,中标几率越大。二是几家投标单位互相联合,形成较为稳定的“窜标同盟”,轮流坐庄,以达到排挤其他投标人,控制中标价格和中标结果的目的,然后按照事先约定分利。在采购活动中往往是代理商们或轮流中标,或由一家公司中标后大家分包。三是个别项目经理和社会闲散人员同时挂靠若干家投标单位投标,表面上是几家单位在参加投标,实际上是一人在背后操纵。
在上述围标串标形式中,均需要多个围标串标的企业之间存在关联,进而能够建立起利益同盟。因此从建立供应商的商业关联关系,通过供应商的商业关联关系,能够有效预测本次招标中,某个供应商是否存在围标串标行为的预测。为进一步核实并处置提供了依据。
本实施例提供了一种基于供应商的商业关系的知识图谱的围串标预测方案,首先收集供应商的商业关系,包括主管部门公开了信息以及供应商主动上报的信息。进而通过建立机器学习和概率模型,实现围串标行为的预测。具体而言,请参阅附图1,一种基于供应商知识图谱的围串标预测方法,包括以下步骤:
步骤A01)读取供应商的商业关联关系,建立供应商关联关系的知识图谱,记为关系图谱;
步骤A02)建立神经网络模型,神经网络模型的输入为本次投标的供应商的关系图谱,输出为供应商围串标概率;
步骤A03)神经网络模型经带有围串标概率标记的关系图谱训练,作为预测神经网络模型;
步骤A04)建立贝叶斯预测模型,贝叶斯预测模型的输入为本次投标的供应商的关系图谱,输出为供应商围串标概率;
步骤A05)使用带有围串标概率标记的关系图谱训练贝叶斯预测模型;
步骤A06)在新的招标中,依次读取每个供应商的关系图谱;
步骤A07)将供应商的关系图谱分别输入预测神经网络模型和贝叶斯预测模型;
步骤A08)将预测神经网络模型和贝叶斯预测模型输出的围串标概率添加置信权重后求和,作为新的供应商在投标中进行围串标的最终概率;
步骤A09)若最终概率高于预设阈值,则发出告警,反之,则反馈新的供应商无围串标风险。
建立供应商的关系图谱后,根据历史招投标数据,能够获得多个样本数据。使用样本数据训练预测神经网络模型,实现通过机器学习手段预测招投标过程的围串标行为。同时建立贝叶斯概率预测模型,实现另一个角度的围串标行为预测。通过设置置信权重,实现两种预测方式的融合,提高预测的准确度。当出现围串标行为告警时,招标方可以通过线下查实的方式确认是否存在围串标行为,进而做出继续招标或者终止招标的处置。也可以将涉嫌围串标的供应商剔除后,继续招标活动。
请参阅附图2,建立关系图谱的方法包括:
步骤B01)获取主管部门公开的供应商股权信息和供应商管理人员信息;
步骤B02)根据供应商的股权信息建立供应商与其他企业的关系图谱;
步骤B03)根据管理人员信息将存在相同管理人员的关联企业加入供应商的关系图谱;
步骤B04)建立供应商与企业之间的关联距离函数,关联距离函数的输入为供应商与企业之间的股权信息和管理人员信息,距离函数的输出为供应商与企业的关联距离值;
步骤B05)关系图谱记录关联企业以及关联企业与供应商的关联距离值。通过主管部门公开的股权信息和管理人员信息,能够快速且可信的建立起供应商的商业关系。若供应商持有某个企业的股权,或者供应商的管理人员同时兼任或曾任另一家企业的管理人员或股东,则二者也具有商业上的关联关系。本实施例对关系图谱做了进一步的改进,关系图谱在知识图谱的基础上,仅记录与供应商存在关联的企业,以及相关企业与供应商之间的关联距离值,简化了知识图谱,同时也方便了预测神经网络模型的训练,以及贝叶斯预测模型的训练。
关联距离函数为:关联距离值=k1*股权关联度+k2*管理人员关联度,其中股权关联度=k3*持股比例+常数c1,管理人员关联度=k4*相关管理人员数量+常数c2,相关管理人员指两个管理人员存在以下关系中的任一种:亲戚关系、同学关系或同事关系。通过优化关联距离值的计算,使关联距离值能够更准确的表征两个企业之间商业关联程度,有助于提高围串标行为预测的准确度。
请参阅附图3,建立关系图谱的方法还包括:
步骤C01)建立关联距离修正函数,关联距离修正函数的输入为供应商与企业之间的合作业务信息,关联距离修正函数的输出为供应商与企业的关联距离修正值;
步骤C02)关联距离修正函数下发给供应商,供应商与企业实施合作业务后,将与对应企业的关联距离修正值上报,同时将合作业务相关合同的哈希值上报备案。供应商与曾经建立过合作业务关系的企业,也存在建立利益同盟的可能性。将与供应商建立过合作业务也纳入供应商的关系图谱中,有助于提高关系图谱对供应商商业关联关系表征的全面程度。供应商的合作业务关系涉及供应商的商业信息,不宜直接提供,本实施例提供了改进的方案。即将关联距离修正函数下发给供应商,供应商与企业实施合作业务后,将与对应企业的关联距离修正值上报,实现关系图谱的建立和更新。同时要求供应商将合作业务相关合同的哈希值上报备案,在必要时,经供应商同意并提供合作业务相关合同,与哈希值验证后,能够验证供应商提供的合作业务相关合同的真伪。
请参阅附图4,建立神经网络模型的方法包括:
步骤D01)建立神经网络模型,神经网络模型的输入层为预设数量个输入神经元,每个输入神经元对应一个关联距离值,神经网络模型是输出为存在围串标的概率;
步骤D02)从历史招投标数据中选择一次招投标中的一个供应商,将供应商的关系图谱记录的全部关联距离值升序排列后,作为输入数据,供应商是否存在围串标行为作为标签,输入数据及相应标签构成样本数据;
步骤D03)使用样本数据训练和测试神经网络模型,直至神经网络模型的预测准确率达到预设阈值。通过将关系图谱记录的全部关联距离值升序排列后,作为输入数据,有助于提高预测神经网络模型的准确度,加快预测神经网络模型训练的效率。
请参阅附图5,将供应商的关系图谱输入预测神经网络模型的方法包括:
步骤E01)读取供应商的关系图谱,提取关系图谱中记录的全部关联距离值;
步骤E02)将关联距离值升序排列后作为预测神经网络模型输入神经元的值,未对应关联距离值的输入神经元取值为预设的初始值。对应的将关联距离值升序排列后,再输入预测神经网络模型。若关联距离值数量不足,则使用预设的初始值替代。根据历史招投标数据,确定预测神经网络模型输入层神经元的数量。
请参阅附图6,为预测神经网络模型和贝叶斯预测模型添加置信权重的方法包括以下步骤:
步骤F01)预测神经网络模型的置信权重记为w1,贝叶斯预测模型的置信权重记为w2,w1和w2均设置为初始值,w1的初始值记为w,w1和w2的和为1;
步骤F02)新的招标中,供应商的关系图谱记录的全部关联距离值升序排列后,记为关联向量;
步骤F03)训练预测神经网络模型的样本数据的输入数据记为训练向量;
步骤F04)计算关联向量与全部训练向量的向量距离的最小值d,若最小值d不大于预设阈值d0,则w1取值为预设初值,若最小值d大于预设阈值d0,则w1=k5*d0/d*w;
步骤F05)获得预测神经网络模型的置信权重w1后,通过计算式w2=1-w1获得贝叶斯预测模型的置信权重。
结合神经网络模型的特点,预测神经网络模型的准确度与训练的样本数据具有显著的关联关系。当前输入的关联向量与训练样本数据的相似度越大,则预测神经网络模型的预测结果越可信,反之,当前输入的关联向量与训练样本数据的相似度越小,则预测神经网络模型的预测结果的可信度就越低。因此本实施例提供了通过计算关联向量与全部训练向量的向量距离的最小值d,并与预设阈值d0对比,最终获得预测神经网络模型的置信权重。当预测神经网络模型的置信权重确定后,贝叶斯预测模型的置信权重也就随之确定。
请参阅附图7,建立贝叶斯预测模型的方法包括以下步骤:
步骤G01)根据供应商的关系图谱计算供应商与其他投标供应商的总关联距离值;
步骤G02)供应商存在围串标行为记为S事件,总关联距离值小于预设阈值记为H事件,总关联距离值不小于预设阈值记为M事件;
步骤G03)从历史招投标数据中选择一次招投标中的一个供应商,计算选择的供应商与其他投标供应商的总关联距离值;
步骤G04)选择的供应商是否存在围串标行为作为结果标签,总关联距离值与结果标签构成样本向量;
步骤G05)从历史招投标数据中获得多个样本向量构成样本集;
步骤G06)根据样本集计算概率P(H|S)、概率P(M|S)、概率P(H) 、概率P(M)和概率P(S),完成贝叶斯预测模型的构建;
步骤G07)进行新的招标时,选择一个供应商,计算供应商与其他投标供应商的总关联距离值;
步骤G08)若总关联距离值小于预设阈值,则选择的供应商存在围串标行为的概率P=P(H|S)* P(S)/ P(H),若总关联距离值不小于预设阈值,则选择的供应商存在围串标行为的概率P=P(M|S)* P(S)/ P(M)。
贝叶斯定理由英国数学家贝叶斯发展,用来描述两个条件概率之间的关系,比如P(A|B) 和P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(A|B)=P(B|A)*P(A)/P(B)。通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯法则就是这种关系的陈述。
在贝叶斯法则中,每个名词都有约定俗成的名称:Pr(A)是A的先验概率或边缘概率。之所以称为“先验”是因为它不考虑任何B方面的因素。Pr(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。Pr(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。Pr(B)是B的先验概率或边缘概率,也作标准化常量。按这些术语,Bayes法则可表述为:后验概率=(似然度*先验概率)/标准化常量。
本实施例借用了贝叶斯法则这一客观规律,但与贝叶斯法则的直接使用存在显著的区别。本实施例所应用的场景不存在后验概率,因为一次招投标活动判断出围串标概率预测后,即不再需要预测,后验概率没有存在的必要。
本实施例中,将供应商存在围串标行为记为S事件,总关联距离值小于预设阈值记为H事件,总关联距离值不小于预设阈值记为M事件,实际上构建两组概率计算模型。一组是参与投标的供应商的总关联距离值小于预设阈值,已经发生的情况下,供应商存在围串标行为的概率预测。另一组是参与投标的供应商的总关联距离值不小于预设阈值,已经发生的情况下,供应商存在围串标行为的概率预测。两组预测综合形成了供应商存在围串标行为概率的预测。
请参阅附图8,计算总关联距离值的方法包括以下步骤:
步骤H01)设置参照距离梯度,参照距离梯度包括若干个升序排列的参照关联距离值;
步骤H02)设置总关联距离值的初始值,记为U0;
步骤H03)根据供应商的关系图谱,获得供应商与其他投标供应商的关联距离值,并按升序排列;
步骤H04)为每个关联距离值设置修正系数,记为ki,i∈[1,n],n的值为参与投标的供应商数量减1;
步骤H05)将升序后的关联距离值依次与对应次序的参照关联距离值对比;
步骤H06)若关联距离值与对应次序的参照关联距离值差值在预设范围内,则修正系数ki等于1,若关联距离值与对应次序的参照关联距离值差值超出预设范围,则进入下一步骤;
步骤H07)若关联距离值小于对应次序的参照关联距离值,则修正系数ki=对应参照关联距离值/关联距离值+常数c1,若关联距离值大于对应次序的参照关联距离值,则修正系数ki=对应参照关联距离值/关联距离值-常数c2;
步骤H08)供应商与其他投标供应商的总关联距离值U=U0*∏ki 。
通过设置参照距离梯度,实现更为客观反映本次招标中,供应商与其余投标方的关联程度的客观评价。因在围串标活动中,牵头围串标的供应商与其他配合围串标的供应商的商业关联程度呈现梯次关系,并非呈现相同的商业关联程度。由此能够促进在招标活动中,更为有效的发现围串标风险。
由预先建立的图谱中心服务器,读取供应商的商业关联关系并建立关系图谱,招标方服务器根据投标的供应商向图谱中心服务器请求相应供应商的关系图谱,图谱中心服务器与招标方服务器建立加密通信连接,传输相应的关系图谱。通过图谱中心服务器的方式,能够使供应商更加愿意提供合作业务相关的信息,使关系图谱更为全面。
请参阅附图9,加密传输关系图谱的方法包括以下步骤:
步骤I01)图谱中心服务器及招标方服务器约定函数R(x)、整数B及加密秘钥更换周期T,函数R(x)的值域覆盖区间[0,B];
步骤I02)加密秘钥为整数,取值区间为[0,B],约定加密秘钥的初始值为V0;
步骤I03)每个更换周期T开始时,图谱中心服务器及招标方服务器分别计算直线y=V与函数R(x)在x轴正半轴上的第一个交点的横坐标vx,令加密秘钥V=floor(vx*10^s)mod B,其中函数floor()为向下取整函数,s为预设正整数。
通过约定函数R(x)及整数B以及初始的加密秘钥V0,即可以周期性的推算出下一个加密秘钥。只需要保证初始的加密秘钥V0的传输安全即可,后续的加密秘钥是不需要在网络上传播的。从而有效的提高了图谱中心服务器及招标方服务器之间传递数据的安全性,确保涉及供应商的商业信息的关系图谱在传输过程的安全性。
综合上述记载和论述,能够预见本实施例的有益技术效果有:1)借助股权信息、管理人员信息及合作业务信息,建立供应商的关系图谱,通过建立并训练预测神经网络模型及贝叶斯预测模型获得围串标概率,实现围串标的预测,有助于及时阻止围串标行为;2)通过设置关联距离表征供应商之间的关联程度,即方便预测神经网络模型的训练也方便贝叶斯预测模型的训练;3)建立总关联距离值表征本次招标活动中供应商的关联关系评价,能够更为准确的识别出围串标风险;4)通过改进的总关联距离值计算方案,提高总关联距离值对供应商关联关系表征的关联度,提高围串标风险预测的准确度。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,熟悉该本领域的技术人员应该明白本发明包括但不限于附图和上面具体实施方式中描述的内容。任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。

Claims (10)

1.一种基于供应商知识图谱的围串标预测方法,其特征在于,
包括以下步骤:
读取供应商的商业关联关系,建立供应商关联关系的知识图谱,记为关系图谱;
建立神经网络模型,所述神经网络模型的输入为本次投标的供应商的关系图谱,输出为供应商围串标概率;
所述神经网络模型经带有围串标概率标记的关系图谱训练,作为预测神经网络模型;
建立贝叶斯预测模型,所述贝叶斯预测模型的输入为本次投标的供应商的关系图谱,输出为供应商围串标概率;
使用带有围串标概率标记的关系图谱训练贝叶斯预测模型;
在新的招标中,依次读取每个供应商的关系图谱;
将供应商的关系图谱分别输入预测神经网络模型和贝叶斯预测模型;
将预测神经网络模型和贝叶斯预测模型输出的围串标概率添加置信权重后求和,作为新的供应商在投标中进行围串标的最终概率;
若所述最终概率高于预设阈值,则发出告警,反之,则反馈新的供应商无围串标风险。
2.根据权利要求1所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
建立关系图谱的方法包括:
获取主管部门公开的供应商股权信息和供应商管理人员信息;
根据供应商的股权信息建立供应商与其他企业的关系图谱;
根据管理人员信息将存在相同管理人员的关联企业加入供应商的关系图谱;
建立供应商与企业之间的关联距离函数,所述关联距离函数的输入为供应商与企业之间的股权信息和管理人员信息,所述关联距离函数的输出为供应商与企业的关联距离值;
所述关系图谱记录关联企业以及关联企业与供应商的关联距离值。
3.根据权利要求2所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
所述关联距离函数为:关联距离值=k1*股权关联度+k2*管理人员关联度,其中股权关联度=k3*持股比例+常数c1,管理人员关联度=k4*相关管理人员数量+常数c2,所述相关管理人员指两个管理人员存在以下关系中的任一种:亲戚关系、同学关系或同事关系。
4.根据权利要求2或3所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
建立关系图谱的方法还包括:
建立关联距离修正函数,所述关联距离修正函数的输入为供应商与企业之间的合作业务信息,所述关联距离修正函数的输出为供应商与企业的关联距离修正值;
所述关联距离修正函数下发给供应商,供应商与企业实施合作业务后,将与对应企业的关联距离修正值上报,同时将合作业务相关合同的哈希值上报备案。
5.根据权利要求2或3所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
建立神经网络模型的方法包括:
建立神经网络模型,所述神经网络模型的输入层为预设数量个输入神经元,每个输入神经元对应一个关联距离值,所述神经网络模型是输出为存在围串标的概率;
从历史招投标数据中选择一次招投标中的一个供应商,将所述供应商的关系图谱记录的全部关联距离值升序排列后,作为输入数据,所述供应商是否存在围串标行为作为标签,输入数据及相应标签构成样本数据;
使用样本数据训练和测试所述神经网络模型,直至所述神经网络模型的预测准确率达到预设阈值。
6.根据权利要求5所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
将供应商的关系图谱输入预测神经网络模型的方法包括:
读取供应商的关系图谱,提取关系图谱中记录的全部关联距离值;
将关联距离值升序排列后作为预测神经网络模型输入神经元的值,未对应关联距离值的输入神经元取值为预设的初始值。
7.根据权利要求5所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
为预测神经网络模型和贝叶斯预测模型添加置信权重的方法包括以下步骤:
预测神经网络模型的置信权重记为w1,贝叶斯预测模型的置信权重记为w2,w1和w2均设置为初始值,w1的初始值记为w,w1和w2的和为1;
新的招标中,供应商的关系图谱记录的全部关联距离值升序排列后,记为关联向量;
训练预测神经网络模型的样本数据的输入数据记为训练向量;
计算关联向量与全部训练向量的向量距离的最小值d,若最小值d不大于预设阈值d0,则w1取值为预设初值,若最小值d大于预设阈值d0,则w1=k5*d0/d*w;
获得预测神经网络模型的置信权重w1后,通过计算式w2=1-w1获得贝叶斯预测模型的置信权重。
8.根据权利要求2或3所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
建立贝叶斯预测模型的方法包括以下步骤:
根据供应商的关系图谱计算供应商与其他投标供应商的总关联距离值;
供应商存在围串标行为记为S事件,总关联距离值小于预设阈值记为H事件,总关联距离值不小于预设阈值记为M事件;
从历史招投标数据中选择一次招投标中的一个供应商,计算选择的供应商与其他投标供应商的总关联距离值;
选择的供应商是否存在围串标行为作为结果标签,总关联距离值与结果标签构成样本向量;
从历史招投标数据中获得多个样本向量构成样本集;
根据样本集计算概率P(H|S)、概率P(M|S)、概率P(H) 、概率P(M)和概率P(S),完成贝叶斯预测模型的构建;
进行新的招标时,选择一个供应商,计算供应商与其他投标供应商的总关联距离值;
若总关联距离值小于预设阈值,则选择的供应商存在围串标行为的概率P=P(H|S)* P(S)/ P(H),若总关联距离值不小于预设阈值,则选择的供应商存在围串标行为的概率P=P(M|S)* P(S)/ P(M)。
9.根据权利要求8所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
计算总关联距离值的方法包括以下步骤:
设置参照距离梯度,所述参照距离梯度包括若干个升序排列的参照关联距离值;
设置总关联距离值的初始值,记为U0;
根据供应商的关系图谱,获得供应商与其他投标供应商的关联距离值,并按升序排列;
为每个关联距离值设置修正系数,记为ki,i∈[1,n],n的值为参与投标的供应商数量减1;
将升序后的关联距离值依次与对应次序的参照关联距离值对比;
若关联距离值与对应次序的参照关联距离值差值在预设范围内,则修正系数ki等于1,若关联距离值与对应次序的参照关联距离值差值超出预设范围,则进入下一步骤;
若关联距离值小于对应次序的参照关联距离值,则修正系数ki=对应参照关联距离值/关联距离值+常数c1,若关联距离值大于对应次序的参照关联距离值,则修正系数ki=对应参照关联距离值/关联距离值-常数c2;
供应商与其他投标供应商的关联距离值U=U0*∏ki 。
10.根据权利要求1至3任一项所述的一种基于供应商知识图谱的围串标预测方法,其特征在于,
由预先建立的图谱中心服务器,读取供应商的商业关联关系并建立关系图谱,招标方服务器根据投标的供应商向图谱中心服务器请求相应供应商的关系图谱,图谱中心服务器与招标方服务器建立加密通信连接,传输相应的关系图谱;
加密传输关系图谱的方法包括以下步骤:
图谱中心服务器及招标方服务器约定函数R(x)、整数B及加密秘钥更换周期T,函数R(x)的值域覆盖区间[0,B];
加密秘钥为整数,取值区间为[0,B],约定加密秘钥的初始值为V0;
每个更换周期T开始时,图谱中心服务器及招标方服务器分别计算直线y=V与函数R(x)在x轴正半轴上的第一个交点的横坐标vx,令加密秘钥V=floor(vx*10^s) mod B,其中函数floor()为向下取整函数,s为预设正整数。
CN202211512975.3A 2022-11-30 2022-11-30 一种基于供应商知识图谱的围串标预测方法 Active CN115630169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211512975.3A CN115630169B (zh) 2022-11-30 2022-11-30 一种基于供应商知识图谱的围串标预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211512975.3A CN115630169B (zh) 2022-11-30 2022-11-30 一种基于供应商知识图谱的围串标预测方法

Publications (2)

Publication Number Publication Date
CN115630169A CN115630169A (zh) 2023-01-20
CN115630169B true CN115630169B (zh) 2023-05-05

Family

ID=84910636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211512975.3A Active CN115630169B (zh) 2022-11-30 2022-11-30 一种基于供应商知识图谱的围串标预测方法

Country Status (1)

Country Link
CN (1) CN115630169B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990697A (zh) * 2021-03-12 2021-06-18 福建万川信息科技股份有限公司 一种基于深度学习的招投标风险值计算系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009032103A (ja) * 2007-07-27 2009-02-12 Tama Tlo Kk 入札監視システム
CN112487209A (zh) * 2020-12-15 2021-03-12 厦门市美亚柏科信息股份有限公司 基于知识图谱的串标行为分析方法、终端设备及存储介质
CN112990281A (zh) * 2021-03-01 2021-06-18 中国工商银行股份有限公司 异常投标识别模型训练方法、异常投标识别方法及装置
CN113486675A (zh) * 2021-06-21 2021-10-08 中国水利电力物资集团有限公司 一种识别围标串标行为的方法
CN114708073B (zh) * 2022-03-29 2023-03-24 湖南华菱电子商务有限公司 一种围标串标智能检测方法、装置、电子设备及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990697A (zh) * 2021-03-12 2021-06-18 福建万川信息科技股份有限公司 一种基于深度学习的招投标风险值计算系统及方法

Also Published As

Publication number Publication date
CN115630169A (zh) 2023-01-20

Similar Documents

Publication Publication Date Title
Smallwood Information governance: Concepts, strategies and best practices
Clohessy et al. Investigating the influence of organizational factors on blockchain adoption: An innovation theory perspective
US11924213B2 (en) User permissions for access to secure data at third-party
US20240006038A1 (en) Team-based tele-diagnostics blockchain-enabled system
CN110263024B (zh) 数据处理方法、终端设备及计算机存储介质
JP2022528839A (ja) 個人情報保護システム
US8180713B1 (en) System and method for searching and identifying potential financial risks disclosed within a document
US20080249936A1 (en) Bill paying systems and associated methods
Taherzadeh et al. No net loss of what, for whom?: stakeholder perspectives to Biodiversity Offsetting in England
US20210065304A1 (en) Contract automation with blockchain based interaction and recording
US7881535B1 (en) System and method for managing statistical models
CN111949733A (zh) 一种基于区块链的资产证券化管理系统及方法
CN110533539B (zh) 基于区块链和ai技术的创新型企业增值权投资交易平台
CN110782350A (zh) 一种基于区块链的企业融资风控方法、装置及系统
Azeem et al. Exploring the impacts of COVID-19 pandemic on risks faced by infrastructure projects in Pakistan
CN115423578A (zh) 基于微服务容器化云平台的招投标方法和系统
US8606615B2 (en) System for managing and tracking an inventory of elements
CN115630169B (zh) 一种基于供应商知识图谱的围串标预测方法
US20090083169A1 (en) Financial opportunity information obtainment and evaluation
US20230103208A1 (en) Methods and systems for classifying resources to niche models
KR100524562B1 (ko) 기술평가 방법 및 그 시스템
CN114331105A (zh) 电子汇票的处理系统、方法、电子设备和存储介质
KR102491666B1 (ko) 기업-프리랜서의 매칭률 향상을 위한 에이전트 시스템
Lawson et al. Novissi Togo: Harnessing Artificial Intelligence to Deliver Shock-Responsive Social Protection
Chu The smart cities approach: The opportunity and possibility of data driven communities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant