CN114418246A - 基于大数据的项目预测系统 - Google Patents
基于大数据的项目预测系统 Download PDFInfo
- Publication number
- CN114418246A CN114418246A CN202210324164.4A CN202210324164A CN114418246A CN 114418246 A CN114418246 A CN 114418246A CN 202210324164 A CN202210324164 A CN 202210324164A CN 114418246 A CN114418246 A CN 114418246A
- Authority
- CN
- China
- Prior art keywords
- project
- enterprise
- predicted
- keyword
- passing rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于大数据的项目预测系统,包括,采集模块,用于采集企业信息和项目申请信息;存储模块,其与采集模块相连接,包括企业信息存储单元和项目信息存储单元,企业信息存储单元用于存储各企业申请项目信息,项目信息存储单元用于存储项目信息;优先级计算模块,用于根据企业信息存储单元存储的项目申请通过的企业信息获取待预测项目属性的各关键词的优先级;通过率计算模块,用于根据待预测项目属性的各关键词优先级获取待评价企业申请待预测项目的通过率;预测模块,用于根据企业关联度和项目关联度对通过率计算模块计算的待评价企业申请待预测项目的通过率进行调节,以使待评价企业申请待预测项目预测准确。
Description
技术领域
本发明涉及项目预测领域,尤其涉及一种基于大数据的项目预测系统。
背景技术
对大量的项目政策进行种类筛选定项的工作过程中,常常需要大量的人工进行筛选定项,浪费人力和时间,且筛选定项效率较低,在大数据分析技术飞速发展的今天,对于企业项目申报过程中需求的解决还不够精准。企业在进行项目申报时,无法较为全面的对实时的项目政策进行了解,同时企业对自身的各项条件符合的项目内容和奖励政策不能较好的了解和掌握,导致企业浪费掉较多的人力物力去开展通过率较低的项目,却没有开展成功率较高的企业项目,现有的项目预测平台由于政策匹配结果不精准、企业信息输入较复杂、政策信息不完善政策匹配条件单一,无权重之分造成企业项目筛选过程中,无法客观评价项目的成功可能。
中国专利ZL2018111152399.X公开了一种项目推荐方模型训练法、项目推荐方法以及装置,其解决了通过获取用于兴趣偏好、提高模型有效性进而提高项目推荐的准确性的技术方案,但并未解决企业申请项目通过率的技术问题。
发明内容
为此,本发明提供一种基于大数据的项目预测系统,可以解决无法根据企业与项目的关联性判定企业申请项目的通过率的技术问题。
为实现上述目的,本发明提供一种基于大数据的项目预测系统,包括:
采集模块,用于采集企业信息和项目申请信息;
存储模块,其与所述采集模块相连接,包括企业信息存储单元和项目信息存储单元,所述企业信息存储单元用于存储各企业申请项目信息,所述项目信息存储单元用于存储项目信息,所述企业信息存储单元包括项目申请通过的企业信息数据库,所述项目信息存储单元包括项目申请信息数据库;
优先级计算模块,其与所述存储模块相连接,用于根据所述企业信息存储单元存储的项目申请通过的企业信息获取待预测项目属性的各关键词的优先级;
通过率计算模块,其与所述存储模块、所述优先级计算模块相连接,用于根据待预测项目属性的各关键词优先级获取待评价企业申请待预测项目的通过率;
预测模块,其与所述通过率计算模块相连接,用于根据待预测项目申请通过的企业信息获取的企业关联度和待评价企业历史申请项目信息获取的项目关联度对所述通过率计算模块计算的待评价企业申请待预测项目的通过率进行调节,以使待评价企业申请待预测项目预测准确。
进一步地,所述优先级计算模块根据待预测项目申请通过的企业信息获取待预测项目属性的各关键词的优先级Fi,设定Fi=1/(((fi1-2-fi0)2+(fi2-3-fi0)2+···+(fi(n-1)n-fi0)2)/(n-1)),其中,fi1-2为待预测项目申请通过企业信息第i关键词第一位置和第i关键词第二位置的距离,fi2-3为待预测项目申请通过企业信息第i关键词第二位置和第i关键词第三位置的距离···fi(n-1)n为待预测项目申请通过企业信息第i关键词第(n-1)位置和第i关键词第n位置的距离,fi0为待预测项目申请通过企业信息第i关键词相邻位置距离的平均值,设定fi0=(fi1-2+fi2-3···+fi(n-1)n)/(n-1),i=1,2···n,n为待预测项目的项目属性关键词数量。
进一步地,所述优先级计算模块获取关键词分布度v,设定v=(v1-2+v2-3+···+v(u-1)u)/(u-1),其中,v1-2为待预测项目申请通过企业项目属性关键词第一位置和项目属性关键词第二位置的距离,v2-3为待预测项目申请通过企业项目属性关键词第二位置和项目属性关键词第三位置的距离···v(u-1)u为待预测项目申请通过企业项目属性关键词第(u-1)位置和项目属性关键词第u位置的距离,其中,u为项目关键词数量。
进一步地,所述优先级计算模块预设关键词分布度标准值V0,优先级计算模块根据获取的关键词分布度与预设关键词分布度标准值相比较,对获取的第i关键词优先级进行调节,其中,
当v≤V0,所述优先级计算模块将第i关键词优先级Fi降低至Fi1,设定Fi1=Fi×(1-(V0-v)/V0);
当v>V0,所述优先级计算模块将第i关键词优先级Fi提高至Fi2,设定Fi2=Fi×(1+(v-V0)/V0)。
进一步地,所述优先级计算模块获取待预测项目的项目属性各关键词优先权Fic,与待预测项目的项目属性各关键词在待评价企业信息中的频率pi,设定pi=ki/K,其中,ki为待评价企业信息中第i关键词的数量,K为待评价企业信息总字符数,所述通过率计算模块获取待评价企业申请待预测项目通过率t,设定t=(p1×F1+p2×F2+···+pn×Fn)/n,其中,c=1,2。
进一步地,所述预测模块获取企业关联度dy,设定dy=(z1+z2+···+zn)/n,其中,zi为第i关键词在待预测项目申请通过企业信息中的频率,设定zi=(ai/M1+ai/M2+···+ai/MG)/G,其中,ai为第i关键词在待预测项目申请通过的第l企业信息中出现的次数,Ml为待预测项目申请通过的第l企业信息字符总数,l=1,2···G,G为待预测项目申请通过的企业总数。
进一步地,所述预测模块预设企业关联度标准值DY,预测模块将获取的企业关联度dy与预设企业关联度标准值相比较,获取通过率调节参数对待评价企业申请待预测项目通过率进行调节,其中,
当dy≤DY1,所述预测模块选取第一预设通过率调节参数e1对待评价企业申请待预测项目通过率进行调节;
当DY1<dy<DY2,所述预测模块选取第二预设通过率调节参数e2对待评价企业申请待预测项目通过率进行调节;
当dy≥DY2,所述预测模块选取第三预设通过率调节参数e3对待评价企业申请待预测项目通过率进行调节;
其中,所述预测模块预设企业关联度标准值DY,设定第一预设企业关联度标准值DY1,第二预设企业关联度标准值DY2,预测模块预设通过率调节参数e,设定第一预设通过率调节参数e1,第二预设通过率调节参数e2,第三预设通过率调节参数e3。
进一步地,所述预测模块获取项目关联度dx,设定dx=(b1+b2+···+bn)/n,其中,bi为第i关键词在待评价企业历史申请项目信息中出现的频率,设定bi=(si/w1+si/w2+···+si/wH)/H,其中,si为第i关键词在待评价企业历史第p申请项目信息中出现的次数,wp为待评价企业历史第p申请项目信息字符总数,p=1,2···H,H为待评价企业历史申请项目总数。
进一步地,所述预测模块预设项目关联度标准值DX,预测模块将获取的项目关联度dx与预设项目关联度标准值相比较,对待评价企业申请待预测项目通过率进行调节,其中,
当dx≤DX1,所述预测模块降低待评价企业申请待预测项目通过率;
当DX1<dx<DX2,所述预测模块根据选取的通过率调节参数将待评价企业申请待预测项目通过率t调节至t1,设定t1=t×eq;
当dx≥DX2,所述预测模块增加待评价企业申请待预测项目通过率;
其中,所述预测模块预设项目关联度标准值DX,设定第一预设项目关联度标准值DX1,第二预设项目关联度标准值DX2,q=1,2,3。
进一步地,所述预测模块获取的项目关联度小于等于第一预设项目关联度标准值,预测模块降低待评价企业申请待预测项目通过率t至t2,设定t2=t×eq×(1-(DX1-dx)/DX1);当所述预测模块获取的项目关联度大于等于第二预设项目关联度标准值,预测模块增加待评价企业申请待预测项目通过率t至t3,设定t3=t×eq×(1+(dx-DX2)/DX2)。
与现有技术相比,本发明的有益效果在于,本发明设置有根据所述企业信息存储单元存储的项目申请通过的企业信息获取待预测项目属性的各关键词的优先级的优先级计算模块,根据待预测项目属性的各关键词优先级获取待评价企业申请待预测项目的通过率的通过率计算模块,根据待预测项目申请通过的企业信息获取的企业关联度和待评价企业历史申请项目信息获取的项目关联度对所述通过率计算模块计算的待评价企业申请待预测项目的通过率进行调节的预测模块,以使待评价企业申请待预测项目预测准确。
尤其,本发明根据历史通过待预测项目的企业信息中各关键词相邻位置的距离获取各关键词的优先级,其中,若各关键词在通过待预测项目的企业信息中相邻位置的距离较为稳定,说明该关键词在企业信息中分布较为均匀,该关键词的优先级较高,若关键词在通过待预测项目的企业信息中相邻位置的距离不稳定,说明该关键词在企业信息中分布不均匀,其优先级较低。
尤其,本发明根据历史通过待预测项目的企业信息中各关键词相邻位置的距离获取各关键词的优先级,其中,若各关键词在通过待预测项目的企业信息中相邻位置的距离较为稳定,说明该关键词在企业信息中分布较为均匀,该关键词的优先级较高,若关键词在通过待预测项目的企业信息中相邻位置的距离不稳定,说明该关键词在企业信息中分布不均匀,其优先级较低。同时,本发明根据历史申请待遇测项目通过的企业的企业信息中隶属于待预测项目属性的关键词相邻位置的平均值用以获取当前关键词分布度,并将获取的关键词分布度与预设分布度标准值相比较,对各关键词的优先级进行调节,其中,优先级的关键词为项目属性中各个关键词的优先级,其实际为单个关键词的优先级,而关键词分布度中优先级指项目属性全部关键词,并不是单一关键词,所述优先级计算模块获取关键词分布度小于等于预设关键词分布度标准值,说明项目属性关键词整体分布情况较标准略低,优先级计算模块判定降低各关键词优先级,所述优先级计算模块获取关键词分布度大于预设关键词分布度标准值,说明项目属性关键词整体分布情况较标准略高,优先级计算模块判定提高各关键词优先级,以将各关键词的优先级与项目属性关键词关系进行整合,获取各关键词更为准确的优先级。
尤其,本发明根据待评价企业信息中各关键词频率与该关键词的优先级计算待评价企业申请待预测项目的通过率,综合评价待评价企业和项目的关联程度,同时,本发明还设置有预测模块,通过预测模块获取的企业关联度和项目关联度,对计算得到的通过率进行调节,更全面的评价待评价企业和项目的关联程度。
尤其,本发明根据各关键词在待遇测项目申请通过的各企业信息中的频率获取企业关联度,同时本发明预测模块将预设的企业关联度标准值划分为两个标准,预测模块将获取的企业关联度与预设企业关联度标准值相比较,选取最佳的通过率调节参数以调节待评价企业申请待预测项目通过率,其中,若企业关联度小于等于第一预设企业关联度标准值,预测模块选取较小的通过率调节参数,以降低通过率,若企业关联度在第一预设企业关联度标准值和第二预设企业关联度标准值之间,预测模块选取中间值的通过率调节参数以修正通过率,若企业关联度大于等于第二预设企业关联度标准值,预测模块选取较大的通过率调节参数,以提高通过率。
尤其,本发明设置有项目关联度获取方式,其根据各关键词在待评价企业历史申请项目信息中的频率用于获取项目关联度,即各关键词在待评价企业历史申请的项目信息中出现次数越多,说明该企业与带预测企业的项目关联度越大,同时本发明将项目关联度标准值划分为两个标准,预测模块将获取的项目关联度与预设项目关联度标准值相比较,对通过率进行调节,其中,当项目关联度小于等于第一预设项目关联度标准值,预测模块根据项目关联度与第一预设项目关联度标准值的差值以及选取的通过率调节参数综合调节待评价企业申请待遇测项目的通过率,当项目关联度在第一预设项目关联度标准值和第二预设项目关联度标准值之间,预测模块根据选取的通过率调节参数综合调节待评价企业申请待遇测项目的通过率,当项目关联度大于等于第二预设项目关联度标准值,预测模块根据项目关联度与第二预设项目关联度标准值的差值以及选取的通过率调节参数综合调节待评价企业申请待遇测项目的通过率。
附图说明
图1为发明实施例基于大数据的项目预测系统示意图;
图2为发明实施例科技型项目各关键词计算方法示意图;
图3为发明实施例科技型项目关键词计算方法示意图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本发明实施例基于大数据的项目预测系统示意图,包括,
采集模块,用于采集企业信息和项目申请信息;
存储模块,其与所述采集模块相连接,包括企业信息存储单元和项目信息存储单元,所述企业信息存储单元用于存储各企业申请项目信息,所述项目信息存储单元用于存储项目信息,所述企业信息存储单元包括项目申请通过的企业信息数据库,所述项目信息存储单元包括项目申请信息数据库;
优先级计算模块,其与所述存储模块相连接,用于根据所述企业信息存储单元存储的项目申请通过的企业信息获取待预测项目属性的各关键词的优先级;
通过率计算模块,其与所述存储模块、所述优先级计算模块相连接,用于根据待预测项目属性的各关键词优先级获取待评价企业申请待预测项目的通过率;
预测模块,其与所述通过率计算模块相连接,用于根据待预测项目申请通过的企业信息获取的企业关联度和待评价企业历史申请项目信息获取的项目关联度对所述通过率计算模块计算的待评价企业申请待预测项目的通过率进行调节,以使待评价企业申请待预测项目预测准确。
具体而言,本发明实施例以科技型企业项目预测系统为例,所述项目预测系统包括,采集模块,用于采集企业信息和科研型项目申请信息;存储模块,其与所述采集模块相连接,包括企业信息存储单元、项目信息存储单元,所述企业信息存储单元包括项目申请通过的企业信息数据库,所述项目信息存储单元包括项目申请信息数据库,所述企业信息存储单元存储有各企业的信息、各企业项目申请历史材料,其中,项目申请通过的企业信息数据库存储有各项目通过的企业信息,其中,企业信息包括企业所在领域、企业资质、企业研发进展、企业研发投入、企业研发人员配置所述项目信息存储单元存储有项目申请信息,其中,项目申请信息包括项目应用领域、项目研发资金投入、项目资助要求以及项目人员学历;
优先级计算模块,其与所述存储模块相连接,用于根据所述企业信息存储单元存储的待预测项目的项目通过企业信息获取项目属性关键词的优先级;
其中,所述优先级计算模块根据所述项目申请通过的企业信息数据库中通过待预测项目的企业信息中各关键词相邻位置的距离获取项目属性中各关键词的优先级,更具体的说,通过待预测项目的企业较多,其企业信息有若干份,优先级计算模块以通过待预测项目的若干企业信息中各关键词优先级的平均值为该关键词的优先级,更具体的说,科技型项目项目属性的关键词包括研发、研究、分析、创新、创造、前沿、先进、成果、高端,请参阅图2所示,其为本发明实施例科技型项目各关键词计算方法示意图,当优先级计算模块获取关键词“研发”的优先级时,优先级计算模块调取通过待预测项目第一个企业的企业信息,其中,第一个研发出现位置11、第二个研发出现位置12、第三个研发出现位置13、第四个研发出现位置14、第五个研发出现位置15、第六个研发出现位置16、第七个研发出现位置17、第八个研发出现位置18、优先级计算模块根据第一个研发出现位置与第二个研发出现位置的距离、第二个研发出现位置与第三个研发出现位置的距离、第三个研发出现位置与第四个研发出现位置的距离、第四个研发出现位置与第五个研发出现位置的距离、第五个研发出现位置与第六个研发出现位置的距离、第六个研发出现位置与第七个研发出现位置的距离、第七个研发出现位置与第八个研发出现位置的距离,获取关键词“研发”的优先级,以此方法,优先级计算模块获取科研型项目属性各个关键词的优先级。
具体而言,本发明实施例对关键词相邻位置的距离获取方式不做限定,只要其能够统一标准,获取企业信息中各个关键词的位置关系即可,本发明实施例提供一种优选的实施方案,以企业信息第一个字符为原点,以文字走向为横坐标,以垂直于文字走向的方向为纵坐标,建立平面直角坐标系,并根据相邻关键词在坐标的位置获取距离,同时,本发明实施例以文字的顺序确定关键词的顺序,即当文字从左向右排列,则关键词从左至右出现顺序为关键词的顺序。
具体而言,本发明实施例一种优先级计算方法,所述优先级计算模块根据待预测项目申请通过的企业信息获取待预测项目属性的各关键词的优先级Fi,设定Fi=1/(((fi1-2-fi0)2+(fi2-3-fi0)2+···+(fi(n-1)n-fi0)2)/(n-1)),其中,fi1-2为待预测项目申请通过企业信息第i关键词第一位置和第i关键词第二位置的距离,fi2-3为待预测项目申请通过企业信息第i关键词第二位置和第i关键词第三位置的距离···fi(n-1)n为待预测项目申请通过企业信息第i关键词第(n-1)位置和第i关键词第n位置的距离,fi0为待预测项目申请通过企业信息第i关键词相邻位置距离的平均值,设定fi0=(fi1-2+fi2-3···+fi(n-1)n)/(n-1),i=1,2···n,n为待预测项目的项目属性关键词数量。
具体而言,本发明根据历史通过待预测项目的企业信息中各关键词相邻位置的距离获取各关键词的优先级,其中,若各关键词在通过待预测项目的企业信息中相邻位置的距离较为稳定,说明该关键词在企业信息中分布较为均匀,该关键词的优先级较高,若关键词在通过待预测项目的企业信息中相邻位置的距离不稳定,说明该关键词在企业信息中分布不均匀,其优先级较低。
具体而言,本发明提供一种实施例,对优先级计算模块获取的优先级进行调节,其中,所述优先级计算模块获取关键词分布度,该关键词分布度用以评价隶属于项目属性中全部关键词的分布情况,具体的,请参阅图3所示,其为本发明实施例科技型项目关键词计算方法示意图,更具体地说,企业信息中第一个项目属性关键词研发21、第二个项目属性关键词研究22、第三个项目属性关键词分析23、第四个项目属性关键词研发24、第五个项目属性关键词成果25、第六个项目属性关键词成果26,、第七个项目属性关键词创造27、第八个项目属性关键词研发28、第九个项目属性关键词先进29,优先级计算模块根据项目属性相邻关键词距离的平均值获取关键词分布度,同时,优先级计算模块设置有关键词分布度标准值,若优先级计算模块获取的关键词分布度小于预设标准值,优先级计算模块降低优先级,反之则提高优先级,以获取准确的各关键词优先级。
具体而言,所述优先级计算模块获取关键词分布度v,设定v=(v1-2+v2-3+···+v(u-1)u)/(u-1),其中,v1-2为待预测项目申请通过企业项目属性关键词第一位置和项目属性关键词第二位置的距离,v2-3为待预测项目申请通过企业项目属性关键词第二位置和项目属性关键词第三位置的距离···v(u-1)u为待预测项目申请通过企业项目属性关键词第(u-1)位置和项目属性关键词第u位置的距离,其中,u为项目关键词数量。
其中,所述优先级计算模块预设关键词分布度标准值V0,优先级计算模块根据获取的关键词分布度与预设关键词分布度标准值相比较,对获取的第i关键词优先级进行调节,其中,
当v≤V0,所述优先级计算模块将第i关键词优先级Fi降低至Fi1,设定Fi1=Fi×(1-(V0-v)/V0);
当v>V0,所述优先级计算模块将第i关键词优先级Fi提高至Fi2,设定Fi2=Fi×(1+(v-V0)/V0)。
具体而言,本发明根据历史通过待预测项目的企业信息中各关键词相邻位置的距离获取各关键词的优先级,其中,若各关键词在通过待预测项目的企业信息中相邻位置的距离较为稳定,说明该关键词在企业信息中分布较为均匀,该关键词的优先级较高,若关键词在通过待预测项目的企业信息中相邻位置的距离不稳定,说明该关键词在企业信息中分布不均匀,其优先级较低。同时,本发明根据历史申请待遇测项目通过的企业的企业信息中隶属于待预测项目属性的关键词相邻位置的平均值用以获取当前关键词分布度,并将获取的关键词分布度与预设分布度标准值相比较,对各关键词的优先级进行调节,其中,优先级的关键词为项目属性中各个关键词的优先级,其实际为单个关键词的优先级,而关键词分布度中优先级指项目属性全部关键词,并不是单一关键词,所述优先级计算模块获取关键词分布度小于等于预设关键词分布度标准值,说明项目属性关键词整体分布情况较标准略低,优先级计算模块判定降低各关键词优先级,所述优先级计算模块获取关键词分布度大于预设关键词分布度标准值,说明项目属性关键词整体分布情况较标准略高,优先级计算模块判定提高各关键词优先级,以将各关键词的优先级与项目属性关键词关系进行整合,获取各关键词更为准确的优先级。
具体而言,通过率计算模块,其与所述存储模块、所述优先级计算模块相连接,用于根据待预测项目属性内各关键词优先级获取企业申请待预测项目的通过率;所述优先级计算模块获取待预测项目的项目属性各关键词优先权Fic,与待预测项目的项目属性各关键词在待评价企业信息中的频率pi,设定pi=ki/K,其中,ki为待评价企业信息中第i关键词的数量,K为待评价企业信息总字符数,所述通过率计算模块获取待评价企业申请待预测项目通过率t,设定t=(p1×F1+p2×F2+···+pn×Fn)/n,其中,c=1,2。
具体而言,本发明根据待评价企业信息中各关键词频率与该关键词的优先级计算待评价企业申请待预测项目的通过率,综合评价待评价企业和项目的关联程度,同时,本发明还设置有预测模块,通过预测模块获取的企业关联度和项目关联度,对计算得到的通过率进行调节,更全面的评价待评价企业和项目的关联程度。
具体而言,预测模块,其用于根据企业信息与待预测项目通过的企业信息获取的企业关联度和待预测项目信息与企业项目申请历史信息获取的项目关联度对所述通过率计算模块计算的企业申请待预测项目的通过率进行调节,以对企业申请待预测项目预测准确。其中,所述企业信息存储单元包括企业信息数据库,以及项目申请通过的企业信息数据库,其中,企业信息数据库储存有企业历史申请项目记录,所述项目信息包括项目申请信息数据库。
具体而言,所述预测模块获取企业关联度dy,设定dy=(z1+z2+···+zn)/n,其中,zi为第i关键词在待预测项目申请通过企业信息中的频率,设定zi=(ai/M1+ai/M2+···+ai/MG)/G,其中,ai为第i关键词在待预测项目申请通过的第l企业信息中出现的次数,Ml为待预测项目申请通过的第l企业信息字符总数,l=1,2···G,G为待预测项目申请通过的企业总数。
所述预测模块预设企业关联度标准值DY,预测模块将获取的企业关联度dy与预设企业关联度标准值相比较,获取通过率调节参数对待评价企业申请待预测项目通过率进行调节,其中,
当dy≤DY1,所述预测模块选取第一预设通过率调节参数e1对待评价企业申请待预测项目通过率进行调节;
当DY1<dy<DY2,所述预测模块选取第二预设通过率调节参数e2对待评价企业申请待预测项目通过率进行调节;
当dy≥DY2,所述预测模块选取第三预设通过率调节参数e3对待评价企业申请待预测项目通过率进行调节;
其中,所述预测模块预设企业关联度标准值DY,设定第一预设企业关联度标准值DY1,第二预设企业关联度标准值DY2,预测模块预设通过率调节参数e,设定第一预设通过率调节参数e1,第二预设通过率调节参数e2,第三预设通过率调节参数e3。
具体而言,本发明根据各关键词在待遇测项目申请通过的各企业信息中的频率获取企业关联度,同时本发明预测模块将预设的企业关联度标准值划分为两个标准,预测模块将获取的企业关联度与预设企业关联度标准值相比较,选取最佳的通过率调节参数以调节待评价企业申请待预测项目通过率,其中,若企业关联度小于等于第一预设企业关联度标准值,预测模块选取较小的通过率调节参数,以降低通过率,若企业关联度在第一预设企业关联度标准值和第二预设企业关联度标准值之间,预测模块选取中间值的通过率调节参数以修正通过率,若企业关联度大于等于第二预设企业关联度标准值,预测模块选取较大的通过率调节参数,以提高通过率。
具体而言,所述预测模块获取项目关联度dx,设定dx=(b1+b2+···+bn)/n,其中,bi为第i关键词在待评价企业历史申请项目信息中出现的频率,设定bi=(si/w1+si/w2+···+si/wH)/H,其中,si为第i关键词在待评价企业历史第p申请项目信息中出现的次数,wp为待评价企业历史第p申请项目信息字符总数,p=1,2···H,H为待评价企业历史申请项目总数。
具体而言,所述预测模块预设项目关联度标准值DX,预测模块将获取的项目关联度dx与预设项目关联度标准值相比较,对待评价企业申请待预测项目通过率进行调节,其中,
当dx≤DX1,所述预测模块降低待评价企业申请待预测项目通过率;
当DX1<dx<DX2,所述预测模块根据选取的通过率调节参数将待评价企业申请待预测项目通过率t调节至t1,设定t1=t×eq;
当dx≥DX2,所述预测模块增加待评价企业申请待预测项目通过率;
其中,所述预测模块预设项目关联度标准值DX,设定第一预设项目关联度标准值DX1,第二预设项目关联度标准值DX2,q=1,2,3。
所述预测模块获取的项目关联度小于等于第一预设项目关联度标准值,预测模块降低待评价企业申请待预测项目通过率t至t2,设定t2=t×eq×(1-(DX1-dx)/DX1);所述预测模块获取的项目关联度大于等于第二预设项目关联度标准值,预测模块增加待评价企业申请待预测项目通过率t至t3,设定t3=t×eq×(1+(dx-DX2)/DX2)。
具体而言,本发明设置有项目关联度获取方式,其根据各关键词在待评价企业历史申请项目信息中的频率用于获取项目关联度,即各关键词在待评价企业历史申请的项目信息中出现次数越多,说明该企业与带预测企业的项目关联度越大,同时本发明将项目关联度标准值划分为两个标准,预测模块将获取的项目关联度与预设项目关联度标准值相比较,对通过率进行调节,其中,当项目关联度小于等于第一预设项目关联度标准值,预测模块根据项目关联度与第一预设项目关联度标准值的差值以及选取的通过率调节参数综合调节待评价企业申请待遇测项目的通过率,当项目关联度在第一预设项目关联度标准值和第二预设项目关联度标准值之间,预测模块根据选取的通过率调节参数综合调节待评价企业申请待遇测项目的通过率,当项目关联度大于等于第二预设项目关联度标准值,预测模块根据项目关联度与第二预设项目关联度标准值的差值以及选取的通过率调节参数综合调节待评价企业申请待遇测项目的通过率。
所述项目预测系统还包括结果输出模块,所述结果输出模块预设通过率参考值Result,结果输出模块获取待评价企业申请待预测项目的通过率tQ,与预设通过率参考值相比较,对待评价企业是否能通过待预测项目进行输出,其中,
当tQ≤Result,所述结果输出模块输出不通过;
当tQ>Result,所述结果输出模块输出通过;
其中,Q=1,2。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (10)
1.一种基于大数据的项目预测系统,其特征在于,包括:
采集模块,用于采集企业信息和项目申请信息;
存储模块,其与所述采集模块相连接,包括企业信息存储单元和项目信息存储单元,所述企业信息存储单元用于存储各企业申请项目信息,所述项目信息存储单元用于存储项目信息,所述企业信息存储单元包括项目申请通过的企业信息数据库,所述项目信息存储单元包括项目申请信息数据库;
优先级计算模块,其与所述存储模块相连接,用于根据所述企业信息存储单元存储的项目申请通过的企业信息获取待预测项目属性的各关键词的优先级;
通过率计算模块,其与所述存储模块、所述优先级计算模块相连接,用于根据待预测项目属性的各关键词优先级获取待评价企业申请待预测项目的通过率;
预测模块,其与所述通过率计算模块相连接,用于根据待预测项目申请通过的企业信息获取的企业关联度和待评价企业历史申请项目信息获取的项目关联度对所述通过率计算模块计算的待评价企业申请待预测项目的通过率进行调节,以使待评价企业申请待预测项目预测准确。
2.根据权利要求1所述的基于大数据的项目预测系统,其特征在于,所述优先级计算模块根据待预测项目申请通过的企业信息获取待预测项目属性的各关键词的优先级Fi,设定Fi=1/(((fi1-2-fi0)2+(fi2-3-fi0)2+···+(fi(n-1)n-fi0)2)/(n-1)),其中,fi1-2为待预测项目申请通过企业信息第i关键词第一位置和第i关键词第二位置的距离,fi2-3为待预测项目申请通过企业信息第i关键词第二位置和第i关键词第三位置的距离···fi(n-1)n为待预测项目申请通过企业信息第i关键词第(n-1)位置和第i关键词第n位置的距离,fi0为待预测项目申请通过企业信息第i关键词相邻位置距离的平均值,设定fi0=(fi1-2+fi2-3···+fi(n-1)n)/(n-1),i=1,2···n,n为待预测项目的项目属性关键词数量。
3.根据权利要求2所述的基于大数据的项目预测系统,其特征在于,所述优先级计算模块获取关键词分布度v,设定v=(v1-2+v2-3+···+v(u-1)u)/(u-1),其中,v1-2为待预测项目申请通过企业项目属性关键词第一位置和项目属性关键词第二位置的距离,v2-3为待预测项目申请通过企业项目属性关键词第二位置和项目属性关键词第三位置的距离···v(u-1)u为待预测项目申请通过企业项目属性关键词第(u-1)位置和项目属性关键词第u位置的距离,其中,u为项目关键词数量。
4.根据权利要求3所述的基于大数据的项目预测系统,其特征在于,所述优先级计算模块预设关键词分布度标准值V0,优先级计算模块根据获取的关键词分布度与预设关键词分布度标准值相比较,对获取的第i关键词优先级进行调节,其中,
当v≤V0,所述优先级计算模块将第i关键词优先级Fi降低至Fi1,设定Fi1=Fi×(1-(V0-v)/V0);
当v>V0,所述优先级计算模块将第i关键词优先级Fi提高至Fi2,设定Fi2=Fi×(1+(v-V0)/V0)。
5.根据权利要求4所述的基于大数据的项目预测系统,其特征在于,所述优先级计算模块获取待预测项目的项目属性各关键词优先权Fic,与待预测项目的项目属性各关键词在待评价企业信息中的频率pi,设定pi=ki/K,其中,ki为待评价企业信息中第i关键词的数量,K为待评价企业信息总字符数,所述通过率计算模块获取待评价企业申请待预测项目通过率t,设定t=(p1×F1+p2×F2+···+pn×Fn)/n,其中,c=1,2。
6.根据权利要求2所述的基于大数据的项目预测系统,其特征在于,所述预测模块获取企业关联度dy,设定dy=(z1+z2+···+zn)/n,
其中,zi为第i关键词在待预测项目申请通过企业信息中的频率,设定zi=(ai/M1+ai/M2+···+ai/MG)/G,其中,ai为第i关键词在待预测项目申请通过的第l企业信息中出现的次数,Ml为待预测项目申请通过的第l企业信息字符总数,l=1,2···G,G为待预测项目申请通过的企业总数。
7.根据权利要求6所述的基于大数据的项目预测系统,其特征在于,所述预测模块预设企业关联度标准值DY,预测模块将获取的企业关联度dy与预设企业关联度标准值相比较,获取通过率调节参数对待评价企业申请待预测项目通过率进行调节,其中,
当dy≤DY1,所述预测模块选取第一预设通过率调节参数e1对待评价企业申请待预测项目通过率进行调节;
当DY1<dy<DY2,所述预测模块选取第二预设通过率调节参数e2对待评价企业申请待预测项目通过率进行调节;
当dy≥DY2,所述预测模块选取第三预设通过率调节参数e3对待评价企业申请待预测项目通过率进行调节;
其中,所述预测模块预设企业关联度标准值DY,设定第一预设企业关联度标准值DY1,第二预设企业关联度标准值DY2,预测模块预设通过率调节参数e,设定第一预设通过率调节参数e1,第二预设通过率调节参数e2,第三预设通过率调节参数e3。
8.根据权利要求7所述的基于大数据的项目预测系统,其特征在于,所述预测模块获取项目关联度dx,设定dx=(b1+b2+···+bn)/n,
其中,bi为第i关键词在待评价企业历史申请项目信息中出现的频率,设定bi=(si/w1+si/w2+···+si/wH)/H,
其中,si为第i关键词在待评价企业历史第p申请项目信息中出现的次数,wp为待评价企业历史第p申请项目信息字符总数,p=1,2···H,H为待评价企业历史申请项目总数。
9.根据权利要求8所述的基于大数据的项目预测系统,其特征在于,所述预测模块预设项目关联度标准值DX,预测模块将获取的项目关联度dx与预设项目关联度标准值相比较,对待评价企业申请待预测项目通过率进行调节,其中,
当dx≤DX1,所述预测模块降低待评价企业申请待预测项目通过率;
当DX1<dx<DX2,所述预测模块根据选取的通过率调节参数将待评价企业申请待预测项目通过率t调节至t1,设定t1=t×eq;
当dx≥DX2,所述预测模块增加待评价企业申请待预测项目通过率;
其中,所述预测模块预设项目关联度标准值DX,设定第一预设项目关联度标准值DX1,第二预设项目关联度标准值DX2,q=1,2,3。
10.根据权利要求9所述的基于大数据的项目预测系统,其特征在于,所述预测模块获取的项目关联度小于等于第一预设项目关联度标准值,预测模块降低待评价企业申请待预测项目通过率t至t2,设定t2=t×eq×(1-(DX1-dx)/DX1);所述预测模块获取的项目关联度大于等于第二预设项目关联度标准值,预测模块增加待评价企业申请待预测项目通过率t至t3,设定t3=t×eq×(1+(dx-DX2)/DX2)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210324164.4A CN114418246B (zh) | 2022-03-30 | 2022-03-30 | 基于大数据的项目预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210324164.4A CN114418246B (zh) | 2022-03-30 | 2022-03-30 | 基于大数据的项目预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114418246A true CN114418246A (zh) | 2022-04-29 |
CN114418246B CN114418246B (zh) | 2022-06-21 |
Family
ID=81264300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210324164.4A Active CN114418246B (zh) | 2022-03-30 | 2022-03-30 | 基于大数据的项目预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114418246B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115080546A (zh) * | 2022-07-20 | 2022-09-20 | 湖南新长海科技产业发展有限公司 | 一种基于大数据的企业数据诊断系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3026614A1 (en) * | 2014-11-25 | 2016-06-01 | Lionbridge Technologies, Inc. | Information technology platform for language translations and task management |
CN106875057A (zh) * | 2017-02-17 | 2017-06-20 | 国网天津市电力公司 | 一种基于条件概率调整的电能计量装置短期需求预测方法 |
CN109389168A (zh) * | 2018-09-29 | 2019-02-26 | 国信优易数据有限公司 | 项目推荐模型训练方法、项目推荐方法以及装置 |
CN110675118A (zh) * | 2019-09-18 | 2020-01-10 | 广州诣启网络科技有限公司 | 基于共创工作流平台的项目协作方法及装置 |
CN111309759A (zh) * | 2020-01-20 | 2020-06-19 | 重庆强大锐智科技服务有限公司 | 企业科技项目智能匹配平台 |
CN111522865A (zh) * | 2020-04-23 | 2020-08-11 | 合肥相佐科技有限公司 | 一种用于项目咨询的智慧数据统计分析系统 |
CN113409174A (zh) * | 2020-09-29 | 2021-09-17 | 腾讯科技(深圳)有限公司 | 知识点测评方法和装置 |
CN113888142A (zh) * | 2021-11-15 | 2022-01-04 | 常州市科技资源统筹服务中心(常州市科技情报研究所) | 一种申报企业信息的项目智能管理方法及系统 |
-
2022
- 2022-03-30 CN CN202210324164.4A patent/CN114418246B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3026614A1 (en) * | 2014-11-25 | 2016-06-01 | Lionbridge Technologies, Inc. | Information technology platform for language translations and task management |
CN106875057A (zh) * | 2017-02-17 | 2017-06-20 | 国网天津市电力公司 | 一种基于条件概率调整的电能计量装置短期需求预测方法 |
CN109389168A (zh) * | 2018-09-29 | 2019-02-26 | 国信优易数据有限公司 | 项目推荐模型训练方法、项目推荐方法以及装置 |
CN110675118A (zh) * | 2019-09-18 | 2020-01-10 | 广州诣启网络科技有限公司 | 基于共创工作流平台的项目协作方法及装置 |
CN111309759A (zh) * | 2020-01-20 | 2020-06-19 | 重庆强大锐智科技服务有限公司 | 企业科技项目智能匹配平台 |
CN111522865A (zh) * | 2020-04-23 | 2020-08-11 | 合肥相佐科技有限公司 | 一种用于项目咨询的智慧数据统计分析系统 |
CN113409174A (zh) * | 2020-09-29 | 2021-09-17 | 腾讯科技(深圳)有限公司 | 知识点测评方法和装置 |
CN113888142A (zh) * | 2021-11-15 | 2022-01-04 | 常州市科技资源统筹服务中心(常州市科技情报研究所) | 一种申报企业信息的项目智能管理方法及系统 |
Non-Patent Citations (10)
Title |
---|
MAJID HUSSAIN等: "Prioritizing the Issues extracted for Getting Right People on Right Project in Software Project Management From Vendors’ Perspective", 《IEEE ACCESS》 * |
MAJID HUSSAIN等: "Prioritizing the Issues extracted for Getting Right People on Right Project in Software Project Management From Vendors’ Perspective", 《IEEE ACCESS》, vol. 9, 5 January 2021 (2021-01-05), pages 8718 - 8732, XP011831385, DOI: 10.1109/ACCESS.2021.3049226 * |
XU MENG等: "Comparative Analysis on the High-speed Railway Bridges Settlement Prediction", 《JOURNAL OF GEOMATICS》 * |
XU MENG等: "Comparative Analysis on the High-speed Railway Bridges Settlement Prediction", 《JOURNAL OF GEOMATICS》, vol. 38, no. 1, 28 February 2013 (2013-02-28), pages 52 - 4 * |
徐锰: "外包测试项目管理方法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
徐锰: "外包测试项目管理方法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》, no. 3, 15 March 2012 (2012-03-15), pages 138 - 1448 * |
王晓玥: "基于Thrift架构的审核系统的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
王晓玥: "基于Thrift架构的审核系统的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》, no. 1, 15 January 2020 (2020-01-15), pages 138 - 411 * |
高朋: "面向项目型组织的项目管理决策技术及其支持系统研究", 《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》 * |
高朋: "面向项目型组织的项目管理决策技术及其支持系统研究", 《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》, no. 10, 15 October 2010 (2010-10-15), pages 003 - 2 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115080546A (zh) * | 2022-07-20 | 2022-09-20 | 湖南新长海科技产业发展有限公司 | 一种基于大数据的企业数据诊断系统 |
CN115080546B (zh) * | 2022-07-20 | 2022-11-11 | 湖南新长海科技产业发展有限公司 | 一种基于大数据的企业数据诊断系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114418246B (zh) | 2022-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210209467A1 (en) | Method and device for predicting thermal load of electrical system | |
Meng et al. | Comparing expert elicitation and model-based probabilistic technology cost forecasts for the energy transition | |
EP3043447A1 (en) | Distribution transformer heavy loading and overloading mid-term and short-term pre-warning analytics model | |
US20030023470A1 (en) | Project risk assessment | |
CN109992601B (zh) | 待办事项信息的推送方法、装置和计算机设备 | |
US20040034857A1 (en) | System and method for simulating a discrete event process using business system data | |
CN106156965B (zh) | 一种物流服务调度方法与设备 | |
CN1773539A (zh) | 用计算中心管理一个或多个计算资源的系统和方法 | |
CN114418246B (zh) | 基于大数据的项目预测系统 | |
KR102574244B1 (ko) | 어텐션 메커니즘 기반의 미래 수요 예측 데이터 생성방법 및 장치 | |
US20070162171A1 (en) | Method for supplier collaboration and data accuracy | |
CN116384837B (zh) | 用于工程质量检测的信息处理方法、系统和检测员终端 | |
EP1672578A1 (en) | Method and system for analyzing the risk of a project | |
CN114881343A (zh) | 基于特征选择的电力系统短期负荷预测方法及装置 | |
CN111105050B (zh) | 风机维护计划的生成方法、装置、设备及存储介质 | |
US20090119077A1 (en) | Use of simulation to generate predictions pertaining to a manufacturing facility | |
US11055666B2 (en) | Systems and methods for automation of corporate workflow processes via machine learning techniques | |
US9491308B1 (en) | Telecommunication price-based routing apparatus, system and method | |
CN109740799A (zh) | 预算数据生成方法、装置、计算机设备和存储介质 | |
US8121719B2 (en) | Methods and apparatus for electronically representing manufacturing flow | |
CN117036062A (zh) | 一种结算资源计算方法及装置 | |
US11907243B2 (en) | Core reconciliation system with cross-platform data aggregation and validation | |
Genova et al. | A multicriteria analysis decision support system. | |
CN100351997C (zh) | 预测保养日期的方法以及仪器 | |
CN115185923B (zh) | 一种气象观测元数据管理的方法、系统和智能终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |