CN115545773B - 一种建设投资换算方法、电子设备及可读存储介质 - Google Patents
一种建设投资换算方法、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN115545773B CN115545773B CN202211230640.2A CN202211230640A CN115545773B CN 115545773 B CN115545773 B CN 115545773B CN 202211230640 A CN202211230640 A CN 202211230640A CN 115545773 B CN115545773 B CN 115545773B
- Authority
- CN
- China
- Prior art keywords
- work
- machine
- price
- material machine
- converted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000010276 construction Methods 0.000 title claims abstract description 34
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 11
- 239000000463 material Substances 0.000 claims abstract description 178
- 238000012986 modification Methods 0.000 claims abstract description 11
- 230000004048 modification Effects 0.000 claims abstract description 11
- 239000013077 target material Substances 0.000 claims abstract description 4
- 238000002372 labelling Methods 0.000 claims description 29
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 8
- 238000012216 screening Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000004568 cement Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种建设投资换算方法、电子设备及可读存储介质,建设投资换算方法包括获取在建筑投资预估时待参考的第一历史工程项目;将所述第一历史工程项目中的待换算工料机与当前价格库中的工料机进行匹配,若所述当前价格库中存在与所述待换算工料机相匹配的目标工料机,将所述待换算工料机的价格修改为所述目标工料机的价格;若所述当前价格库中不存在所述目标工料机,根据所述待换算工料机的历史价格,修改所述待换算工料机的价格;及基于完成价格修改后的所述第一历史工程项目,进行建筑投资的预估。人工成本低。
Description
技术领域
本发明涉及建设行业工程数据分析领域,具体涉及一种建设投资换算方法、电子设备及可读存储介质。
背景技术
在工程造价领域,存在大量的历史工程项目。这些历史工程项目中存在大量工程造价时可关注的信息,例如:项目基本信息、技术经济指标、工料机指标……。然而,这些信息都是历史发生的,想要将历史工程项目的信息反映在当前,只需要将历史工程项目中的工料机价格替换为最新的单价,即可得到一份有价值的数据信息。
目前,都是通过人工方式对历史工程项目中的工料机价格进行替换。人工成本高。
发明内容
有鉴于此,本发明实施方式提供了一种建设投资换算方法、电子设备和计算机可读存储介质,在基于历史工程项目预估建筑投资时,人工成本低。
本发明一方面提供了一种建设投资换算方法,所述方法包括:
获取在建筑投资预估时待参考的第一历史工程项目;
将所述第一历史工程项目中的待换算工料机与当前价格库中的工料机进行匹配,若所述当前价格库中存在与所述待换算工料机相匹配的目标工料机,将所述待换算工料机的价格修改为所述目标工料机的价格;及
若所述当前价格库中不存在所述目标工料机,根据所述待换算工料机的历史价格,修改所述待换算工料机的价格;及
基于完成价格修改后的所述第一历史工程项目,进行建筑投资的预估。
本发明另一方面还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现如上所述的方法。
本发明另一方面还提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现如上所述的方法。
在本申请的一些实施例中,针对在建筑投资预估时待参考的第一历史工程项目,将第一历史工程项目的待换算工料机与当前价格库中的工料机进行匹配,在当前价格库中存在与待换算工料机相匹配的目标工料机时,将待换算工料机的价格修改为目标工料机的价格,在当前价格库中不存在目标工料机,根据待换算工料机的历史价格,修改待换算工料机的价格。通过工料机匹配以及参考历史价格,可自动对第一历史工程项目中的待换算工料机进行价格修改,可以无需人工修改,达到了减少人工工作量,降低人工成本的目的,进而可以使得在基于历史工程项目预估建筑投资时,人工成本低。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了本申请的一个实施例提供的建设投资换算方法的流程示意图;
图2示出了本申请的一个实施例提供的模型训练方法的流程示意图;
图3示出了本申请的一个实施例提供的匹配方法的流程示意图;
图4示出了本申请的一个实施例提供的电子设备的示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施方式,都属于本发明保护的范围。
在对本申请的方案进行阐述前,先对本申请涉及的相关概念进行说明。
工料机,是对建设工程项目中使用的人工、材料、机械的统称。
工料机具有历史各个时期内的历史价格和当前价格(又可称为实时价格)。通常,历史价格可以是工料机在各个历史时期内的价格,当前价格可以是工料机的当前市场价。为便于理解,表1示例性的给出了一个工料机在部分历史时期内的价格。
表1历史价格
序号 | 工料机名称 | 工料机规格 | 单位 | 价格(元) | 价格时间段 |
Item1 | 蝶阀 | DN80 | 个 | 20 | 202003 |
Item1 | 蝶阀 | DN80 | 个 | 23 | 202004 |
Item1 | 蝶阀 | DN80 | 个 | 21 | 202005 |
…… | …… | …… | …… |
表1中,给出了规格为“DN80”的蝶阀在2020年的3月、4月和5月的价格。
表2示例性的给出了部分工料机的当前价格。
表2当前价格
序号 | 工料机名称 | 工料机规格 | 单位 | 价格(元) |
Item1 | 蝶阀 | DN65 | 个 | 20 |
Item2 | 蝶阀 | DN80 | 个 | 23 |
Item3 | 码墙双层架 | 1400*300*180 | 台 | 131 |
请参阅图1,为本申请的一个实施例提供的建设投资换算方法的流程示意图。建设投资换算方法可应用于电子设备中,该电子设备可以包括笔记本、台式电脑、平板电脑等。图1中,建设投资换算方法包括如下步骤:
步骤S11,获取在建筑投资预估时待参考的第一历史工程项目。
在一些实施例中,第一历史工程项目是在对当前工程项目进行造价时,待参考的已完成工程项目。第一历史工程项目可以是满足设定条件的已完成建筑工程项目。具体地,第一历史工程项目所在领域可以与待进行造价预估的当前建筑工程项目属于同一领域(比如均属于桥梁建筑领域)、第一历史工程项目可以与当前建筑工程项目具有相似的建筑规模。如此,第一历史工程项目与当前建筑工程项目属于同一领域,且建筑规模相似,第一历史工程项目的造价便可以反映当前建筑工程项目所需的建筑投资。可以理解的是,设定条件可以不限于上述所列举的条件,举例来说,第一历史工程项目还可以是指定历史时期的已完成工程项目。比如,假设当前时间为2022年03月11日,第一历史工程项目可以是2021年12月的与当前工程项目处于同一领域的已完成工程项目。
第一历史工程项目来可以包括第一历史工程项目所使用的工料机以及工料机信息。表3示例性的给出了一个第一历史工程项目所使用的工料机以及工料机信息。
表3工料机以及工料机信息
序号 | 工料机名称 | 工料机规格 | 单位 | 价格 |
Item1 | 蝶阀 | DN80 | 个 | 19 |
Item2 | 蝶阀 | DN65 | 个 | 20 |
Item3 | 码墙双层架 | 1400*300*180 | 台 | 185 |
…… | …… | …… | …… | |
Itemn | 蝶阀 | DN80 | 个 | 19 |
在表3中,一行代表一个工料机。每一行的数据为工料机信息。可以理解的是,在第一历史工程项目中,每个工料机的价格为工料机在第一历史工程项目造价期间内的价格。比如假设表3中的第一历史工程项目是在2020年5月进行造价,那么表3中各个工料机的价格为工料机在2020年5月的价格。若要参考第一历史工程项目对当前工程项目进行造价,那么需要把第一历史工程项目中各个工料机的价格替换为当前价格后,第一历史工程项目相对于当前工程项目才具有参考意义。
步骤S12,将第一历史工程项目中的待换算工料机与当前价格库中的工料机进行匹配,若当前价格库中存在与待换算工料机相匹配的目标工料机,将待换算工料机的价格修改为目标工料机的价格。
在一些实施例中,当前价格库用于保存工料机的当前价格,即实时价格。当前价格库中的数据存储格式类似表2。对于将第一历史工程项目中的待换算工料机与当前价格库中的工料机进行匹配的过程,可参见后续相关描述,此处不赘述。
在一些实施例中,待换算工料机可以是第一历史工程项目中需要进行价格修改的工料机。可以将第一历史工程项目中的各个待换算工料机与当前价格库中的工料机依次进行匹配,若当前价格库中存在与待换算工料机相匹配的目标工料机,将待换算工料机的价格修改为目标工料机的价格。
举例来说,将表3中的工料机Item1与表2中的工料机依次进行匹配后,确定表3中的工料机Item1与表格2中的工料机Item2相匹配,则将表3中工料机Item1的价格修改为表2中工料机Item2的价格。
步骤S13,若当前价格库中不存在目标工料机,根据待换算工料机的历史价格,修改待换算工料机的价格。
其中,待换算工料机的历史价格类似表1所示。待换算工料机的历史价格包括多个历史时间段内的历史价格。根据待换算工料机的历史价格,修改待换算工料机的价格,包括:
对历史价格进行平均计算,得到待换算工料机的历史平均价格,以及对历史价格进行标准差计算,得到待换算工料机的历史价格标准差;
基于待换算工料机的历史平均价格和历史价格标准差,确定待换算工料机的价格范围,并在价格范围内,修改待换算工料机的价格。
其中,可以根据表达式(1),计算待换算工料机的历史平均价格:
dateavg表示待换算工料机的历史平均价格;
data1、data2、datan表示待换算工料机在各个历史时期内的历史价格;
N表示历史价格的数量。
进一步的,在历史价格为待换算工料机的所有历史价格时,可以根据表达式(2),计算待换算工料机的历史价格标准差(又可称为总体标准差):
在历史价格为待换算工料机的部分历史价格时,可以根据表达式(3),计算待换算工料机的历史价格标准差(又可称为样本标准差):
在一些实施例中,基于待换算工料机的历史平均参考价格和历史价格标准差,确定待换算工料机的价格范围,可以包括:
按照如下表达式,确定价格范围
limitmin=dataavg-2б
limitmax=dataavg+2б
其中,limitmin表示价格范围的起始价格,limitmax表示价格范围的结束价格,dataavg表示待换算工料机的历史平均参考价格,б表示待换算工料机的历史价格标准差。在历史价格为待换算工料机的所有历史价格时,б取值为σ1,在历史价格为待换算工料机的部分历史价格时,б取值为σ2。
步骤S14,基于完成价格修改后的第一历史工程项目,进行建筑投资的预估。
可以理解的是,经过价格修改后的第一历史工程项目中,工料机的价格是当前价格,因此,第一历史工程项目的造价便可以反映当前建筑工程项目可能所需的建筑投资。
在本申请的一些实施例中,针对在建筑投资预估时待参考的第一历史工程项目,将第一历史工程项目的待换算工料机与当前价格库中的工料机进行匹配,在当前价格库中存在与待换算工料机相匹配的目标工料机时,将待换算工料机的价格修改为目标工料机的价格,在当前价格库中不存在目标工料机,根据待换算工料机的历史价格,修改待换算工料机的价格。通过工料机匹配以及参考历史价格,可自动对第一历史工程项目中的待换算工料机进行价格修改,可以无需人工修改,从而达到了减少人工工作量,降低人工成本的目的,进而可以使得在基于历史工程项目预估建筑投资时,人工成本低。
以下详细说明如何将第一历史工程项目中的待换算工料机与当前价格库中的工料机进行匹配。
在对匹配过程进行说明前,先对一些背景信息进行说明。
在一些实施例中,判断两个工料机是否匹配,主要是判断两个工料机是否为相同类型的工料机。其中,历史工程项目所使用的工料机以及这些工料机的工料机信息类似表4所示。
表4工料机以及工料机信息
序号 | 工料机名称 | 工料机规格 | 单位 |
Item1 | 蝶阀 | DN80 | 个 |
Item2 | 蝶阀 | DN65 | 个 |
Item3 | 码墙双层架 | 1400*300*180 | 台 |
…… | …… | …… | …… |
Itemn | 蝶阀 | DN80 | 个 |
在表4中,一行代表一个工料机。每一行的数据为工料机信息。具体地,在每一行中,从左到右依次表示工料机的序号、名称、规格以及计量单位。工料机的名称信息包括工料机的名称和规格。具有相同名称和相同规格的多个工料机可以判定为相同类型的工料机。即具有相同名称信息的工料机可以判定为相同类型的工料机。
通常,在同一个历史工程项目内,对于相同类型的工料机来说,这些工料机的名称信息是一致的,但在不同历史工程项目之间,或者历史工程项目与当前价格库之间,相同类型的工料机可能具有不同的名称信息。比如表5示例性的列举了规格为“DN80”的蝶阀在不同历史工程项目以及当前价格库中的名称信息。
表5名称信息比对
在表5中,虽然蝶阀的名称信息不同,但却是相同类型的蝶阀。因此,有必要对工料机在不同历史工程项目和当前价格库的名称信息进行一致性判断。鉴于此,本申请提供一种匹配方法,可以对工料机在不同历史工程项目和当前价格库的名称信息进行一致性判断,且具有较高精度。匹配方法依赖于训练好的匹配模型,因此,以下先对匹配模型的训练过程进行说明。
请参阅图2,为本申请的一个实施例提供的模型训练方法的流程示意图。其中,模型训练方法可应用于电子设备中,该电子设备可以包括笔记本、台式电脑、平板电脑等。图2中,模型训练方法包括如下步骤:
步骤S21,获取多个第二历史工程项目和当前价格库中的工料机以及工料机的工料机信息,工料机信息包括工料机的名称信息。
在一些实施例中,第二历史工程项目可以是满足设定条件的已完成建筑工程项目。比如,这些第二历史工程项目所在的领域,可以与待进行造价预估的当前建筑工程项目属于同一领域。又比如,这些第二历史工程项目可以是指定历史时间段内的建筑工程项目。当然,这些第二历史工程项目也可以是当前时间之前所有的已完成建筑工程项目。
在一些实施例中,考虑到在同一个第二历史工程项目内,可能存在名称信息相同的多个工料机。比如假设上述表4为其中一个第二历史工程项目使用的工料机以及工料机信息。从表4可以看出,存在两个规格均为“DN80”的蝶阀。在将该第二历史工程项目内的工料机与其他第二历史工程项目(或当前价格库)的工料机进行名称信息的一致性比对时,这两个规格为“DN80”的蝶阀会分别与其他第二历史工程项目(或当前价格库)的工料机进行名称信息的一致性比对。但可以理解的是,对于这两个规格为“DN80”的蝶阀来说,由于它们的名称信息相同,只需要将其中一个蝶阀与其他第二历史工程项目(或当前价格库)的工料机进行名称信息的一致性比对即可。若将这两个规格为“DN80”的蝶阀分别与其他第二历史工程项目(或当前价格库)的工料机进行名称信息的一致性比对,无疑会增加无效的数据比对量。
鉴于此,针对任一第二历史工程项目,在获取到该第二历史工程项目使用的工料机以及工料机信息后,可在具有相同名称信息的工料机中,保留其中一个工料机,删除所保留工料机之外的其他工料机,以对该第二历史工程项目的工料机信息进行去重,以减少无效的数据比对。
在完成数据去重后,可以将各个第二历史工程项目和当前价格库的工料机以及工料机信息进行汇总,基于汇总的工料机以及工料机信息对匹配模型进行训练。
步骤S22,将满足相似度条件的工料机作为待训练工料机,并将任两个待训练工料机的标注信息以及该两个待训练工料机的名称信息输入待训练的匹配模型,对匹配模型进行训练,其中,标注信息用于表征该两个待训练工料机是否匹配。
在一些实施例中,针对任一工料机,相似度条件包括以下条件中的至少一个:
在该工料机之外的其他工料机中,存在与该工料机具有相同计量单位的工料机;
在该工料机之外的其他工料机中,至少存在一个工料机的名称信息与该工料机的名称信息进行相似度计算后,得到的相似度大于相似度阈值。
即在汇总得到的所有工料机中,根据工料机的计量单位和/或工料机之间的相似度,从工料机中筛选出满足相似度条件的待训练工料机。在本实施例中,将同时满足上述两个相似度条件的工料机确定为待训练工料机。在筛选过程中,可以先根据计量单位对工料机进行筛选,然后对筛选得到的工料机进行相似度判断,确定待训练工料机。
具体地,可以在汇总得到的所有工料机中,将任两个工料机进行组合,得到工料机组合。以表4为例。可以对所有工料机进行笛卡尔乘积,得到任两个工料机的工料机组合(Item1,Item2)、(Item1,Item3)、(Item1,Itemn)……。此处,一个括号内的两个工料机组成一个工料机组合。比如(Item1,Item2)表示序号为Item1、Item2的两个工料机组成一个工料机组合。
对于任一工料机组合,若该工料机组合中的两个工料机具有相同计量单位,那么对于该工料组合中的任一个工料机来说,可以确定在该工料机之外的其他工料机中,存在与该工料机具有相同计量单位的工料机,该工料机可以确定为目标工料机。
基于筛选得到的所有目标工料机(即满足计量单位条件的工料机),可以将每个目标工料机的名称和规格进行拼接,得到各个目标工料机的拼接名称。以表1为例,假设序号为“Item1”、“Item2”的工料机为目标工料机,那么工料机Item1的拼接名称可以是“蝶阀DN80”,工料机Item2所对应的拼接名称可以是“蝶阀DN65”。
针对任两个目标工料机,可以将该两个目标工料机的拼接名称进行相似度计算。若计算得到相似度大于相似度阈值(比如70%),可以将该两个目标工料机确定为待训练工料机。在本实施例中,基于编辑距离算法,对任意两个目标工料机的拼接名称进行相似度计算。编辑距离算法为相关领域的常规技术,本申请在此不作赘述。
在本实施例中,对于任一个待训练工料机来说,在该待训练工料机之外的其他待训练工料机中,必然存在至少一个待训练工料机与该待训练工料机具有相同的计量单位,同时,也必然存在至少一个待训练工料机的名称信息,与该待训练工料机的名称信息进行相似度计算后,得到的相似度大于相似度阈值。比如假设待训练工料机包括工料机A、工料机B、工料机C、工料机D。对于工料机A来说,可能是工料机B与工料机A具有相同计量单位,同时,工料机C的名称信息与工料机A的名称信息进行相似度计算后,得到的相似度大于相似度阈值;或者可能是工料机B与工料机A具有相同计量单位,同时,工料机B的名称信息与工料机A的名称信息进行相似度计算后,得到的相似度大于相似度阈值。
筛选得到的待训练工料机,是通过其他相似度方法检测后,还需进一步进行相似度检测的工料机。具体来说:
在上述的计量单位判断中,可以理解的是,对于相同类型的多个工料机来说,通常可以是具有相同计量单位的工料机。若一个工料机与其他所有工料机的计量单位均不相同,则已经可以明确地确定该工料机与其他所有工料机均不是相同类型的工料机,无需再进一步检测,因此这种工料机可以剔除。相应地,若一个工料机与其他至少一个工料机的计量单位相同,可以说明的是该工料机与具有相同计量单位的工料机可能是相同类型的工料机,也可能是不同类型的工料机,因此这种工料机可以筛选出来以进一步检测。
在上述名称信息的相似度判断中,对于任一个工料机来说,若该工料机的名称信息与其他工料机的名称信息进行相似度计算后,得到相似度均小于或等于相似度阈值,则可以明确地确定该工料机与其他工料机均不是相同类型的工料机,该工料机可以剔除。若该工料机的名称信息与其他工料机的名称信息进行相似度计算后,得到的至少一个相似度大于相似度阈值,则可以说明的是该工料机与其他至少一个工料机可能是相同类型的工料机,也可能是不同类型的工料机,因此这种工料机可以筛选出来以进一步检测。
在一些实施例中,针对筛选得到的待训练工料机,可以进一步对待训练工料机进行人工标注。即人工标注任意两个待训练工料机是否属于相同类型的工料机。可以理解的是,由于在不同第二历史工程项目之间,或者第二历史工程项目与当前价格库之间,相同类型的工料机可能具有不同的名称信息。故对具有不同名称信息的工料机,可以标注为相同类型的工料机。
在一些实施例中,考虑到在标注过程中,可能存在多个标注人员对相同两个待训练工料机进行标注,而不同标注人员对该两个待训练工料机进行标注的结果可能不同。比如针对待训练工料机A和待训练工料机B,标注人员1将待训练工料机A和待训练工料机B标注为相同类型的工料机,标注人员2和标注人员3将待训练工料机A和待训练工料机B标注为不同类型的工料机。这样,待训练工料机A和待训练工料机B就可能存在多个不同的标注信息,无法对匹配模型进行训练。
鉴于此,对于任两个待训练工料机,本申请将每个标注人员的标注信息作为初始标注信息,若该两个待训练工料机具有多个不完全相同的初始标注信息,则将相同的初始标注信息作为一类初始标注信息。比如,假设两个待训练工料机具有表征该两个待训练工料机为相同类型工料机的第一标注,以及具有表征该两个待训练工料机为不同类型工料机的第二标注,则可以将各个第一标注汇聚为第一类初始标注信息,将第二标注汇聚为第二类初始标注信息。进而可以统计每一类初始标注信息中的初始标注信息个数,将初始标注信息个数最多的一类初始标注信息,作为该两个待训练工料机的标注信息。比如,假设第一类初始标注信息中具有三个第一标注,第二类初始标注信息中具有两个第二标注,则可以将第一标注作为该两个待训练工料机的标注信息。
如此,在任两个待训练工料机的标注信息确定后,便可以结合该两个待训练工料机的名称信息,对匹配模型进行训练。其中,可以采用BERT算法对匹配模型进行预训练,得到预训练模型,再根据预训练模型,结合BertModel方法训练得到最后的模型。对匹配模型的训练方法为相关领域的常规技术手段,本申请在此不作赘述。
本申请筛选满足相似度条件的工料机作为待训练工料机,并基于待训练工料机的名称信息来对匹配模型进行训练,可以使匹配模型更好的学习这类工料机的名称信息特征,进而可以在匹配模型训练好后,可以对这类工料机的名称信息进行一致性校验。简单来说,就是通过其他相似度检测方法对两个工料机进行检测后,若依然无法确定该两个工料机是否为相同类型的工料机,便可以根据该两个工料机的名称信息,通过训练好的匹配模型进一步检测。以提高检测精度。
基于训练好的匹配模型,请参阅图3,为本申请的一个实施例提供的匹配方法的流程示意图。其中,匹配方法可应用于电子设备中,该电子设备可以包括笔记本、台式电脑、平板电脑等。图3中,匹配方法包括如下步骤:
步骤S31,将当前价格库中的工料机作为参考工料机,在待换算工料机和参考工料机满足相似度条件的情况下,获取待换算工料机的第一工料机信息和参考工料机的第二工料机信息,第一工料机信息包括待换算工料机的第一名称信息,工料机信息包括参考工料机的第二名称信息。
和上述训练方法相对应地,第一工料机信息还可以包括待换算工料机的第一计量单位,第二工料机信息还可以包括参考工料机的第二计量单位;相似度条件包括以下条件中的至少一个;
待换算工料机的第一计量单位,与参考工料机的第二计量单位相同;
待换算工料机的第一名称信息与参考工料机的第二名称信息进行相似度计算后,得到的相似度大于相似度阈值。
步骤S32,将第一名称信息和第二名称信息输入训练好的匹配模型,并根据匹配模型的输出结果判断待换算工料机和参考工料机是否匹配。
在一些实施例中,匹配模型的输出结果为概率值。概率值用于表征待换算工料机和参考工料机属于相同类型的工料机的概率。若匹配模型输出的概率值大于概率阈值,确定待换算工料机和参考工料机属于相同类型的工料机。
在本实施例中,概率阈值为50%。
在本申请的一些实施例中,筛选满足相似度条件的工料机作为待训练工料机,并根据待训练工料机的名称信息对匹配模型进行训练,可以使匹配模型更好的学习这类工料机的名称信息特征,训练得到的匹配模型,精度较高,从而利用训练好的匹配模型对工料机的名称信息进行一致性校验时,即根据名称信息判断工料机是否为相同类型的工料机时,精度较高。
另外,本申请在两个工料机满足相似度条件的情况下,基于训练好的匹配模型和工料机的名称信息,进一步检测该两个工料机是否为相同类型的工料机,可以提高检测精度。即在两个工料机满足相似度条件的情况下,不直接判定该两个工料机是否属于相同类型的工料机,而是基于训练好的匹配模型和工料机的名称信息,进一步检测该两个工料机是否为相同类型的工料机。故可以提高检测精度。
比如,一些技术只通过字符串相似度检测方法来对两个工料机的名称信息进行相似度检测,在得到的相似度大于相似度阈值时,直接判定这两个工料机是相同类型的工料机。显然,这样的结论在一些情况下是不准确的。比如一个工料机的名称信息为“水泥C25#”,另一个工料机的名称信息为“水泥C35#”,这两个工料机的名称信息进行相似度计算时,得到的相似度虽然可能远远大于相似度阈值,但实际上这两个工料机并不是相同类型的工料机。故本申请在两个工料机满足相似度条件的情况下,通过基于训练好的匹配模型和工料机的名称信息,进一步检测该两个工料机是否为相同类型的工料机,可以提高检测精度。
请参阅图4,为本申请的一个实施例提供的电子设备的示意图。电子设备包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述方法。
其中,处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施方式中的方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施方式中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请一个实施方式还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现上述方法。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (8)
1.一种建设投资换算方法,其特征在于,所述方法包括:
获取在建筑投资预估时待参考的第一历史工程项目;
将所述第一历史工程项目中的待换算工料机与当前价格库中的工料机进行匹配,若所述当前价格库中存在与所述待换算工料机相匹配的目标工料机,将所述待换算工料机的价格修改为所述目标工料机的价格;
若所述当前价格库中不存在所述目标工料机,根据所述待换算工料机的历史价格,修改所述待换算工料机的价格;及
基于完成价格修改后的所述第一历史工程项目,进行建筑投资的预估;其中,
所述将所述历史工程项目中的待换算工料机与当前价格库中的工料机进行匹配,包括:
将所述当前价格库中的工料机作为参考工料机,在所述待换算工料机和所述参考工料机满足相似度条件的情况下,获取所述待换算工料机的第一工料机信息和所述参考工料机的第二工料机信息,所述第一工料机信息包括所述待换算工料机的第一名称信息,所述第二工料机信息包括所述参考工料机的第二名称信息;及
将所述第一名称信息和所述第二名称信息输入训练好的匹配模型,并根据所述匹配模型的输出结果判断所述待换算工料机和所述参考工料机是否匹配;
所述匹配模型是基于如下方法训练得到的:
获取多个第二历史工程项目和当前价格库中的工料机以及工料机的工料机信息,所述工料机信息包括工料机的名称信息;及
将满足相似度条件的工料机作为待训练工料机,并将任两个所述待训练工料机的标注信息以及该两个待训练工料机的名称信息输入待训练的匹配模型,以对匹配模型进行训练,其中,所述标注信息用于表征该两个待训练工料机是否匹配;其中,
所述工料机信息还包括工料机的计量单位;
针对任一工料机,所述相似度条件包括以下条件中的至少一个:
在该工料机之外的其他工料机中,存在与该工料机具有相同计量单位的工料机;
在该工料机之外的其他工料机中,至少存在一个工料机的名称信息与该工料机的名称信息进行相似度计算后,得到的相似度大于相似度阈值。
2.如权利要求1所述的方法,其特征在于,所述待换算工料机的历史价格包括多个历史时间段内的历史价格;
所述根据所述待换算工料机的历史价格,修改所述待换算工料机的价格,包括:
对所述历史价格进行平均计算,得到所述待换算工料机的历史平均价格,以及对所述历史价格进行标准差计算,得到所述待换算工料机的历史价格标准差;
基于所述待换算工料机的所述历史平均价格和所述历史价格标准差,确定所述待换算工料机的价格范围,并在所述价格范围内,修改所述待换算工料机的价格。
3.如权利要求2所述的方法,其特征在于,所述基于所述待换算工料机的所述历史平均价格和所述历史价格标准差,确定所述待换算工料机的价格范围,包括:
按照如下表达式,确定所述价格范围
limitmin=dataavg-2б
limitmax=dataavg+2б
其中,limitmin表示所述价格范围的起始价格,limitmax表示所述价格范围的结束价格,dataavg表示所述待换算工料机的所述历史平均价格,б表示所述待换算工料机的所述历史价格标准差。
4.如权利要求1所述的方法,其特征在于,所述第一工料机信息包括所述待换算工料机的第一计量单位,所述第二工料机信息包括所述参考工料机的第二计量单位;
所述相似度条件包括以下条件中的至少一个;
所述待换算工料机的所述第一计量单位,与所述参考工料机的所述第二计量单位相同;
所述待换算工料机的所述第一名称信息与所述参考工料机的所述第二名称信息进行相似度计算后,得到的相似度大于相似度阈值。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
对于任两个所述待训练工料机,若该两个待训练工料机具有多个不完全相同的初始标注信息,则将相同的初始标注信息汇聚为一类初始标注信息;
统计每一类初始标注信息中的初始标注信息个数,将初始标注信息个数最多的一类初始标注信息,作为该两个待训练工料机的标注信息。
6.如权利要求1所述的方法,其特征在于,针对任一所述第二历史工程项目,在获取到该第二历史工程项目使用的工料机以及工料机信息后,所述方法还包括:
在具有相同名称信息的工料机中,保留其中一个工料机,删除所保留工料机之外的其他工料机,以对该第二历史工程项目的工料机信息进行去重。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至6中任一所述的方法。
8.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,
所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,
实现如权利要求1至6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211230640.2A CN115545773B (zh) | 2022-09-30 | 2022-09-30 | 一种建设投资换算方法、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211230640.2A CN115545773B (zh) | 2022-09-30 | 2022-09-30 | 一种建设投资换算方法、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115545773A CN115545773A (zh) | 2022-12-30 |
CN115545773B true CN115545773B (zh) | 2023-07-28 |
Family
ID=84734133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211230640.2A Active CN115545773B (zh) | 2022-09-30 | 2022-09-30 | 一种建设投资换算方法、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115545773B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117635248A (zh) * | 2023-12-11 | 2024-03-01 | 永道工程咨询有限公司 | 一种基于bim技术的投资测算方法、系统、设备及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114707507A (zh) * | 2022-04-02 | 2022-07-05 | 永道工程咨询有限公司 | 一种基于人工智能算法的清单信息检测方法及装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7379898B2 (en) * | 2000-12-22 | 2008-05-27 | I2 Technologies Us, Inc. | System and method for generating market pricing information for non-fungible items |
US20180174174A1 (en) * | 2016-12-19 | 2018-06-21 | Sap Se | Trend-based data anlysis |
SG11202102774SA (en) * | 2018-09-20 | 2021-05-28 | China Construction Science&Technology Group Co Ltd | Method and device for cost early warning of prefabricated building |
CN112949906B (zh) * | 2021-02-04 | 2024-03-19 | 品茗科技股份有限公司 | 工程造价定额换算的匹配方法、装置、设备及存储介质 |
CN113034190B (zh) * | 2021-03-30 | 2023-11-07 | 重庆渝高科技产业(集团)股份有限公司 | 一种用于工程项目的核价管理系统 |
CN113222646A (zh) * | 2021-04-23 | 2021-08-06 | 重庆新城建设造价事务所有限责任公司 | 一种快速建筑造价估算方法及系统 |
CN113505942A (zh) * | 2021-07-30 | 2021-10-15 | 永道科技有限公司 | 项目工程造价预估方法、装置、电子设备及存储介质 |
CN114511358A (zh) * | 2022-02-16 | 2022-05-17 | 永道工程咨询有限公司 | 工程建设材料价格估算方法、装置、电子设备及存储介质 |
CN114595979A (zh) * | 2022-03-11 | 2022-06-07 | 四川水利职业技术学院 | 一种水利工程造价数据中心管理系统及装置 |
-
2022
- 2022-09-30 CN CN202211230640.2A patent/CN115545773B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114707507A (zh) * | 2022-04-02 | 2022-07-05 | 永道工程咨询有限公司 | 一种基于人工智能算法的清单信息检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN115545773A (zh) | 2022-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020062702A9 (zh) | 短信发送的方法、装置、计算机设备和存储介质 | |
CN115545773B (zh) | 一种建设投资换算方法、电子设备及可读存储介质 | |
CN112508105A (zh) | 一种采油机故障检测与检索方法 | |
CN111506610B (zh) | 一种面向烟草行业生产现场的实时流数据预处理方法 | |
CN102541736A (zh) | 一种软件可靠性执行过程加速测试方法 | |
CN118211882B (zh) | 一种基于大数据的产品质量管理系统及方法 | |
CN111027318B (zh) | 基于大数据的行业分类方法、装置、设备及存储介质 | |
CN113808132B (zh) | 三维网络模型质量检测方法、装置和计算机设备 | |
CN114021338A (zh) | 一种基于多源数据融合的可靠性评估方法 | |
WO2019100616A1 (zh) | 事件评价数据显示方法、装置、计算机设备及计算机存储介质 | |
CN115545772B (zh) | 一种基于自然语言处理技术的建设投资预估方法及系统 | |
US7797136B2 (en) | Metrics to evaluate process objects | |
CN104850624B (zh) | 近重复记录的相似度评估方法 | |
CN113393169B (zh) | 基于大数据技术的金融行业交易系统性能指标分析方法 | |
CN115545490A (zh) | 基于小样本机器学习的电站工程造价分析方法及装置 | |
CN109710305B (zh) | 一种开发信息的获取方法、装置、存储介质及终端设备 | |
CN113780724A (zh) | 产品质量批次稳定性量化评估判据计算方法 | |
CN112287110A (zh) | 一种招聘数据的岗位智能分类的方法及装置 | |
CN117909717B (zh) | 一种基于深度学习和数据挖掘的工程量辅助验收结算方法 | |
CN111177132B (zh) | 关系型数据的标签清洗方法、装置、设备及存储介质 | |
CN117520480B (zh) | 多标准的报表数据检测方法、设备及存储介质 | |
CN112016944A (zh) | 一种成本件量模型构建方法、模型应用方法及存储介质 | |
CN114548538A (zh) | 任务量的预测方法、装置、电子设备及存储介质 | |
Sellberg et al. | Evaluating four types of data parsing methods for machine learning integration from building information models | |
CN116911977A (zh) | 虚拟资源处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |