发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一方面在于提出了一种工程量清单综合单价合理性的检测方法。
本发明的另一方面在于提出了一种工程量清单综合单价合理性的检测系统。
本发明的再一方面在于提出了一种计算机设备。
本发明的又一方面在于提出了一种计算机可读存储介质。
有鉴于此,本发明的一方面,提出了一种工程量清单综合单价合理性的检测方法,包括:导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;获取工程量清单的清单内容及其对应的定额信息、人材机信息,配置清单模板内容,得到带有配置信息的清单模板;识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核。
根据本发明的工程量清单综合单价合理性的检测方法,从数据库中导入工程量清单,确定工程量清单所属类别,可选地,通过解析采集到的工程造价文件,汇总相同九位清单编码的清单数据,来确定该工程量清单所属类别,进而选择与该类别相应的清单模板;通过获取工程量清单的清单内容及其对应的定额信息、人材机信息等信息,为清单模板各标签项配置相应的内容,得到基于工程类型、工程时间、专业工程、分部分项、清单规范、清单编码等关键技经参数的带有配置信息的清单模板,具体而言,将自然语言描述的清单内容按照行业标准进行了规范化,将不规范的材料名称、工艺方法替换为规范的材料名称、工艺方法,以及对获取到的工程量清单的清单内容及其对应的定额信息、人材机信息等信息进行正则处理,以提取影响工程量清单综合单价关键因素的标签数据,同时通过机器学习的方法不断调整问题标签值(如错误的标签值),以顺利得到带有配置信息的清单模板;在得到带有配置信息的清单模板之后,识别影响工程量清单综合单价关键因素数据,并对各关键因素数据进行聚类分析,计算出每一类清单的综合单价合理性区间,在此基础上,对清单综合单价进行自动化审核;对于清单综合单价的自动化审核过程,具体而言,是将符合某些特征集的综合单价与符合相应特征集的综合单价合理性区间进行对比分析,综合单价落在此区间内,即认为此条清单通过审核。本发明的技术方案运用大数据技术手段,规范了工程量清单编制,从海量的清单描述内容中,基于清单模板自动挖掘出影响工程量清单综合单价的关键因素,以及识别清单描述内容的关键标签信息,进而计算出清单综合单价的合理性区间,实现了工程量清单审核工作的信息化、智能化,提高了工程量清单审核工作效率和质量,进而为工程造价管控决策,提供了有效的理论支撑和实践依据。
另外,根据本发明上述的工程量清单综合单价合理性的检测方法,还可以具有如下附加的技术特征:
在上述技术方案中,优选地,获取工程量清单的清单内容及其对应的定额信息、人材机信息,配置清单模板内容,得到带有配置信息的清单模板的步骤,具体包括:根据获取的清单内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价的关键因素标签值对应的正则表达式及其运算式;根据正则表达式及其运算式,从清单内容及其对应的定额、人材机信息中提取影响工程量清单综合单价的关键因素标签值;以及判断提取的影响工程量清单综合单价的关键因素标签值是否正确;若标签值不正确,则重新配置正则表达式及其运算式,根据重新配置的正则表达式及其运算式再次提取影响工程量清单综合单价的关键因素标签值,将再次提取的标签值作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,并利用训练好的模型提取正确的标签值;若标签值正确,则得到带有配置信息的清单模板。
在该技术方案中,限定了对导入的工程量清单进行标签化处理的具体过程,基于规则与统计相结合的清单内容处理技术方案,在采用正则化技术处理清单标签提取不正确时,则重新配置正则表达式,获取较为宽泛的数据结果(中间结果),作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,从而得到正确的标签值。具体而言,根据该工程量清单的清单描述内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价关键因素标签值对应的正则表达式及其运算式,根据配置好的正则表达式及其运算式,从清单描述内容、定额信息、人材机信息中抽取清单模板中各标签项相应的标签值;如果标签值结果不正确,则调整清单模板中统计模型的配置信息,调用基于条件随机场原理的机器学习方法,进行相应标签值的训练,并利用训练好的模型提取正确的标签值;如果标签值结果正确,则说明成功提取了相应的内容,进而实现工程量清单标签化过程。
在上述任一技术方案中,优选地,该检测方法还包括:对带有配置信息的清单模板进行人工审核;若审核不通过,则重新确定工程量清单所属类别;或重新配置提取影响工程量清单综合单价关键因素标签对应的正则表达式及其运算式。
在该技术方案中,在得到带有配置信息的清单模板后进行人工审核,例如,对比标签项字段与提取的标签内容是否相符,或者查看标签化的清单内容是否涵盖了该工程量清单需要提取的内容;如果审核不通过,依据具体原因对该工程量清单的所属类别进行重新确定,或者重新配置正则表达式及其运算式。本方案在实现工程量清单审核工作的信息化、智能化的基础上,进一步加入人工审核的步骤,有利于检测系统的不断完善,能够大大提高审核的精准性。当然,本领域技术人员应该理解,在检测系统完善的基础上,人工审核这一步骤并非必须。
在上述任一技术方案中,优选地,该检测方法还包括:完成清单模板的编制,并将清单模板存储在数据库中;清单模板的编制的步骤,具体包括:采集多个工程量清单,汇总相同九位清单编码的清单内容集合,将工程量清单要提取的清单内容以及影响工程量清单综合单价的关键因素提炼成标签项,将标签项及其对应的经验值集合形成清单模板;经验值集合包括:采用行业规范化语言描述的材料名称、工艺方法。
在该技术方案中,清单模板的设计过程主要参照相同九位清单编码下的清单数据集合,通过资深专业人士的深入分析,将该清单要抽取的内容以及影响清单综合单价的关键因素提炼成清单标签项,将此标签项及其对应的经验值集合形成标签模板。具体而言,将清单工艺方法与材料名称、清单描述规范化内容以及影响清单综合单价的重要标签等内容融合一体的清单模板,其中将自然语言描述的清单内容按照行业标准进行了规范化,将不规范的材料名称、工艺方法替换为规范的材料名称、工艺方法。
在上述任一技术方案中,优选地,工程量清单要提取的清单内容以及影响工程量清单综合单价的关键因素包括以下任一项或其组合:工程类型、工程时间、专业工程、分部分项、清单规范、清单编码。
在该技术方案中,不同类别的工程量清单对应不同的清单模板,每个清单模板中要提取的清单内容以及影响工程量清单综合单价的关键因素包括但不限于以下任一项或其组合:工程类型、工程时间、专业工程、分部分项、清单规范、清单编码,还可以依据实际情况设定需要的标签项,如厚度、截面积、回填材料、运距等。
本发明的另一方面,提出了一种工程量清单综合单价合理性的检测系统,包括:模板确定单元,用于导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;处理单元,用于获取工程量清单的清单内容及其对应的定额信息、人材机信息,配置清单模板内容,得到带有配置信息的清单模板;计算单元,用于识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;比较单元,用于将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核。
根据本发明的工程量清单综合单价合理性的检测系统,从数据库中导入工程量清单,确定工程量清单所属类别,可选地,通过解析采集到的工程造价文件,汇总相同九位清单编码的清单数据,来确定该工程量清单所属类别,进而选择与该类别相应的清单模板;通过获取工程量清单的清单内容及其对应的定额信息、人材机信息等信息,为清单模板各标签项配置相应的内容,得到基于工程类型、工程时间、专业工程、分部分项、清单规范、清单编码等关键技经参数的带有配置信息的清单模板,具体而言,将自然语言描述的清单内容按照行业标准进行了规范化,将不规范的材料名称、工艺方法替换为规范的材料名称、工艺方法,以及对获取到的工程量清单的清单内容及其对应的定额信息、人材机信息等信息进行正则处理,以提取影响工程量清单综合单价关键因素的标签数据,同时通过机器学习的方法不断调整问题标签值(如错误的标签值),以顺利得到带有配置信息的清单模板;在得到带有配置信息的清单模板之后,识别影响工程量清单综合单价关键因素数据,并对各关键因素数据进行聚类分析,计算出每一类清单的综合单价合理性区间,在此基础上,对清单综合单价进行自动化审核,清单综合单价的自动化审核过程具体而言,将符合某些特征集的综合单价与符合相应特征集的综合单价合理性区间进行对比分析,综合单价落在此区间内,即认为此条清单通过审核。本发明的技术方案运用大数据技术手段,规范了工程量清单编制,从海量的清单描述内容中,基于清单模板自动挖掘出影响工程量清单综合单价的关键因素,以及识别清单描述内容的关键标签信息,进而计算出清单综合单价的合理性区间,实现了工程量清单审核工作的信息化、智能化,提高了工程量清单审核工作效率和质量,进而为工程造价管控决策,提供了有效的理论支撑和实践依据。
在上述技术方案中,优选地,处理单元,具体包括:正则配置单元,用于根据获取的清单内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价的关键因素标签值对应的正则表达式及其运算式;提取单元,用于根据正则表达式及其运算式,从清单内容及其对应的定额、人材机信息中提取影响工程量清单综合单价的关键因素标签值;以及判断提取的影响工程量清单综合单价的关键因素标签值是否正确;标签值训练单元,用于若标签值不正确,则重新配置正则表达式及其运算式,根据重新配置的正则表达式及其运算式再次提取影响工程量清单综合单价的关键因素标签值,将再次提取的标签值作为基于条件随机场原理的机器学习方法的输入语料,进行标签值训练,并利用训练好的模型提取正确的标签值;若标签值正确,则得到带有配置信息的清单模板。
在该技术方案中,限定了对导入的工程量清单进行标签化处理的具体过程,基于规则与统计相结合的清单内容处理技术方案,在采用正则化技术处理清单标签提取不正确时,则重新配置正则表达式,获取较为宽泛的数据结果(中间结果),作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,从而得到正确的标签值。具体而言,根据该工程量清单的清单描述内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价关键因素标签对应的正则表达式及其运算式,根据配置好的正则表达式及其运算式,从清单描述内容、定额信息、人材机信息中抽取清单模板中各标签项相应的标签值;如果标签值结果不正确,则调整清单模板中统计模型的配置信息,调用基于条件随机场原理的机器学习方法,进行相应标签值的训练,并利用训练好的模型提取正确的标签值;如果标签值结果正确,则说明成功提取了相应的内容,进而实现工程量清单标签化过程。
在上述任一技术方案中,优选地,该检测系统还包括:人工审核单元,用于对带有配置信息的清单模板进行人工审核;若审核不通过,则模板确定单元,还用于重新确定工程量清单所属类别;或正则配置单元,还用于重新配置提取影响工程量清单综合单价的关键因素标签值对应的正则表达式及其运算式。
在该技术方案中,在得到带有配置信息的清单模板后进行人工审核,例如,对比标签项字段与提取的标签内容是否相符,或者查看标签化的清单内容是否涵盖了该工程量清单需要提取的内容;如果审核不通过,依据具体原因对该工程量清单的所属类别进行重新确定,或者重新配置正则表达式及其运算式。本方案在实现工程量清单审核工作的信息化、智能化的基础上,进一步加入人工审核的步骤,有利于检测系统的不断完善,能够大大提高审核的精准性。当然,本领域技术人员应该理解,在检测系统完善的基础上,人工审核这一步骤并非必须。
在上述任一技术方案中,优选地,该检测系统还包括:编制单元,用于完成清单模板的编制,并将清单模板存储在数据库中;该编制单元,具体用于:采集多个工程量清单,汇总相同九位清单编码的清单内容集合,将工程量清单要提取的清单内容以及影响工程量清单综合单价的关键因素提炼成标签项,将标签项及其对应的经验值集合形成清单模板;经验值集合包括:采用行业规范化语言描述的材料名称、工艺系统。
在该技术方案中,清单模板的设计过程主要参照相同九位清单编码下的清单数据集合,通过资深专业人士的深入分析,将该清单要抽取的内容以及影响清单综合单价的关键因素提炼成清单标签项,将此标签项及其对应的经验值集合形成标签模板。具体而言,将清单工艺方法与材料名称、清单描述规范化内容以及影响清单综合单价的重要标签等内容融合一体的清单模板,其中将自然语言描述的清单内容按照行业标准进行了规范化,将不规范的材料名称、工艺方法替换为规范的材料名称、工艺方法。
在上述任一技术方案中,优选地,工程量清单要提取的清单内容以及影响工程量清单综合单价的关键因素包括以下任一项或其组合:工程类型、工程时间、专业工程、分部分项、清单规范、清单编码。
在该技术方案中,不同类别的工程量清单对应不同的清单模板,每个清单模板中要提取的清单内容以及影响工程量清单综合单价的关键因素包括但不限于以下任一项或其组合:工程类型、工程时间、专业工程、分部分项、清单规范、清单编码,还可以依据实际情况设定需要的标签项,如厚度、截面积、回填材料、运距等。
本发明的再一方面,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器用于执行如上述任一技术方案中的工程量清单综合单价合理性的检测方法的步骤。
根据本发明的计算机设备,其存储器上存储的计算机程序被处理器执行时,实现了如上述任一技术方案中的工程量清单综合单价合理性的检测方法的步骤,因而具有如上述任一技术方案中的工程量清单综合单价合理性的检测方法全部的有益效果,在此不再赘述。
本发明的又一方面,提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现了如上述任一技术方案中的工程量清单综合单价合理性的检测方法的步骤。
根据本发明的计算机可读存储介质,其上存储的计算机程序被处理器执行时,实现了如上述任一技术方案中的工程量清单综合单价合理性的检测方法的步骤,因而具有如上述任一技术方案中的工程量清单综合单价合理性的检测方法全部的有益效果,在此不再赘述。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
如图1所示,根据本发明的一个实施例的工程量清单综合单价合理性的检测方法的流程示意图。其中,该检测方法包括:
步骤102,导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;
步骤104,获取工程量清单的清单内容及其对应的定额信息、人材机信息,配置清单模板内容,得到带有配置信息的清单模板;
步骤106,识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;
步骤108,将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核。
本发明提供的工程量清单综合单价合理性的检测方法,从数据库中导入工程量清单,确定工程量清单所属类别,可选地,通过解析采集到的工程造价文件,汇总相同九位清单编码的清单数据,来确定该工程量清单所属类别,进而选择与该类别相应的清单模板;通过获取工程量清单的清单内容及其对应的定额信息、人材机信息等信息,为清单模板各标签项配置相应的内容,得到基于工程类型、工程时间、专业工程、分部分项、清单规范、清单编码等关键技经参数的带有配置信息的清单模板,具体而言,将自然语言描述的清单内容按照行业标准进行了规范化,将不规范的材料名称、工艺方法替换为规范的材料名称、工艺方法,以及对获取到的工程量清单的清单内容及其对应的定额信息、人材机信息等信息进行正则处理,以提取影响工程量清单综合单价关键因素的标签数据,同时通过机器学习的方法不断调整问题标签值(如错误的标签值),以顺利得到带有配置信息的清单模板;在得到带有配置信息的清单模板之后,识别影响工程量清单综合单价关键因素数据,并对各关键因素数据进行聚类分析,计算出每一类清单的综合单价合理性区间,在此基础上,对清单综合单价进行自动化审核,清单综合单价的自动化审核过程具体而言,将符合某些特征集的综合单价与符合相应特征集的综合单价合理性区间进行对比分析,综合单价落在此区间内,即认为此条清单通过审核。本发明的技术方案运用大数据技术手段,规范了工程量清单编制,从海量的清单描述内容中,基于清单模板自动挖掘出影响工程量清单综合单价的关键因素,以及识别清单描述内容的关键标签信息,进而计算出清单综合单价的合理性区间,实现了工程量清单审核工作的信息化、智能化,提高了工程量清单审核工作效率和质量,进而为工程造价管控决策,提供了有效的理论支撑和实践依据。
如图2所示,根据本发明的另一个实施例的工程量清单综合单价合理性的检测方法的流程示意图。其中,该检测方法包括:
步骤202,导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;
步骤204,获取工程量清单的清单内容及其对应的定额信息、人材机信息;
步骤206,根据获取的清单内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价的关键因素标签值对应的正则表达式及其运算式;
步骤208,根据正则表达式及其运算式,从清单内容及其对应的定额、人材机信息中提取影响工程量清单综合单价的关键因素标签值;以及
步骤210,判断提取的影响工程量清单综合单价的关键因素标签值是否正确;
步骤212,若标签值不正确,则重新配置正则表达式及其运算式,根据重新配置的正则表达式及其运算式再次提取影响工程量清单综合单价的关键因素标签值,将再次提取的标签值作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,并利用训练好的模型提取正确的标签值;若标签值正确,则得到带有配置信息的清单模板;
步骤214,若标签值正确,则得到带有配置信息的清单模板;
步骤216,识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;
步骤218,将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核。
在该实施例中,限定了对导入的工程量清单进行标签化处理的具体过程,基于规则与统计相结合的清单内容处理技术方案,在采用正则化技术处理清单标签提取不正确时,则重新配置正则表达式,获取较为宽泛的数据结果(中间结果),作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,从而得到正确的标签值。具体而言,根据该工程量清单的清单描述内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价关键因素标签对应的正则表达式及其运算式,根据配置好的正则表达式及其运算式,从清单描述内容、定额信息、人材机信息中抽取清单模板中各标签项相应的标签值;如果标签值结果不正确,则调整清单模板中统计模型的配置信息,调用基于条件随机场原理的机器学习方法,进行相应标签值的训练,并利用训练好的模型提取正确的标签值;如果标签值结果正确,则说明成功提取了相应的内容,进而实现工程量清单标签化过程。
如图3所示,根据本发明的再一个实施例的工程量清单综合单价合理性的检测方法的流程示意图。其中,该检测方法包括:
步骤302,导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;
步骤304,获取工程量清单的清单内容及其对应的定额信息、人材机信息;
步骤306,根据获取的清单内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价的关键因素标签值对应的正则表达式及其运算式;
步骤308,根据正则表达式及其运算式,从清单内容及其对应的定额、人材机信息中提取影响工程量清单综合单价的关键因素标签值;以及
步骤310,判断提取的影响工程量清单综合单价的关键因素标签值是否正确;
步骤312,若标签值不正确,则重新配置正则表达式及其运算式,根据重新配置的正则表达式及其运算式再次提取影响工程量清单综合单价的关键因素标签值,将再次提取的标签值作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,并利用训练好的模型提取正确的标签值;若标签值正确,则得到带有配置信息的清单模板;
步骤314,若标签值正确,则得到带有配置信息的清单模板;
步骤316,对带有配置信息的清单模板进行人工审核;
若审核通过,则执行步骤322;
步骤318,审核不通过,则重新确定工程量清单所属类别;或
步骤320,审核不通过,重新配置提取影响工程量清单综合单价的关键因素标签值对应的正则表达式及其运算式;
步骤322,识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;
步骤324,将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核。
在该实施例中,在得到带有配置信息的清单模板后进行人工审核,例如,对比标签项字段与提取的标签内容是否相符,或者查看标签化的清单内容是否涵盖了该工程量清单需要提取的内容;如果审核不通过,依据具体原因对该工程量清单的所属类别进行重新确定,或者重新配置正则表达式及其运算式。本方案在实现工程量清单审核工作的信息化、智能化的基础上,进一步加入人工审核的步骤,有利于检测系统的不断完善,能够大大提高审核的精准性。当然,本领域技术人员应该理解,在检测系统完善的基础上,人工审核这一步骤并非必须。
在上述任一实施例中,优选地,该检测方法还包括:完成清单模板的编制,并将清单模板存储在数据库中;清单模板的编制的步骤,具体包括:采集多个工程量清单,汇总相同九位清单编码的清单内容集合,将工程量清单要提取的清单内容以及影响工程量清单综合单价的关键因素提炼成标签项,将标签项及其对应的经验值集合形成清单模板;经验值集合包括:采用行业规范化语言描述的材料名称、工艺方法。
在该实施例中,清单模板的设计过程主要参照相同九位清单编码下的清单数据集合,通过资深专业人士的深入分析,将该清单要抽取的内容以及影响清单综合单价的关键因素提炼成清单标签项,将此标签项及其对应的经验值集合形成标签模板。具体而言,将清单工艺方法与材料名称、清单描述规范化内容以及影响清单综合单价的重要标签等内容融合一体的清单模板,其中将自然语言描述的清单内容按照行业标准进行了规范化,将不规范的材料名称、工艺方法替换为规范的材料名称、工艺方法。
在上述任一实施例中,优选地,工程量清单要提取的清单内容以及影响工程量清单综合单价的关键因素包括以下任一项或其组合:工程类型、工程时间、专业工程、分部分项、清单规范、清单编码。
在该实施例中,不同类别的工程量清单对应不同的清单模板,每个清单模板中要提取的清单内容以及影响工程量清单综合单价的关键因素包括但不限于以下任一项或其组合:工程类型、工程时间、专业工程、分部分项、清单规范、清单编码,还可以依据实际情况设定需要的标签项,如厚度、截面积、回填材料、运距等。
如图4所示,根据本发明的一个具体实施例的工程量清单综合单价合理性的检测方法的流程示意图。其中,该检测方法包括:
步骤402,导入工程量清单;
步骤404,对工程量清单进行正则化处理;
步骤406,判断经过正则化处理后的标签值是否正确;
步骤408,若标签值不正确,则通过序列标注模型CRF(conditional random fieldalgorithm,CRF)对标签值进行训练,得到正确的标签值;
步骤410,若标签值正确,则得到带有配置信息的清单模板;
步骤412,对带有配置信息的清单模板进行人工审核;
步骤414,若审核不通过,通过分类器不断调整正则表达式及其运算式;
步骤416,若审核通过,对影响工程量清单综合单价关键因素的标签数据进行识别;
步骤418,基于高斯混合模型GMM(Gaussian Mixture Model,GMM)进行聚类分析;
步骤420,计算基于多特征的综合单价区间;
步骤422,对工程量清单综合单价进行自动化审核。
在该实施例中,通过采用机器学习方法,从海量的清单描述内容中,基于清单模板自动挖掘出影响清单综合单价的重要因素,在采用正则化技术处理清单标签提取不正确时,将此时正则提取的内容作为中间结果,进一步采用机器学习方法从中间结果中提取正确内容,以及识别清单描述内容的关键标签信息,进而实现基于关键特征的清单综合单价合理性区间计算,使用机器自动进行工程信息校验,大幅缩短了人工审核的时间,并且降低了人工审核对审核人专业性的要求,降低了人工成本。
如图5所示,根据本发明的一个实施例的工程量清单综合单价合理性的检测系统的示意框图。其中,该检测系统500包括:
模板确定单元502,用于导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;
处理单元504,用于获取工程量清单的清单内容及其对应的定额信息、人材机信息,配置清单模板内容,得到带有配置信息的清单模板;
计算单元506,用于识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;
比较单元508,用于将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核。
本发明提供的工程量清单综合单价合理性的检测系统,从数据库中导入工程量清单,确定工程量清单所属类别,可选地,通过解析采集到的工程造价文件,汇总相同九位清单编码的清单数据,来确定该工程量清单所属类别,进而选择与该类别相应的清单模板;通过获取工程量清单的清单内容及其对应的定额信息、人材机信息等信息,为清单模板各标签项配置相应的内容,得到基于工程类型、工程时间、专业工程、分部分项、清单规范、清单编码等关键技经参数的带有配置信息的清单模板,具体而言,将自然语言描述的清单内容按照行业标准进行了规范化,将不规范的材料名称、工艺方法替换为规范的材料名称、工艺方法,以及对获取到的工程量清单的清单内容及其对应的定额信息、人材机信息等信息进行正则处理,以提取影响工程量清单综合单价关键因素的标签数据,同时通过机器学习的方法不断调整问题标签值(如错误的标签值),以顺利得到带有配置信息的清单模板;在得到带有配置信息的清单模板之后,识别影响工程量清单综合单价关键因素数据,并对各关键因素数据进行聚类分析,计算出每一类清单的综合单价合理性区间,在此基础上,对清单综合单价进行自动化审核,清单综合单价的自动化审核过程具体而言,将符合某些特征集的综合单价与符合相应特征集的综合单价合理性区间进行对比分析,综合单价落在此区间内,即认为此条清单通过审核。本发明的技术方案运用大数据技术手段,规范了工程量清单编制,从海量的清单描述内容中,基于清单模板自动挖掘出影响工程量清单综合单价的关键因素,以及识别清单描述内容的关键标签信息,进而计算出清单综合单价的合理性区间,实现了工程量清单审核工作的信息化、智能化,提高了工程量清单审核工作效率和质量,进而为工程造价管控决策,提供了有效的理论支撑和实践依据。
如图6所示,根据本发明的另一个实施例的工程量清单综合单价合理性的检测系统的示意框图。其中,该检测系统600包括:
模板确定单元602,用于导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;
处理单元604,用于获取工程量清单的清单内容及其对应的定额信息、人材机信息,配置清单模板内容,得到带有配置信息的清单模板;
其中,处理单元604,具体包括:
正则配置单元6042,用于根据获取的清单内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价的关键因素标签值对应的正则表达式及其运算式;
提取单元6044,用于根据正则表达式及其运算式,从清单内容及其对应的定额、人材机信息中提取影响工程量清单的综合单价关键因素标签值;以及判断提取的影响工程量清单综合单价的关键因素标签值是否正确;
标签值训练单元6046,用于若标签值不正确,重新配置正则表达式及其运算式,根据重新配置的正则表达式及其运算式再次提取影响工程量清单综合单价的关键因素标签值,将再次提取的标签值作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,并利用训练好的模型提取正确的标签值;若标签值正确,则得到带有配置信息的清单模板;
计算单元606,用于识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;
比较单元608,用于将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核。
在该实施例中,限定了对导入的工程量清单进行标签化处理的具体过程,基于规则与统计相结合的清单内容处理技术方案,在采用正则化技术处理清单标签提取不正确时,则重新配置正则表达式,获取较为宽泛的数据结果(中间结果),作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,从而得到正确的标签值。具体而言,根据该工程量清单的清单描述内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价关键因素标签对应的正则表达式及其运算式,根据配置好的正则表达式及其运算式,从清单描述内容、定额信息、人材机信息中抽取清单模板中各标签项相应的标签值;如果标签值结果不正确,则调整清单模板中统计模型的配置信息,调用基于条件随机场原理的机器学习方法,进行相应标签值的训练,并利用训练好的模型提取正确的标签值;如果标签值结果正确,则说明成功提取了相应的内容,进而实现工程量清单标签化过程。
如图7所示,根据本发明的再一个实施例的工程量清单综合单价合理性的检测系统的示意框图。其中,该检测系统700包括:
模板确定单元702,用于导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;
处理单元704,用于获取工程量清单的清单内容及其对应的定额信息、人材机信息,配置清单模板内容,得到带有配置信息的清单模板;
其中,处理单元704,具体包括:正则配置单元7042,用于根据获取的清单内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价关键因素标签值对应的正则表达式及其运算式;
提取单元7044,用于根据正则表达式及其运算式,从清单内容及其对应的定额、人材机信息中提取影响工程量清单综合单价的关键因素标签值;以及判断提取的影响工程量清单综合单价的关键因素标签值是否正确;
标签值训练单元7046,用于若标签值不正确,则重新配置正则表达式及其运算式,根据重新配置的正则表达式及其运算式再次提取影响工程量清单综合单价关键因素标签的标签值,将再次提取的标签值作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,并利用训练好的模型提取正确的标签值;若标签值正确,则得到带有配置信息的清单模板;
计算单元706,用于识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;
比较单元708,用于将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核;
人工审核单元710,用于对带有配置信息的清单模板进行人工审核;若审核不通过,则模板确定单元702,还用于重新确定工程量清单所属类别;或正则配置单元7042,还用于重新配置提取影响工程量清单综合单价关键因素标签值对应的正则表达式及其运算式。
在该实施例中,在得到带有配置信息的清单模板后进行人工审核,例如,对比标签项字段与提取的标签内容是否相符,或者查看标签化的清单内容是否涵盖了该工程量清单需要提取的内容;如果审核不通过,依据具体原因对该工程量清单的所属类别进行重新确定,或者重新配置正则表达式及其运算式。本方案在实现工程量清单审核工作的信息化、智能化的基础上,进一步加入人工审核的步骤,有利于检测系统的不断完善,能够大大提高审核的精准性。当然,本领域技术人员应该理解,在检测系统完善的基础上,人工审核这一步骤并非必须。
如图8所示,根据本发明的又一个实施例的工程量清单综合单价合理性的检测系统的示意框图。其中,该检测系统800包括:
模板确定单元802,用于导入工程量清单,确定工程量清单所属类别,根据类别,选择相应的清单模板;
处理单元804,用于获取工程量清单的清单内容及其对应的定额信息、人材机信息,配置清单模板内容,得到带有配置信息的清单模板;
其中,处理单元804,具体包括:
正则配置单元8042,用于根据获取的清单内容及其对应的定额、人材机信息,配置提取影响工程量清单综合单价关键因素标签值对应的正则表达式及其运算式;
提取单元8044,用于根据正则表达式及其运算式,从清单内容及其对应的定额、人材机信息中提取影响工程量清单综合单价关键因素标签的标签值;以及判断提取的影响工程量清单综合单价关键因素标签的标签值是否正确;
标签值训练单元8046,用于若标签值不正确,则重新配置正则表达式及其运算式,根据重新配置的正则表达式及其运算式再次提取影响工程量清单综合单价关键因素标签的标签值,将再次提取的标签值作为基于条件随机场原理的机器学习方法的输入(训练)语料,进行标签值训练,并利用训练好的模型提取正确的标签值;若标签值正确,则得到带有配置信息的清单模板;
计算单元806,用于识别影响工程量清单综合单价的关键因素标签值,进行聚类分析,计算工程量清单综合单价的合理性区间;
比较单元808,用于将工程量清单综合单价与工程量清单综合单价的合理性区间进行比对,若工程量清单综合单价处于工程量清单综合单价的合理性区间内,则工程量清单通过审核;
人工审核单元810,用于对带有配置信息的清单模板进行人工审核;若审核不通过,则模板确定单元802,还用于重新确定工程量清单所属类别;或正则配置单元8042,还用于重新配置提取影响工程量清单综合单价关键因素标签对应的正则表达式及其运算式;
编制单元812,用于完成清单模板的编制,并将清单模板存储在数据库中;编制单元812,具体用于:采集多个工程量清单,汇总相同九位清单编码的清单内容集合,将工程量清单要提取的清单内容以及影响工程量清单综合单价的关键因素提炼成标签项,将标签项及其对应的经验值集合形成清单模板;经验值集合包括:采用行业规范化语言描述的材料名称、工艺系统。
在该实施例中,清单模板的设计过程主要参照相同九位清单编码下的清单数据集合,通过资深专业人士的深入分析,将该清单要抽取的内容以及影响清单综合单价的关键因素提炼成清单标签项,将此标签项及其对应的经验值集合形成标签模板。具体而言,将清单工艺方法与材料名称清单描述规范化内容以及影响清单综合单价的重要标签等内容融合一体的清单模板,其中将自然语言描述的清单内容按照行业标准进行了规范化,将不规范的材料名称、工艺方法替换为规范的材料名称、工艺方法。
在上述任一实施例中,优选地,工程量清单要提取的清单内容以及影响工程量清单综合单价的关键因素包括以下任一项或其组合:工程类型、工程时间、专业工程、分部分项、清单规范、清单编码。
在该实施例中,不同类别的工程量清单对应不同的清单模板,每个清单模板中要提取的清单内容以及影响工程量清单综合单价的关键因素包括但不限于以下任一项或其组合:工程类型、工程时间、专业工程、分部分项、清单规范、清单编码,还可以依据实际情况设定需要的标签项,如厚度、截面积、回填材料、运距等。
如图9所示,根据本发明的一个实施例的计算机设备的示意图。该计算机设备1包括存储器12、处理器14及存储在存储器12上并可在处理器14上运行的计算机程序,处理器14用于执行如上述任一实施例中的工程量清单综合单价合理性的检测方法的步骤。
本发明提供的计算机设备1,其存储器12上存储的计算机程序被处理器14执行时,实现了如上述任一实施例中的工程量清单综合单价合理性的检测方法的步骤,因而具有如上述任一实施例中的工程量清单综合单价合理性的检测方法全部的有益效果,在此不再赘述。
本发明的又一方面,提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现了如上述任一实施例中的工程量清单综合单价合理性的检测方法的步骤。
本发明提供的计算机可读存储介质,其上存储的计算机程序被处理器执行时,实现了如上述任一实施例中的工程量清单综合单价合理性的检测方法的步骤,因而具有如上述任一实施例中的工程量清单综合单价合理性的检测方法全部的有益效果,在此不再赘述。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。