CN114168716A - 基于深度学习的工程造价自动抽取和分析方法及装置 - Google Patents

基于深度学习的工程造价自动抽取和分析方法及装置 Download PDF

Info

Publication number
CN114168716A
CN114168716A CN202210126772.4A CN202210126772A CN114168716A CN 114168716 A CN114168716 A CN 114168716A CN 202210126772 A CN202210126772 A CN 202210126772A CN 114168716 A CN114168716 A CN 114168716A
Authority
CN
China
Prior art keywords
cost
project
information
database
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210126772.4A
Other languages
English (en)
Other versions
CN114168716B (zh
Inventor
叶杰舜
黄文炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202210126772.4A priority Critical patent/CN114168716B/zh
Publication of CN114168716A publication Critical patent/CN114168716A/zh
Application granted granted Critical
Publication of CN114168716B publication Critical patent/CN114168716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Abstract

本发明公开了一种基于深度学习的工程造价自动抽取和分析方法。该方法如下:导入工程量清单及市场工程造价信息,使用自然语言处理技术中的分词拆分方法进行分词拆分,建立知识图谱及结构化数据库,建立深度学习模型,自动识别造价信息,并依据知识图谱对应关系,将单价信息输入结构化数据库;导入待测造价的工程量清单,使用深度学习模型,依据项目名称、描述特征和造价标准的对应关系自动读取结构化数据库和输出其造价。建立造价指标数据库,与已有数据比对分析输出造价的准确率。本发明实现小样本深度学习下的工程造价信息自动抽取及工程造价自动生成和分析,提高工程造价信息数据库建立以及工程造价预测、计划、控制、核算的工作效率。

Description

基于深度学习的工程造价自动抽取和分析方法及装置
技术领域
本发明涉及建设工程造价、工程成本、小样本深度学习与自然语言处理技术领域,具体公开一种基于深度学习的工程造价自动抽取和分析方法、装置、计算机设备及存储介质,涉及一种计算机程序、一种计算机设备、一种计算机可读存储介质、一种云服务设备、一种云服务可读存储介质、一种云服务系统。
背景技术
大数据时代对建筑行业造价信息的时效性、准确性更高要求,人工整理工程造价信息的效率以及基于造价信息对工程项目的成本的预测、计划、控制、核算效率,已无法满足当下建筑行业产业化的发展要求。
由于不同造价人员编制工程量清单方法不同,以及市场上对于人工、材料、机械等采购清单表述的方法不同,工程量清单与市场采购清单表述也不同,缺乏规范的、统一的、可对应的表述标准。因此极度依赖造价人员用人工方式对市场上工程造价信息的采集及整理、工程量清单与市场采购清单差异的理解,及基于所采集到的造价信息进行二次加工。基于工程量清单对工程项目成本进行预测、计划、控制、核算,目前这些工作都由造价人员人工完成,对造价人员本身的经验知识、准确率要求高,并且需要耗费大量时间。而使用深度学习与自然语言处理技术建立模型,并实现造价信息的自动抽取与工程成本自动生成及分析,可以减少人工判断,统一造价标准、使准确率达到满足要求,通过机器进行海量的训练集训练,极大减少人工对训练集进行处理的时间和成本,通过人工智能手段,有利于提高工程造价行业水平以及施工现场造价核算工作的效率和准确性。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析方法、装置、计算机设备、存储介质及云服务器系统。
本发明的第一个目的在于提供一种基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析方法。
本发明的第二个目的在于提供一种基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析装置。
本发明的第三个目的在于提供一种计算机设备。
本发明的第四个目的在于提供一种存储介质。
本发明的第五个目的在于提供一种云服务器系统。
本发明的第一个目的可以通过采取如下技术方案达到:
一种基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析方法,该方法包括工程造价信息自动识别及抽取步骤以及工程造价自动生成和分析步骤,其中,
所述工程造价信息自动识别及抽取步骤过程如下:
S101、导入不同建设工程类型工程量清单信息,将工程量清单的内容按:分部工程、项目名称、项目特征描述、计量单位中的两种或多种组合划分为多个部分;
S102、导入市场工程造价信息;
S103、将工程量清单信息、市场工程造价信息使用自然语言处理技术中的分词拆分方法进行工程描述特征分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
S104、对于分词拆分,若出现输出的分词与内容表述原意有偏差的情况,按照正确的分词拆分;
S105、对于拆分后的工程量清单信息与市场工程造价信息,对分词内容、词性、描述特征、出现频率,建立知识图谱对应关系,并根据知识图谱建立对应关系结构化数据库;
S106、将输出的分词按照事先指定的顺序排列,然后将分词内容、以及分词出现的频率、分词的词性,按照不同对应关系,建立标签并建立数据矩阵;
S107、将上述数据矩阵作为训练集,选择深度学习算法,建立并训练小样本深度学习模型,通过小样本深度学习模型自动识别造价信息,并抽取造价信息并输入结构化数据库;
所述工程造价自动生成和分析步骤过程如下:
S201、导入待测算成本的工程量清单,按照不同建设工程类型深度学习模型,依据知识图谱对应关系,自动读取结构化数据库,识别每一项工程量清单的造价内容,实现小样本学习,自动输出各项造价内容的单价;
S202、根据各类造价内容的单价计算得出综合单价、合价,最后根据各项工程量清单的合价汇总得出总价;
S203、根据工程量清单的总价,计算工程量清单的关键造价指标,并储存进指标数据库;
S204、根据工程量清单的各个关键造价指标,与指标数据库的历史数据进行比对,自动计算并输出偏离度,以此分析造价的合理性。
进一步地,所述小样本深度学习模型的工作过程如下:
S301、导入工程量清单,执行步骤S101、S102、S103,将工程量清单分进行分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
S302、根据输出的分词及分词对应的词性、分词对应的出现频率,使用知识图谱对应关系、知识图谱与对应关系结构化数据库的关系、以及预先设定深度学习算法的数据的分布式特征表示,使用深度学习算法,输入所述数据矩阵,得到标签的分类方法;
S303、导入工程量清单信息、市场工程造价信息后,使用分类方法输出标签,根据输出的标签找到工程量清单信息、市场工程造价信息与对应关系结构化数据库的关系;
S304、按照工程量清单信息、市场工程造价信息与对应关系结构化数据库的关系,将工程量清单信息、市场工程造价信息,按照标签分别储存进数据库;
S305、输出不带造价信息的工程量清单后,按照标签,读取数据库,输出工程量清单中各项清单的单价,然后按照单价计算得出综合单价、合价;
S306、按照计算得出工程量清单中各项清单的综合单价、合价,分别除以工程量清单的总价所得百分比的计算得到占比,其中占工程量清单的总价的比例在5%以上的清单作为工程量清单关键指标,并分别储存进数据库;
S307、导入新的工程量清单,重复步骤S301至S306,计算得出工程量清单关键造价指标,与数据库中同一关键造价指标进行相减,然后相减的差值除以指标数据库中同一关键造价指标所得百分比为偏离度。
进一步地,所述分词拆分的操作包括:段落切分、句子切分、词语切分;段落切分是以文本换行符作为分割符号,将文本内容划分为两个或以上段落;句子切分是以标点符号作为分割符号,将段落内容划分为两个或以上句子;词语切分是使用分词器将句子内容划分为两个或以上词语;所述分词器是将一个汉字序列进行切分,与事先设定的分词库进行匹配比对,按照最符合原文含义的方法,得到一个个单独的词语;所述分词库是指两个以上的词语以及词语对应的词性组合形成的数据库。
目前国内工程造价计价规范以工程量清单作为计价依据,而各造价从业人员编制工程量清单各不一致,工程量清单文本的读取及分析所包含的造价内容,占用造价人员编制工程项目造价的大部分时间;通过文本切割技术,可以快速提取工程量清单有效内容,从而可以实现识别当中包含的造价信息。使用现有文本分割技术,可将工程量清单拆分成一个个分词,通过建立分词库储存已拆分分词,并根据分词与工程量清单包含的造价内容的关联关系高低,设置分词的权重,使得拆分后的分词含义与其包含造价内容的关联关系,在使用过程中越来越高。通过本发明提出的分词拆分方案,使工程量清单分割成一个个分词,从而更准确地提取工程量清单包含造价内容。
进一步地,所述知识图谱对应关系是指按照步骤S103中的输出分词的内容、词性、出现频率与工程量清单信息、市场工程造价信息建立对应关系;当词性为名词的分词,包括“钢筋”、“混凝土”、“模板”,按照分词出现的频率,建立工程量清单信息、市场工程造价信息中对应包含的材料及材料费用;当词性为动词的分词,包括“绑扎”、“浇筑”、“搭设”,按照分词出现的频率,建立工程量清单信息、市场工程造价信息中对应包含的施工工序及人工费用、机械费用;当词性为动词、动词之外的分词,建立工程量清单信息、市场工程造价信息中对应材料费、人工费、机械费的规格型号、品牌及影响价格的关系。
在工程量清单分割成一个个分词后,为使得机器可读性加强,需设置知识图谱关系,使得在得到分割后的分词,通过知识图谱对应关系,输出工程量清单造价信息中对应影响价格的关系。
本发明按照输出分词的内容、词性、出现频率与工程量清单信息、市场工程造价信息建立对应关系;当词性为名词的分词,包括“钢筋”、“混凝土”、“模板”,按照分词出现的频率,建立工程量清单信息、市场工程造价信息中对应包含的材料及材料费用;当词性为动词的分词,包括“绑扎”、“浇筑”、“搭设”,按照分词出现的频率,建立工程量清单信息、市场工程造价信息中对应包含的施工工序及人工费用、机械费用;当词性为动词、动词之外的分词,建立工程量清单信息、市场工程造价信息中对应材料费、人工费、机械费的规格型号、品牌及影响价格的关系。通过建立的知识图谱对应关系,使得工程量清单在进行分词拆分后,可输出工程量清单造价信息中对应造价信息以及影响价格的关系。
所述对应关系结构化数据库按照知识图谱对应关系中的人工费、材料费、机械费,以及规格型号、品牌及影响价格的关系,建立不同类型的价格数据库,储存价格信息;按照知识图谱对应关系,通过按照工程量清单信息、市场工程造价信息中包含的输出分词的内容、词性、出现频率,建立该工程量清单信息、市场工程造价信息与价格数据库的映射关系;通过导入市场工程造价信息,找到与价格数据库的映射关系,将市场工程造价信息中的价格信息储存进对应关系结构化数据库;通过导入工程量清单信息,找到与价格数据库的映射关系,将事先导入的价格信息输出。
在识别出工程量清单造价信息中对应造价信息以及影响价格的关系后,需要进行造价信息的抽取及储存,才能在下一次导入工程量清单后,输出其造价。
按照知识图谱对应关系中的人工费、材料费、机械费,以及规格型号、品牌及影响价格的关系,建立不同类型的价格数据库,储存价格信息;按照知识图谱对应关系,通过按照工程量清单信息、市场工程造价信息中包含的输出分词的内容、词性、出现频率,建立该工程量清单信息、市场工程造价信息与价格数据库的映射关系。
通过导入市场工程造价信息,找到与价格数据库的映射关系,将市场工程造价信息中的价格信息储存进对应关系结构化数据库;通过导入工程量清单信息,找到与价格数据库的映射关系,将事先导入的价格信息输出。
进一步地,所述深度学习算法是通过组合低层特征形成抽象的高层表示属性类别或特征,以输出数据的分布式特征表示的方法,包括:贝叶斯算法、决策树算法、神经网络算法、支持向量机算法、聚类算法、KNN算法、回归树算法中的一种或多种;
为使得计算机可自动识别工程量清单包含的造价内容,需要将不同类型的工程量清单进行归类,使用深度学习算法,识别出工程量清单所属类别后,根据上述预先设定的知识图谱关系,输出工程量清单造价信息中对应造价信息以及影响价格的关系。
不同类型的工程量清单进行归类并设置标签,然后将所有工程量清单进行分词拆分,输出分词的频率、词性;通过数据矩阵储存所有工程量清单输出分词的频率、词性;使用深度学习算法,使得在输入工程量清单输出分词的频率,词性后,输出工程量清单所属类别的标签。
通过引入深度学习算法,使得在输入工程量清单输出分词的频率、词性后,输出工程量清单所属类别的标签。
所述小样本深度学习模型按照知识图谱对应关系、知识图谱与对应关系结构化数据库的关系、以及预先设定深度学习算法的数据的分布式特征表示,使用深度学习算法,首先,输入步骤S106的数据矩阵后,输出步骤S106的标签的分类方法;然后,导入工程量清单信息、市场工程造价信息后,使用分类方法输出步骤S106的标签,根据输出的标签找到与对应关系结构化数据库的关系,并根据对应关系结构化数据库进行造价信息的抽取和输出。
为使得计算机在识别工程量清单包含的造价内容后,进行工程造价的输出,需要使用上述工程量清单识别方法,在导入工程量清单后,识别出工程量清单所包含的造价内容后,读取上述建立的价格数据库,进行输出。
导入工程量清单信息、市场工程造价信息后,使用分类方法输出步骤S106的标签,根据输出的标签找到与对应关系结构化数据库的关系,并根据对应关系结构化数据库进行造价信息的抽取和输出。
在导入工程量清单后,识别出工程量清单所包含的造价内容后,读取上述建立的价格数据库,进行造价信息的抽取输出。
进一步地,所述综合单价是指完成一个工程量清单所需的人工费、材料费、机械费、间接费、利润以及一定范围内的风险的费用,综合单价当中的人工费、材料费、机械费通过步骤S201输出的单价相加所得,综合单价当中的间接费、利润、以及一定范围内的风险通过步骤S201输出的单价乘以事先给定的系数所得;
所述关键造价指标是指单一类别工程量清单的合价占工程量清单的总价的比例在5%以上,通过单一类别工程量清单的合价除以工程量清单的总价所得百分比的计算得到;所述指标数据库是储存上述关键造价指标的数据库。
目前工程量清单计价规范中,需使用综合单价进行工程造价的计价,然后通过综合单价乘以工程量得到合价,通过各项工程量清单合价之和得到工程造价;综合单价是指完成一个工程量清单所需的人工费、材料费、机械费、间接费、利润以及一定范围内的风险的费用。因此需要通过上述步骤,在导入工程量清单并输出各项单价后,计算得出综合单价、合价。
综合单价当中的人工费、材料费、机械费通过步骤S201输出的单价相加所得,综合单价当中的间接费、利润、以及一定范围内的风险通过步骤S201输出的单价乘以事先给定的系数所得;通过综合单价乘以工程量得到合价,通过各项工程量清单合价之和得到工程造价。
在导入工程量清单后,通过上述步骤得到各项工程量清单的单价、综合单价、合价以及工程造价。
进一步地,所述偏离度的计算方式如下:将步骤S203计算得出的工程量清单的关键造价指标,与步骤S203中的指标数据库中的同一关键造价指标进行相减,然后相减的差值除以指标数据库中的同一关键造价指标所得百分比。
在上述步骤输出工程造价后,为使得自动分析工程造价的准确率,需通过计算工程量清单的关键造价指标并储存进数据库,通过导入新的工程量造价清单并计算关键造价指标,与数据库比对,计算偏离度,可分析工程造价的准确率。
将步骤S203计算得出的工程量清单的关键造价指标,与步骤S203中的指标数据库中的同一关键造价指标进行相减,然后相减的差值除以指标数据库中的同一关键造价指标所得百分比。
导入工程量造价清单后,通过上述步骤得到工程造价,计算关键造价指标,与数据库比对,计算并输出偏离度。
本发明的第二个目的可以通过采取如下技术方案达到:
一种工程造价信息自动抽取及工程成本自动生成和分析装置,所述工程造价信息自动抽取及工程成本自动生成和分析装置包括工程造价信息自动识别及抽取模块和工程造价自动生成和分析模块,其中,
所述工程造价信息自动识别及抽取模块包括:
第一导入单元,用于将工程量清单的内容按:分部工程、项目名称、项目特征描述、计量单位中的两种或多种组合划分为多个部分;
第二导入单元,用于导入市场工程造价信息;
分词拆分单元,用于将工程量清单信息、市场工程造价信息使用自然语言处理技术中的分词拆分方法进行分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
检测判断单元,用于对于分词拆分,若出现输出的分词与内容表述原意有偏差的情况,按照正确的分词拆分;
第一建立单元,用于对于拆分后的工程量清单信息与市场工程造价信息,对分词内容、词性、出现频率,建立知识图谱对应关系,并根据知识图谱建立对应关系结构化数据库;
第二建立单元,用于将输出的分词按照事先指定的顺序排列,然后将分词内容、以及分词出现的频率、分词的词性,按照不同对应关系,建立标签并建立数据矩阵;
模型运用单元,用于将上述数据矩阵作为训练集,选择深度学习算法,建立并训练小样本深度学习模型,通过小样本深度学习模型自动识别造价信息,并抽取造价信息并输入结构化数据库;
所述工程造价自动生成和分析模块包括:
第三导入单元,用于导入待测算成本的工程量清单,按照上述小样本深度学习模型,依据知识图谱对应关系,自动读取结构化数据库,识别每一项工程量清单的造价内容,并自动输出各项造价内容的单价;
第一计算单元,用于根据各类造价内容的单价计算得出综合单价、合价,最后根据各项工程量清单的合价汇总得出总价;
第二计算单元,用于根据工程量清单的总价,计算工程量清单的关键造价指标,并储存进指标数据库;
第三计算单元,用于根据工程量清单的各个关键造价指标,与指标数据库的历史数据进行比对,自动计算并输出偏离度,分析造价的合理性。
本发明的第三个目的可以通过采取如下技术方案达到:
一种计算机设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现上述工程造价信息自动抽取及工程成本自动生成和分析方法。
本发明的第四个目的可以通过采取如下技术方案达到:
一种存储介质,存储有程序,所述程序被处理器执行时,实现上述工程造价信息自动抽取及工程成本自动生成和分析方法。
本发明的第五个目的可以通过采取如下技术方案达到:
一种云服务系统,包括云计算的服务器、存储器、处理器及存储在所述存储器上并可在所述处理器上,运行的计算机程序,用于执行上述工程造价信息自动抽取及工程成本自动生成和分析方法。
为使得一种基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析方法的所有步骤可于计算机上运行并使用,需要编写程序,并于计算机或者云计算的服务器中运行,使得在使用上述程序时,可实现上述所有步骤。通过将上述步骤,以计算机语言编写程序,程序中包括可实现上述所有步骤的功能,并于计算机或者云计算的服务器中运行。在使用上述程序时,可实现上述所有步骤。
本发明相对于现有技术具有如下的优点及效果:
1、目前国内工程造价的计价规范以工程量清单计价为主,由于行业从业人员的水平偏差以及编制习惯的不同,导致不同工程量清单中同样的造价内容,会因上述差异出现文字描述的不同,大大降低工程量清单的编制、审核以及工程造价的预测、计划、控制、核算效率;本发明使用的自然语言处理分词拆分技术,可对不同工程量清单的造价内容进行更准确的识别和抽取,相较于目前人工工作,本发明识别的效率更高。
2、目前国内工程造价的计价极大依赖人工对工程量清单的识别、分析及编制,编制效率过低;基于本发明可实现导入过往工程量清单后,将造价信息储存进数据库,在导入新的工程量清单后,可使计算机自动识别工程量清单,并根据数据库输出单价、综合单价、合价,自动输出工程造价。基于上述对工程量清单的自然语言处理分词拆分技术,拆分得出各分词出现的频率和词性。本发明使用深度学习技术,将同类工程量清单设置标签,通过导入上述各分词出现的频率和词性,可通过深度学习输出导入工程量清单所属类别的标签;通过建立知识图谱关系和造价数据库,然后建立知识图谱与深度学习输出的标签的对应关系,可在导入工程量清单后,通过上述步骤识别出类别及标签,并根据知识图谱关系将单价储存进造价数据库,或者输出造价数据库中的单价,然后计算得出综合单价、合价、工程造价。
3、区别于其他深度学习算法,在上述步骤输出工程造价后,建立关键造价指标数据库,使导入新的工程量清单并输出工程造价后,计算关键造价指标并与数据库同类指标比较,计算出偏离度,使得更容易评价输出的工程造价准确率,并且可以通过调整上述步骤,使得输出的工程造价准确率不断提高。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明公开的一种基于小样本深度学习与自然语言处理技术下的工程造价信息自动识别及抽取方法的流程示意图;
图2示出了本发明公开的一种基于小样本深度学习与自然语言处理技术下的工程造价自动生成和分析方法的流程示意图;
图3示出了根据本发明的一个实施例的基于小样本深度学习与自然语言处理技术下的工程造价信息自动识别及抽取方法的流程示意图;
图4示出了根据本发明的一个实施例的基于小样本深度学习与自然语言处理技术下的工程造价自动生成和分析方法的流程示意图;
图5是本发明实施例2中基于小样本深度学习与自然语言处理技术下的工程造价信息自动识别及抽取方法、自动生成和分析方法装置的结构框图;
图6是本发明实施例3中计算机设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本实施例公开一种基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析方法,该方法包括工程造价信息自动识别及抽取步骤以及工程造价自动生成和分析步骤,其中,
工程造价信息自动识别及抽取步骤过程如下:
S101、导入工程量清单信息,将工程量清单的内容按:分部工程、项目名称、项目特征描述、计量单位中的两种或多种组合划分为多个部分;
S102、导入市场工程造价信息;
按照步骤S101、S102,导入如下的工程量清单信息或市场工程造价信息,并按:分部工程、项目名称、项目特征描述、计量单位中的两种或多种组合划分为多个部分,其中一个工程量清单的示例表1如下;
表1.工程量清单
Figure DEST_PATH_IMAGE001
S103、将工程量清单信息、市场工程造价信息使用自然语言处理技术中的分词拆分方法进行分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
其中,所述分词拆分的操作包括:段落切分、句子切分、词语切分;段落切分是以文本换行符作为分割符号,将文本内容划分为两个或以上段落;句子切分是以标点符号作为分割符号,将段落内容划分为两个或以上句子;词语切分是使用分词器将句子内容划分为两个或以上词语,其中,分词器是将一个汉字序列进行切分,与事先设定的分词库进行匹配比对,按照最符合原文含义的方法,得到一个个单独的词语;分词库是指两个以上的词语以及词语对应的词性组合形成的数据库;
S104、对于分词拆分,若出现输出的分词与内容表述原意有偏差的情况,按照正确的分词拆分;
按照步骤S103、S104,工程量清单信息、市场工程造价信息使用自然语言处理技术中的分词拆分方法进行分词拆分,输出分词及分词对应的词性、出现频率,因空格也视为一个分词,所以也进行统计,具体如下表2;
表2.工程量清单分词拆分输出结果
Figure 999203DEST_PATH_IMAGE002
其中,词性编码说明如下表3所示,具体如下:
表3.词性编码说明
Figure DEST_PATH_IMAGE003
S105、对于拆分后的工程量清单信息与市场工程造价信息,对分词内容、词性、出现频率,建立知识图谱对应关系,并根据知识图谱建立对应关系结构化数据库;
知识图谱对应关系是指,按照步骤S103中的输出分词的内容、词性、出现频率与工程量清单信息、市场工程造价信息建立对应关系;当词性为名词的分词,包括“钢筋”、“混凝土”、“模板”,按照分词出现的频率,建立工程量清单信息、市场工程造价信息中对应包含的材料及材料费用;当词性为动词的分词,包括“绑扎”、“浇筑”、“搭设”,按照分词出现的频率,建立工程量清单信息、市场工程造价信息中对应包含的施工工序及人工费用、机械费用;当词性为动词、动词之外的分词,包括“C30”、“HRB335”、“木模”,建立工程量清单信息、市场工程造价信息中对应材料费、人工费、机械费的规格型号、品牌及影响价格的关系;
对应关系结构化数据库按照知识图谱对应关系中的人工费、材料费、机械费,以及规格型号、品牌及影响价格的关系,建立不同类型的价格数据库,储存价格信息;按照知识图谱对应关系,通过按照工程量清单信息、市场工程造价信息中包含的输出分词的内容、词性、出现频率,建立该工程量清单信息、市场工程造价信息与价格数据库的映射关系;通过导入市场工程造价信息,找到与价格数据库的映射关系,将市场工程造价信息中的价格信息储存进对应关系结构化数据库;通过导入工程量清单信息,找到与价格数据库的映射关系,可将事先导入的价格信息输出;
结构化数据库如下表4所示,具体如下:
表4.结构化数据库格式
Figure 905891DEST_PATH_IMAGE004
S106、将输出的分词按照事先指定的顺序排列,然后将分词内容、以及分词出现的频率、分词的词性,按照不同对应关系,建立标签并建立数据矩阵;数据矩阵如表5所示,具体如下:
表5.数据矩阵格式
Figure DEST_PATH_IMAGE005
S107、将上述数据矩阵作为训练集,选择深度学习算法,建立并训练小样本深度学习模型,通过小样本深度学习模型自动识别造价信息,并抽取造价信息并输入结构化数据库;
深度学习算法是通过组合低层特征形成抽象的高层表示属性类别或特征,以输出数据的分布式特征表示的方法,包括:贝叶斯算法、决策树算法、神经网络算法、支持向量机算法、聚类算法、KNN算法、回归树算法中的一种或多种;
小样本深度学习模型按照所述知识图谱对应关系、知识图谱与对应关系结构化数据库的关系、以及预先设定深度学习算法的数据的分布式特征表示,使用深度学习算法,首先,输入步骤S106的数据矩阵后,输出步骤S106的标签的分类方法;然后,导入工程量清单信息、市场工程造价信息后,使用分类方法输出步骤S106的标签,根据输出的标签找到与对应关系结构化数据库的关系,并根据对应关系结构化数据库进行造价信息的抽取和输出;
工程造价自动生成和分析步骤过程如下:
S201、导入待测算成本的工程量清单,对工程量清单进行分词拆分,按照上述小样本深度学习模型,依据知识图谱对应关系,自动读取结构化数据库,识别每一项工程量清单的造价内容,并自动输出各项造价内容的单价;待测算成本的工程量清单,其中一个工程量清单的示例表6如下:
表6.待测算成本的工程量清单
Figure 75841DEST_PATH_IMAGE006
其中一个工程量清单的分词拆分示例如表7所示:
表7.待测算成本的工程量清单的分词拆分输出结果
Figure DEST_PATH_IMAGE007
上述示例中,按照步骤S106、S107,将工程量清单拆分后输出的分词、分词出现频率、词性,建立数据矩阵,使用小样本深度学习模型,导入数据矩阵后,模型识别出该工程量清单的标签为:“1”;
按照步骤S105,根据输出识别出该工程量清单的标签,读取该工程量清单对应关系结构化数据库,输出单价分别为:人工费:50、材料费:600、机械费:20;人工费、材料费、机械费之和为670;预先设定系数为:间接费10%、利润15%、一定范围内的风险:5%;计算得到:间接费=670*10%=67、利润=670*15%=100.5、一定范围内的风险=670*5%=33.5;综合单价等于人工费、材料费、机械费、间接费、利润、一定范围内的风险之和,等于871;合价=综合单价*工程量,合价=10000*871=8710000;然后将所有工程量清单按照上述步骤,输出综合单价、合价,将所有合价相加得到总价,总价即为工程造价;
S202、根据各类造价内容的单价计算得出综合单价、合价,最后根据各项工程量清单的合价汇总得出总价;
其中,综合单价是指完成一个工程量清单所需的人工费、材料费、机械费、间接费、利润以及一定范围内的风险的费用,综合单价当中的人工费、材料费、机械费通过步骤S201输出的单价相加所得,综合单价当中的间接费、利润、以及一定范围内的风险通过步骤S201输出的单价乘以事先给定的系数所得;
S203、根据工程量清单的总价,计算工程量清单的关键造价指标,并储存进指标数据库;
其中,关键造价指标是指单一类别工程量清单的合价占工程量清单的总价的比例在5%以上,通过单一类别工程量清单的合价除以工程量清单的总价所得百分比的计算得到;指标数据库是储存上述关键造价指标的数据库;
S204、根据工程量清单的各个关键造价指标,与指标数据库的历史数据进行比对,自动计算并输出偏离度,以此分析造价的合理性。
其中,偏离度的计算方式如下:将步骤S203计算得出的工程量清单的关键造价指标,与步骤S203中的指标数据库中的同一关键造价指标进行相减,然后相减的差值除以指标数据库中的同一关键造价指标所得百分比。
本实施例中,假定工程量清单的总价、即工程造价为:87100000,则示例当中的工程量清单合价占工程造价比例为:8710000/87100000=10%,读取指标数据库,数据库中同类工程量清单的历史造价指标平均值为8%,偏离度计算为:(10%-8%)/8%=25%。
实施例2:
如图5所示,本实施例公开了一种工程造价信息自动抽取及工程成本自动生成和分析装置,所述工程造价信息自动抽取及工程成本自动生成和分析装置包括工程造价信息自动识别及抽取模块501和工程造价自动生成和分析模块502,其中,工程造价信息自动识别及抽取模块501包括:
第一导入单元5011,用于将工程量清单的内容按:分部工程、项目名称、项目特征描述、计量单位中的两种或多种组合划分为多个部分;
第二导入单元5012,用于导入市场工程造价信息;
分词拆分单元5013,用于将工程量清单信息、市场工程造价信息使用自然语言处理技术中的分词拆分方法进行分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
检测判断单元5014,用于对于分词拆分,若出现输出的分词与内容表述原意有偏差的情况,按照正确的分词拆分;
第一建立单元5015,用于对于拆分后的工程量清单信息与市场工程造价信息,对分词内容、词性、出现频率,建立知识图谱对应关系,并根据知识图谱建立对应关系结构化数据库;
第二建立单元5016,用于将输出的分词按照事先指定的顺序排列,然后将分词内容、以及分词出现的频率、分词的词性,按照不同对应关系,建立标签并建立数据矩阵;
模型运用单元5017,用于将上述数据矩阵作为训练集,选择深度学习算法,建立并训练小样本深度学习模型,通过小样本深度学习模型自动识别造价信息,并抽取造价信息并输入结构化数据库;
工程造价自动生成和分析模块502包括:
第三导入单元5021,用于导入待测算成本的工程量清单,按照上述小样本深度学习模型,依据知识图谱对应关系,自动读取结构化数据库,识别每一项工程量清单的造价内容,并自动输出各项造价内容的单价;
第一计算单元5022,用于根据各类造价内容的单价计算得出综合单价、合价,最后根据各项工程量清单的合价汇总得出总价;
第二计算单元5023,用于根据工程量清单的总价,计算工程量清单的关键造价指标,并储存进指标数据库;
第三计算单元5024,用于根据工程量清单的各个关键造价指标,与指标数据库的历史数据进行比对,自动计算并输出偏离度,以此分析造价的合理性。
实施例3:
本实施例提供了一种计算机设备,该计算机设备可以为计算机,如图6所示,其通过系统总线601连接的处理器602、存储器、输入装置603、显示器604和网络接口605,该处理器用于提供计算和控制能力,该存储器包括非易失性存储介质606和内存储器607,该非易失性存储介质606存储有操作系统、计算机程序和数据库,该内存储器607为非易失性存储介质中的操作系统和计算机程序的运行提供环境,处理器602执行存储器存储的计算机程序时,实现上述实施例1的基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析方法,该方法包括工程造价信息自动识别及抽取步骤以及工程造价自动生成和分析步骤,其中,
工程造价信息自动识别及抽取步骤过程如下
S101、导入工程量清单信息,将工程量清单的内容按:分部工程、项目名称、项目特征描述、计量单位中的两种或多种组合划分为多个部分;
S102、导入市场工程造价信息;
S103、将工程量清单信息、市场工程造价信息使用自然语言处理技术中的分词拆分方法进行分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
S104、对于分词拆分,若出现输出的分词与内容表述原意有偏差的情况,按照正确的分词拆分;
S105、对于拆分后的工程量清单信息与市场工程造价信息,对分词内容、词性、出现频率,建立知识图谱对应关系,并根据知识图谱建立对应关系结构化数据库;
S106、将输出的分词按照事先指定的顺序排列,然后将分词内容、以及分词出现的频率、分词的词性,按照不同对应关系,建立标签并建立数据矩阵;
S107、将上述数据矩阵作为训练集,选择深度学习算法,建立并训练小样本深度学习模型,通过小样本深度学习模型自动识别造价信息,并抽取造价信息并输入结构化数据库;
工程造价自动生成和分析步骤过程如下:
S201、导入待测算成本的工程量清单,按照上述小样本深度学习模型,依据知识图谱对应关系,自动读取结构化数据库,识别每一项工程量清单的造价内容,并自动输出各项造价内容的单价;
S202、根据各类造价内容的单价计算得出综合单价、合价,最后根据各项工程量清单的合价汇总得出总价;
S203、根据工程量清单的总价,计算工程量清单的关键造价指标,并储存进指标数据库;
S204、根据工程量清单的各个关键造价指标,与指标数据库的历史数据进行比对,自动计算并输出偏离度,以此分析造价的合理性。
实施例4:
如图6所述,本实施例提供了一种存储介质,该存储介质为计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现上述实施例1的基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析方法,该方法包括工程造价信息自动识别及抽取步骤以及工程造价自动生成和分析步骤。各个步骤的实现过程参照实施例3。
本实施例中所述存储介质可以是磁盘、光盘、计算机存储器、随机存取存储器(RAM,Random Access Memory)、U盘、移动硬盘等介质。
实施例5:
本实施例提供了一种云服务计算系统,包括云计算的服务器、存储器、处理器及存储在所述存储器上并可在所述处理器上,运行的计算机程序,用于执行上述实施例1的基于小样本深度学习与自然语言处理技术下的工程造价信息自动抽取及工程成本自动生成和分析方法,该方法包括工程造价信息自动识别及抽取步骤以及工程造价自动生成和分析步骤。各个步骤的实现过程参照实施例3。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种基于深度学习与自然语言处理技术的工程造价信息自动抽取及工程成本自动生成和分析方法,其特征在于,该方法包括工程造价信息自动识别及抽取步骤以及工程造价自动生成和分析步骤,其中,
所述工程造价信息自动识别及抽取步骤过程如下:
S101、导入不同建设工程类型工程量清单信息,将工程量清单的内容按:分部工程、项目名称、项目特征描述、计量单位中的两种或多种组合划分为多个部分;
S102、导入市场工程造价信息;
S103、将工程量清单信息、市场工程造价信息使用自然语言处理技术中的分词拆分方法进行工程描述特征分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
S104、对于分词拆分,若出现输出的分词与内容表述原意有偏差的情况,按照正确的分词拆分;
S105、对于拆分后的工程量清单信息与市场工程造价信息,对分词内容、词性、描述特征、出现频率,建立知识图谱对应关系,并根据知识图谱建立对应关系结构化数据库;
S106、将输出的分词按照事先指定的顺序排列,然后将分词内容、以及分词出现的频率、分词的词性,按照不同对应关系,建立标签并建立数据矩阵;
S107、将上述数据矩阵作为训练集,选择深度学习算法,建立并训练小样本深度学习模型,通过小样本深度学习模型自动识别造价信息,并抽取造价信息并输入结构化数据库;
所述工程造价自动生成和分析步骤过程如下:
S201、导入待测算成本的工程量清单,按照不同建设工程类型深度学习模型,依据知识图谱对应关系,自动读取结构化数据库,识别每一项工程量清单的造价内容,实现小样本学习,自动输出各项造价内容的单价;
S202、根据各类造价内容的单价计算得出综合单价、合价,最后根据各项工程量清单的合价汇总得出总价;
S203、根据工程量清单的总价,计算工程量清单的关键造价指标,并储存进指标数据库;
S204、根据工程量清单的各个关键造价指标,与指标数据库的历史数据进行比对,自动计算并输出偏离度,以此分析造价的合理性。
2.根据权利要求1所述的工程造价信息自动抽取及工程成本自动生成和分析方法,其特征在于,所述小样本深度学习模型的工作过程如下:
S301、导入工程量清单,执行步骤S101、S102、S103,将工程量清单进行描述特征分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
S302、根据输出的分词及分词对应的词性、分词对应的出现频率,使用知识图谱对应关系、知识图谱与对应关系结构化数据库的关系、以及预先设定深度学习算法的数据的分布式特征表示,使用深度学习算法,输入所述数据矩阵,得到标签的分类方法;
S303、导入工程量清单信息、市场工程造价信息后,使用分类方法输出标签,根据输出的标签找到工程量清单信息、市场工程造价信息与对应关系结构化数据库的关系;
S304、按照对应关系结构化数据库的关系,将工程量清单信息、市场工程造价信息,按照标签分别储存进数据库;
S305、输出不带造价信息的工程量清单后,按照标签,读取数据库,输出工程量清单中各项清单的单价,然后按照单价计算得出综合单价、合价;
S306、按照计算得出工程量清单中各项清单的综合单价、合价,分别除以工程量清单的总价所得百分比的计算得到占比,其中占工程量清单的总价的比例在5%以上的清单作为工程量清单关键指标,并分别储存进数据库;
S307、导入新的工程量清单,重复步骤S301至S306,计算得出工程量清单关键造价指标,与数据库中同一关键造价指标进行相减,然后相减的差值除以指标数据库中同一关键造价指标所得百分比为偏离度。
3.根据权利要求1所述的工程造价信息自动抽取及工程成本自动生成和分析方法,其特征在于,所述分词拆分的操作包括:段落切分、句子切分、词语切分;段落切分是以文本换行符作为分割符号,将文本内容划分为两个或以上段落;句子切分是以标点符号作为分割符号,将段落内容划分为两个或以上句子;词语切分是使用分词器将句子内容划分为两个或以上词语;所述分词器是将一个汉字序列进行切分,与事先设定的分词库进行匹配比对,按照最符合原文含义的方法,得到一个个单独的词语;所述分词库是指两个以上的词语以及词语对应的词性组合形成的数据库。
4.根据权利要求1所述的工程造价信息自动抽取及工程成本自动生成和分析方法,其特征在于,所述知识图谱对应关系是指按照步骤S103中的输出分词的内容、词性、出现频率与工程量清单信息、市场工程造价信息建立对应关系;当词性为名词的分词,包括“钢筋”、“混凝土”、“模板”,按照分词出现的频率,建立工程量清单信息、市场工程造价信息中对应包含的材料及材料费用;当词性为动词的分词,包括“绑扎”、“浇筑”、“搭设”,按照分词出现的频率,建立工程量清单信息、市场工程造价信息中对应包含的施工工序及人工费用、机械费用;当词性为动词、动词之外的分词,建立工程量清单信息、市场工程造价信息中对应材料费、人工费、机械费的规格型号、品牌及影响价格的关系;
所述对应关系结构化数据库按照知识图谱对应关系中的人工费、材料费、机械费,以及规格型号、品牌及影响价格的关系,建立不同类型的价格数据库,储存价格信息;按照知识图谱对应关系,通过按照工程量清单信息、市场工程造价信息中包含的输出分词的内容、词性、出现频率,建立该工程量清单信息、市场工程造价信息与价格数据库的映射关系;通过导入市场工程造价信息,找到与价格数据库的映射关系,将市场工程造价信息中的价格信息储存进对应关系结构化数据库;通过导入工程量清单信息,找到与价格数据库的映射关系,将事先导入的价格信息输出。
5.根据权利要求1所述的工程造价信息自动抽取及工程成本自动生成和分析方法,其特征在于,所述深度学习算法是通过组合低层特征形成抽象的高层表示属性类别或特征,以输出数据的分布式特征表示的方法,包括:贝叶斯算法、决策树算法、神经网络算法、支持向量机算法、聚类算法、KNN算法、回归树算法中的一种或多种;
所述小样本深度学习模型按照知识图谱对应关系、知识图谱与对应关系结构化数据库的关系、以及预先设定深度学习算法的数据的分布式特征表示,使用深度学习算法,首先,输入步骤S106的数据矩阵后,输出步骤S106的标签的分类方法;然后,导入工程量清单信息、市场工程造价信息后,使用分类方法输出步骤S106的标签,根据输出的标签找到与对应关系结构化数据库的关系,并根据对应关系结构化数据库进行造价信息的抽取和输出。
6.根据权利要求1所述的工程造价信息自动抽取及工程成本自动生成和分析方法,其特征在于,所述综合单价是指完成一个工程量清单所需的人工费、材料费、机械费、间接费、利润以及一定范围内的风险的费用,综合单价当中的人工费、材料费、机械费通过步骤S201输出的单价相加所得,综合单价当中的间接费、利润、以及一定范围内的风险通过步骤S201输出的单价乘以事先给定的系数所得;
所述关键造价指标是指单一类别工程量清单的合价占工程量清单的总价的比例在5%以上,通过单一类别工程量清单的合价除以工程量清单的总价所得百分比的计算得到;所述指标数据库是储存上述关键造价指标的数据库;
所述偏离度的计算方式如下:将步骤S203计算得出的工程量清单的关键造价指标,与步骤S203中的指标数据库中的同一关键造价指标进行相减,然后相减的差值除以指标数据库中的同一关键造价指标所得百分比。
7.一种基于权利要求1-6任一所述的工程造价信息自动抽取及工程成本自动生成和分析方法的工程造价信息自动抽取及工程成本自动生成和分析装置,其特征在于,所述工程造价信息自动抽取及工程成本自动生成和分析装置包括工程造价信息自动识别及抽取模块和工程造价自动生成和分析模块,其中,
所述工程造价信息自动识别及抽取模块包括:
第一导入单元,用于将工程量清单的内容按:分部工程、项目名称、项目特征描述、计量单位中的两种或多种组合划分为多个部分;
第二导入单元,用于导入市场工程造价信息;
分词拆分单元,用于将工程量清单信息、市场工程造价信息使用自然语言处理技术中的分词拆分方法进行分词拆分,输出分词及分词对应的词性、分词对应的出现频率;
检测判断单元,用于对于分词拆分,若出现输出的分词与内容表述原意有偏差的情况,按照正确的分词拆分;
第一建立单元,用于对于拆分后的工程量清单信息与市场工程造价信息,对分词内容、词性、出现频率,建立知识图谱对应关系,并根据知识图谱建立对应关系结构化数据库;
第二建立单元,用于将输出的分词按照事先指定的顺序排列,然后将分词内容、以及分词出现的频率、分词的词性,按照不同对应关系,建立标签并建立数据矩阵;
模型运用单元,用于将上述数据矩阵作为训练集,选择深度学习算法,建立并训练小样本深度学习模型,通过小样本深度学习模型自动识别造价信息,并抽取造价信息并输入结构化数据库;
所述工程造价自动生成和分析模块包括:
第三导入单元,用于导入待测算成本的工程量清单,按照上述小样本深度学习模型,依据知识图谱对应关系,自动读取结构化数据库,识别每一项工程量清单的造价内容,并自动输出各项造价内容的单价;
第一计算单元,用于根据各类造价内容的单价计算得出综合单价、合价,最后根据各项工程量清单的合价汇总得出总价;
第二计算单元,用于根据工程量清单的总价,计算工程量清单的关键造价指标,并储存进指标数据库;
第三计算单元,用于根据工程量清单的各个关键造价指标,与指标数据库的历史数据进行比对,自动计算并输出偏离度,以此分析造价的合理性。
8.一种计算机设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现权利要求1-7任一项所述的工程造价信息自动抽取及工程成本自动生成和分析方法。
9.一种存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现权利要求1-7任一项所述的工程造价信息自动抽取及工程成本自动生成和分析方法。
10.一种云服务计算系统,包括依托云服务器进行计算运行的计算机软件程序,其特征在于,用于执行权利要求 1-7任一项所述的工程造价信息自动抽取及工程成本自动生成和分析方法,工程造价信息上传云服务器进行抽取及工程成本自动生成和分析,然后下载结果。
CN202210126772.4A 2022-02-11 2022-02-11 基于深度学习的工程造价自动抽取和分析方法及装置 Active CN114168716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210126772.4A CN114168716B (zh) 2022-02-11 2022-02-11 基于深度学习的工程造价自动抽取和分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210126772.4A CN114168716B (zh) 2022-02-11 2022-02-11 基于深度学习的工程造价自动抽取和分析方法及装置

Publications (2)

Publication Number Publication Date
CN114168716A true CN114168716A (zh) 2022-03-11
CN114168716B CN114168716B (zh) 2022-05-24

Family

ID=80489744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210126772.4A Active CN114168716B (zh) 2022-02-11 2022-02-11 基于深度学习的工程造价自动抽取和分析方法及装置

Country Status (1)

Country Link
CN (1) CN114168716B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114611980A (zh) * 2022-03-23 2022-06-10 武汉有方设计有限公司 一种工程项目造价分析方法、设备及计算机存储介质
CN115907875A (zh) * 2022-10-21 2023-04-04 珠海纵横创新软件有限公司 价格区间的造价编制方法、装置、电子设备及介质
CN116012037A (zh) * 2022-10-19 2023-04-25 珠海纵横创新软件有限公司 智能材价替换市场价的方法、装置、电子设备及介质
CN116051164A (zh) * 2022-12-29 2023-05-02 北京北咨信息工程咨询有限公司 建设成本测算方法、装置、设备及可读存储介质
CN116205601A (zh) * 2023-02-27 2023-06-02 开元数智工程咨询集团有限公司 基于互联网的工程清单复核及数据统计方法与系统
CN117474583A (zh) * 2023-11-07 2024-01-30 北京梦诚科技有限公司 一种基于价格体系的施工项目收益率测算方法及装置
CN117541289A (zh) * 2023-11-21 2024-02-09 佛山轨道交通设计研究院有限公司 一种全流程自动计价方法、装置、设备及存储介质
CN117709908A (zh) * 2024-02-06 2024-03-15 国网山东省电力公司东营供电公司 一种电网工程人、材、机分配合理性智慧审计方法与系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649275A (zh) * 2016-12-28 2017-05-10 成都数联铭品科技有限公司 基于词性信息和卷积神经网络的关系抽取方法
US20170308934A1 (en) * 2016-04-22 2017-10-26 Economy Research Institute of State Grid Zhejiang Electric Power Management method of power engineering cost
CN107578212A (zh) * 2017-08-15 2018-01-12 广联达科技股份有限公司 工程量清单综合单价合理性的检测方法、检测系统
CN109523224A (zh) * 2018-10-08 2019-03-26 重庆大学城市科技学院 一种建筑工程造价用的分析仪及控制方法
CN111967268A (zh) * 2020-06-30 2020-11-20 北京百度网讯科技有限公司 文本中的事件抽取方法、装置、电子设备和存储介质
CN112507442A (zh) * 2021-02-02 2021-03-16 巧夺天宫(深圳)科技有限公司 一种bim项目物料及工程造价统计方法
WO2021218086A1 (zh) * 2020-04-28 2021-11-04 平安科技(深圳)有限公司 呼叫控制方法、装置、计算机设备以及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170308934A1 (en) * 2016-04-22 2017-10-26 Economy Research Institute of State Grid Zhejiang Electric Power Management method of power engineering cost
CN106649275A (zh) * 2016-12-28 2017-05-10 成都数联铭品科技有限公司 基于词性信息和卷积神经网络的关系抽取方法
CN107578212A (zh) * 2017-08-15 2018-01-12 广联达科技股份有限公司 工程量清单综合单价合理性的检测方法、检测系统
CN109523224A (zh) * 2018-10-08 2019-03-26 重庆大学城市科技学院 一种建筑工程造价用的分析仪及控制方法
WO2021218086A1 (zh) * 2020-04-28 2021-11-04 平安科技(深圳)有限公司 呼叫控制方法、装置、计算机设备以及存储介质
CN111967268A (zh) * 2020-06-30 2020-11-20 北京百度网讯科技有限公司 文本中的事件抽取方法、装置、电子设备和存储介质
CN112507442A (zh) * 2021-02-02 2021-03-16 巧夺天宫(深圳)科技有限公司 一种bim项目物料及工程造价统计方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIUYU: "Research on Cost Control Method of Construction Engineering Based on Dea Model", 《2020 12TH INTERNATIONAL CONFERENCE ON MEASURING TECHNOLOGY AND MECHATRONICS AUTOMATION》 *
李喜梅: "基于人工智能技术的建筑工程造价估算研究", 《建筑技术应用》 *
黄文炜等: "基于结构方程模型的既有住区适老化改造研究", 《南方建筑 》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114611980A (zh) * 2022-03-23 2022-06-10 武汉有方设计有限公司 一种工程项目造价分析方法、设备及计算机存储介质
CN116012037A (zh) * 2022-10-19 2023-04-25 珠海纵横创新软件有限公司 智能材价替换市场价的方法、装置、电子设备及介质
CN115907875A (zh) * 2022-10-21 2023-04-04 珠海纵横创新软件有限公司 价格区间的造价编制方法、装置、电子设备及介质
CN116051164A (zh) * 2022-12-29 2023-05-02 北京北咨信息工程咨询有限公司 建设成本测算方法、装置、设备及可读存储介质
CN116051164B (zh) * 2022-12-29 2023-11-28 北京北咨信息工程咨询有限公司 建设成本测算方法、装置、设备及可读存储介质
CN116205601A (zh) * 2023-02-27 2023-06-02 开元数智工程咨询集团有限公司 基于互联网的工程清单复核及数据统计方法与系统
CN116205601B (zh) * 2023-02-27 2024-04-05 开元数智工程咨询集团有限公司 基于互联网的工程清单复核及数据统计方法与系统
CN117474583A (zh) * 2023-11-07 2024-01-30 北京梦诚科技有限公司 一种基于价格体系的施工项目收益率测算方法及装置
CN117541289A (zh) * 2023-11-21 2024-02-09 佛山轨道交通设计研究院有限公司 一种全流程自动计价方法、装置、设备及存储介质
CN117709908A (zh) * 2024-02-06 2024-03-15 国网山东省电力公司东营供电公司 一种电网工程人、材、机分配合理性智慧审计方法与系统

Also Published As

Publication number Publication date
CN114168716B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN114168716B (zh) 基于深度学习的工程造价自动抽取和分析方法及装置
CN112035653B (zh) 一种政策关键信息提取方法和装置、存储介质、电子设备
CN107578212B (zh) 工程量清单综合单价合理性的检测方法、检测系统
CN108153729B (zh) 一种面向金融领域的知识抽取方法
CN112347226B (zh) 文档知识抽取方法、装置、计算机设备及可读存储介质
CN112163553B (zh) 物料价格核算方法、装置、存储介质和计算机设备
CN109800354B (zh) 一种基于区块链存储的简历修改意图识别方法及系统
CN109933783A (zh) 一种不良资产经营领域的合同要素化方法
CN109800420A (zh) 一种可研评审报告自动生成方法及存储介质
Moon et al. Automatic review of construction specifications using natural language processing
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN111815162A (zh) 一种数字化审计工具及方法
CN113220885B (zh) 一种文本处理方法和系统
CN110796381A (zh) 建模数据评价指标的处理方法、装置、终端设备及介质
CN112699245A (zh) 预算管理知识图谱的构建方法、装置及应用方法、装置
CN115618264A (zh) 数据资产的主题分类方法、装置、设备和介质
CN115482075A (zh) 财务数据的异常分析方法、装置、电子设备及存储介质
CN113111635A (zh) 一种报表对比方法及装置
CN114549177A (zh) 保函审查方法、装置、系统与计算机可读存储介质
CN114722163B (zh) 数据查询方法、装置、电子设备和存储介质
Patil Time Series Analysis and Stock Price Forecasting using Machine Learning Techniques”
CN117314163B (zh) 基于大数据的社保数据处理方法及系统
CN115392805B (zh) 一种交易型合同合规风险诊断方法及系统
CN114595675A (zh) 一种文档间差异内容的追踪方法、装置及电子设备
CN115423529A (zh) 经营状态分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant