CN106934536B - 建设行业工程量计价清单数据自动编码与识别方法及系统 - Google Patents
建设行业工程量计价清单数据自动编码与识别方法及系统 Download PDFInfo
- Publication number
- CN106934536B CN106934536B CN201710117033.8A CN201710117033A CN106934536B CN 106934536 B CN106934536 B CN 106934536B CN 201710117033 A CN201710117033 A CN 201710117033A CN 106934536 B CN106934536 B CN 106934536B
- Authority
- CN
- China
- Prior art keywords
- list
- pricing
- codes
- standard
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 230000011218 segmentation Effects 0.000 claims description 16
- 238000003066 decision tree Methods 0.000 claims description 10
- 238000010801 machine learning Methods 0.000 claims description 10
- 239000000463 material Substances 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 238000012423 maintenance Methods 0.000 claims description 7
- 230000006872 improvement Effects 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 abstract description 2
- 239000004567 concrete Substances 0.000 description 13
- 238000005086 pumping Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000011150 reinforced concrete Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000009435 building construction Methods 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种建设行业工程量计价清单数据自动编码与识别方法及系统,其能够将人类自然语言描述的计价清单数据进行智能识别、统一标准编码及自动归集,经过处理后的计价清单数据将具有唯一对应的编码,可实现智能识别、转换、分析、归类、统计等功能的自动化,无需人工操作,有助于提高工作效率,降低企业成本,更快推进建设工程项目的投资分析以及全过程造价管理。
Description
技术领域
本发明属于建设行业工程数据分析领域,具体涉及一种建设行业工程量计价清单数据自动编码与识别方法及系统。
背景技术
在建设行业,各个企业要实现建设工程项目的全过程管理,需要对海量的工程项目数据(例如工程量计价清单数据)进行对比、分析、预警、总结等等。各省份所采用的清单计价规范偏差较大,或者采用不同版本的清单计价规范,编码不统一,工程项目数据难以在计算机系统中统一识别和调用,通常只能靠人工经验进行判断,效率低、成本高,准确性差。导致在建设工程项目全过程管理中无法准确有效的进行成本管控和预警。
发明内容
本发明针对现有技术中计价清单数据难以识别、分析所导致的效率低以及成本高等问题,提出一种建设行业工程量计价清单数据自动编码与识别方法,同时相应提出一种建设行业工程量计价清单数据自动编码与识别系统的结构方案。
本发明提出的一种建设行业工程量计价清单数据自动编码与识别方法,主要包括以下步骤A1至步骤A6:
A1、获取计价清单数据,根据统一的标准清单编码规范对所述计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;
A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;
A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;
A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码;
A5、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程;
A6、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。
本发明的一优选方案中,所述步骤A1之前还包括:
A0、将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码;所述标准清单编码包括四个层级,从主到次分别为:专业编码、分部编码、分项编码、清单编码,分别与计价清单数据所属的工程专业、分部工程以及分项工程、计价清单对应。
本发明的一优选方案中,所述预设位数的标准清单编码为9位编码,该9位编码的前2位为专业编码,前4位为分部编码,前6位为分项编码,全部9位唯一对应一组计价清单编码。当然,标准清单编码及各层级的位数可根据具体情况设置。
本发明的一优选方案中,所述步骤A3中预置关键词规则库的方法包括:
A31、以计价清单数据对应规范化编码的方式形成数据训练集,对计价清单数据的清单名称和清单特征词汇进行分词处理,以获取关键词;
A32、通过决策树算法将获取的关键词进行组合,结合分项编码,形成关键词规则库;
A33、以加入新的数据训练集形成新的关键词组合,并通过机器学习方式完善关键词规则库,保证编码的准确性。
本发明的一优选方案中,所述步骤A4包括:
A41、若匹配到的关键词组合在关键词规则库中只对应一个标准清单编码,则直接获取该标准清单编码;若匹配到的关键词组合对应多个标准清单编码,则加上标准的分项编码进行仲裁得到唯一的标准清单编码;
A42、若匹配到的关键词组合在规则库中无对应的标准清单编码,则先对该关键词组合进行降维算法重新提取关键词组合,并将该关键词组合重新执行步骤A41进行匹配分析,根据最高匹配度确定唯一的标准清单编码。
本发明的一可选方案中,所述各地清单计价规范包括各省份的清单计价规范,所述各版本的清单计价规范包括《GB50500-2008建设工程工程量清单计价规范》,所述标准清单计价规范为《GB50500-2013建设工程工程量清单计价规范》。
本发明相应提出的一种建设行业工程量计价清单数据自动编码与识别系统的结构方案,主要包括规范化模块、分词模块、维护及完善模块、匹配分析模块、存储模块以及指引编码模块;
所述规范化模块,用于获取计价清单数据,根据统一的标准清单编码对其清单编码进行规范化处理,从中提取标准的分项编码,并过滤错误的清单编码;
所述分词模块,用于将计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;
所述维护及完善模块,用于将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;
所述匹配分析模块,用于将计价清单数据中提取出的关键词在关键词规则库进行匹配分析,结合分项编码仲裁计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码,以及进一步识别计价清单数据所属的工程专业、分部工程以及分项工程;
所述存储模块,用于将识别出所属的工程专业、分部工程以及分项工程的计价清单数据分为工程专业、分部工程、分项工程以及计价清单四个层级进行存储;
所述指引编码模块,用于基于识别出的预设位数的标准清单编码,对计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。
本发明的一优选方案中,还包括统一编码模块,所述统一编码模块用于将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码。
本发明至少具备以下有益效果:
1、经过处理后的各计价清单数据将具有唯一对应的编码,可实现智能识别、转换、分析、归类、统计等功能的自动化,无需人工操作,有助于提高工作效率,降低企业成本,更快推进建设工程项目的投资分析以及全过程造价管理。
2、能够智能识别计价清单数据的专业、分部工程、分项工程、计价清单等数据,形成以计价清单为基础的清单指引,并可进行人工、材料、机械设备的定额及价格匹配,以便于计价清单数据的进一步应用及管理。
3、优选方案中,将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码,方便对计价清单数据进行识别、转换、分析、归类、统计等应用及管理。
附图说明
图1是实施例一涉及的一种建设行业工程量计价清单数据自动编码与识别方法整体流程示意图。
图2是实施例二涉及的一种建设行业工程量计价清单数据自动编码与识别系统结构框图。
具体实施方式
为了便于本领域技术人员理解,下面将结合附图以及实施例对本发明进行进一步描述。
实施例一
请参阅图1,本实施例涉及的一种建设行业工程量计价清单数据自动编码与识别方法,包括以下步骤S100至步骤S700:
S100、将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码。
步骤S100主要是形成新的统一标准清单编码,其中各地清单计价规范可包括各省份的清单计价规范,各版本的清单计价规范的其中之一可包括《GB50500-2008建设工程工程量清单计价规范》(以下简称为2008清单计价规范),所述标准清单计价规范为《GB50500-2013建设工程工程量清单计价规范》(以下简称为2013清单计价规范)。当然,随着清单计价规范的不断推陈出新,不限于以上2008清单计价规范及2013清单计价规范两个版本。
步骤S100中通过将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行比对,形成一一对应关系,不同的清单名称根据所在分项工程进行编码顺延,形成统一的标准清单编码。
例如,2008清单计价规范中,清单编码“010402001”对应的清单名称为“矩形柱”,与2013清单计价规范中的清单编码“010502001矩形柱”形成对应关系;而2008清单计价规范中的清单编码“010203002振冲灌注碎石”,并不存在于2013清单计价规范中,该编码的分项工程为“基坑与边坡支护”,对应2013清单计价规范中的分项工程编码为“010202”,则可在该分项工程中进行编码顺延为“010202012”(010202011之前的已被占用)。
步骤S100中所述标准清单编码包括四个层级,从主到次分别为:专业编码、分部编码、分项编码、清单编码,分别与计价清单数据所属的工程专业、分部工程以及分项工程、计价清单对应。
例如,本实施例中预设的标准清单编码为9位编码(当然也可根据需要预设为其他位数),该9位编码的前2位为专业编码,前4位为分部编码,前6位为分项编码,全部9位唯一对应一组计价清单编码。假设一组计价清单编码“010502001”,则对应层级分别为:
专业编码“01”,所对应的工程专业为“房屋建筑与装饰工程”;
分部编码“0105”,所对应的分部工程为“混凝土及钢筋混凝土工程”;
分项编码“010502”,所对应的分项工程为“现浇混凝土柱”;
清单编码“010502001”,所对应的计价清单为“矩形柱”。
在步骤S100首次执行之后,以后对计价清单数据的自动编码及识别均可从步骤S200起执行。
S200、获取计价清单数据,根据统一的标准清单编码规范对所述计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码。
以一条用自然语言描述的不标准的工程量计价清单数据为例,假设其包括原始编码、清单名称、清单特征等信息,具体如下:
原始编码:10402001001
名称:矩形柱
清单特征:1.混凝土强度等级:C30普通商品混凝土2.综合考虑:混凝土拌和料要求、混凝土掺加剂、泵送费用3.混凝土制作、运输、浇筑、振捣、养护、其它。
步骤S200主要是将不规范的原始编码进行标准化处理,提取出标准的分项编码,例如上述计价清单数据的原始编码“10402001001”并不是标准的清单编码,而其中分项编码应为“010402”,因此需要将该编码进行处理,提取为正确的分项编码。
当然,这只是举例说明,而当出现“001040200100”、“010402001001”字符时,同样也会提取为“010402”;而当出现的编码不是数字时,则认为该计价清单数据无分项编码。
进一步地,标准的分项编码会在关键词规则库中预先存储,通过系统设定的提取规则,先进行分项编码的提取。
S300、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词。
S400、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库。
步骤S400中预置关键词规则库的方法可参考如下步骤S410至S430:
S410、以计价清单数据对应规范化编码的方式形成数据训练集,对计价清单数据的清单名称和清单特征词汇进行分词处理,以获取关键词。
S420、通过决策树算法将获取的关键词进行组合,结合分项编码,形成关键词规则库。
S430、以加入新的数据训练集形成新的关键词组合,并通过机器学习方式完善关键词规则库,保证编码的准确性。
例如,本实施例可将原始编码、清单名称、清单特征作为训练集数据,将该条数据与正确的标准清单编码形成对应,通过决策树算法,自动生成名称关键词组合为“矩形柱+泵送费+混凝土+运输+制作”,对应的分项编码为“010502”,将名称关键词组合及分项编码给合得到清单编码“010502001”,该数据中的关键词组合、分项编码、清单编码则成为关键词规则库中的匹配规则。关键词规则库中的匹配规则均是通过这样的方式自动生成对应关系的,并且加入机器学习的方式,可自动将更多的训练数据生成新的匹配规则,完善及补充关键词规则库,以保证编码的成功率及准确性。
S500、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码。
步骤S500中预设位数的标准清单编码在本实施例中为9位编码。作为参考,步骤S500进一步细化如下步骤S510至S520:
S510、若匹配到的关键词组合在关键词规则库中只对应一个标准清单编码,则直接获取该标准清单编码;若匹配到的关键词组合对应多个标准清单编码,则加上标准化的分项编码进行仲裁得到唯一的标准清单编码。
S520、若匹配到的关键词组合在规则库中无对应的标准清单编码,则先对该关键词组合进行降维算法重新提取关键词组合,并将该关键词组合重新执行步骤S510进行匹配分析,根据最高匹配度确定唯一的标准清单编码。
例如,通过分词处理,可以获得“矩形柱”、“泵送费”、“运输”、“制作”、“浇筑”、“混凝土”等关键词;而在这些关键词中,通过关键词优化及优先级评定,最终提取“矩形柱”、“泵送费”、“混凝土”、“运输”、“制作”作为关键词组合与关键词规则库进行匹配分析;执行步骤S510后,符合该关键词组合的只有一个标准清单编码“010502001”,对应的标准清单名称为“矩形柱”。
S600、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程。
步骤S600例如,根据获得的9位标准清单编码,确定所属工程专业为“01房屋建筑与装饰工程”;分部工程为“0105混凝土及钢筋混凝土工程”;分项工程为“010502现浇混凝土柱”。
S700、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。
步骤S700例如,根据获得的9位标准清单编码,将可对该清单所包含的人工、材料、机械设备的具体要求进行12位清单指引编码,内容分别为:
清单指引编码“010502001001”对应的内容为“矩形”,
清单指引编码“010502001002”对应的内容为“矩形(泵送商品砼)”,
清单指引编码“010502001005”对应的内容为“矩形柱复合木模板”,
以此类推,从而将人工、材料、机械设备的具体要求均进行编码,每一项清单指引编码下将可包含定额及价格。
实施例二
请参阅图2,实施例二是与实施例一相对应的一种建设行业工程量计价清单数据自动编码与识别系统,主要包括规范化模块10、分词模块20、维护及完善模块30、匹配分析模块40、存储模块50以及指引编码模块60。
所述规范化模块10,用于获取计价清单数据,根据统一的标准清单编码规范对计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码。
所述分词模块20,用于将计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词。
所述维护及完善模块30,用于将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库。
所述匹配分析模块40,用于将计价清单数据中提取出的关键词在关键词规则库进行匹配分析,结合分项编码仲裁计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码,以及进一步识别计价清单数据所属的工程专业、分部工程以及分项工程。
所述存储模块50,用于将识别出所属的工程专业、分部工程以及分项工程的计价清单数据分为工程专业、分部工程、分项工程以及计价清单四个层级进行存储。
所述指引编码模块60,用于基于识别出的预设位数的标准清单编码,对计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。
请继续参阅图2,进一步优选方案中,除了以上模块之外还包括统一编码模块70,用于将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码。
以上实施例二的技术原理和有益效果与实施例一相对应,这里不再赘述。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (5)
1.一种建设行业工程量计价清单数据自动编码与识别方法,其特征在于,包括以下步骤:
A0、将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码;所述标准清单编码包括四个层级,从主到次分别为:专业编码、分部编码、分项编码、清单编码,分别与计价清单数据所属的工程专业、分部工程以及分项工程、计价清单对应;
A1、获取计价清单数据,根据统一的标准清单编码规范对计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;
A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;
A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;
A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码;所述预设位数的标准清单编码为9位编码,该9位编码的前2位为专业编码,前4位为分部编码,前6位为分项编码,全部9位唯一对应一组计价清单编码;
A5、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程;
A6、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。
2.根据权利要求1所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述步骤A3中预置关键词规则库的方法包括:
A31、以计价清单数据对应规范化编码的方式形成数据训练集,对计价清单数据的清单名称和清单特征词汇进行分词处理,以获取关键词;
A32、通过决策树算法将获取的关键词进行组合,结合分项编码,形成关键词规则库;
A33、以加入新的数据训练集形成新的关键词组合,并通过机器学习方式完善关键词规则库,保证编码的准确性。
3.根据权利要求2所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述步骤A4包括:
A41、若匹配到的关键词组合在关键词规则库中只对应一个标准清单编码,则直接获取该标准清单编码;若匹配到的关键词组合对应多个标准清单编码,则加上标准的分项编码进行仲裁得到唯一的标准清单编码;
A42、若匹配到的关键词组合在规则库中无对应的标准清单编码,则先对该关键词组合进行降维算法重新提取关键词组合,并将该关键词组合重新执行步骤A41进行匹配分析,根据最高匹配度确定唯一的标准清单编码。
4.根据权利要求1至3任一项所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述各地清单计价规范包括各省份的清单计价规范,所述各版本的清单计价规范包括《GB50500-2008建设工程工程量清单计价规范》,所述标准清单计价规范为《GB50500-2013建设工程工程量清单计价规范》。
5.一种建设行业工程量计价清单数据自动编码与识别系统,其特征在于,包括统一编码模块、规范化模块、分词模块、维护及完善模块、匹配分析模块、存储模块以及指引编码模块;
统一编码模块,所述统一编码模块用于将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码;所述标准清单编码包括四个层级,从主到次分别为:专业编码、分部编码、分项编码、清单编码,分别与计价清单数据所属的工程专业、分部工程以及分项工程、计价清单对应;
所述规范化模块,用于获取计价清单数据,根据统一的标准清单编码规范对计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;
所述分词模块,用于将计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;
所述维护及完善模块,用于将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;
所述匹配分析模块,用于将计价清单数据中提取出的关键词在关键词规则库进行匹配分析,结合分项编码仲裁计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码,以及进一步识别计价清单数据所属的工程专业、分部工程以及分项工程;
所述存储模块,用于将识别出所属的工程专业、分部工程以及分项工程的计价清单数据分为工程专业、分部工程、分项工程以及计价清单四个层级进行存储;
所述指引编码模块,用于基于识别出的预设位数的标准清单编码,对计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码;所述预设位数的标准清单编码为9位编码,该9位编码的前2位为专业编码,前4位为分部编码,前6位为分项编码,全部9位唯一对应一组计价清单编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710117033.8A CN106934536B (zh) | 2017-03-01 | 2017-03-01 | 建设行业工程量计价清单数据自动编码与识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710117033.8A CN106934536B (zh) | 2017-03-01 | 2017-03-01 | 建设行业工程量计价清单数据自动编码与识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106934536A CN106934536A (zh) | 2017-07-07 |
CN106934536B true CN106934536B (zh) | 2020-08-25 |
Family
ID=59424389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710117033.8A Active CN106934536B (zh) | 2017-03-01 | 2017-03-01 | 建设行业工程量计价清单数据自动编码与识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106934536B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107578212B (zh) * | 2017-08-15 | 2021-04-20 | 深圳市建设工程交易服务中心 | 工程量清单综合单价合理性的检测方法、检测系统 |
CN107871169B (zh) * | 2017-11-24 | 2020-05-05 | 中科院合肥技术创新工程院 | 一种利用多叉树结构的工程量清单编码自动生成方法 |
CN108269013A (zh) * | 2018-01-16 | 2018-07-10 | 中国三峡建设管理有限公司 | 水电工程结构属性清单库的建立及编码方法 |
CN108920770A (zh) * | 2018-06-08 | 2018-11-30 | 上海大学 | 基于Revit软件的BIM构件自动编码和关联BIM模型的方法 |
CN109146421B (zh) * | 2018-08-18 | 2021-03-23 | 深圳市江益达科技股份有限公司 | 成本分析数据页面展示方法及装置 |
CN109408637B (zh) * | 2018-10-15 | 2021-12-07 | 苏州慧筑信息科技有限公司 | 一种自动解析工程清单的方法及系统 |
CN111127068B (zh) * | 2019-02-27 | 2023-04-18 | 上海万亩电子科技有限公司 | 一种工程量清单自动组价方法和装置 |
CN110309132B (zh) * | 2019-05-08 | 2022-02-22 | 广东中建普联科技股份有限公司 | 一种工程概算表的定额标准化方法 |
CN110097137B (zh) * | 2019-05-10 | 2022-11-25 | 广东中建普联科技股份有限公司 | 工程概算项目数据的国标定额自定义特征数据提取方法 |
CN110473067B (zh) * | 2019-08-14 | 2020-09-04 | 杭州品茗安控信息技术股份有限公司 | 构件的造价标准文件确定方法、装置、设备及存储介质 |
CN111026743B (zh) * | 2019-12-11 | 2021-11-30 | 广州地铁集团有限公司 | 轨道交通工程项目结构数据标准化方法 |
CN113409001A (zh) * | 2021-05-17 | 2021-09-17 | 林基础 | 一种控制建筑工程工程量清单自动组价的方法 |
CN113806392A (zh) * | 2021-08-24 | 2021-12-17 | 广联达科技股份有限公司 | 一种建筑工程清单数据处理方法、工程量计价方法及装置 |
CN113850680A (zh) * | 2021-08-25 | 2021-12-28 | 广州地铁集团有限公司 | 一种轨道交通工程全生命周期工程投资水平评估方法 |
CN113888288A (zh) * | 2021-10-29 | 2022-01-04 | 中广核工程有限公司 | 不规则综合单价数据的规范方法 |
CN114119110A (zh) * | 2022-01-26 | 2022-03-01 | 四川野马科技有限公司 | 一种工程造价清单归集系统及其方法 |
CN116797105B (zh) * | 2023-08-22 | 2023-10-24 | 中建西南咨询顾问有限公司 | 基于工程标准化编码的量价指标统计方法及系统 |
CN117151767B (zh) * | 2023-10-30 | 2024-02-23 | 彩讯科技股份有限公司 | 工程费用评估方法和装置 |
CN117539978B (zh) * | 2023-10-31 | 2024-07-30 | 青矩技术股份有限公司 | 工程量清单数据归类指标方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178737A (zh) * | 2006-12-12 | 2008-05-14 | 北京搜狗科技发展有限公司 | 一种互联网关键字符相关信息的发布方法和系统 |
CN103699623A (zh) * | 2013-12-19 | 2014-04-02 | 百度在线网络技术(北京)有限公司 | 地理编码实现方法和装置 |
CN105045927A (zh) * | 2015-08-26 | 2015-11-11 | 广东中建普联科技有限公司 | 建设工程工料机数据自动编码方法及系统 |
CN106354861A (zh) * | 2016-09-06 | 2017-01-25 | 中国传媒大学 | 电影标签自动标引方法及自动标引系统 |
CN106373036A (zh) * | 2016-09-21 | 2017-02-01 | 广东中建普联科技股份有限公司 | 建设工程文件数据自动识别分析方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130101059A1 (en) * | 2011-10-03 | 2013-04-25 | Ira S. Moskowitz | Pre-modulation physical layer steganography |
-
2017
- 2017-03-01 CN CN201710117033.8A patent/CN106934536B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178737A (zh) * | 2006-12-12 | 2008-05-14 | 北京搜狗科技发展有限公司 | 一种互联网关键字符相关信息的发布方法和系统 |
CN103699623A (zh) * | 2013-12-19 | 2014-04-02 | 百度在线网络技术(北京)有限公司 | 地理编码实现方法和装置 |
CN105045927A (zh) * | 2015-08-26 | 2015-11-11 | 广东中建普联科技有限公司 | 建设工程工料机数据自动编码方法及系统 |
CN106354861A (zh) * | 2016-09-06 | 2017-01-25 | 中国传媒大学 | 电影标签自动标引方法及自动标引系统 |
CN106373036A (zh) * | 2016-09-21 | 2017-02-01 | 广东中建普联科技股份有限公司 | 建设工程文件数据自动识别分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106934536A (zh) | 2017-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106934536B (zh) | 建设行业工程量计价清单数据自动编码与识别方法及系统 | |
CN108764773B (zh) | 一种产品物料编码管理方法及系统 | |
CN114168716B (zh) | 基于深度学习的工程造价自动抽取和分析方法及装置 | |
CN106373036A (zh) | 建设工程文件数据自动识别分析方法及系统 | |
CN113051365A (zh) | 一种产业链图谱构建方法及相关设备 | |
CN111950922B (zh) | 一种基于多源数据交互分析的装备经济数据评估方法 | |
CN112163553B (zh) | 物料价格核算方法、装置、存储介质和计算机设备 | |
CN113806392A (zh) | 一种建筑工程清单数据处理方法、工程量计价方法及装置 | |
CN115641162A (zh) | 一种基于建筑工程造价的预测数据分析系统和方法 | |
CN113159118A (zh) | 物流数据指标的处理方法、装置、设备及存储介质 | |
CN111639857B (zh) | 订单智能审核方法、装置、电子设备及存储介质 | |
CN113409001A (zh) | 一种控制建筑工程工程量清单自动组价的方法 | |
CN111026743B (zh) | 轨道交通工程项目结构数据标准化方法 | |
CN113610375B (zh) | 基于自然语言处理的保单核保方法及核保装置 | |
CN116126790B (zh) | 铁路工程档案归档方法、装置、电子设备、存储介质 | |
CN112100373A (zh) | 一种基于深度神经网络的合同文本分析方法及系统 | |
CN110688445B (zh) | 一种数字化档案建设方法 | |
CN109815297A (zh) | 一种不依赖关系数据库的树状结构存取运算系统 | |
CN113127647A (zh) | 一种基于大数据分析的工艺知识库构建方法 | |
CN112613290A (zh) | 单证模板生成方法、装置、设备及存储介质 | |
CN117171587B (zh) | 材料信息的编码方法、平台、电子设备及存储介质 | |
CN118095794B (zh) | 基于正则算法的工单信息提取方法及系统 | |
CN118246775B (zh) | 煤矿指标管理配置方法及系统 | |
CN115080687B (zh) | 一种核电厂工单任务与质量缺陷报告信息精准匹配方法 | |
CN114722163B (zh) | 数据查询方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |