CN110032643A - 一种建筑维修工单分析方法、装置、存储介质及客户端 - Google Patents
一种建筑维修工单分析方法、装置、存储介质及客户端 Download PDFInfo
- Publication number
- CN110032643A CN110032643A CN201910262142.8A CN201910262142A CN110032643A CN 110032643 A CN110032643 A CN 110032643A CN 201910262142 A CN201910262142 A CN 201910262142A CN 110032643 A CN110032643 A CN 110032643A
- Authority
- CN
- China
- Prior art keywords
- work order
- building
- repair
- segmentation
- maintenance work
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 186
- 238000004458 analytical method Methods 0.000 title claims abstract description 138
- 230000011218 segmentation Effects 0.000 claims abstract description 121
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 37
- 230000008439 repair process Effects 0.000 claims description 198
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000010276 construction Methods 0.000 claims description 18
- 238000005065 mining Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 11
- 238000007619 statistical method Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 24
- 230000006870 function Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000009435 building construction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种建筑维修工单分析方法、装置、存储介质及客户端,该方法包括:获取建筑维修工单集合、以及所述建筑维修工单集合所涉及楼宇的BIM模型;确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库;并根据所述BIM模型确定关键词库;根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,实现对所述建筑维修工单集合的自动分类。本发明的方案,可以解决使用维修工单的位置、时间、报修人等结构化信息进行统计分析的准确性差的问题,达到提升准确性的效果。
Description
技术领域
本发明属于建筑智能运维技术领域,具体涉及一种建筑维修工单分析方法、装置、存储介质及客户端,尤其涉及一种基于BIM的建筑维修工单智能分析方法、装置、存储介质及客户端,特别涉及一种应用BIM、中文语义分析、数据挖掘等技术对建筑维修工单进行智能语义分析并挖掘重复工单的方法、装置、存储介质及客户端。
背景技术
维修工单服务系统在大型公共建筑运维中应用越来越广泛,特别是医院、航站楼、火车站和大型商场等运维要求较高的场所。在使用过程中,维修工单服务系统积累了大量维修工单的信息,包括报修地址、工单描述、报修时间、工单类型、报修人、处理结果等信息。通过对历史维修工单的信息挖掘,可以分析重复出现的工单、高频报修的位置和问题类型等,从而有针对性地进行管控。在一段时间内重复出现的工单往往意味着运维班组工作不负责或备品备件质量不到位等管理漏洞,是建筑运维管理中重点管控的内容;而高频报修的位置意味着需要进行改造升级,否则将影响用户体验。
其中,维修工单服务系统是一个网络化的工单处理平台,支持护士、病人等人员手机上传维修工单;或护士病人打电话到服务中心,由服务中心人员手工录入维修工单;然后服务人员根据工单信息分配给各个维修班组;维修班组接单后,将工单处理过程信息和照片通过手机或网页上传到系统;服务中心人员在根据处理情况进行工单关闭。
传统的维修工单分析方法大都使用维修工单的位置、时间、报修人等结构化信息进行统计分析,可以识别出一些重复工单和高频工单;例如:按楼层统计不同楼层的工单数量和比例;或者安装时间统计白天或晚上的工单数量;统计护士长、病人报修的比例等。但使用维修工单的位置、时间、报修人等结构化信息进行统计分析的方式,也存在一些问题;例如:工单文字描述是由现场人员填报的重要的非结构化语义信息,然而受限于目前中文语义分析的难度,传统的工单分析往往采用人工阅读的方法分析工单描述(如维修工单文字描述),或者就直接忽略该信息,导致分析的效率和准确性均较低。
其中,维修工单文字描述一般包括工单位置、所涉及的系统、设备或构件 (工单分类,譬如家具、卫浴、空调、灯)以及,问题类型,维修人员可以从描述中获取工单的详细信息;因此对工单的分析至关重要。建筑信息模型 (Building Information Model,BIM)是对建筑全生命周期信息的三维数字化表达,在建筑设计、施工阶段应用广泛;BIM模型中包括建筑的空间位置信息以及,建筑设备和系统信息,可为建筑维修工单的语义挖掘提供原始关键词。其中原始关键词是中文语义分析的关键,对工单语义分析的准确性和收敛速度影响巨大。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的目的在于,针对上述缺陷,提供一种建筑维修工单分析方法、装置、存储介质及客户端,以解决使用维修工单的位置、时间、报修人等结构化信息进行统计分析的维修工单分析方法,存在分析结果的准确性差的问题,达到提升准确性的效果。
本发明提供一种建筑维修工单分析方法,包括:获取建筑维修工单集合、以及所述建筑维修工单集合所涉及楼宇的BIM模型;确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库;并根据所述BIM模型确定关键词库;根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,实现对所述建筑维修工单集合的自动分类。
可选地,其中,确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库,包括:从所述建筑维修工单集合的每条建筑维修工单中提取设定属性字段的值,得到每条建筑维修工单的结构化信息和工单描述文本;所述结构化信息,包括:报修人、报修时间、报修位置中的至少之一;收集每条建筑维修工单的工单描述文本,形成所述建筑维修工单集合的原始语料库;和/或,根据所述BIM模型确定关键词库,包括:从所述BIM模型中提取目标关键词,并将所述目标关键词加入设定的关键词库;其中,所述目标关键词,包括:工单位置关键词、工单分类关键词和问题类型关键词中的至少之一;所述工单位置关键词,包括:所述建筑维修工单集合的每条建筑维修工单所对应的建筑、楼层、空间和房间的名称及编号信息中的至少之一;所述工单分类关键词,包括:机电系统、机电设备和建筑构件的名称、编号及类型名称中的至少之一;所述问题类型关键词,包括:建筑维修中的常见问题描述和常用词语中的至少之一。
可选地,根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,包括:按设定的循环次数,对所述原始语料库进行语义分词分割,形成分割词语组集合;并根据所述分割词语组集合对所述关键词库进行调整;根据所述分割词语组集合和调整后的关键词库,确定所述建筑维修工单集合的工单位置、工单分类和问题类型,并确定每个所述工单分类中所述工单位置和所述问题类型所占比例;和/或,根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中的重复工单群组。
可选地,其中,对所述原始语料库进行语义分词分割,包括:按设定的语义分词规则,对所述原始语料库中每个工单描述文本进行语义分词分割,形成分割词语组集合;其中,所述语义分词规则,包括以下至少之一:将标点符号两侧文本进行分割,将设定字符两侧文本进行分割,将所述关键词库中任一目标关键词两侧文本进行分割,将纯数字串两侧文本进行分割;和/或,根据所述分割词语组集合对所述关键词库进行调整,包括:确定所述分割词语组集合中每个分割词语组的出现次数是否大于设定次数;若所述分割词语组集合中有分割词语组的出现次数大于所述设定次数,则将出现次数大于所述设定次数的分割词语组加入所述关键词库;和/或,确定所述建筑维修工单集合的工单位置、工单分类和问题类型,包括:将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的位置关键词匹配,确定工单位置;以及,将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的分类关键词匹配,确定工单分类;以及,将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的问题类型关键词匹配,获得问题类型;和/或,确定所述建筑维修工单集合中的重复工单群组,包括:根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中任意两个建筑维修工单之间的工单距离;采用密度检测算法,根据所述工单距离确定重复工单和/或高频工单的候选工单集合;所述高频工单,为出现频次高于设定频次的工单;采用聚类挖掘算法,根据所述候选工单集合确定重复工单群组。
与上述方法相匹配,本发明另一方面提供一种建筑维修工单分析装置,包括:获取单元,用于获取建筑维修工单集合、以及所述建筑维修工单集合所涉及楼宇的BIM模型;分析单元,用于确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库;并根据所述BIM模型确定关键词库;所述分析单元,还用于根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,实现对所述建筑维修工单集合的自动分类。
可选地,其中,所述分析单元确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库,包括:从所述建筑维修工单集合的每条建筑维修工单中提取设定属性字段的值,得到每条建筑维修工单的结构化信息和工单描述文本;所述结构化信息,包括:报修人、报修时间、报修位置中的至少之一;收集每条建筑维修工单的工单描述文本,形成所述建筑维修工单集合的原始语料库;和/或,所述分析单元根据所述BIM 模型确定关键词库,包括:从所述BIM模型中提取目标关键词,并将所述目标关键词加入设定的关键词库;其中,所述目标关键词,包括:工单位置关键词、工单分类关键词和问题类型关键词中的至少之一;所述工单位置关键词,包括:所述建筑维修工单集合的每条建筑维修工单所对应的建筑、楼层、空间和房间的名称及编号信息中的至少之一;所述工单分类关键词,包括:机电系统、机电设备和建筑构件的名称、编号及类型名称中的至少之一;所述问题类型关键词,包括:建筑维修中的常见问题描述和常用词语中的至少之一。
可选地,所述分析单元根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,包括:按设定的循环次数,对所述原始语料库进行语义分词分割,形成分割词语组集合;并根据所述分割词语组集合对所述关键词库进行调整;根据所述分割词语组集合和调整后的关键词库,确定所述建筑维修工单集合的工单位置、工单分类和问题类型,并确定每个所述工单分类中所述工单位置和所述问题类型所占比例;和/或,根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中的重复工单群组。
可选地,其中,所述分析单元对所述原始语料库进行语义分词分割,包括:按设定的语义分词规则,对所述原始语料库中每个工单描述文本进行语义分词分割,形成分割词语组集合;其中,所述语义分词规则,包括以下至少之一:将标点符号两侧文本进行分割,将设定字符两侧文本进行分割,将所述关键词库中任一目标关键词两侧文本进行分割,将纯数字串两侧文本进行分割;和/ 或,所述分析单元根据所述分割词语组集合对所述关键词库进行调整,包括:确定所述分割词语组集合中每个分割词语组的出现次数是否大于设定次数;若所述分割词语组集合中有分割词语组的出现次数大于所述设定次数,则将出现次数大于所述设定次数的分割词语组加入所述关键词库;和/或,所述分析单元确定所述建筑维修工单集合的工单位置、工单分类和问题类型,包括:将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的位置关键词匹配,确定工单位置;以及,将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的分类关键词匹配,确定工单分类;以及,将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的问题类型关键词匹配,获得问题类型;和/或,所述分析单元确定所述建筑维修工单集合中的重复工单群组,包括:根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中任意两个建筑维修工单之间的工单距离;采用密度检测算法,根据所述工单距离确定重复工单和/或高频工单的候选工单集合;所述高频工单,为出现频次高于设定频次的工单;采用聚类挖掘算法,根据所述候选工单集合确定重复工单群组。
与上述装置相匹配,本发明再一方面提供一种客户端,包括:以上所述的建筑维修工单分析装置。
与上述方法相匹配,本发明再一方面提供一种存储介质,包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的建筑维修工单分析方法。
与上述方法相匹配,本发明再一方面提供一种客户端,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的建筑维修工单分析方法。
本发明的方案,通过基于BIM和语义分析,对建筑维修工单进行自动分类,可以从工单描述中精确挖掘问题的位置、工单分类和问题描述信息,高效且精准。
进一步,本发明的方案,通过基于BIM和语义分析,对建筑维修工单进行自动分类,可以挖掘重复、高频出现的工单,提高对建筑维修工单分析及分类的精准性。
进一步,本发明的方案,通过从BIM中提取整个建筑的所有空间信息和建筑系统和设备信息,从工单描述中挖掘出工单的位置、所涉及的系统或设备等信息,实现智能的工单分类、定位,可靠且精准。
进一步,本发明的方案,通过从BIM中提取整个建筑的所有空间信息和建筑系统和设备信息,从工单描述中挖掘出工单的位置、所涉及的系统或设备等信息,自动挖掘出高频重复工单,极大地提高了运维管理的效率。
进一步,本发明的方案,通过基于BIM和语义分析,对建筑维修工单进行自动分类,从工单描述中挖掘出工单的位置、所涉及的系统或设备等信息,实现智能的工单分类、定位,并自动挖掘出高频重复工单,精准且高效。
由此,本发明的方案,通过基于BIM和语义分析,对建筑维修工单进行自动分类,解决使用维修工单的位置、时间、报修人等结构化信息进行统计分析的维修工单分析方法,存在分析结果的准确性差的问题;从而,克服现有技术中人工劳动量大、分析效率低和分析结果的准确性差的缺陷,实现人工劳动量小、分析效率高和分析结果的准确性好的有益效果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的建筑维修工单分析方法的一实施例的流程示意图;
图2为本发明的方法中确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库的一实施例的流程示意图;
图3为本发明的方法中根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理的一实施例的流程示意图;
图4为本发明的方法中根据所述分割词语组集合对所述关键词库进行调整的一实施例的流程示意图;
图5为本发明的方法中确定所述建筑维修工单集合的工单位置、工单分类和问题类型的一实施例的流程示意图;
图6为本发明的方法中确定所述建筑维修工单集合中的重复工单群组的一实施例的流程示意图;
图7为本发明的建筑维修工单分析装置的一实施例的结构示意图;
图8为本发明的客户端的一实施例的基于BIM的建筑维修工单智能分析整体流程示意图;
图9为本发明的客户端的一实施例的维修工单实例示意图;
图10为本发明的客户端的一实施例的包括房间编号和名称的BIM模型实例示意图;
图11为本发明的客户端的一实施例的基于位置和类型的工单统计分析实例示意图;
图12为本发明的客户端的一实施例的重复工单群组实例示意图。
结合附图,本发明实施例中附图标记如下:
102-获取单元;104-分析单元。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种建筑维修工单分析方法,如图1所示本发明的方法的一实施例的流程示意图。该建筑维修工单分析方法可以包括:步骤S110至步骤S130。
在步骤S110处,获取建筑维修工单集合、以及所述建筑维修工单集合所涉及楼宇的BIM模型。其中,建筑维修工单集合,可以是待分析的建筑维修工单集合。
在步骤S120处,确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库;并根据所述BIM模型确定关键词库。
可选地,可以结合图2所示本发明的方法中确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库的一实施例流程示意图,进一步说明步骤S120中确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库的具体过程,可以包括:步骤S210和步骤S220。
步骤S210,从所述建筑维修工单集合的每条建筑维修工单中提取设定属性字段的值,得到每条建筑维修工单的结构化信息和工单描述文本。所述结构化信息,可以包括:报修人、报修时间、报修位置中的至少之一。
步骤S220,收集每条建筑维修工单的工单描述文本,形成所述建筑维修工单集合的原始语料库。
例如:从建筑维修工单集合C中提取各属性字段的值,包括报修人、报修时间、报修楼宇等基本信息,以及,工单描述文本。特别地,将每条工单的描述文本ci另外收集,形成原始语料库R。如图9就是维修工单实例的集合,具体就是一个个需要维修的问题列表;从建筑维修工单集合C中提取各属性字段的值时,提取的方法就是从图9表格中读取各行各列的数据,或者从数据库中读取各行各列的数据。
由此,通过自每条建筑维修工单中提取设定属性字段的值以得到每条建筑维修工单的结构化信息和工单描述文本,并收集每条建筑维修工单的工单描述文本以形成所述建筑维修工单集合的原始语料库,从而得到建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库,获取方式简便、且获取结果精准性好。
可选地,步骤S120中根据所述BIM模型确定关键词库,可以包括:从所述BIM模型中提取目标关键词,并将所述目标关键词加入设定的关键词库,以作为语义分词的依据。
其中,所述目标关键词,可以包括:工单位置关键词、工单分类关键词和问题类型关键词中的至少之一。所述工单位置关键词,可以包括:所述建筑维修工单集合的每条建筑维修工单所对应的建筑、楼层、空间和房间的名称及编号信息中的至少之一。所述工单分类关键词,可以包括:机电系统、机电设备和建筑构件的名称、编号及类型名称中的至少之一。所述问题类型关键词,可以包括:建筑维修中的常见问题描述和常用词语中的至少之一。
例如:从相关楼宇的BIM中提取建筑、楼层、空间和房间的名称和编号信息作为工单位置关键词K1,机电系统、机电设备、建筑构件的名称、编号和类型名称作为工单分类关键词K2;将建筑维修中常见问题描述和其他常用词语,作为问题类型关键词K3;均加入关键词库K,作为分词的重要依据。其中,相关楼宇指的是分析的报修工单涉及的楼宇;BIM模型一般楼宇建造时会完成,是一个施工单位竣工交付的文件。
由此,通过从BIM模型中提取目标关键词并将该目标关键词加入关键词库,从而得到基于BIM模块的关键词库,使得对关键词库的确定精准而可靠。
在步骤S130处,根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,实现对所述建筑维修工单集合的自动分类。
例如:一种基于建筑信息模型化(BIM,Building Information Modeling) 和语义分析的建筑维修工单智能分析方法,从工单描述(如维修工单文字描述) 中精确挖掘问题的位置、工单分类和问题描述信息,挖掘重复、高频出现的工单,定位管理的漏洞,实现精准运维,提高运维效率。
由此,通过基于每条建筑维修工单的结构化信息、建筑维修工单集合的原始语料库、以及根据BIM模型确定的关键词库进行语义分词处理和分析处理,从而实现对建筑维修工单集合的自动分类,高效且精准。
可选地,可以结合图3所示本发明的方法中根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理的一实施例流程示意图,进一步说明步骤S130中根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理的具体过程,可以包括:步骤S310至步骤S330。
步骤S310,按设定的循环次数,对所述原始语料库进行语义分词分割,形成分割词语组集合;并根据所述分割词语组集合对所述关键词库进行调整,直至达到设定的调整需求。
更可选地,步骤S310中对所述原始语料库进行语义分词分割,可以包括:按设定的语义分词规则,对所述原始语料库中每个工单描述文本进行语义分词分割,形成分割词语组集合。
其中,所述语义分词规则,可以包括以下至少之一:
将标点符号两侧文本进行分割,将设定字符两侧文本进行分割,将所述关键词库中任一目标关键词两侧文本进行分割,将纯数字串两侧文本进行分割。
例如:根据中文语法规则(如基本的中文语法)和维修工单描述的结构化特点,定义语义分词规则。优选以下四条规则:
(1)将标点符号两侧文本进行分割;(2)将“的”和“了”字两侧文本进行分割;(3)将关键词库K中任意关键词ki两侧文本进行分割;(4)将纯数字串两侧文本进行分割。
例如:对原始语料库R中各个工单描述文本ri,根据上述规则进行分割,形成一词语组Wi。
由此,通过按设定的语义分词规则对所述原始语料库中每个工单描述文本进行语义分词分割从而形成分割词语组集合,使得基于原始语料库进行语义分词分割而得到分割词语组集合的方式简便且高效,且分割所得分割词语组集合的精准性可以得到保证。
更可选地,可以结合图4所示本发明的方法中根据所述分割词语组集合对所述关键词库进行调整的一实施例流程示意图,进一步说明步骤S310中根据所述分割词语组集合对所述关键词库进行调整的具体过程,可以包括:步骤 S410和步骤S420。
步骤S410,确定所述分割词语组集合中每个分割词语组的出现次数是否大于设定次数。
步骤S420,若所述分割词语组集合中有分割词语组的出现次数大于所述设定次数,则将出现次数大于所述设定次数的分割词语组加入所述关键词库。
例如:对于所有工单分割后的Wi中的每个分割词语组w,求其在所有Wi中出现的次数Freq(w),若Freq(w)>fmin,则表示w为高频率词语,作为关键词加入关键词库K。优选fmin=5,fmin为预设次数。优选地,可以设置前后两次循环,关键词库的关键词数量维持不变。
由此,通过基于在分割词语组集合中有分割词语组出现、且其出现次数大于设定次数的情况下,将出现次数大于设定次数的分割词语组加入关键词库,实现对关键词库的调整,有利于提升对建筑维修工单集合的自动分类的精准性和可靠性。
步骤S320,根据所述分割词语组集合和调整后的关键词库,确定所述建筑维修工单集合的工单位置、工单分类和问题类型,并确定每个所述工单分类中所述工单位置和所述问题类型所占比例。这样,通过步骤S320,可以通过统计分析,确定哪些类型或位置的工单比较多,有利于管理力量分配。
更可选地,可以结合图5所示本发明的方法中确定所述建筑维修工单集合的工单位置、工单分类和问题类型的一实施例流程示意图,进一步说明步骤 S320中确定所述建筑维修工单集合的工单位置、工单分类和问题类型的具体过程,可以包括:以下步骤S510至步骤S530中至少任一步骤,其中在包括步骤 S510至步骤S530的情况下三个步骤之间的顺序可以任意调整。
步骤S510,将所述分割词语组集合中每条所述建筑维修工单的分割词语组中可以包括的词语,与调整后的关键词库中的位置关键词匹配,确定工单位置。以及,
步骤S520,将所述分割词语组集合中每条所述建筑维修工单的分割词语组中可以包括的词语,与调整后的关键词库中的分类关键词匹配,确定工单分类。以及,
步骤S530,将所述分割词语组集合中每条所述建筑维修工单的分割词语组中可以包括的词语,与调整后的关键词库中的问题类型关键词匹配,获得问题类型。
例如:将每个维修工单的词语组Wi(如分割词语组集合)中包括的词语,与位置关键词K1匹配,确定工单位置;与分类关键词K2匹配,设置工单分类;与问题类型关键词K3匹配,获得问题类型。根据工单的位置和分类信息进行统计,分析占比较高的位置或类型,如图11所示,支持有针对性的维修管理。
由此,通过将分割词语组集合中每条所述建筑维修工单的分割词语组中可以包括的词语,与调整后的关键词库中的位置关键词匹配、分类关键词匹配和问题类型关键词等分别进行匹配,从而确定所述建筑维修工单集合的工单位置、工单分类和问题类型,确定方式简便且高效,确定结果精准性可以得到保证。
和/或,步骤S330,根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中的重复工单群组。
由此,通过对原始语料库进行语义分词分割形成分割词语组集合,进而根据分割词语组集合对关键词库进行调整,循环设定次数直至达到设定的调整需求;再根据该分割词语组集合和调整后的关键词库确定建筑维修工单集合的工单位置、工单分类和问题类型等,和/或根据分割词语组集合和结构化信息确定建筑维修工单集合中的重复工单群组,实现对建筑维修工单集合的自动分类,自动化程度高、且精准性好。
更可选地,可以结合图6所示本发明的方法中确定所述建筑维修工单集合中的重复工单群组的一实施例流程示意图,进一步说明步骤S330中确定所述建筑维修工单集合中的重复工单群组的具体过程,可以包括:步骤S610至步骤S630。
步骤S610,根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中任意两个建筑维修工单之间的工单距离。
例如:对建筑维修工单C中任意两个工单ci和cj,根据步骤4获得的分词词语组Wi和Wj中的相同词语数量,以及,ci和cj的报修人、报修时间、报修类型等结构化信息,定义两个工单之间的距离度量dij。
步骤S620,采用密度检测算法,根据所述工单距离确定重复工单和/或高频工单的候选工单集合。所述高频工单,为出现频次高于设定频次的工单。
例如:采用kmeans密度检测算法选出重复、高频工单的候选。首先,计算出每个工单附近的密度值,对于第i个工单ci,其密度Di的计算公式可以如下:
其中,k为事先定义的一个参数,dij表示距离工单ci最近的k个工单和ci之间的距离。然后,选出密度Di逆序排名前10%的工单ci,组成工单集合C1 作为候选的重复、高频工单。
步骤S630,采用聚类挖掘算法,根据所述候选工单集合确定重复工单群组。
例如:针对工单集合C1中的每个工单ci,计算与每个工单ci距离较近的工单,形成一个重复、高频集群Fi,使得每个集群内部Fi的工单之间尽可能相似(互相间的距离度量dij尽可能小),而不同集群间尽可能不相似。这样就将这些工单作了自动归类,便于管理人员分类查看。每个集群Fi即为一组高频或重复工单,是最后输出结果。其中,针对工单集合C1中的每个工单ci,计算与ci距离较近的工单,形成一个重复、高频集群Fi,主要是自动分类:使得每个集群内部的工单之间尽可能相似,而不同集群间尽可能不相似。
由此,通过根据分割词语组集合和结构化信息确定建筑维修工单集合中任意两个建筑维修工单之间的工单距离,进而采用密度检测算法根据工单距离确定重复工单、高频工单等候选工单集合,再采用聚类挖掘算法根据候选工单确定重复工单群组,实现对建筑维修工单集合的自动分类,分类过程高效且节省人力成本,分类结果精准且可靠。
经大量的试验验证,采用本实施例的技术方案,通过基于BIM和语义分析,对建筑维修工单进行自动分类,可以从工单描述中精确挖掘问题的位置、工单分类和问题描述信息,高效且精准。
根据本发明的实施例,还提供了对应于建筑维修工单分析方法的一种建筑维修工单分析装置。参见图7所示本发明的装置的一实施例的结构示意图。该建筑维修工单分析装置可以包括:获取单元102和分析单元104。
在一个可选例子中,获取单元102,可以用于获取建筑维修工单集合、以及所述建筑维修工单集合所涉及楼宇的BIM模型。其中,建筑维修工单集合,可以是待分析的建筑维修工单集合。该获取单元102的具体功能及处理参见步骤S110。
在一个可选例子中,分析单元104,可以用于确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库;并根据所述BIM模型确定关键词库。该分析单元104的具体功能及处理参见步骤S120。
可选地,所述分析单元104确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库,可以包括:
所述分析单元104,具体还可以用于从所述建筑维修工单集合的每条建筑维修工单中提取设定属性字段的值,得到每条建筑维修工单的结构化信息和工单描述文本。所述结构化信息,可以包括:报修人、报修时间、报修位置中的至少之一。该分析单元104的具体功能及处理还参见步骤S210。
所述分析单元104,具体还可以用于收集每条建筑维修工单的工单描述文本,形成所述建筑维修工单集合的原始语料库。该分析单元104的具体功能及处理还参见步骤S220。
例如:从建筑维修工单集合C中提取各属性字段的值,包括报修人、报修时间、报修楼宇等基本信息,以及,工单描述文本。特别地,将每条工单的描述文本ci另外收集,形成原始语料库R。如图9就是维修工单实例的集合,具体就是一个个需要维修的问题列表;从建筑维修工单集合C中提取各属性字段的值时,提取的方法就是从图9表格中读取各行各列的数据,或者从数据库中读取各行各列的数据。
由此,通过自每条建筑维修工单中提取设定属性字段的值以得到每条建筑维修工单的结构化信息和工单描述文本,并收集每条建筑维修工单的工单描述文本以形成所述建筑维修工单集合的原始语料库,从而得到建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库,获取方式简便、且获取结果精准性好。
可选地,所述分析单元104根据所述BIM模型确定关键词库,可以包括:所述分析单元104,具体还可以用于从所述BIM模型中提取目标关键词,并将所述目标关键词加入设定的关键词库,以作为语义分词的依据。
其中,所述目标关键词,可以包括:工单位置关键词、工单分类关键词和问题类型关键词中的至少之一。所述工单位置关键词,可以包括:所述建筑维修工单集合的每条建筑维修工单所对应的建筑、楼层、空间和房间的名称及编号信息中的至少之一。所述工单分类关键词,可以包括:机电系统、机电设备和建筑构件的名称、编号及类型名称中的至少之一。所述问题类型关键词,可以包括:建筑维修中的常见问题描述和常用词语中的至少之一。
例如:从相关楼宇的BIM中提取建筑、楼层、空间和房间的名称和编号信息作为工单位置关键词K1,机电系统、机电设备、建筑构件的名称、编号和类型名称作为工单分类关键词K2;将建筑维修中常见问题描述和其他常用词语,作为问题类型关键词K3;均加入关键词库K,作为分词的重要依据。其中,相关楼宇指的是分析的报修工单涉及的楼宇;BIM模型一般楼宇建造时会完成,是一个施工单位竣工交付的文件。
由此,通过从BIM模型中提取目标关键词并将该目标关键词加入关键词库,从而得到基于BIM模块的关键词库,使得对关键词库的确定精准而可靠。
在一个可选例子中,所述分析单元104,还可以用于根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,实现对所述建筑维修工单集合的自动分类。该分析单元104的具体功能及处理还参见步骤 S130。
例如:一种基于建筑信息模型化(BIM,Building Information Modeling) 和语义分析的建筑维修工单智能分析方法,从工单描述(如维修工单文字描述) 中精确挖掘问题的位置、工单分类和问题描述信息,挖掘重复、高频出现的工单,定位管理的漏洞,实现精准运维,提高运维效率。
由此,通过基于每条建筑维修工单的结构化信息、建筑维修工单集合的原始语料库、以及根据BIM模型确定的关键词库进行语义分词处理和分析处理,从而实现对建筑维修工单集合的自动分类,高效且精准。
可选地,所述分析单元104根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,可以包括:
所述分析单元104,具体还可以用于按设定的循环次数,对所述原始语料库进行语义分词分割,形成分割词语组集合;并根据所述分割词语组集合对所述关键词库进行调整,直至达到设定的调整需求。该分析单元104的具体功能及处理还参见步骤S310。
更可选地,所述分析单元104对所述原始语料库进行语义分词分割,可以包括:所述分析单元104,具体还可以用于按设定的语义分词规则,对所述原始语料库中每个工单描述文本进行语义分词分割,形成分割词语组集合。
其中,所述语义分词规则,可以包括以下至少之一:
将标点符号两侧文本进行分割,将设定字符两侧文本进行分割,将所述关键词库中任一目标关键词两侧文本进行分割,将纯数字串两侧文本进行分割。
例如:根据中文语法规则(如基本的中文语法)和维修工单描述的结构化特点,定义语义分词规则。优选以下四条规则:
(1)将标点符号两侧文本进行分割;(2)将“的”和“了”字两侧文本进行分割;(3)将关键词库K中任意关键词ki两侧文本进行分割;(4)将纯数字串两侧文本进行分割。
例如:对原始语料库R中各个工单描述文本ri,根据上述规则进行分割,形成一词语组Wi。
由此,通过按设定的语义分词规则对所述原始语料库中每个工单描述文本进行语义分词分割从而形成分割词语组集合,使得基于原始语料库进行语义分词分割而得到分割词语组集合的方式简便且高效,且分割所得分割词语组集合的精准性可以得到保证。
更可选地,所述分析单元104根据所述分割词语组集合对所述关键词库进行调整,可以包括:
所述分析单元104,具体还可以用于确定所述分割词语组集合中每个分割词语组的出现次数是否大于设定次数。该分析单元104的具体功能及处理还参见步骤S410。
所述分析单元104,具体还可以用于若所述分割词语组集合中有分割词语组的出现次数大于所述设定次数,则将出现次数大于所述设定次数的分割词语组加入所述关键词库。该分析单元104的具体功能及处理还参见步骤S420。
例如:对于所有工单分割后的Wi中的每个分割词语组w,求其在所有Wi中出现的次数Freq(w),若Freq(w)>fmin,则表示w为高频率词语,作为关键词加入关键词库K。优选fmin=5,fmin为预设次数。优选地,可以设置前后两次循环,关键词库的关键词数量维持不变。
由此,通过基于在分割词语组集合中有分割词语组出现、且其出现次数大于设定次数的情况下,将出现次数大于设定次数的分割词语组加入关键词库,实现对关键词库的调整,有利于提升对建筑维修工单集合的自动分类的精准性和可靠性。
所述分析单元104,具体还可以用于根据所述分割词语组集合和调整后的关键词库,确定所述建筑维修工单集合的工单位置、工单分类和问题类型,并确定每个所述工单分类中所述工单位置和所述问题类型所占比例。该分析单元 104的具体功能及处理还参见步骤S320。
更可选地,所述分析单元104确定所述建筑维修工单集合的工单位置、工单分类和问题类型,可以包括以下至少之一:
所述分析单元104,具体还可以用于将所述分割词语组集合中每条所述建筑维修工单的分割词语组中可以包括的词语,与调整后的关键词库中的位置关键词匹配,确定工单位置。该分析单元104的具体功能及处理还参见步骤S510。以及,
所述分析单元104,具体还可以用于将所述分割词语组集合中每条所述建筑维修工单的分割词语组中可以包括的词语,与调整后的关键词库中的分类关键词匹配,确定工单分类。该分析单元104的具体功能及处理还参见步骤S520。以及,
所述分析单元104,具体还可以用于将所述分割词语组集合中每条所述建筑维修工单的分割词语组中可以包括的词语,与调整后的关键词库中的问题类型关键词匹配,获得问题类型。该分析单元104的具体功能及处理还参见步骤 S530。
例如:将每个维修工单的词语组Wi(如分割词语组集合)中包括的词语,与位置关键词K1匹配,确定工单位置;与分类关键词K2匹配,设置工单分类;与问题类型关键词K3匹配,获得问题类型。根据工单的位置和分类信息进行统计,分析占比较高的位置或类型,如图11所示,支持有针对性的维修管理。
由此,通过将分割词语组集合中每条所述建筑维修工单的分割词语组中可以包括的词语,与调整后的关键词库中的位置关键词匹配、分类关键词匹配和问题类型关键词等分别进行匹配,从而确定所述建筑维修工单集合的工单位置、工单分类和问题类型,确定方式简便且高效,确定结果精准性可以得到保证。
和/或,所述分析单元104,具体还可以用于根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中的重复工单群组。该分析单元104 的具体功能及处理还参见步骤S330。
由此,通过对原始语料库进行语义分词分割形成分割词语组集合,进而根据分割词语组集合对关键词库进行调整,循环设定次数直至达到设定的调整需求;再根据该分割词语组集合和调整后的关键词库确定建筑维修工单集合的工单位置、工单分类和问题类型等,和/或根据分割词语组集合和结构化信息确定建筑维修工单集合中的重复工单群组,实现对建筑维修工单集合的自动分类,自动化程度高、且精准性好。
更可选地,所述分析单元104确定所述建筑维修工单集合中的重复工单群组,可以包括:
所述分析单元104,具体还可以用于根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中任意两个建筑维修工单之间的工单距离。该分析单元104的具体功能及处理还参见步骤S610。
例如:对建筑维修工单C中任意两个工单ci和cj,根据步骤4获得的分词词语组Wi和Wj中的相同词语数量,以及,ci和cj的报修人、报修时间、报修类型等结构化信息,定义两个工单之间的距离度量dij。
所述分析单元104,具体还可以用于采用密度检测算法,根据所述工单距离确定重复工单和/或高频工单的候选工单集合。所述高频工单,为出现频次高于设定频次的工单。该分析单元104的具体功能及处理还参见步骤S620。
例如:采用kmeans密度检测算法选出重复、高频工单的候选。首先,计算出每个工单附近的密度值,对于第i个工单ci,其密度Di的计算公式可以如下:
其中,k为事先定义的一个参数,dij表示距离工单ci最近的k个工单和ci之间的距离。然后,选出密度Di逆序排名前10%的工单ci,组成工单集合C1 作为候选的重复、高频工单。
所述分析单元104,具体还可以用于采用聚类挖掘算法,根据所述候选工单集合确定重复工单群组。该分析单元104的具体功能及处理还参见步骤S630。
例如:针对工单集合C1中的每个工单ci,计算与每个工单ci距离较近的工单,形成一个重复、高频集群Fi,使得每个集群内部Fi的工单之间尽可能相似(互相间的距离度量dij尽可能小),而不同集群间尽可能不相似。这样就将这些工单作了自动归类,便于管理人员分类查看。每个集群Fi即为一组高频或重复工单,是最后输出结果。其中,针对工单集合C1中的每个工单ci,计算与ci距离较近的工单,形成一个重复、高频集群Fi,主要是自动分类:使得每个集群内部的工单之间尽可能相似,而不同集群间尽可能不相似。
由此,通过根据分割词语组集合和结构化信息确定建筑维修工单集合中任意两个建筑维修工单之间的工单距离,进而采用密度检测算法根据工单距离确定重复工单、高频工单等候选工单集合,再采用聚类挖掘算法根据候选工单确定重复工单群组,实现对建筑维修工单集合的自动分类,分类过程高效且节省人力成本,分类结果精准且可靠。
由于本实施例的装置所实现的处理及功能基本相应于前述图1至图6所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过基于BIM和语义分析,对建筑维修工单进行自动分类,可以挖掘重复、高频出现的工单,提高对建筑维修工单分析及分类的精准性。
根据本发明的实施例,还提供了对应于建筑维修工单分析装置的一种客户端。该客户端可以包括:以上所述的建筑维修工单分析装置。
在一个可选实施方式中,本发明的方案,提出一种基于建筑信息模型化 (BIM,Building Information Modeling)和语义分析的建筑维修工单智能分析方法,从工单描述(如维修工单文字描述)中精确挖掘问题的位置、工单分类和问题描述信息,挖掘重复、高频出现的工单,定位管理的漏洞,实现精准运维,提高运维效率。
在一个可选例子中,本发明的方案,提出一种基于BIM的建筑维修工单智能分析方法,主要可以包括以下步骤(可以参见图8至图12所示的例子):
步骤1:从建筑维修工单集合C中提取各属性字段的值,包括报修人、报修时间、报修楼宇等基本信息,以及,工单描述文本。特别地,将每条工单的描述文本ci另外收集,形成原始语料库R。
例如:图9就是维修工单实例的集合,具体就是一个个需要维修的问题列表。从建筑维修工单集合C中提取各属性字段的值时,提取的方法就是从图9 表格中读取各行各列的数据,或者从数据库中读取各行各列的数据。
步骤1中,从建筑维修工单集合C中提取基本属性值。对于工单描述文本 ci,收集形成基本语料库R。以某医院的建筑维修工单为例,从2017年7月至 2018年12月的包括2.8万条工单,合计约31万字的语料库,如图9所示。
步骤2:从相关楼宇的BIM中提取建筑、楼层、空间和房间的名称和编号信息作为工单位置关键词K1,机电系统、机电设备、建筑构件的名称、编号和类型名称作为工单分类关键词K2;将建筑维修中常见问题描述和其他常用词语,作为问题类型关键词K3;均加入关键词库K,作为分词的重要依据。
例如:建筑维修中常见问题描述,可以是专业人士在人工阅读维修工单描述后抽取的词语;譬如:黑屏、漏水、关不上等。其他常用词语,可以是专业人士根据自身经验输入的常用问题类型;譬如太热、太冷、坏、掉、堵等,实际上可以合称为建筑维修中常见问题描述。
其中,相关楼宇指的是分析的报修工单涉及的楼宇;BIM模型一般楼宇建造时会完成,是一个施工单位竣工交付的文件。
步骤2中从BIM模型提取建筑、楼层、空间和房间的名称和编号信息作为工单位置关键词K1,机电系统、机电设备、建筑构件的名称、编号和类型名称作为工单分类关键词K2;将建筑维修中常见问题描述或其他常用语,作为问题类型关键词K3;均加入关键词库K,作为分词的重要依据。以该医院建筑为例,K1包括儿1F、儿4F、儿外1F、儿外4F、门诊1F、急诊2F等位置信息,手术室、厕所、护士站、污物间等房间名称;K2包括空调、冰箱、五金、病床、洗衣机、灯、家具、设备;K3包括漏水、太热、不响、坏等;在该医院案例中,选取了110个原始关键词。
步骤3:根据中文语法规则(如基本的中文语法)和维修工单描述的结构化特点,定义语义分词规则。优选以下四条规则:
(1)将标点符号两侧文本进行分割;(2)将“的”和“了”字两侧文本进行分割;(3)将关键词库K中任意关键词ki两侧文本进行分割;(4)将纯数字串两侧文本进行分割。
具体地,根据基本的中文语法和维修工单描述的结构化特点,可以作为选择四条规则的解释依据,可以根据实际需求选用或不选用。
具体地,定义的语法分词规则可以包括以上四条规则;计算机根据该语法分词规则将中文的一句话拆分为一个个词语,形成词语集合。
步骤4:对原始语料库R中各个工单描述文本ri,根据步骤3所述规则进行分割,形成一词语组Wi。譬如工单c1描述“儿外4F 401房间顶灯坏”分割形成的词语组Wi={“儿外4F”、“401”、“顶灯”、“坏”};工单c2描述“儿外4F污物间水龙头关不上”分割形成的词语组Wi={“儿外4F”、“污物间”、“水龙头”、“关不上”}。
步骤5:对于所有工单分割后的Wi中的每个分割词语组w,求其在所有Wi中出现的次数Freq(w),若Freq(w)>fmin,则表示w为高频率词语,作为关键词加入关键词库K。优选fmin=5,fmin为预设次数。
在该示例中,第一次循环获得的高频词语可以包括{“房间”、“儿”、“床头”、“墙面”}等。
步骤6:迭代执行步骤4和步骤5,优选收敛条件为前后两次循环,关键词库的关键词数量维持不变。当达到收敛条件时,迭代停止,进入步骤7。
其中,可以设定按循环次数循环,也可以设定一直循环直至其他循环结束条件达到时才结束循环。
例如:前一次有10个关键词;根据关键词进行拆分后,没有新的词语频率大于fmin,那么就没有新的次加入到关键词中;那么循环就可以结束了;这种循环结束条件是比较常见的方式之一,也是效果最好的,但速度会比较慢。
步骤6中,循环执行步骤4和步骤5,当达到收敛条件时,退出循环进入步骤7。优选收敛条件为前后两次循环,关键词库的关键词数量维持不变。在该实施例中,循环迭代3次即收敛了。Wi中5字以上的长短语数量随迭代急速下降,由10万字以上减少为不足0.5万字。初始分词不充分的4字和3字词汇也明显减少。最终的结果大致组成为:少量单字、高词频的2字词汇、较少频率出现的3字词汇、更少频率但数量较多的4字词汇以及,一些残余的不可分割短语。
步骤7:将步骤4计算的每个维修工单的词语组Wi中包括的词语,与位置关键词K1匹配,确定工单位置;与分类关键词K2匹配,设置工单分类;与问题类型关键词K3匹配,获得问题类型。
例如:Wi中包括401房间;K1中包括401房间,则认为该工单发生在401 房间。
步骤7中将步骤4计算的每个维修工单描述分割的词语组Wi中包括的词语,与位置关键词K1匹配,确定工单位置,与分类关键词K2匹配,设置工单分类,与问题类型关键词K3匹配,获得问题类型;c1的工单位置关键词包括{“儿外”、“4F”、“401”},工单分类关键词包括{“灯”}。然后根据工单的位置和分类信息进行统计,分析占比较高的位置或类型,如图11所示,支持有针对性的维修管理。
步骤8:对建筑维修工单C中任意两个工单ci和cj,根据步骤4获得的分词词语组Wi和Wj中的相同词语数量,以及,ci和cj的报修人、报修时间、报修类型等结构化信息,定义两个工单之间的距离度量dij。
其中,步骤7和8之间可以没有必然关联;步骤7是为了统计分析,哪些类型或位置的工单比较多,有利于运维管理力量分配。
步骤9:采用kmeans密度检测算法选出重复、高频工单的候选。其中,这个选择基础可以是步骤8的计算结果dij。
首先,计算出每个工单附近的密度值,对于第i个工单ci,其密度Di的计算公式可以如下:
其中,k为事先定义的一个参数,dij表示距离工单ci最近的k个工单和ci之间的距离。然后,选出密度Di逆序排名前10%的工单ci,组成工单集合C1 作为候选的重复、高频工单。
步骤10:针对工单集合C1中的每个工单ci,计算与每个工单ci距离较近的工单,形成一个重复、高频集群Fi,使得每个集群内部Fi的工单之间尽可能相似(互相间的距离度量dij尽可能小),而不同集群间尽可能不相似。这样就将这些工单作了自动归类,便于管理人员分类查看。每个集群Fi即为一组高频或重复工单,是最后输出结果。例如:参见图11和图12所示的例子,输出的是若干组报修工单,每组中的报修单彼此之间是内容非常类似或相同的;这样管理人员就能知道存在一些经常反复要修理的设备,从而有针对性。在该医院的计算实例中,明显的重复工单群组之一如图12所示。
其中,针对工单集合C1中的每个工单ci,计算与ci距离较近的工单,形成一个重复、高频集群Fi,主要是自动分类:使得每个集群内部的工单之间尽可能相似,而不同集群间尽可能不相似。
可见,本发明的方案,从BIM中提取整个建筑的所有空间信息和建筑系统和设备信息,从工单描述中挖掘出工单的位置、所涉及的系统或设备等信息,实现智能的工单分类、定位,准确率高达90%;并自动挖掘出80%以上的高频重复工单,极大地提高了运维管理的效率。
由于本实施例的客户端所实现的处理及功能基本相应于前述图7所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过从BIM中提取整个建筑的所有空间信息和建筑系统和设备信息,从工单描述中挖掘出工单的位置、所涉及的系统或设备等信息,实现智能的工单分类、定位,可靠且精准。
根据本发明的实施例,还提供了对应于建筑维修工单分析方法的一种存储介质。该存储介质,可以包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的建筑维修工单分析方法。
由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图6 所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过从BIM中提取整个建筑的所有空间信息和建筑系统和设备信息,从工单描述中挖掘出工单的位置、所涉及的系统或设备等信息,自动挖掘出高频重复工单,极大地提高了运维管理的效率。
根据本发明的实施例,还提供了对应于建筑维修工单分析方法的一种客户端。该客户端,可以包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的建筑维修工单分析方法。
由于本实施例的客户端所实现的处理及功能基本相应于前述图1至图6所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过基于BIM和语义分析,对建筑维修工单进行自动分类,从工单描述中挖掘出工单的位置、所涉及的系统或设备等信息,实现智能的工单分类、定位,并自动挖掘出高频重复工单,精准且高效。
综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种建筑维修工单分析方法,其特征在于,包括:
获取建筑维修工单集合、以及所述建筑维修工单集合所涉及楼宇的BIM模型;
确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库;并根据所述BIM模型确定关键词库;
根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,实现对所述建筑维修工单集合的自动分类。
2.根据权利要求1所述的方法,其特征在于,其中,
确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库,包括:
从所述建筑维修工单集合的每条建筑维修工单中提取设定属性字段的值,得到每条建筑维修工单的结构化信息和工单描述文本;所述结构化信息,包括:报修人、报修时间、报修位置中的至少之一;
收集每条建筑维修工单的工单描述文本,形成所述建筑维修工单集合的原始语料库;
和/或,
根据所述BIM模型确定关键词库,包括:
从所述BIM模型中提取目标关键词,并将所述目标关键词加入设定的关键词库;
其中,所述目标关键词,包括:工单位置关键词、工单分类关键词和问题类型关键词中的至少之一;所述工单位置关键词,包括:所述建筑维修工单集合的每条建筑维修工单所对应的建筑、楼层、空间和房间的名称及编号信息中的至少之一;所述工单分类关键词,包括:机电系统、机电设备和建筑构件的名称、编号及类型名称中的至少之一;所述问题类型关键词,包括:建筑维修中的常见问题描述和常用词语中的至少之一。
3.根据权利要求1或2所述的方法,其特征在于,根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,包括:
按设定的循环次数,对所述原始语料库进行语义分词分割,形成分割词语组集合;并根据所述分割词语组集合对所述关键词库进行调整;
根据所述分割词语组集合和调整后的关键词库,确定所述建筑维修工单集合的工单位置、工单分类和问题类型,并确定每个所述工单分类中所述工单位置和所述问题类型所占比例;和/或,
根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中的重复工单群组。
4.根据权利要求3所述的方法,其特征在于,其中,
对所述原始语料库进行语义分词分割,包括:
按设定的语义分词规则,对所述原始语料库中每个工单描述文本进行语义分词分割,形成分割词语组集合;
其中,所述语义分词规则,包括以下至少之一:
将标点符号两侧文本进行分割,将设定字符两侧文本进行分割,将所述关键词库中任一目标关键词两侧文本进行分割,将纯数字串两侧文本进行分割;
和/或,
根据所述分割词语组集合对所述关键词库进行调整,包括:
确定所述分割词语组集合中每个分割词语组的出现次数是否大于设定次数;
若所述分割词语组集合中有分割词语组的出现次数大于所述设定次数,则将出现次数大于所述设定次数的分割词语组加入所述关键词库;
和/或,
确定所述建筑维修工单集合的工单位置、工单分类和问题类型,包括:
将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的位置关键词匹配,确定工单位置;以及,
将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的分类关键词匹配,确定工单分类;以及,
将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的问题类型关键词匹配,获得问题类型;
和/或,
确定所述建筑维修工单集合中的重复工单群组,包括:
根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中任意两个建筑维修工单之间的工单距离;
采用密度检测算法,根据所述工单距离确定重复工单和/或高频工单的候选工单集合;所述高频工单,为出现频次高于设定频次的工单;
采用聚类挖掘算法,根据所述候选工单集合确定重复工单群组。
5.一种建筑维修工单分析装置,其特征在于,包括:
获取单元,用于获取建筑维修工单集合、以及所述建筑维修工单集合所涉及楼宇的BIM模型;
分析单元,用于确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库;并根据所述BIM模型确定关键词库;
所述分析单元,还用于根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,实现对所述建筑维修工单集合的自动分类。
6.根据权利要求5所述的装置,其特征在于,其中,
所述分析单元确定所述建筑维修工单集合中每条建筑维修工单的结构化信息、以及所述建筑维修工单集合的原始语料库,包括:
从所述建筑维修工单集合的每条建筑维修工单中提取设定属性字段的值,得到每条建筑维修工单的结构化信息和工单描述文本;所述结构化信息,包括:报修人、报修时间、报修位置中的至少之一;
收集每条建筑维修工单的工单描述文本,形成所述建筑维修工单集合的原始语料库;
和/或,
所述分析单元根据所述BIM模型确定关键词库,包括:
从所述BIM模型中提取目标关键词,并将所述目标关键词加入设定的关键词库;
其中,所述目标关键词,包括:工单位置关键词、工单分类关键词和问题类型关键词中的至少之一;所述工单位置关键词,包括:所述建筑维修工单集合的每条建筑维修工单所对应的建筑、楼层、空间和房间的名称及编号信息中的至少之一;所述工单分类关键词,包括:机电系统、机电设备和建筑构件的名称、编号及类型名称中的至少之一;所述问题类型关键词,包括:建筑维修中的常见问题描述和常用词语中的至少之一。
7.根据权利要求5或6所述的装置,其特征在于,所述分析单元根据所述结构化信息、所述原始语料库和所述关键词库,进行语义分词处理和分析处理,包括:
按设定的循环次数,对所述原始语料库进行语义分词分割,形成分割词语组集合;并根据所述分割词语组集合对所述关键词库进行调整;
根据所述分割词语组集合和调整后的关键词库,确定所述建筑维修工单集合的工单位置、工单分类和问题类型,并确定每个所述工单分类中所述工单位置和所述问题类型所占比例;和/或,
根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中的重复工单群组。
8.根据权利要求7所述的装置,其特征在于,其中,
所述分析单元对所述原始语料库进行语义分词分割,包括:
按设定的语义分词规则,对所述原始语料库中每个工单描述文本进行语义分词分割,形成分割词语组集合;
其中,所述语义分词规则,包括以下至少之一:
将标点符号两侧文本进行分割,将设定字符两侧文本进行分割,将所述关键词库中任一目标关键词两侧文本进行分割,将纯数字串两侧文本进行分割;
和/或,
所述分析单元根据所述分割词语组集合对所述关键词库进行调整,包括:
确定所述分割词语组集合中每个分割词语组的出现次数是否大于设定次数;
若所述分割词语组集合中有分割词语组的出现次数大于所述设定次数,则将出现次数大于所述设定次数的分割词语组加入所述关键词库;
和/或,
所述分析单元确定所述建筑维修工单集合的工单位置、工单分类和问题类型,包括:
将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的位置关键词匹配,确定工单位置;以及,
将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的分类关键词匹配,确定工单分类;以及,
将所述分割词语组集合中每条所述建筑维修工单的分割词语组中包括的词语,与调整后的关键词库中的问题类型关键词匹配,获得问题类型;
和/或,
所述分析单元确定所述建筑维修工单集合中的重复工单群组,包括:
根据所述分割词语组集合和所述结构化信息,确定所述建筑维修工单集合中任意两个建筑维修工单之间的工单距离;
采用密度检测算法,根据所述工单距离确定重复工单和/或高频工单的候选工单集合;所述高频工单,为出现频次高于设定频次的工单;
采用聚类挖掘算法,根据所述候选工单集合确定重复工单群组。
9.一种客户端,其特征在于,包括:如权利要求5-8任一所述的建筑维修工单分析装置;
或者,
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1-4任一所述的建筑维修工单分析方法。
10.一种存储介质,其特征在于,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-4任一所述的建筑维修工单分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910262142.8A CN110032643B (zh) | 2019-04-02 | 2019-04-02 | 一种建筑维修工单分析方法、装置、存储介质及客户端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910262142.8A CN110032643B (zh) | 2019-04-02 | 2019-04-02 | 一种建筑维修工单分析方法、装置、存储介质及客户端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110032643A true CN110032643A (zh) | 2019-07-19 |
CN110032643B CN110032643B (zh) | 2021-04-27 |
Family
ID=67237282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910262142.8A Active CN110032643B (zh) | 2019-04-02 | 2019-04-02 | 一种建筑维修工单分析方法、装置、存储介质及客户端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110032643B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112288331A (zh) * | 2020-11-24 | 2021-01-29 | 哈尔滨工业大学 | 一种基于语义识别的建筑改建评估系统 |
CN112488736A (zh) * | 2020-12-15 | 2021-03-12 | 济南市城乡建设数字化中心 | 一种住建领域政务热线工单数据分析方法及系统 |
CN113536766A (zh) * | 2020-04-16 | 2021-10-22 | 浙江大搜车软件技术有限公司 | 一种汽车维保记录的解析方法和装置 |
CN114462903A (zh) * | 2022-04-14 | 2022-05-10 | 四川省大数据中心 | 一种水电气业务报装系统 |
CN114548445A (zh) * | 2022-02-28 | 2022-05-27 | 四川省建筑科学研究院有限公司 | 一种基于实时反馈的建筑运维管理系统 |
CN117114452A (zh) * | 2023-10-23 | 2023-11-24 | 中科云谷科技有限公司 | 用于确定施工方案的方法、处理器、装置及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942220A (zh) * | 2013-01-23 | 2014-07-23 | 成都勤智数码科技股份有限公司 | 一种适用于it运维系统的工单智能关联知识库知识的方法 |
CN105760493A (zh) * | 2016-02-18 | 2016-07-13 | 国网江苏省电力公司电力科学研究院 | 一种电力营销服务热点95598工单自动分类方法 |
CN107861942A (zh) * | 2017-10-11 | 2018-03-30 | 国网浙江省电力公司电力科学研究院 | 一种基于深度学习的电力疑似投诉工单识别方法 |
CN107992609A (zh) * | 2017-12-15 | 2018-05-04 | 广东电网有限责任公司信息中心 | 一种基于文本分类技术和决策树的投诉倾向判断方法 |
CN109063217A (zh) * | 2018-10-29 | 2018-12-21 | 广州供电局有限公司 | 电力营销系统中的工单分类方法、装置及其相关设备 |
US20190095865A1 (en) * | 2017-09-22 | 2019-03-28 | The Brandt Companies, LLC | Fabrication, distribution, and integrated order processing system |
-
2019
- 2019-04-02 CN CN201910262142.8A patent/CN110032643B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942220A (zh) * | 2013-01-23 | 2014-07-23 | 成都勤智数码科技股份有限公司 | 一种适用于it运维系统的工单智能关联知识库知识的方法 |
CN105760493A (zh) * | 2016-02-18 | 2016-07-13 | 国网江苏省电力公司电力科学研究院 | 一种电力营销服务热点95598工单自动分类方法 |
US20190095865A1 (en) * | 2017-09-22 | 2019-03-28 | The Brandt Companies, LLC | Fabrication, distribution, and integrated order processing system |
CN107861942A (zh) * | 2017-10-11 | 2018-03-30 | 国网浙江省电力公司电力科学研究院 | 一种基于深度学习的电力疑似投诉工单识别方法 |
CN107992609A (zh) * | 2017-12-15 | 2018-05-04 | 广东电网有限责任公司信息中心 | 一种基于文本分类技术和决策树的投诉倾向判断方法 |
CN109063217A (zh) * | 2018-10-29 | 2018-12-21 | 广州供电局有限公司 | 电力营销系统中的工单分类方法、装置及其相关设备 |
Non-Patent Citations (1)
Title |
---|
余芳强等: "基于BIM的医院建筑智慧运维管理技术", 《中国医院建筑与装置》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536766A (zh) * | 2020-04-16 | 2021-10-22 | 浙江大搜车软件技术有限公司 | 一种汽车维保记录的解析方法和装置 |
CN113536766B (zh) * | 2020-04-16 | 2024-04-12 | 浙江大搜车软件技术有限公司 | 一种汽车维保记录的解析方法和装置 |
CN112288331A (zh) * | 2020-11-24 | 2021-01-29 | 哈尔滨工业大学 | 一种基于语义识别的建筑改建评估系统 |
CN112288331B (zh) * | 2020-11-24 | 2022-04-12 | 哈尔滨工业大学 | 一种基于语义识别的建筑改建评估系统 |
CN112488736A (zh) * | 2020-12-15 | 2021-03-12 | 济南市城乡建设数字化中心 | 一种住建领域政务热线工单数据分析方法及系统 |
CN114548445A (zh) * | 2022-02-28 | 2022-05-27 | 四川省建筑科学研究院有限公司 | 一种基于实时反馈的建筑运维管理系统 |
CN114462903A (zh) * | 2022-04-14 | 2022-05-10 | 四川省大数据中心 | 一种水电气业务报装系统 |
CN117114452A (zh) * | 2023-10-23 | 2023-11-24 | 中科云谷科技有限公司 | 用于确定施工方案的方法、处理器、装置及存储介质 |
CN117114452B (zh) * | 2023-10-23 | 2024-01-09 | 中科云谷科技有限公司 | 用于确定施工方案的方法、处理器、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110032643B (zh) | 2021-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110032643B (zh) | 一种建筑维修工单分析方法、装置、存储介质及客户端 | |
Peng et al. | A hybrid data mining approach on BIM-based building operation and maintenance | |
US12079777B2 (en) | Job description generation based on machine learning | |
US10883345B2 (en) | Processing of computer log messages for visualization and retrieval | |
CN106919689A (zh) | 基于术语释义知识单元的专业领域知识图谱动态构建方法 | |
CN117454492A (zh) | 一种基于bim技术的机电施工方法及系统 | |
US20130332812A1 (en) | Method and system to generate a process flow diagram | |
CN113987199B (zh) | 一种规范自动解译的bim智能审图方法、系统和介质 | |
Ren et al. | Semantic rule-based construction procedural information extraction to guide jobsite sensing and monitoring | |
CN114510566B (zh) | 基于工单的热词挖掘、分类和分析的方法和系统 | |
CN113779272A (zh) | 基于知识图谱的数据处理方法、装置、设备及存储介质 | |
CN114997263B (zh) | 基于机器学习的结训率分析方法、装置、设备及存储介质 | |
Martínez‐Rojas et al. | An approach for the automatic classification of work descriptions in construction projects | |
CN111553556A (zh) | 业务数据分析方法、装置、计算机设备及存储介质 | |
CN113688169A (zh) | 基于大数据分析的矿山安全隐患辨识与预警系统 | |
Wu et al. | Model validation using invariant signatures and logic-based inference for automated building code compliance checking | |
CN117807691A (zh) | 一种基于建筑可视化的信息模型数据集成方法及系统 | |
CN114491081A (zh) | 基于数据血缘关系图谱的电力数据溯源方法及系统 | |
KR102251426B1 (ko) | 맞춤형 예산 관리 시스템 | |
CN113420946B (zh) | 一种新闻媒体的评价方法 | |
Lawrence et al. | Counterfactual learning from human proofreading feedback for semantic parsing | |
CN111339290A (zh) | 一种文本分类方法和系统 | |
CN117094663A (zh) | 工程设计前置信息生成方法、信息显示方法及审图方法 | |
CN115577526B (zh) | 一种面向行人交通建模的定制建筑信息模型构建方法 | |
CN116703441A (zh) | 一种基于知识图谱的医疗项目成本核算可视分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |