发明内容
本申请预解决的技术问题是如何对工厂工程档案资料中非结构化的数据进行信息关联,以实现科学有效的数字化管理。
第一方面,一实施例中提供一种用于工厂工程档案资料的数字化管理方法,包括:
将非结构化的工程档案资料转换为图文档格式,并将转换为图文档格式的所述工程档案资料上传至一数字化管理平台;所述工程档案资料包括三维模型数据、工程图纸和/或档案文件资料;所述三维模型数据包括工厂的建构筑物模型、生产设备系统模型、生产管理系统模型和/或设备配件模型,所述设备配件模型包括仪表、阀门、管道、沟道和/或焊口;所述工程图纸包括设计资料和/或管线及施工图;所述档案文件资料包括工厂运维资料、清册报表、文件报告、技术规格书和/或设备厂家资料;
所述数字化管理平台将图文档格式的所述工程档案资料转换为HTML文本;
所述数字化管理平台对转换为HTML文本的所述工程档案资料进行文字识别,并将进行文字识别获取的文字存储在一预设的档案编码数据库中,所述档案编码数据库用于建立所述工程档案资料与对其进行文字识别获取的文字建立映射关系;
所述档案编码数据库按一预设的工厂对象编码规则,依据从所述工程档案资料进行文字识别获取的文字对所述工程档案资料进行编码,并将获取的编码作为对应所述工程档案资料的编码文件名;所述编码文件名包括部件标识、部件流水号、设备标识号、设备流水号、专业标识和位置标识;每个编码文件名对应一个所述工程档案资料;
所述档案编码数据库依据每个工程档案资料的编码文件名中的设备标识号,将所述工程档案资料归档到一工厂类别库中;所述工厂类别库用于采用信息索引方式实现工厂工程档案资料的信息关联。
一实施例中,所述图文档格式包括Rvm格式、Dvg格式、svg格式、sls/xlsx格式、doc/docx格式、ppt/pptx格式、pdf格式、png格式、jpg格式和tiff格式;其中,所述三维模型数据为Rvm格式,所述清册报表为doc/docx格式和/或ppt/pptx格式,所述文件报告为doc/docx格式和/或ppt/pptx格式,所述技术规格书和设备厂家资料为doc/docx格式和/或pdf格式,所述工程图纸为png格式、jpg格式和/或tiff格式。
一实施例中,所述Rvm格式包括存储模型中的树结构信息、节点信息、几何外形信息、颜色信息、法向量信息、纹理信息和设计属性信息。
一实施例中,所述工厂类别库的建立方法包括:
所述工厂类别库依据结构化的工程档案资料建立,是针对工厂的设备设施及管线按一预设关联规则建立的对象类库,用于对所述对象的描述进行分类及设定每个分类的属性,以实现对工厂全厂预设的对象进行统一的分类管理;所述对象包括建构筑物、系统、设备、仪表、阀门、管道、沟道和/或焊口。
一实施例中,所述预设关联规则是依据对所述对象的描述与三维模型数据、工程图纸和/或档案文件资料建立的至少两个所述对象之间的关联关系。
一实施例中,所述工厂类别库的建立方法还包括:
所述工厂类别库对每个所述对象按所述工厂对象编码规则进行编码,以获取对应每个所述对象的编码文件名。
一实施例中,所述编码文件名由数字和英文字母构成;其中,每个英文字母对应一种分类。
一实施例中,所述数字化管理方法还包括:
通过所述编码文件名查询所述对象及该对象关联的其它对象内容。
第二方面,一实施例中提供一种计算机可读存储介质,所述介质上存储有程序;所述程序能够被处理器执行以实现如第一方面所述的数字化管理方法。
第三方面,一实施例中提供一种用于工厂工程档案资料的数字化管理系统,用于应用如第一方面所述的数字化管理方法,所述数字化管理系统包括资料上传装置、数字化管理平台和类别库服务器:
所述资料上传装置用于将非结构化的工程档案资料转换为图文档格式,并将转换为图文档格式的所述工程档案资料上传至所述数字化管理平台;所述工程档案资料包括三维模型数据、工程图纸和/或档案文件资料;所述三维模型数据包括工厂的建构筑物模型、生产设备系统模型、生产管理系统模型和/或设备配件模型,所述设备配件模型包括仪表、阀门、管道、沟道和/或焊口;所述工程图纸包括设计资料和/或管线及施工图;所述档案文件资料包括工厂运维资料、清册报表、文件报告、技术规格书和/或设备厂家资料;
所述数字化管理平台用于将图文档格式的所述工程档案资料转换为HTML文本;所述数字化管理平台还用于对转换为HTML文本的所述工程档案资料进行文字识别,并将进行文字识别获取的文字发送至所述类别库服务器;
所述类别库服务器包括档案编码数据库和工厂类别库;所述类别库服务器用于将进行文字识别获取的文字存储在所述档案编码数据库中,所述档案编码数据库用于建立所述工程档案资料与对其进行文字识别获取的文字建立映射关系;所述档案编码数据库按一预设的工厂对象编码规则,依据从所述工程档案资料进行文字识别获取的文字对所述工程档案资料进行编码,并将获取的编码作为对应所述工程档案资料的编码文件名;所述编码文件名包括部件标识、部件流水号、设备标识号、设备流水号、专业标识和位置标识;每个编码文件名对应一个所述工程档案资料;所述档案编码数据库还用于依据每个工程档案资料的编码文件名中的设备标识号,将所述工程档案资料归档到所述工厂类别库中;所述工厂类别库用于采用信息索引方式实现工厂工程档案资料的信息关联。
如上述实施例中的数字化管理方法,通过识别非结构化的工程档案资料的文字进行编码命名,以依据编码文件名将其归档到工厂类别库中,实现对非结构化的工程档案资料的信息关联,以满足工厂对工程档案资料进行科学的、有效的数字化管理要求。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
在现有技术中,针对工厂全生命周期过程中涉及到的非结构化的工程档案资料主要以设施、设备、管线等三维模型为核心,对三维模型、文件、图纸、数据等多种信息进行手动关联,从而统一集成管理工厂中的模型数据、图纸文档、清册表单、运维资料、运行参数,实现工厂数据信息的对象化、可视化浏览,查询与管理,但是当交付的非结构数据图片、扫描版文档资料为成千上万份时通过手动关联所花费的时间也是相当巨大的,实施起来也很困难,在手动关联过程中可能会出现遗漏现象,对于该现象无有效的手段进行查缺补漏。同时也存在一些无三维模型的设施、设备、管线对象,对于这些对象无法有效管理。
在本申请实施例中,将工厂所有设备、设施、管线等工程数据进行全面对象化,按照对象类进行管理文件、图纸、模型、属性等信息建立对应的层级结构。首先识别并提取图片、扫描版文档的文字信息形成结构化数据,然后按照对象类进行管理关联关系规则及关联关系建立层级结构,最终将非结构化的数据实现信息关联。
实施例一
请参考图1,为一种实施例中数字化管理方法的流程示意图,该数字化管理方法用于对工厂非结构化的工程档案资料进行的数字化管理,具体包括:
步骤101,转换为图文档格式。
将非结构化的工程档案资料转换为图文档格式,并将转换为图文档格式的工程档案资料上传至一数字化管理平台。其中,工程档案资料包括三维模型数据、工程图纸和/或档案文件资料,三维模型数据包括工厂的建构筑物模型、生产设备系统模型、生产管理系统模型和/或设备配件模型,设备配件模型包括仪表、阀门、管道、沟道和/或焊口,工程图纸包括设计资料和/或管线及施工图,档案文件资料包括工厂运维资料、清册报表、文件报告、技术规格书和/或设备厂家资料。
图文档格式包括Rvm格式、Dvg格式、svg格式、sls/xlsx格式、doc/docx格式、ppt/pptx格式、pdf格式、png格式、jpg格式和tiff格式。其中,三维模型数据为Rvm格式,清册报表为doc/docx格式和/或ppt/pptx格式,文件报告为doc/docx格式和/或ppt/pptx格式,技术规格书和设备厂家资料为doc/docx格式和/或pdf格式,工程图纸为png格式、jpg格式和/或tiff格式。一实施例中,Rvm格式包括存储模型中的树结构信息(Tree)、节点信息(Node)、几何外形信息(Geomtry)、颜色信息(Color)、法向量信息(Mormal)、纹理信息(Texture)和设计属性信息(Att)。
步骤102,转换为HTML文本。
数字化管理平台将图文档格式的工程档案资料转换为HTML文本。HTML全称为超文本标记语言,是一种标记语言。它包括一系列标签.通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑整体。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字,图形、动画、声音、表格、链接等。超文本是一种组织信息的方式,它通过超级链接方法将文本中的文字、图表与其他信息媒体相关联。这些相互关联的信息媒体可能在同一文本中,也可能是其他文件,或是地理位置相距遥远的某台计算机上的文件。这种组织信息方式将分布在不同位置的信息资源用随机方式进行连接,为人们查找,检索信息提供方便。
步骤103,文字识别。
数字化管理平台对转换为HTML文本的工程档案资料进行文字识别,并将进行文字识别获取的文字存储在一预设的档案编码数据库中,档案编码数据库用于建立工程档案资料与对其进行文字识别获取的文字建立映射关系。一实施例中,对pdf格式、png格式、jpg格式和tiff格式采用OCR技术进行识别,对文件中的图片进行文字扫描识别,现有技术中OCR技术文字识别率达90%以上。一实施例中,对sls/xlsx格式、doc/docx格式和ppt/pptx格式采用Java POI组件读取其中的文字内容进行文字识别。一实施例中,对非图片的PDF格式的文件采用Java pdfbox组件读取非图片格式pdf文件内容中的文字。一实施例中,对Rvm格式的文字提取可直接读取自主三维模型数据库中Att设计属性中模型节点name的属性。
请参考图2,为一种实施例中档案编码数据库建立映射关系的示意图,一实施例中,档案编码数据库建立工程档案资料与对其进行文字识别获取的文字建立映射关系的方式包括:
建立文字库,并再文字库中分别建立对应不同工程档案资料的文字子库,例如,对文件、模型、图子和数据分别建立各自的文字子库。其中,对应文件的文字子库包含对应文件的ID和文件格式,对应模型的文字子库包含对应模型的ID和节点名称,对应图纸的文字子库包含对应图子的ID和图子格式,对应数据的文字子库包括数据ID和数据。
步骤104,获取编码文件名。
档案编码数据库按一预设的工厂对象编码规则,依据从工程档案资料进行文字识别获取的文字对工程档案资料进行编码,并将获取的编码作为对应工程档案资料的编码文件名。一实施例中,编码文件名包括部件标识、部件流水号、设备标识号、设备流水号、专业标识和位置标识。一实施例中,每个编码文件名对应一个工程档案资料。
请参考图3,为一种实施例中编码文件名的定义示意图,其中,大写的英文字母表示字母字符(除I和O及专用字符除外的A~Z英文字母或其它特殊字符),n表示数字字符(阿拉伯数字0~9)。一实施例中,根据工厂对象的编码正则表达式(如:[0-9]{2}[A-Z0-9]{3}[0-9]{2}[A-Z]{2}[0-9]{3})挖掘文字库中的编码,在工厂中,该编码代表设备设施管线等对象,需要记录在编码库中。
一种实施例中,通过对工程档案资料原始数据进行数据挖掘获取编码,例如:
原始数据为图纸(DWG格式或SVG格式),挖掘图纸中存在的编码,并将挖掘出来的每一个编码建立热点,以依据建立的编码热点作为编码文件名。
原始数据为文件(office格式、pdf格式、png格式、tif格式和jpg格式),挖掘文件中存在的编码作为编码文件名。
原始文件为模型(Rvm格式),挖掘模型节点名称中的编码,将节点的编码作为编码文件名。
步骤105,归档到工厂类别库中。
档案编码数据库依据每个工程档案资料的编码文件名中的设备标识号,将工程档案资料归档到一工厂类别库中。工厂类别库用于采用信息索引方式实现工厂工程档案资料的信息关联。
请参考图4,为一种实施例中工厂类别库的结构示意图,一实施例中,工厂类别库的建立方法包括:
工厂类别库依据结构化的工程档案资料建立,是针对工厂的设备设施及管线按一预设关联规则建立的对象类库,用于对对象的描述进行分类及设定每个分类的属性,以实现对工厂全厂预设的对象进行统一的分类管理,其中,对象包括建构筑物、系统、设备、仪表、阀门、管道、沟道和/或焊口。
请参考下表,为一种实施例中工厂类别库分类表。
类别编号 |
中文名称 |
英文名称 |
描述 |
运行参数表号 |
10 |
机组 |
Crew |
- |
- |
|
设备 |
Equipment |
- |
- |
|
容器 |
Vessel |
包括搅拌器、过滤器、储罐等 |
- |
AG048 |
泵 |
Pump |
包括离心泵、潜水泵,螺杆泵 |
- |
AG086 |
管道 |
PIPE |
包括水管道、气管道 |
- |
一实施例中,预设关联规则是依据对对象的描述与三维模型数据、工程图纸和/或档案文件资料建立的至少两个对象之间的关联关系。一实施例中,工厂类别库对每个对象按工厂对象编码规则进行编码,以获取对应每个对象的编码文件名。一实施例中,编码文件名由数字和英文字母构成,其中,每个英文字母对应一种分类。
一实施例中,归档到工厂类别库后,对象库仅有编码字段,其他字段的值需要通过上传属性文件将属性上传到对象库中,上传时根据属性文件中的编码与对象库中的编码相同进行自动匹配,补充其他属性字段的值。一实施例中,归档到工厂类别库后进行对象关联。关联规则的配置可以自动根据配置的关联规则建立对象之间的关联关系,挖掘完成后,通过对象自动创建与三维模型的关联、通过对象自动创建与图纸的关联、通过对象自动创建与文件的关联,同时也可以手动建立两个对象之间的关联关系。
一实施例中,数字化管理方法还包括:
步骤106,对象查询。
通过编码文件名查询所述对象及该对象关联的其它对象内容。
请参考图5,为一种实施例中数字化管理系统的结构示意图,本申请一实施例中还公开了一种数字化管理系统,用于应用如上所述的数字化管理方法。数字化管理系统包括资料上传装置10、数字化管理平台20和类别库服务器30。资料上传装置10用于将非结构化的工程档案资料转换为图文档格式,并将转换为图文档格式的工程档案资料上传至数字化管理平台20。工程档案资料包括三维模型数据、工程图纸和/或档案文件资料。三维模型数据包括工厂的建构筑物模型、生产设备系统模型、生产管理系统模型和/或设备配件模型,设备配件模型包括仪表、阀门、管道、沟道和/或焊口,工程图纸包括设计资料和/或管线及施工图,档案文件资料包括工厂运维资料、清册报表、文件报告、技术规格书和/或设备厂家资料。数字化管理平台20用于将图文档格式的工程档案资料转换为HTML文本。数字化管理平台20还用于对转换为HTML文本的工程档案资料进行文字识别,并将进行文字识别获取的文字发送至类别库服务器30。类别库服务器30包括档案编码数据库和工厂类别库。类别库服务器30用于将进行文字识别获取的文字存储在档案编码数据库中,档案编码数据库用于建立工程档案资料与对其进行文字识别获取的文字建立映射关系。档案编码数据库用于按一预设的工厂对象编码规则,依据从工程档案资料进行文字识别获取的文字对工程档案资料进行编码,并将获取的编码作为对应工程档案资料的编码文件名。编码文件名包括部件标识、部件流水号、设备标识号、设备流水号、专业标识和位置标识,每个编码文件名对应一个工程档案资料。档案编码数据库还用于依据每个工程档案资料的编码文件名中的设备标识号,将工程档案资料归档到工厂类别库中。工厂类别库用于采用信息索引方式实现工厂工程档案资料的信息关联。
本申请实施例中公开的数字化管理系统将工厂所有设备、设施、管线等工程数据进行对象化处理,以三维模型对象为核心,根据配置的关联关系,自动关联文件、图纸、模型、属性等信息。该数字化管理方法还根据配置的编码规则提取图片、扫描版文档的标识编码,自动根据关联关系将文档、图纸关联到三维模型,同时将关联关系使用关联列表进行管理,对应无三维模型的对象也可有效管理,对于遗漏的对象可以使用文档、图纸、模型、属性中的对象互相校验。
请参考图6,为另一种实施例中数字化管理方法的整体框架示意图,一实施例中,数字化管理方法通过组件读取非结构化图文档中的文字,读取自主三维模型数据库文件的编码属性文字,并存放在文字库中,根据编码规则从文字库中识别的标识编码,自动根据关联关系将文档、图纸、设计属性等关联到三维模型。还通过关联规则自动将图纸、文档、模型、设计属性关联到其他任意对象,实现图文档、模型、属性之间的相互关联查询。由于根据工厂对象特点,内置工程数据识别算法(如工厂索引表、编码规则等),提高工厂对象标识编码等信息的识别率。又由于根据算法库挖掘图文档、模型中的编码标识,图纸、文档、模型、属性均可根据关联关系关联到其他任意对象。还由于可以将算法库关系规则和结构层次按照对象类进行管理。
本申请实施例中公开的数字化管理方法和系统,首先将非结构化的工程档案资料转换为图文档格式;再由数字化管理平台将图文档格式的工程档案资料转换为HTML文本;然后通过档案编码数据库按一预设的工厂对象编码规则,依据从工程档案资料进行文字识别获取的文字对所述工程档案资料进行编码,以获取编码文件名;最后用于依据每个工程档案资料的编码文件名中的设备标识号,将工程档案资料归档到工厂类别库中。通过识别非结构化的工程档案资料的文字进行编码命名,以依据编码文件名将其归档到工厂类别库中,实现对非结构化的工程档案资料的信息关联,以满足工厂对工程档案资料进行科学的、有效的数字化管理要求。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。