CN112368657A - 管线和仪表图的机器学习分析 - Google Patents
管线和仪表图的机器学习分析 Download PDFInfo
- Publication number
- CN112368657A CN112368657A CN201980040226.5A CN201980040226A CN112368657A CN 112368657 A CN112368657 A CN 112368657A CN 201980040226 A CN201980040226 A CN 201980040226A CN 112368657 A CN112368657 A CN 112368657A
- Authority
- CN
- China
- Prior art keywords
- symbol
- tag
- label
- feedback
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 49
- 238000010586 diagram Methods 0.000 title claims abstract description 8
- 238000004458 analytical method Methods 0.000 title claims description 21
- 238000000034 method Methods 0.000 claims abstract description 107
- 238000003860 storage Methods 0.000 claims description 33
- 238000001914 filtration Methods 0.000 claims description 29
- 238000007781 pre-processing Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 24
- 238000013527 convolutional neural network Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 10
- 238000004886 process control Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 9
- 230000005055 memory storage Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 12
- 238000000605 extraction Methods 0.000 abstract description 10
- 238000011156 evaluation Methods 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 13
- 238000012937 correction Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 9
- 230000003190 augmentative effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 230000003321 amplification Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000006855 networking Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
Abstract
来自管线和仪表图(P&ID)的信息的自动评估和提取。所述系统和方法的各方面利用机器学习和图像处理技术从P&ID中提取相关信息,诸如标签名称、标签编号和符号及其位置。进一步的方面将错误反馈给机器学习系统以更新其学习并改善所述系统和方法的操作。
Description
技术领域
本公开的各方面一般而言涉及工业过程自动化和控制系统。更具体而言,本公开的各方面涉及从管线和仪表图(P&ID)自动评估和提取信息的系统和方法。
背景技术
通常以硬拷贝打印输出或便携式文档文件(PDF)格式的形式向项目工程师提供P&ID。必须手动分析这些图以提取与标签、循环和相关联的元数据相关的信息。这种手动分析既耗时又容易出错。例如,分析每个图可以花费几分钟(例如,30到90),因此每个项目总计要花很多小时。而且,手动工作中的任何错误都要求返工,这是浪费且昂贵的(例如,损失的时间、延迟罚款等)。此外,因为项目工程活动位于关键链路径上,所以延迟完成这种工程工作会造成工业过程调试的延迟。最多,常规技术利用系统和方法来数字化P&ID,例如诸如经由光学字符识别(OCR)。但是,这些常规技术是静态的,要求确切匹配才能识别字符和几何形状,并且必须被重新编码才能接受新的符号或字符。
发明内容
本发明的各方面利用机器学习和图像处理技术来分析P&ID,以从图中提取相关信息,诸如标签名称、标签编号、符号及其相对位置。本发明的各方面附加地将错误反馈给机器学习系统,以更新其学习并改善系统的操作。错误反馈使本文描述的技术能够以最少的编码或无需编码来学习新的对象和文本。
实施本公开的各方面的计算机实现的方法包括在访问P&ID的图像的计算设备上执行的机器学习系统。在计算设备上执行的符号分类引擎确定所访问的图像是否包括指示过程控制元件的符号。使用监督式学习来训练符号分类系统,以基于所访问的图像是否包括指示过程控制元件的符号来将图像分类为多个类。在确定所访问的图像包括符号后,将符号输出存储在计算机可读存储器存储设备中。在计算设备上执行的标签分类引擎确定所访问的图像是否包括与该符号对应的标签。使用监督式学习来训练标签分类引擎,以基于所访问的图像是否包括标签来将图像分类为多个类。在确定所访问的图像包括标签后,将标签输出存储在计算机可读存储器存储设备中。
实施本公开的各方面的系统包括P&ID分析处理器和计算机可读存储设备。该存储设备存储处理器可执行指令,该处理器可执行指令在由处理器执行时包括图像转换器、一个或多个过滤算法、符号提取器、一个或多个标签预处理算法、标签提取器和智能系统。图像转换器被配置为接收电子格式的P&ID,并将其转换成图像格式的计算图像。过滤算法被配置为处理计算图像以获得图像中符号的近似尺寸。符号提取器被配置为从计算图像中提取符号并将提取出的符号存储在计算机可读存储设备上。标签预处理算法被配置为从计算图像中的符号移除符号线。标签提取器被配置为提取计算图像中的符号的标签成分,并将提取出的标签存储在计算机可读存储设备上。并且智能系统被配置为从过滤算法接收符号反馈、从标签后处理算法接收标签反馈、基于接收到的符号反馈来重新训练符号提取器,并且基于接收到的标签反馈来重新训练标签提取器。
实施本公开的各方面的另一种计算机实现的方法包括接收数字化的P&ID并使用符号引擎来分析数字化的P&ID以从中识别并提取符号。以一种形式,分析导致至少一个符号错误。标签引擎被用于分析数字化的P&ID,以识别并从中提取标签。以一种形式,分析产生至少一个标签错误。提取出的符号和标签被存储在计算机可读存储介质上。基于至少一个符号错误来重新训练符号引擎,并且基于至少一个标签错误来重新训练标签引擎。
其它目的和特征将部分地显而易见并且部分地在下文中指出。
附图说明
图1图示了根据实施例的演化的管线和仪表图(P&ID)分析系统和方法。
图2图示了图1的演化的P&ID分析系统和方法的另一个实施例。
图3图示了根据实施例的将P&ID转换成图像格式的示例性过程。
图4A图示了根据实施例的计算P&ID中的符号的近似尺寸的示例性过程。
图4B图示了根据实施例的用于通过预测符号中的圆圈的半径来计算输入P&ID图像的比例的示例性卷积网络。
图5A图示了根据实施例的检测降级的图像(stepped down image)中的符号的示例性过程。
图5B图示了根据实施例的用于识别降级的图像中的符号的示例性卷积网络。
图6A图示了根据实施例的从检测到的符号中移除符号线的示例性过程。
图6B图示了根据实施例的在符号线已经被移除之后符号的标签成分的示例性输出。
图6C图示了根据实施例的提取出的标签的示例性输出。
图7A图示了根据实施例的提取符号的标签成分的示例性过程。
图7B图示了根据实施例的示例性滑动窗口分割技术。
图7C图示了根据实施例的示例性字符识别网络。
图7D图示了图7C的字符识别网络的判定器卷积网络。
图7E图示了图7C的字符识别网络的单字符卷积网络。
图7F图示了图7C的字符识别网络的辅助单词卷积网络。
图8、9和10图示了图1的演化的P&ID分析系统和方法的示例性工作流程。
图11图示了图1的演化的P&ID分析系统和方法的机器学习模型、自动反馈和手动反馈之间的关系。
图12图示了根据实施例的基于反馈来更新智能系统的示例性过程。
图13图示了被编程为提供图1的演化的P&ID分析系统和方法的各方面的计算设备的示例性体系架构。
图14图示了本公开的各方面可被结合在其中的示例性工业过程系统。
在所有附图中,对应的附图标记指示对应的部分。
具体实施方式
参考图1,总体上以100指示的演化的管线和仪表图(P&ID)分析系统和方法从图中提取相关信息,并将错误反馈给机器学习系统,以更新其学习并改善系统和方法的操作。以这种方式,系统和方法100的各方面被配置为学习图中的新对象和文本,而无需大量的新编码,并且更新和训练针对跨全局(例如,全局学习)的所有项目或跨给定项目(例如,本地学习)的模型。如图1中所示,系统100包括P&ID 102、机器学习系统104、自动反馈/校正组件106、应用108、手动反馈/校正组件110、图形用户界面(GUI)112和分析器114。
将P&ID 102馈送到机器学习系统104中,并且机器学习系统104利用机器学习和图像处理技术从P&ID 102中提取相关信息,诸如标签名称、标签编号和符号。以一种形式,P&ID 102包括信息,诸如标签名称、标签编号和符号,其表示适于改变或精炼原材料以产生最终产品的工业过程系统的各方面。示例性过程包括但不限于化学、石油和天然气、食品和饮料、制药、水处理和电力行业中的那些。例如,过程可以包括泵、阀门、传感器、输送机、配电系统和/或不能中断的过程或操作。
在实施例中,经由能够促进数据交换的一个或多个通信网络来接收P&ID 102。例如,通信网络可以包括可连接到其它电信网络的广域网(WAN)和/或局域网(LAN),其它电信网络包括其它WAN、LAN和/或互联网或内联网的一部分。例如,通信网络可以是促进数据交换的任何电信网络,诸如根据IEEE 802.3(例如,以太网)和/或IEEE 802.11(例如,Wi-Fi)协议操作的那些通信网络。在另一个实施例中,通信网络是允许数据通过串行或并行通信信道(例如,铜线、光纤、计算机总线、无线通信信道等)被物理传送的任何介质。在实施例中,通信网络至少部分地包括过程控制网络。在另一个实施例中,通信网络至少部分地包括监督控制和数据采集(SCADA)系统。在又一个实施例中,通信网络至少部分地包括企业制造智能(EMI)/操作智能(OI)系统。
机器学习系统104实现图像处理和/或几何算法以减少噪声并增强其准确性。自动反馈/校正组件106包括被配置为检测从机器学习系统104接收的输出中的错误的规则和算法。这些错误被用于自动校正输出,并经由分析器114反馈回机器学习系统104中,以更新机器学习系统104的学习并改善系统100。来自自动反馈/校正组件106的经处理的输出然后经由应用108显示给用户以进行验证。由用户进行的校正由手动反馈/校正组件110捕获并保存在应用108中,并经由分析器114反馈回机器学习系统104中,以更新机器学习系统104的学习并改善系统100。以这种方式,系统和方法100使用机器学习和图像处理算法持续地演化以自动评估P&ID 102并提取相关信息,诸如标签名称、标签编号、符号及其类别(例如,传感器、显示器、马达、泵、阀门等)、它们在P&ID中的位置、单元、工厂、区域以及修订号。
图2图示了系统和方法100的另一个实施例。在这个实施例中,系统和方法100包括P&ID 102、图像转换器204、过滤算法206、符号提取208、标签预处理210、标签提取212、规则引擎214、行提取216、智能系统218、自动反馈/校正组件106、应用108、手动反馈/校正组件110和GUI 112。在实施例中,图像转换器204、过滤算法206、符号提取208、标签预处理210、标签提取212、规则引擎214、行提取和智能系统218至少部分地包括机器学习系统104和/或分析器114。
图像转换器204被配置为将P&ID 102转换成图像格式。图3图示了图像转换器204将P&ID 102转换成图像格式的示例性方法,总体上以300指示。在实施例中,图像转换器204在302处获得便携式文档文件(PDF)或其它电子数据格式的P&ID 102。在304处,图像转换器204将它们转换成任何图像格式。示例性图像格式包括但不限于便携式网络图形(PNG)格式、联合图像专家组(JPEG)格式、图形交换格式(GIF)等。在实施例中,图像转换器204在306处创建两个图像文件,其中之一用于显示(例如,经由应用108和/或GUI 112),并且其中之一用于计算(例如,通过过滤算法206、符号提取208、标签预处理210、标签提取212、规则引擎214、行提取216和智能系统218的分析)。图像转换器204可以以各种尺寸(例如,16.54×11.69英寸、34.00×22.00英寸等)接收P&ID 102。图像转换器204在308处设置为计算目的而创建的图像(即,“计算图像”)的分辨率,并且在310处设置为显示目的而创建的图像(即,“显示图像”)的分辨率。由图像转换器204创建的图像的每英寸最大点数(dpi)被计算为300000/(以英寸为单位的长度×宽度)。在实施例中,计算图像具有800dpi的最大上限,并且显示图像具有大约200dpi的分辨率。
在实施例中,图像转换器204包括实施在存储存储器设备上的处理器可执行指令,以经由软件环境提供图像转换器204。例如,根据本公开的示例性实施例,图像转换器204可以被提供为处理器可执行指令,其包括被计算设备独立使用或结合系统100的附加方面使用的过程、函数、例程、方法和/或子程序,如本文进一步描述的。
再次参考图2,在一些实施例中,P&ID 102包括可以使用现成的库提取的几何和文本信息。在这些实施例中,将P&ID 102直接馈送到机器学习系统104(例如,过滤算法206)中以识别其类型和提取出的文本,而无需首先将其馈送到图像转换器204中。
过滤算法206被配置为处理计算图像以获得其中的符号的近似尺寸。示例性符号包括但不限于那些符合针对仪器、控制/显示元件、可编程逻辑控制器(PLC)、阀门、泵等的国际自动化协会(ISA)标准的符号。在实施例中,符号包括标识字母(例如,FIC)和标签号(例如,123)。获得符号的近似尺寸有助于对用于P&ID符号检测的系统和方法100的机器学习方面的输入进行归一化,这有助于避免为不同尺寸的符号创建训练数据。
图4A图示了总体上以400指示的用于计算近似符号尺寸的示例性方法。过滤算法206在402处假设符号的初始尺寸。在实施例中,初始尺寸是200×200像素。在404处,过滤算法206将计算图像降级以减小符号尺寸。在实施例中,将计算图像降级,使得假设的符号尺寸是52×52像素。过滤算法206在406处从降级的图像中移除大的(例如,大于P&ID的高度的75%等)线(水平和垂直)。在408处,过滤算法206对降级的图像执行窗口滑动算法,并在410处经由总体符号识别技术检查给定窗口中的符号,如本文进一步描述的。在实施例中,窗口滑动算法检测降级的图像中具有跨尺寸为52×52像素的窗口分布的黑色像素的区域。过滤算法206记录已识别出的符号在降级的图像中的位置,并使用那个位置来计算已识别出的符号在计算图像中的位置。然后,过滤算法206在412处对提取出的符号和集合执行圆圈检测算法(例如,“只看一次”(YOLO)算法的改编),以在414处预测输入P&ID图像的比例、计算图像的符号的计算出的长度。在实施例中,跨所有检测到的图像执行圆圈检测算法以获得最频繁出现的圆圈的直径,并且将最频繁的直径设置为计算图像的符号的计算出的长度。本领域普通技术人员将理解的是,本文描述的像素尺寸是示例性的,并且在本公开的一个或多个方面内,可以使用任何其它尺寸来实现相似的结果。
在实施例中,过滤算法206包括实施在存储存储器设备上的处理器可执行指令,以经由软件环境提供过滤算法206。例如,根据本公开的示例性实施例,过滤算法206可以被提供为处理器可执行指令,其包括被计算设备独立使用或结合系统100的附加方面使用的过程、函数、例程、方法和/或子程序,如本文进一步描述的。
图4B图示了总体上以422指示的被配置为预测圆圈半径的示例性卷积网络。在实施例中,卷积网络422输入各自具有52×52像素的尺寸的二进制图像的一个通道,并输出指示该符号是否是圆圈、中心坐标和半径的数组(例如,[is-Circle?,center_x,center_y,radius])。有益地,这有助于识别输入图像的比例。以一种形式,卷积网络422在3200个原始训练数据单元上包括92%的训练准确度,并且不利用扩增的训练数据。
再次参考图2,符号提取器208被配置为检测降级的图像中的符号。图5A图示了总体上以500指示的用于检测降级的图像中的符号的示例性方法。在502处,符号提取器208应用图像处理算法以识别具有52×52像素的符号尺寸的降级的图像中符号的可能区域。在504处,符号提取器208经由总体符号识别技术来检测符号、它们的确切类型以及它们在降级的图像(52×52像素)中的位置。在506处,符号提取器208增加用于任何新检测到的符号的计数器。以这种方式,符号提取器208跟踪检测到的符号的数量,并且可以确定在当前执行周期期间是否检测到任何新的符号。当在当前周期期间符号计数增加时,该方法返回到步骤502并重复。当当前周期期间符号计数未增加时,该方法结束。
在实施例中,符号提取器208包括实施在存储存储器设备上的处理器可执行指令,以经由软件环境提供符号提取器208。例如,根据本公开的示例性实施例,符号提取器208可以被提供为处理器可执行指令,其包括被计算设备独立使用或结合系统100的附加方面使用的过程、函数、例程、方法和/或子程序,如本文进一步描述的。在实施例中,过滤算法206和符号提取器208至少部分地包括符号分类引擎。
图5B图示了总体上以508指示的被配置为识别降级的图像中的符号的示例性卷积网络。在实施例中,卷积网络508输入各自具有64×64像素的尺寸的二进制图像的一个通道,并输出检测到的符号的名称。以一种形式,卷积网络508包括6073个原始训练数据单元,并利用151790个扩增的训练数据单元(例如,用于训练的144156个和用于验证的7581个)。下表描述了根据本公开的一方面的用于卷积网络508的示例性扩增技术。
再次参考图2,标签预处理210被配置为从计算图像中的检测到的符号中移除符号线,在计算图像中仅留下标签成分(例如,标识字母和标签编号)。图6A图示了总体上以600指示的用于从检测到的符号中移除符号线的示例性方法。在602处,标签预处理算法210使符号居中。然后,标签预处理算法210在604处从符号中移除符号线,仅留下标签成分。在606处,标签预处理算法210将连接的像素聚类,并移除小于标准文本尺寸且大于标准文本尺寸的任何东西。每个集群都有边界框。标签预处理算法210在608处以相同的级别并且按照从左到右的次序找到边界框。以这种方式,标签预处理算法210被配置为移除非标签像素和噪声。图6B图示了在移除符号线之后(例如,在步骤604之后)的符号的标签成分的示例性输出,并且图6C图示了提取出的标签的示例性输出(例如,在步骤606和608之后)。
在实施例中,标签预处理算法210包括实施在存储存储器设备上的处理器可执行指令,以经由软件环境提供标签预处理算法210。例如,根据本公开的示例性实施例,标签预处理算法210可以被提供为处理器可执行指令,其包括被计算设备独立使用或结合系统100的附加方面使用的过程、函数、例程、方法和/或子程序,如本文进一步描述的。
再次参考图2,标签提取器212被配置为提取计算图像中的符号的标签成分。图7A图示了总体上以700指示的用于提取符号的标签成分的示例性方法。在实施例中,标签包括标签名称和标签编号,并且经由机器学习来识别。在一些实施例中,标签名称和/或标签编号中的相邻字符彼此结合,并且必须经由一种或多种分割技术来分离。在702处,标签提取器212检查标签的字符中的垂直间隙。当存在垂直间隙时,标签提取器212在704处对字符进行分割,然后使用机器学习技术执行字符识别。当不存在垂直间隙时,标签提取器212确定给定字符集的宽高比是否大于预定阈值(例如,0.6等)。当宽高比大于预定阈值时,标签提取器212使用垂直方向上的像素密度应用分割。示出白色像素的峰的区域是连接的字符中可能的拆分区域。此后,标签提取器212使用机器学习技术执行字符识别。当宽高比小于或等于阈值时,标签提取器212使用机器学习技术执行字符识别。当字符识别失败时,标签提取器212确定字符的尺寸是否小(例如,应用检查以照顾未被先前技术拆分的字符)。此外,在708处,标签提取器212应用滑动窗口分割技术。当滑动窗口分割技术无法识别字符时,将重复该过程,但是任何字符识别导致或具有小尺寸输出的方法都有助于停止滑动窗口。
在实施例中,标签提取器212包括实施在存储存储器设备上的处理器可执行指令,以经由软件环境提供标签提取器212。例如,根据本公开的示例性实施例,标签提取器212可以被提供为处理器可执行指令,其包括被计算设备独立使用或结合系统100的附加方面使用的过程、函数、例程、方法和/或子程序,如本文进一步描述的。在实施例中,标签预处理算法210和标签提取器212至少部分地包括标签分类引擎。
图7B图示了滑动窗口分割技术的各方面。在712处,将字符“S”和“V”结合在一起,并且标签提取器212利用滑动窗口710-A来对其进行分割。标签提取器212测试给定的滑动是否产生由机器学习(例如,机器学习系统104)识别的任何字符。如果不是,那么标签提取器212减小滑动窗口710-A的尺寸,在714处示出的,并重复该过程。当机器学习组件识别出字符时,在716处示出的,标签提取器212存储该字符并将窗口前进到下一个位置。如在718处所示,用另一个滑动窗口710-B针对下一个字符重复步骤。
图7C图示了根据本公开的一方面的包括标签提取器212的示例性字符识别网络720。字符识别网络720被划分为两个级别。网络720的第一级别是判定器网络722。判定器网络722判定输入图像是字符(例如,单个字符、字母数字等)还是辅助词(例如,多字符)。判定器网络720的第二级别包括单字符网络724和辅助词网络726。
图7D将判定器网络722图示为卷积神经网络。在实施例中,判定器网络722输入各自具有64×64像素的尺寸的二进制图像的一个通道,并输出进一步的字符分类所需的网络的类型。以一种形式,判定器网络722在4431个原始训练数据单元上包括99.1%的训练准确度,并利用75339个扩增的训练数据单元(例如,用于训练的71575个和用于验证的3764个)。下表描述了根据本公开的一方面的用于判定器网络722的示例性扩增技术。
图7E图示了作为卷积网络的单字符网络724。在实施例中,单字符网络724输入各自具有64×64像素的尺寸的二进制图像的一个通道,并输出识别出的字符。以一种形式,单字符网络724在4431个原始训练数据单元上包括98.5%的训练准确度,并利用72882个扩增的训练数据单元(例如,用于训练的69271个和用于验证的3611个)。下表描述了根据本公开的一方面的用于单字符网络724的示例性扩增技术。
图7F图示了作为卷积网络的辅助词网络726。在实施例中,辅助词网络726输入各自具有64×64像素的尺寸的二进制图像的一个通道,并输出检测到的符号的名称。以一种形式,辅助词网络726在1228个原始训练数据单元上包括98.2%的训练准确度,并利用20812个扩增的训练数据单元(例如,用于训练的19805个和用于验证的1007个)。下表描述了根据本公开的一方面的用于辅助词网络726的示例性扩增技术。
再次参考图2,规则引擎214被配置为基于一个或多个规则来核实从计算图像中提取出的标签。在实施例中,规则基于ISA符号标准,并且被划分为两类:主要合规性检查(例如,红色类别)和次要合规性检查(例如,橙色类别)。示例性主要合规性检查包括但不限于核实符号是有效类型之一(例如,现场设备、控制室显示器等),以及核实标签名称具有一个或多个标识字母。示例性次要合规性检查包括但不限于核实标签名称中的标识字母不包含任何数字数位,以及标签名称中的标签编号除末尾以外不包含任何字母字符。在实施例中,规则引擎214包括实施在存储存储器设备上的处理器可执行指令,以经由软件环境提供规则引擎214。例如,根据本公开的示例性实施例,规则引擎214可以被提供为处理器可执行指令,其包括被计算设备独立使用或结合系统100的附加方面使用的过程、函数、例程、方法和/或子程序,如本文进一步描述的。
线提取器216被配置为提取计算图像中的符号之间的线。在实施例中,提取出的线包括管线和连接符号,诸如管线、过程连接、电气信号、气动信号、数据链路、用于填充的系统的毛细管道、液压信号线以及引导的电磁或声音信号。如本领域普通技术人员将理解的,使用几何线拟合算法从图像中提取线。一旦线被提取出,就使线的一部分经受一个或多个机器学习模型,以获得如上面所提到的线的类型。在实施例中,线提取器216包括实施在存储存储器设备上的处理器可执行指令,以经由软件环境提供线提取器216。例如,根据本公开的示例性实施例,线提取器216可以被提供为处理器可执行指令,其包括被计算设备独立使用或结合系统100的附加方面使用的过程、函数、例程、方法和/或子程序,如本文进一步描述的。
应用108被配置为经由GUI 112(例如,在计算设备的显示设备上)显示信息,以使人类用户能够查看和/或核实所有机器识别出的符号和标签,添加、编辑和/或删除符号和标签,并将结果保存(例如,保存数据226)到计算机可读存储设备中以供下游消费。示例性下游任务包括但不限于仪器标签列表验证、控制和安全性软件工程、硬件工程、HMI和测试任务的自动化以及用分层信息构建资产模型。在实施例中,应用108包括实施在存储存储器设备上的处理器可执行指令,以经由软件环境提供应用108。例如,根据本公开的示例性实施例,应用108可以被提供为处理器可执行指令,其包括被计算设备独立使用或结合系统100的附加方面使用的过程、函数、例程、方法和/或子程序,如本文进一步描述的。根据本公开的各方面,应用可以包括桌面应用和/或web浏览器应用。根据本公开的各方面,图8图示了利用应用108的系统和方法100的示例性工作流800,并且图9图示了利用应用108的系统和方法100的示例性工作流900。
图10图示了根据本公开的一方面的利用应用108的系统和方法100的示例性自动化工作流1000。在1002处,在web浏览器中打开应用108(例如,P&ID应用)。当在系统100中创建新项目时,工作流进行到1004,在其中创建新项目。继续到1006,P&ID 102批量上传,然后工作流前进到1016。当利用系统100中的现有项目时,工作流前进到1008,在其中打开现有项目。在实施例中,在1010处,新的P&ID 102被添加到系统,然后工作流前进到1016。在另一个实施例中,在1012处将修订后的P&ID 102添加到系统。在1014处,找出差异(例如,修订),然后工作流前进到1016。在1016处,系统100检查标签和符号类型的正确性并获得批准。系统100在1018处识别丢失的符号并添加标签。在1020处,系统100下载标签列表(例如,以逗号分隔的值(csv)格式等)。
再次参考图2,智能系统218被配置为实现机器学习算法以识别计算图像中的符号。在实施例中,由智能系统218实现的机器学习算法是确切的符号识别步骤。在确切的符号识别步骤中,智能系统218将深度神经网络应用于通过整个图像上的滑动窗口获得的图像的特定区域。这种深层的神经网络导致符号候选的多类分类。在实施例中,按照ISA符号体系对符号进行分类。示例性符号包括但不限于仪器、控制/显示元件、可编程逻辑控制器(PLC)、阀门、泵等。如本文进一步描述的,智能系统218利用至少三种类型的卷积神经网络来识别标签和/或标签字符。三种类型包括:判定器网络(例如,判定器网络722),以决定输入是单个还是多个字符;单字符网络(例如,单字符网络724),以识别单个字母和数字字符;以及多字符网络(例如,辅助词网络726),以识别多个字符或词。在实施例中,智能系统218利用基于上下文的预测来区分相似的字符,诸如大写字母“I”与数字“1”以及数字“0”与字母“O”等。
如图2中所示,智能系统218接收反馈,诸如自动反馈106和手动反馈110。智能系统218利用这些反馈校正来训练机器学习算法,并提高系统100从P&ID 102提取相关信息的能力。以这种方式,智能系统218利用监督式学习。图11图示了智能系统218的机器学习模型、自动反馈106和手动反馈110之间的关系。手动反馈110被用于直接训练机器学习模型,并且还控制自动反馈106的各方面。自动反馈106还训练机器学习模型。在实施例中,自动反馈106包括对符号的验证以及对标签和/或字符的验证。对符号的示例性验证包括但不限于核实符号具有分布良好的像素并且黑色或白色像素的高密度指示不存在符号。标签和/或字符的示例性验证包括但不限于核实标签和/或字符具有与符号的尺寸成比例的最小和最大尺寸、核实给定字符是否由连续的相连像素组成(例如,任何间隙都指示非字符),并核实单个字符具有在大约0.2到大约0.8之间的宽高比。智能系统218从应用108接收手动反馈110。
图12图示了总体上以1200指示的基于反馈来更新智能系统218的示例性方法。在1202处,智能系统218接收自动反馈106,并确定机器学习模型与接收到的自动反馈106之间是否存在差异。当不存在差异时,不更新模型。但是,当机器学习模型与接收到的自动反馈106之间存在至少一个差异时,智能系统218在1204处重新计算机器学习模型。当智能系统218接收到手动反馈110时,它在1204处直接重新计算机器学习模型。在1206处,智能系统218确定系统中是否存在任何回归。当未找到回归时,系统在1212处自动更新模型。当找到回归时,将警报发送给专家(例如,经由应用108),以做出关于是否更新模型的决定。
图13图示了计算设备1300的示例性体系架构,该计算设备1300被编程为经由软件环境提供演进的P&ID分析系统和方法100的各方面。在这个实施例中,计算设备1300包括P&ID分析处理器1302、存储器1304以及与I/O组件1308接口的输入/输出(I/O)接口1306。存储器1304包括P&ID 102、图像转换器204、(一个或多个)计算图像、过滤算法206、符号提取器208、标签预处理算法210、标签提取器212、规则引擎214、线提取器216、智能系统218、保存数据226、自动反馈106、应用102、GUI 112和手动反馈110,这些各自实施在处理器可执行指令中以供处理器1302执行。
处理器1302、存储器1304和I/O接口1306彼此通信连接和/或电连接。I/O接口1306通信和/或电连接到I/O组件1308。处理器1302适于执行存储在存储器1302中的处理器可执行指令,以实现图像转换器204、过滤算法206、符号提取器208、标签预处理算法210、标签提取器212、规则引擎214、线提取器216、智能系统218、自动反馈106、应用108和手动反馈110。图13的I/O接口1306在计算设备1300和I/O组件1308之间提供物理数据连接。在实施例中,如本文进一步描述的,I/O接口1306是网络接口卡(NIC)或调制解调器,并且I/O组件1308是电信网络。
图14图示了总体上以1400指示的可以在其中实现本公开的各方面的示例性工程系统和方法。在实施例中,在1402处,将P&ID 102提供给应用108。在实施例中,项目工程师以PDF文件格式提供P&ID 102。在1412处,应用108将接收到的P&ID 102(例如,PDF文件)写入(例如,保存数据226)到存储器设备1304。在实施例中,存储器设备1304包括硬盘驻留文件系统。在1414处,应用108还在SQL服务器1402上创建作业,并在1418处将作业信息添加到SQL数据库1404。作业管理器服务1406从SQL数据库1404读取1420作业信息,并将作业指派1422给核心服务1408。核心服务1408在1424处从存储器设备1304读取P&ID 102(例如,PDF文件),并且对其执行本文描述的演进的P&ID分析技术。核心服务1408在1426处将分析的结果集(例如,JSON文件、符号文件、符号数据等)存储到存储器设备1304,并且在1428处将结果集从存储设备1304提供给应用108。核心服务1408还在1430处更新SQL数据库1404中的作业信息。在1418处,通过HMI应用108进行的任何改变(例如,由项目工程师等进行的改变)都记录在SQL DB 1404中,并且这个信息在1416处经由SQL服务器1402提供给智能系统218(例如,“学习系统”)以便用新的学习来更新机器学习模型。
在一方面,本公开提供了一种计算机实现的方法,该方法从P&ID提取相关信息并将信息反馈回机器学习组件以进行自我演进和自我学习。该方法包括在访问(例如,来自图像转换器204的)P&ID的图像的计算设备(例如,计算设备1300)上执行的机器学习系统(例如,机器学习系统104)。在计算设备上执行的符号分类引擎(例如,过滤算法206、符号提取器208、自动反馈106和/或智能系统218)确定所访问的图像是否包括指示过程控制元件(例如,流体处理系统1410的组件)的符号。使用监督式学习来训练符号分类系统,以基于所访问的图像是否包括指示过程控制元件的符号以及该符号在P&ID中的相对位置来将图像分类为多个类别。在确定所访问的图像包括符号后,将符号输出(例如,保存的数据226)存储在计算机可读存储器存储设备(例如,存储器1304)中。在计算设备上执行的标签分类引擎(例如,标签预处理算法210、标签提取器212、自动反馈106和/或智能系统218)确定所访问的图像是否包括与该符号对应的标签。使用监督式学习来训练标签分类引擎,以基于所访问的图像是否包括标签来将图像分类为多个类别。在确定所访问的图像包括标签后,将标签输出(例如,保存的数据226)存储在计算机可读存储器存储设备中。
在另一方面,一种系统包括处理器(例如,处理器1302)和计算机可读存储设备(例如,存储器1304)。存储设备存储处理器可执行指令,该处理器可执行指令在由处理器执行时包括图像转换器(例如,图像转换器204)、一个或多个过滤算法(例如,过滤算法206)、符号提取器(例如,符号提取器208)、一个或多个标签预处理算法(例如,标签预处理算法210)、标签提取器(例如,标签提取器212)和智能系统(例如,智能系统218)。图像转换器被配置为接收电子格式的P&ID,并将其转换成图像格式的计算图像。过滤算法被配置为处理计算图像,以获得图像中符号的近似尺寸。符号提取器被配置为从计算图像提取符号并将提取出的符号存储在计算机可读存储设备上。标签预处理算法被配置为从计算图像中的符号移除符号线。标签提取器被配置为在计算图像中提取符号的标签成分,并将提取出的标签存储在计算机可读存储设备上。并且智能系统被配置为从过滤算法接收符号反馈、从标签预处理算法接收标签反馈、基于接收到的符号反馈来重新训练符号提取器,并且基于接收到的标签反馈来重新训练标签提取器。
在另一方面,本公开提供了一种从P&ID提取相关信息并重新训练机器学习组件的计算机实现的方法。该方法包括接收数字化的P&ID并使用符号引擎(例如,过滤算法206、符号提取器208、自动反馈106和/或智能系统218)来分析数字化的P&ID,以从中识别和提取符号。以一种形式,分析导致至少一个符号错误。标签引擎(例如,标签预处理算法210、标签提取器212、自动反馈106和/或智能系统218)被用于分析数字化的P&ID,以识别并从中提取标签。以一种形式,分析导致至少一个标签错误。提取出的符号和标签被存储在计算机可读存储介质(例如,存储器1304)上。基于至少一个符号错误来重新训练符号引擎,并且基于至少一个标签错误来重新训练标签引擎。
本公开的实施例可以包括专用计算机,该专用计算机包括各种计算机硬件,如下面更详细地描述的。
在本公开的范围内的实施例还包括用于携带或具有存储在其上的计算机可执行指令或数据结构的计算机可读介质。这样的计算机可读介质可以是可以由专用计算机访问的任何可用介质,并且包括计算机存储介质和通信介质。作为示例而非限制,计算机存储介质包括以用于存储信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质,诸如计算机可读指令、数据结构、程序模块或其它数据。计算机存储介质是非暂态的,并且包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程ROM(EEPROM)、光盘ROM(CD-ROM)、数字多功能盘(DVD)或其它光盘存储装置、固态驱动器(SSD)、磁带盒、磁带、磁盘存储装置或其它磁性存储设备,或可以被用于以计算机可执行指令或数据结构的形式携带或存储期望的非暂态信息并且可以由计算机访问的任何其它介质。当通过网络或另一个通信连接(或者硬连线、无线,或者硬连线或无线的组合)将信息传送或提供给计算机时,计算机将连接适当地视为计算机可读介质。因此,任何这种连接都被适当地称为计算机可读介质。上述的组合也应当包括在计算机可读介质的范围内。计算机可执行指令包括例如使通用计算机、专用计算机或专用处理设备执行特定功能或功能组的指令和数据。
以下讨论旨在提供可以在其中实现本公开的各方面的合适计算环境的简要、一般描述。虽然不是必需的,但是将在由网络环境中的计算机执行的计算机可执行指令(例如,程序模块)的一般上下文中描述本公开的各方面。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。计算机可执行指令、相关联的数据结构和程序模块表示用于执行本文公开的方法的步骤的程序代码手段的示例。这样的可执行指令或相关联的数据结构的特定序列表示用于实现在这些步骤中描述的功能的对应动作的示例。
本领域技术人员将认识到的是,可以在具有许多类型的计算机系统配置的网络计算环境中实践本公开的各方面,所述计算机系统配置包括个人计算机、手持式设备、多处理器系统、基于微处理器或可编程的消费者电子设备、网络PC、小型计算机、大型计算机等。本公开的各方面也可以在分布式计算环境中实践,其中任务由通过通信网络链接(或者通过硬连线、无线链路,或者通过硬连线或无线链路的组合)的本地和远程处理设备执行。在分布式计算环境中,程序模块可以位于本地和远程存储器存储设备中。
用于实现本公开的各方面的示例性系统包括常规计算机形式的专用计算设备,该专用计算设备包括处理单元、系统存储器以及将包括系统存储器的各种系统组件耦合到处理单元的系统总线。系统总线可以是几种类型的总线结构中的任何一种,包括使用各种总线体系架构中的任何一种的存储器总线或存储器控制器,外围总线和局部总线。系统存储器包括计算机存储介质,包括非易失性和易失性存储器类型。包含有助于在计算机内部的元件之间传递信息(诸如在启动期间)的基本例程的基本输入/输出系统(BIOS)可以存储在在ROM中。另外,计算机可以包括能够无线地向互联网传输或从互联网接收IP地址的任何设备(例如,计算机、膝上型计算机、平板电脑、PDA、蜂窝电话、移动电话、智能电视等)。
计算机还可以包括用于从磁性硬盘读取和向磁性硬盘写入的磁性硬盘驱动器、用于从可移动磁盘读取或向可移动磁盘写入的磁盘驱动器,以及用于从可移动光盘(诸如CD-ROM或其它光学介质)读取或向可移动光盘写入的光盘驱动器。磁性硬盘驱动器、磁盘驱动器和光盘驱动器分别通过硬盘驱动器接口、磁盘驱动器接口和光盘驱动器接口连接到系统总线。驱动器及其相关联的计算机可读介质为计算机提供了计算机可执行指令、数据结构、程序模块和其它数据的非易失性存储。虽然本文描述的示例性环境采用磁性硬盘、可移动磁盘和可移动光盘,但是也可以使用其它类型的用于存储数据的计算机可读介质,包括盒式磁带、闪存卡、数字视频盘、Bernoulli盒式磁带、RAM、ROM、SSD等。
通信介质通常在诸如载波或其它运输机制之类的经调制的数据信号中实施计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。
包括一个或多个程序模块的程序代码手段可以存储在硬盘、磁盘、光盘、ROM和/或RAM上,包括操作系统、一个或多个应用程序、其它程序模块和程序数据。用户可以通过键盘、定点设备或其它输入设备(诸如麦克风、操纵杆、游戏垫、碟形卫星天线、扫描仪等)将命令和信息输入到计算机中。这些和其它输入设备常常通过耦合到系统总线的串行端口接口连接到处理单元。可替代地,输入设备可以通过其它接口连接(诸如并行端口、游戏端口或通用串行总线(USB))连接。监视器或另一种显示设备也经由接口(诸如视频适配器)连接到系统总线。除了监视器之外,个人计算机通常还包括诸如扬声器和打印机之类的其它外围输出设备(未示出)。
本公开的一个或多个方面可以在存储在系统存储器或非易失性存储器中的计算机可执行指令(即,软件)、例程或函数中实施为应用程序、程序模块和/或程序数据。可替代地,软件可以远程存储,诸如存储在具有远程应用程序的远程计算机上。一般而言,程序模块包括例程、程序、对象、组件、数据结构等,它们在由计算机或其它设备中的处理器执行时执行特定任务或实现特定抽象数据类型。可以将计算机可执行指令存储在一个或多个有形的非暂态计算机可读介质(例如,硬盘、光盘、可移动存储介质、固态存储器、RAM等)上,并由一个或多个处理器或其它设备执行。如本领域技术人员将认识到的,程序模块的功能可以在各种实施例中按照期望组合或分布。此外,功能可以全部或部分地实施在固件或硬件等同物中,诸如集成电路、专用集成电路、现场可编程门阵列(FPGA)等。
计算机可以使用到一个或多个远程计算机的逻辑连接在联网的环境中操作。远程计算机可以各自是另一个个人计算机、平板电脑、PDA、服务器、路由器、网络PC、对等设备或其它公共网络节点,并且通常包括上面相对于计算机所描述的许多或所有元件。逻辑连接包括在此以示例而非限制的方式呈现的局域网(LAN)和广域网(WAN)。这种联网环境在办公室范围或企业范围的计算机网络、内联网和互联网中是常见的。
当在LAN联网环境中使用时,计算机通过网络接口或适配器连接到本地网络。当在WAN联网环境中使用时,计算机可以包括调制解调器、无线链路或用于通过广域网(诸如互联网)建立通信的其它手段。可以是内部的或外部的调制解调器经由串行端口接口连接到系统总线。在联网的环境中,相对于计算机描绘的程序模块或其部分可以存储在远程存储器存储设备中。将认识到的是,所示的网络连接是示例性的,并且可以使用在广域网上建立通信的其它手段。
优选地,计算机可执行指令被存储在诸如硬盘驱动器之类的存储器中,并由计算机执行。有利地,计算机处理器具有实时执行所有操作(例如,执行计算机可执行指令)的能力。
在本文中说明和描述的本公开的实施例中,执行操作的次序不是必需的,除非另有说明。即,除非另有说明,否则可以以任何次序执行操作,并且本公开的实施例可以包括比本文公开的操作更多或更少的操作。例如,预期在另一个操作之前、同时或之后执行特定操作在本公开的各方面的范围内。
本公开的实施例可以用计算机可执行指令来实现。可以将计算机可执行指令组织成一个或多个计算机可执行组件或模块。可以用任何数量和组织的此类组件或模块来实现本公开的各方面。例如,本公开的各方面不限于图中所示和本文描述的特定计算机可执行指令或特定组件或模块。本公开的其它实施例可以包括具有比本文说明和描述的功能更多或更少的功能的不同的计算机可执行指令或组件。
当介绍本公开的各方面或其实施例的要素时,冠词“一”、“该”和“所述”旨在表示存在一个或多个该要素。术语“包括”、“包含”和“具有”旨在是包括性的,并且意味着除所列要素外还可以有附加要素。已经详细描述了本公开的各方面,将清晰的是,在不脱离如所附权利要求所限定的本公开的各方面的范围的情况下,修改和变化是可能的。由于可以在不脱离本公开的方面的范围的情况下对以上构造、产品和方法进行各种改变,因此意图在于以上描述中包含的以及在附图中示出的所有内容都应被解释为说明性的,而不在限制的意义上解释。
Claims (20)
1.一种方法,包括:
由在计算设备上执行的机器学习系统访问管线和仪表图(P&ID)的图像;
使用在计算设备上执行的机器学习系统的符号分类引擎来确定所访问的图像是否包括指示过程控制元件的符号,使用监督式学习对符号分类引擎进行训练,以基于所访问的图像是否包括指示过程控制元件的符号以及该符号在P&ID中的相对位置将图像分类为多个类;
在确定所访问的图像包括符号后,在计算机可读存储器存储设备中存储指示表示过程控制元件的符号的符号输出;
使用在计算设备上执行的机器学习系统的标签分类引擎来确定所访问的图像是否包括与符号对应的标签,使用监督式学习对标签分类引擎进行训练,以基于所访问的图像是否包括与符号对应的标签将图像分类为多个类;以及
在确定所访问的图像包括标签后,在计算机可读存储器存储设备中存储指示与符号对应的标签的标签输出。
2.如权利要求1所述的方法,其中所述确定所访问的图像是否包括符号包括符号分类引擎执行窗口滑动算法、符号识别技术以及被配置为确定P&ID的图像的比例的圆圈检测算法。
3.如权利要求1所述的方法,其中所述确定所访问的图像是否包括标签包括标签分类引擎从符号移除符号线、分割标签的字符,并对标签执行滑动窗口分割算法。
4.如权利要求1所述的方法,其中符号分类引擎包括第一卷积神经网络,并且其中标签分类引擎包括第二卷积神经网络。
5.如权利要求1所述的方法,其中标签分类引擎包括字符识别网络,并且其中字符识别网络包括判定器卷积神经网络、单字符卷积神经网络和辅助单词卷积神经网络中的一个或多个。
6.如权利要求1所述的方法,其中用于训练符号分类引擎的监督式学习和用于训练标签分类引擎的监督式学习都包括手动反馈。
7.如权利要求1所述的方法,其中用于训练符号分类引擎的监督式学习和用于训练标签分类引擎的监督式学习都包括自动反馈。
8.一种系统,包括:
管线和仪表图(P&ID)分析处理器;以及
存储处理器可执行指令的计算机可读存储设备,其中处理器可执行指令在由处理器执行时包括:
图像转换器,被配置为接收电子格式的P&ID并将该P&ID转换成计算图像;
一个或多个过滤算法,被配置为处理计算图像以获得其中的符号的近似尺寸;
符号提取器,被配置为从计算图像中提取符号并将提取出的符号存储在计算机可读存储设备上;
一个或多个标签预处理算法,被配置为从计算图像中的符号移除符号线;
标签提取器,被配置为提取计算图像中的符号的标签成分,并将提取出的标签存储在计算机可读存储设备上;以及
智能系统,被配置为:
从一个或多个过滤算法接收符号反馈,
从一个或多个标签预处理算法接收标签反馈,
基于接收到的符号反馈来重新训练符号提取器,以及
基于接收到的标签反馈来重新训练标签提取器。
9.如权利要求8所述的系统,其中所述一个或多个过滤算法包括以下至少之一:窗口滑动算法、符号识别算法,以及被配置为确定P&ID的图像的比例的圆圈检测算法。
10.如权利要求8所述的系统,其中所述一个或多个标签预处理算法包括以下至少之一:用于从符号移除符号线的算法、用于分割标签的字符的算法,以及用于对标签执行滑动窗口分割的算法。
11.如权利要求8所述的系统,其中符号提取器包括第一卷积神经网络,并且其中标签提取器包括第二卷积神经网络。
12.如权利要求8所述的系统,其中标签提取器包括字符识别网络,并且其中字符识别网络包括判定器卷积神经网络、单字符卷积神经网络和辅助单词卷积神经网络中的一个或多个。
13.如权利要求8所述的系统,其中智能系统还被配置为从用户接收符号反馈和标签反馈,并基于从用户接收到的反馈来进一步重新训练符号提取器和标签提取器。
14.一种方法,包括:
接收数字化的管线和仪表图(P&ID);
使用符号引擎来分析数字化的P&ID以从数字化的P&ID中识别并提取符号,其中所述分析导致至少一个符号错误;
使用标签引擎来分析数字化的P&ID以从数字化的P&ID中识别并提取标签,其中所述分析导致至少一个标签错误;
将提取出的符号和标签存储在计算机可读存储介质上;
基于所述至少一个符号错误来重新训练符号引擎;以及
基于所述至少一个标签错误来重新训练标签引擎。
15.如权利要求14所述的方法,其中所述使用符号引擎来分析数字化的P&ID包括执行窗口滑动算法、符号识别技术以及被配置为确定数字化的P&ID的比例的圆圈检测算法中的一个或多个。
16.如权利要求14所述的方法,其中所述使用标签引擎分析数字化的P&ID包括以下至少之一:从符号中移除符号线、分割标签的字符和对标签执行滑动窗口分割算法。
17.如权利要求14所述的方法,其中符号引擎包括第一卷积神经网络和被配置为确定数字化的P&ID的比例的自适应只看一次(YOLO)算法,并且其中标签引擎包括第二卷积神经网络。
18.如权利要求14所述的方法,其中标签引擎包括字符识别网络,并且其中字符识别网络包括判定器卷积神经网络、单字符卷积神经网络和辅助词卷积神经网络中的一个或多个。
19.如权利要求14所述的方法,还包括:
从用户接收符号反馈;以及
基于所述至少一个符号错误和符号反馈来重新训练符号引擎。
20.如权利要求14所述的方法,还包括:
从用户接收标签反馈;以及
基于所述至少一个标签错误和标签反馈来重新训练标签引擎。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/021,867 US10635945B2 (en) | 2018-06-28 | 2018-06-28 | Machine learning analysis of piping and instrumentation diagrams |
US16/021,867 | 2018-06-28 | ||
PCT/US2019/036651 WO2020005541A1 (en) | 2018-06-28 | 2019-06-12 | Machine learning analysis of piping and instrumentation diagrams |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112368657A true CN112368657A (zh) | 2021-02-12 |
Family
ID=68987546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980040226.5A Pending CN112368657A (zh) | 2018-06-28 | 2019-06-12 | 管线和仪表图的机器学习分析 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10635945B2 (zh) |
EP (1) | EP3814860A4 (zh) |
CN (1) | CN112368657A (zh) |
WO (1) | WO2020005541A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11169507B2 (en) | 2017-06-08 | 2021-11-09 | Rockwell Automation Technologies, Inc. | Scalable industrial analytics platform |
US10685261B2 (en) * | 2018-06-11 | 2020-06-16 | GM Global Technology Operations LLC | Active segmention of scanned images based on deep reinforcement learning for OCR applications |
US11403541B2 (en) | 2019-02-14 | 2022-08-02 | Rockwell Automation Technologies, Inc. | AI extensions and intelligent model validation for an industrial digital twin |
US11086298B2 (en) | 2019-04-15 | 2021-08-10 | Rockwell Automation Technologies, Inc. | Smart gateway platform for industrial internet of things |
US11789854B2 (en) * | 2019-08-19 | 2023-10-17 | Volkswagen Aktiengesellschaft | Hybrid interface testing |
CN114730198A (zh) * | 2019-09-11 | 2022-07-08 | 思睿人工智能公司 | 用于自动解析示意图的系统和方法 |
US11841699B2 (en) | 2019-09-30 | 2023-12-12 | Rockwell Automation Technologies, Inc. | Artificial intelligence channel for industrial automation |
US11435726B2 (en) | 2019-09-30 | 2022-09-06 | Rockwell Automation Technologies, Inc. | Contextualization of industrial data at the device level |
US11249462B2 (en) | 2020-01-06 | 2022-02-15 | Rockwell Automation Technologies, Inc. | Industrial data services platform |
CN113377018A (zh) * | 2020-03-09 | 2021-09-10 | 青岛海尔空调器有限总公司 | 空调器的智能控制方法与空调器的智能控制设备 |
US11726459B2 (en) | 2020-06-18 | 2023-08-15 | Rockwell Automation Technologies, Inc. | Industrial automation control program generation from computer-aided design |
US20210397171A1 (en) * | 2020-06-22 | 2021-12-23 | Rockwell Automation Technologies, Inc. | Industrial automation hmi program file generation from computer-aided design |
US11842035B2 (en) * | 2020-08-04 | 2023-12-12 | Bentley Systems, Incorporated | Techniques for labeling, reviewing and correcting label predictions for PandIDS |
CN112231522B (zh) * | 2020-09-24 | 2021-09-14 | 北京奥鹏远程教育中心有限公司 | 一种在线课程知识树的生成关联方法 |
CN113065556B (zh) * | 2021-04-16 | 2024-04-02 | 西安交通大学 | 一种数字式仪表定位和数字识别方法、装置和计算机设备 |
AU2022202976A1 (en) * | 2021-05-28 | 2022-12-15 | Schneider Electric Systems Usa, Inc. | Artificial intelligence alarm management |
US20230214671A1 (en) | 2021-12-31 | 2023-07-06 | Schneider Electric Systems Usa, Inc. | Systems and methods for building a knowledge base for industrial control and design applications |
US20230213921A1 (en) | 2021-12-31 | 2023-07-06 | Schneider Electric Systems Usa, Inc. | Knowledge driven artificial intelligence engine for engineering automation |
CN117315643A (zh) * | 2023-11-23 | 2023-12-29 | 合肥天帷信息安全技术有限公司 | 一种精密空调目标数据提取方法、装置及存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5245672A (en) * | 1992-03-09 | 1993-09-14 | The United States Of America As Represented By The Secretary Of Commerce | Object/anti-object neural network segmentation |
CN1380623A (zh) * | 2000-07-13 | 2002-11-20 | 纬衡知识产权有限公司 | 用于分析和解释工程图的计算机自动处理 |
US20030158795A1 (en) * | 2001-12-28 | 2003-08-21 | Kimberly-Clark Worldwide, Inc. | Quality management and intelligent manufacturing with labels and smart tags in event-based product manufacturing |
US20070005266A1 (en) * | 2004-05-04 | 2007-01-04 | Fisher-Rosemount Systems, Inc. | Process plant monitoring based on multivariate statistical analysis and on-line process simulation |
JP2007086954A (ja) * | 2005-09-21 | 2007-04-05 | Fuji Xerox Co Ltd | 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム |
CN101030258A (zh) * | 2006-02-28 | 2007-09-05 | 浙江工业大学 | 基于bp神经网络的数显仪表动态显示字符识别方法 |
US20090292514A1 (en) * | 2008-02-15 | 2009-11-26 | Invensys Systems, Inc. | System And Method For Autogenerating Simulations For Process Control System Checkout And Operator Training |
CN101882218A (zh) * | 2009-05-07 | 2010-11-10 | (株)赛丽康 | 用于字符识别的图像传感器和图像感测方法 |
CN103984930A (zh) * | 2014-05-21 | 2014-08-13 | 南京航空航天大学 | 基于视觉的数字仪表识别系统及其识别方法 |
CN106529537A (zh) * | 2016-11-22 | 2017-03-22 | 亿嘉和科技股份有限公司 | 一种数字仪表读数图像识别方法 |
US20170147807A1 (en) * | 2011-12-30 | 2017-05-25 | Bedrock Automation Platforms Inc. | Image capture devices for a secure industrial control system |
CN106940800A (zh) * | 2016-01-05 | 2017-07-11 | 深圳友讯达科技股份有限公司 | 计量仪表读数识别方法及装置 |
US20170228589A1 (en) * | 2014-10-01 | 2017-08-10 | Abb Schweiz Ag | Method and system for configuring devices of a control system based on engineering graphic objects |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9042647B2 (en) * | 2013-06-06 | 2015-05-26 | Xerox Corporation | Adaptive character segmentation method and system for automated license plate recognition |
TWI643134B (zh) * | 2013-10-16 | 2018-12-01 | 3M新設資產公司 | 建立並操作表示實體便箋的軟體便箋之方法、電腦系統、非暫時性電腦可讀取媒體及運算裝置 |
US9720396B2 (en) | 2014-05-23 | 2017-08-01 | Fisher-Rosemount Systems, Inc. | Methods and apparatus to configure process control systems based on generic process system libraries |
EP3029535A3 (en) | 2014-12-03 | 2016-07-13 | Rockwell Automation Technologies, Inc. | P&ID and control system synchronization |
US9626594B2 (en) * | 2015-01-21 | 2017-04-18 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
US11295123B2 (en) * | 2017-09-14 | 2022-04-05 | Chevron U.S.A. Inc. | Classification of character strings using machine-learning |
-
2018
- 2018-06-28 US US16/021,867 patent/US10635945B2/en active Active
-
2019
- 2019-06-12 CN CN201980040226.5A patent/CN112368657A/zh active Pending
- 2019-06-12 EP EP19826121.6A patent/EP3814860A4/en active Pending
- 2019-06-12 WO PCT/US2019/036651 patent/WO2020005541A1/en active Application Filing
-
2020
- 2020-03-06 US US16/810,951 patent/US10671894B1/en active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5245672A (en) * | 1992-03-09 | 1993-09-14 | The United States Of America As Represented By The Secretary Of Commerce | Object/anti-object neural network segmentation |
CN1380623A (zh) * | 2000-07-13 | 2002-11-20 | 纬衡知识产权有限公司 | 用于分析和解释工程图的计算机自动处理 |
US20030158795A1 (en) * | 2001-12-28 | 2003-08-21 | Kimberly-Clark Worldwide, Inc. | Quality management and intelligent manufacturing with labels and smart tags in event-based product manufacturing |
US20070005266A1 (en) * | 2004-05-04 | 2007-01-04 | Fisher-Rosemount Systems, Inc. | Process plant monitoring based on multivariate statistical analysis and on-line process simulation |
JP2007086954A (ja) * | 2005-09-21 | 2007-04-05 | Fuji Xerox Co Ltd | 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム |
CN101030258A (zh) * | 2006-02-28 | 2007-09-05 | 浙江工业大学 | 基于bp神经网络的数显仪表动态显示字符识别方法 |
US20090292514A1 (en) * | 2008-02-15 | 2009-11-26 | Invensys Systems, Inc. | System And Method For Autogenerating Simulations For Process Control System Checkout And Operator Training |
CN101882218A (zh) * | 2009-05-07 | 2010-11-10 | (株)赛丽康 | 用于字符识别的图像传感器和图像感测方法 |
US20170147807A1 (en) * | 2011-12-30 | 2017-05-25 | Bedrock Automation Platforms Inc. | Image capture devices for a secure industrial control system |
CN103984930A (zh) * | 2014-05-21 | 2014-08-13 | 南京航空航天大学 | 基于视觉的数字仪表识别系统及其识别方法 |
US20170228589A1 (en) * | 2014-10-01 | 2017-08-10 | Abb Schweiz Ag | Method and system for configuring devices of a control system based on engineering graphic objects |
CN106940800A (zh) * | 2016-01-05 | 2017-07-11 | 深圳友讯达科技股份有限公司 | 计量仪表读数识别方法及装置 |
CN106529537A (zh) * | 2016-11-22 | 2017-03-22 | 亿嘉和科技股份有限公司 | 一种数字仪表读数图像识别方法 |
Non-Patent Citations (2)
Title |
---|
DAEKYOUNG JUNG ET AL.: ""ChartSense: Interactive Data Extraction from Chart Images"", <PROCEEDINGS OF THE 2017 CHI CONFERENCE ON HUMAN FACTORS IN COMPUTING SYSTEMS>, pages 1 - 12 * |
MAHESH KUMAR GELLABOINA ET AL.: ""Graphic Symbol Recognition using Auto Associative Neural Network Model"", <2009 SEVENTH INTERNATIONAL CONFERENCE ON ADVANCES IN PATTERN RECOGNITION>, pages 297 - 301 * |
Also Published As
Publication number | Publication date |
---|---|
US20200005094A1 (en) | 2020-01-02 |
EP3814860A4 (en) | 2022-04-06 |
WO2020005541A1 (en) | 2020-01-02 |
US10635945B2 (en) | 2020-04-28 |
EP3814860A1 (en) | 2021-05-05 |
US10671894B1 (en) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10671894B1 (en) | Machine learning analysis of piping and instrumentation diagrams | |
US11295123B2 (en) | Classification of character strings using machine-learning | |
US10685462B2 (en) | Automatic data extraction from a digital image | |
CN109902622B (zh) | 一种用于登机牌信息验证的文字检测识别方法 | |
CN110942074B (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
US20120213429A1 (en) | System and method for extracting flowchart information from digital images | |
CN106980856B (zh) | 公式识别方法及系统和符号推理计算方法及系统 | |
KR102104605B1 (ko) | 인공지능 기반 플랜트 도면 내 심볼 자동인식 방법 및 장치 | |
CN110705952A (zh) | 一种合同审核方法及装置 | |
CN109740609B (zh) | 一种轨距检测方法及装置 | |
CN111652117B (zh) | 一种对多文档图像分割的方法及介质 | |
US10970531B2 (en) | Digitization of industrial inspection sheets by inferring visual relations | |
CN110796210A (zh) | 一种标签信息的识别方法及装置 | |
CN113496212A (zh) | 箱式结构的文本识别方法、装置及电子设备 | |
CN107330470B (zh) | 识别图片的方法和装置 | |
KR102488049B1 (ko) | 딥러닝 모델 기반 문자정보 자동인식 시스템 및 자동인식 방법 | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
CN101546379A (zh) | 计算机可读记录介质、字符识别设备和字符识别方法 | |
Mulyana et al. | Optimization of Text Mining Detection of Tajweed Reading Laws Using the Yolov8 Method on the Qur'an | |
EP4109415A1 (en) | Symbol recognition from raster images of p&ids using a single instance per symbol class | |
US11789990B1 (en) | Automated splitting of document packages and identification of relevant documents | |
Kokku et al. | A complete OCR system for Tamil magazine documents | |
CN115683504A (zh) | 基于多标签分类的桥梁加速度监测数据异常识别方法及系统 | |
CN114495127A (zh) | 基于rpa和ai的商品信息处理方法、装置、设备和介质 | |
CN117315708A (zh) | 一种基于图像检测的工程图纸属性参数匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |