CN116431818A - 一种用于热加工工艺设计的知识图谱自动构建方法 - Google Patents

一种用于热加工工艺设计的知识图谱自动构建方法 Download PDF

Info

Publication number
CN116431818A
CN116431818A CN202211425511.9A CN202211425511A CN116431818A CN 116431818 A CN116431818 A CN 116431818A CN 202211425511 A CN202211425511 A CN 202211425511A CN 116431818 A CN116431818 A CN 116431818A
Authority
CN
China
Prior art keywords
knowledge
data
layer
text
adopting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211425511.9A
Other languages
English (en)
Other versions
CN116431818B (zh
Inventor
严玺
曾志
陈鹏宇
葛福国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202211425511.9A priority Critical patent/CN116431818B/zh
Publication of CN116431818A publication Critical patent/CN116431818A/zh
Application granted granted Critical
Publication of CN116431818B publication Critical patent/CN116431818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及知识图谱领域,提供一种用于热加工工艺设计的知识图谱自动构建方法,该方法包括:建立热加工工艺知识图谱基础本体;建立基于工艺实例热加工工艺实体集合,实体间关系集合;通过CRNN深度学习模型的OCR技术对工艺卡片进行自适应模板匹配抽取内容,同时对应生产资料及工艺书籍使用同样模型进行数据提取,并采用引入注意力机制的序列标注深度学习模型对工艺书籍资料采集内容进行实体标注,提取其中的工艺知识信息,随后基于构建的知识图谱本体模型进行知识填充,形成不同的子知识图谱;将得到的若干子知识图谱与热加工工艺知识图谱的框架进行融合,得到热加工工艺知识图谱。本发明提出的热加工工艺知识图谱模型及构建方法,可广泛应用在热加工生产环境中,以基于工艺实例的图谱构建特点,保证了图谱的易拓展性,提高工艺设计人员的设计效率,减少工艺实验带来的成本,同时为工艺设计提供了参照和设计依据。

Description

一种用于热加工工艺设计的知识图谱自动构建方法
技术领域
本发明属于知识图谱技术领域,具体设计一种用于热加工工艺设计的知识图谱构建方法。
背景技术
目前在热加工工艺设计领域中工艺设计仍依赖人工经验试错,需要进行大量的工艺实验以得到相对较优的加工工艺参数,这种热工艺设计方式使得产品存在研制成本高、周期长、质量可靠性低以及加工过程中构件尺寸超差等问题,同时在工艺生产过程中产生的工艺资料,无法做到有效的收集和复用,造成了热工艺设计耗时长、成本高以及智能化信息化水平低的问题,因此,需要一种实现工艺快速设计的方法,保障产品高质高效的生产。
发明内容
本发明的主要目的是为了解决热加工工艺设计过程耗时长,难以实现快速设计的问题,为实现以上目的,本方案提供了一种热加工工艺知识图谱自动构建方法。
本发明技术方案为一种用于热加工工艺设计的知识图谱自动构建方法,该方法包括:
步骤1:采集数据并对数据进行预处理;
步骤1.1:采集的数据包括工艺资料的文本数据和图片数据,如果是图片数据则提取出图片数据中的文本数据;图片数据类型包含两个部分:一是产品投入生产时的工艺卡片,二是与热加工工艺加工相关书籍数据;
对于工艺卡片,每张工艺卡片都有固定的表格模板,首先对每一种模板训练一个文本提取网络,实时采集时首先对工艺卡片进行分类,确定该工艺卡片属于哪一种模板,然后根据该模板对应的文本提取网络对工艺卡片进行文本采集,得到文本数据;
对于热加工工艺书籍类数据,基于获取的扫描版书籍图片,直接采用卷积神经网络进行内容提取,得到文本数据;
步骤1.2:首先对步骤1得到的文本数据进行如下处理:去除停用词、去除无效符号、参数值的格式校验、文本错别字校验;
步骤2:构建反应热加工工艺情况的热加工领域知识图谱;
该图谱为树状图,包括四层,分别为:工艺层、方法层、零件层、实例层,工艺层表示热加工领域知识图谱包括的多种热加工工艺,方法层表示每种工艺包括的多种实施方法,零件层表示每种方法涉及的多种零件,实例层表示每种零件涉及的多种实例,实例层包括案例集和知识集,案例集表示采用对应的工艺、方法对对应零件进行热处理的一种例子中的标识性信息,知识集表示对应的工艺、方法对对应零件进行热处理的一种例子的操作性知识信息;
步骤3:对步骤1中提取的文本数据进行数据识别;
步骤3.1:从步骤1得到的数据中选择出一部分数据作为训练集和一部分数据作为测试集;训练集中的每一句话进行人工识别,识别出这句话是案例集中的哪种标识信息或知识集中的哪种知识信息;采用训练集和测试集对识别模型进行训练,所述识别模型的具体识别方法包括步骤3.2到步骤3.5;
步骤3.2:采用预训练的词向量矩阵将一句话中的每个字映射为低维稠密的数字向量,然后将该句话所有字组成的数值向量输入BILSTM模型,得到句子词向量H;
步骤3.3:采用注意目标生成向量
Figure 313056DEST_PATH_IMAGE001
通过softmax函数对句子词向量H进行加权处 理,得到句子词向量H中每个词语的权值
Figure 244103DEST_PATH_IMAGE002
,方法为:
Figure 936115DEST_PATH_IMAGE003
其中,n表示句子词向量H中元素的总个数;
步骤3.4:采用权值
Figure 607880DEST_PATH_IMAGE002
对句子词向量H进行加权,得到向量r,方法为:
Figure 131266DEST_PATH_IMAGE004
步骤3.5:采用条件随机场模型对向量r进行识别;
步骤4:采用步骤3中的识别模型对剩余的所有文本句子或新得到的待识别文本进行识别,得到对应文本的实例层;再根据实例层中的数据,识别出该文本对应工艺层中的热加工工艺,对应方法层中的实时方法,对应零件层中的零件;
步骤5:根据步骤4得到具体信息对文本进行存储。
进一步的,所述步骤2中的案例集包括:案例名称、设备名称,知识集包括:设备知识、材料知识、工艺知识、加工知识;步骤4中利用案例名称、设备名称、设备知识、材料知识、工艺知识、加工知识,这6类数据采用步骤3中相同的识别模型识别出该文本对应工艺层中的热加工工艺,对应方法层中的实时方法,对应零件层中的零件。
进一步的,所述步骤1中针对工艺卡片的文本提取网络结构依次为:STN空间变换网络、2个5x5卷积层、2个全连接层、输出层。
此发明针对热加工工艺提出了一种热加工工艺知识图谱自动构建方法,通过此方法,实现了对工艺资料的快速准确的采集,基于本发明构建热加工工艺知识集,可实现对热加工工艺知识进行有效挖掘,基于本发明的热加工工艺图谱结构,为实现以知识驱动生产的智能化模式提供基础。
附图说明
图1是本发明提供的面向热加工工艺设计的知识图谱构建方法的流程示意图;
图2是热加工工艺知识图谱本体结构示意图;
图3是知识图谱中案例实体与案例相关知识的图谱关系表示示意图。
具体实施方式
如图1,本发明具体方法为一种用于热加工工艺设计的知识图谱自动构建方法,该方法包括:
步骤1:采集数据并对数据进行预处理;
步骤1.1:采集的数据包括工艺资料的文本数据和图片数据,如果是图片数据则提取出图片数据中的文本数据;图片数据类型包含两个部分:一是产品投入生产时的工艺卡片,二是与热加工工艺加工相关书籍数据;
对于工艺卡片,每张工艺卡片都有固定的表格模板,首先对每一种模板训练一个文本提取网络,实时采集时首先对工艺卡片进行分类,确定该工艺卡片属于哪一种模板,然后根据该模板对应的文本提取网络对工艺卡片进行文本采集,得到文本数据;该文本提取网络结构依次为:STN空间变换网络、2个5x5卷积层、2个全连接层、输出层。
对于热加工工艺书籍类数据,基于获取的扫描版书籍图片,直接采用卷积神经网络进行内容提取,得到文本数据;
步骤1.2:首先对步骤1得到的文本数据进行如下处理:去除停用词、去除无效符号、参数值的格式校验、文本错别字校验;
步骤2:构建反应热加工工艺情况的热加工领域知识图谱;
如图2所述,建立的图谱为树状图,包括四层,分别为:工艺层、方法层、零件层、实例层,工艺层表示热加工领域知识图谱包括的多种热加工工艺,方法层表示每种工艺包括的多种实施方法,零件层表示每种方法涉及的多种零件,实例层表示每种零件涉及的多种实例,实例层包括案例集和知识集,案例集表示采用对应的工艺、方法对对应零件进行热处理的一种例子中的标识性信息,知识集表示对应的工艺、方法对对应零件进行热处理的一种例子的操作性知识信息;
工艺层包括:焊接、铸造、增材制造等,
方法层中,对应焊接工艺的包括:电子束焊接、激光焊机、氩弧焊,对应铸造的包括:离心铸造、低压铸造,对应增材制造的包括:电弧增材、激光熔融沉积、激光选取融化;所述零件层中对应激光焊接的包括:轴类零件、齿轮、管类零件、异型构建等;所述实例层中案例集包括:案例名称、设备名称、操作人员,知识集包括:设备知识、材料知识、工艺知识、加工知识、总结知识。
步骤3:对步骤1中提取的文本数据进行数据识别;
如图3所示首先对案例集和知识集中包括的信息进行识别,一个案例包括:加工信息、工艺参数、工艺优化、模型参数、经验总结,其中加工信息包括:起止时间、所在车间、人员姓名、设备名称等,工艺参数包括:激光功率、扫描速度、扫描方式、离焦量、入射角、缺陷形式等,所述工艺优化包括:优化方法、模型名称、优化参数等,经验总结包括:工艺优化经验、工艺参数设置经验、加工过程经验等,所述模型参数包括:模型图纸、材料牌号、零件质量等;知识集包括:设备知识、工艺知识、材料知识、总结知识等。
步骤3.1:从步骤1得到的数据中选择出一部分数据作为训练集和一部分数据作为测试集;训练集中的每一句话进行人工识别,识别出这句话是案例集中的哪种标识信息或知识集中的哪种知识信息;采用训练集和测试集对识别模型进行训练,所述识别模型的具体识别方法包括步骤3.2到步骤3.5;
步骤3.2:采用预训练的词向量矩阵将一句话中的每个字映射为低维稠密的数字向量,然后将该句话所有字组成的数值向量输入BILSTM模型,得到句子词向量H;
步骤3.3:采用注意目标生成向量
Figure 498793DEST_PATH_IMAGE005
通过softmax函数对句子词向量H进行加权 处理,得到句子词向量H中每个词语的权值
Figure 678102DEST_PATH_IMAGE006
,方法为:
Figure 953225DEST_PATH_IMAGE007
其中,n表示句子词向量H中元素的总个数;
步骤3.4:采用权值
Figure 534379DEST_PATH_IMAGE008
对句子词向量H进行加权,得到向量r,方法为:
Figure 807229DEST_PATH_IMAGE009
步骤3.5:采用条件随机场模型对向量r进行识别;
步骤4:采用步骤3中的识别模型对剩余的所有文本句子或新得到的待识别文本进行识别,得到对应文本的实例层;再根据实例层中的数据,识别出该文本对应工艺层中的热加工工艺,对应方法层中的实时方法,对应零件层中的零件;
步骤5:根据步骤4得到具体信息对文本进行存储。
通过此种方法实现对重要的工艺知识相关词汇赋予较高权重以提升该模型的注意力,将注意力赋予的权重与BILSTM输出的概率矩阵结合并归一化,将结果传入条件随机场模型,条件随机场模型通过学习标签之间的顺序依赖信息,得到最终的实体标注结果。其中条件随机场模型可以通过学习数据集中标签之间的转移概率从而修正BILSTM层的输出,从而保证预测标签的合理性。此方法很好地进行并行计算,并大大提高了计算效率,并且可以将模型的实体标注时的注意力聚焦到重要的词汇上,从而捕获到句子中最重要的工艺知识信息,提升模型对实体的预测精度。
例如材料相关知识,经过爬虫获取的百度百科相关数据“5A06铝板为Al-Mg系防锈铝,5A06铝板具有较高的强度和腐蚀稳定性,在退火和挤压状态下塑性尚好,用氩弧焊的焊缝气密性和焊缝塑性尚可,气焊和点焊其焊接接头强度为基体强度的90~95%;可切削性能良好。”基于本发明模型获取以下相关实体:1.材料名称实体:5A06铝板;2.材料特性:较高的强度和腐蚀稳定性,切削性能良好;3.热处理知识:退火和挤压状态下塑性尚好;4.焊接方法实体:气焊、点焊、氩弧焊。
此模型结合注意力机制以及由人工标注的热加工知识数据集,相较于原有的BILSTM+CRF采用通用中文训练集的标注模型在基于不同热加工实体的标注准确率上提升了7-10%,并且平均准确率在86%以上,个别类型的工艺实体中有较多的训练样本可达到95%左右。

Claims (3)

1.一种用于热加工工艺设计的知识图谱自动构建方法,其特征在于,该方法包括:
步骤1:采集数据并对数据进行预处理;
步骤1.1:采集的数据包括工艺资料的文本数据和图片数据,如果是图片数据则提取出图片数据中的文本数据;图片数据类型包含两个部分:一是产品投入生产时的工艺卡片,二是与热加工工艺加工相关书籍数据;
对于工艺卡片,每张工艺卡片都有固定的表格模板,首先对每一种模板训练一个文本提取网络,实时采集时首先对工艺卡片进行分类,确定该工艺卡片属于哪一种模板,然后根据该模板对应的文本提取网络对工艺卡片进行文本采集,得到文本数据;
对于热加工工艺书籍类数据,基于获取的扫描版书籍图片,直接采用卷积神经网络进行内容提取,得到文本数据;
步骤1.2:首先对步骤1得到的文本数据进行如下处理:去除停用词、去除无效符号、参数值的格式校验、文本错别字校验;
步骤2:构建反应热加工工艺情况的热加工领域知识图谱;
该图谱为树状图,包括四层,分别为:工艺层、方法层、零件层、实例层,工艺层表示热加工领域知识图谱包括的多种热加工工艺,方法层表示每种工艺包括的多种实施方法,零件层表示每种方法涉及的多种零件,实例层表示每种零件涉及的多种实例,实例层包括案例集和知识集,案例集表示采用对应的工艺、方法对对应零件进行热处理的一种例子中的标识性信息,知识集表示对应的工艺、方法对对应零件进行热处理的一种例子的操作性知识信息;
步骤3:对步骤1中提取的文本数据进行数据识别;
步骤3.1:从步骤1得到的数据中选择出一部分数据作为训练集和一部分数据作为测试集;训练集中的每一句话进行人工识别,识别出这句话是案例集中的哪种标识信息或知识集中的哪种知识信息;采用训练集和测试集对识别模型进行训练,所述识别模型的具体识别方法包括步骤3.2到步骤3.5;
步骤3.2:采用预训练的词向量矩阵将一句话中的每个字映射为低维稠密的数字向量,然后将该句话所有字组成的数值向量输入BILSTM模型,得到句子词向量H;
步骤3.3:采用注意目标生成向量
Figure 709322DEST_PATH_IMAGE001
通过softmax函数对句子词向量H进行加权处理, 得到句子词向量H中每个词语的权值
Figure 725820DEST_PATH_IMAGE002
,方法为:
Figure 223797DEST_PATH_IMAGE003
其中,n表示句子词向量H中元素的总个数;
步骤3.4:采用权值
Figure 953635DEST_PATH_IMAGE004
对句子词向量H进行加权,得到向量r,方法为:
Figure 841957DEST_PATH_IMAGE005
步骤3.5:采用条件随机场模型对向量r进行识别;
步骤4:采用步骤3中的识别模型对剩余的所有文本句子或新得到的待识别文本进行识别,得到对应文本的实例层;再根据实例层中的数据,识别出该文本对应工艺层中的热加工工艺,对应方法层中的实时方法,对应零件层中的零件;
步骤5:根据步骤4得到具体信息对文本进行存储。
2.如权利要求1所述的一种用于热加工工艺设计的知识图谱自动构建方法,其特征在于,所述步骤2中的案例集包括:案例名称、设备名称,知识集包括:设备知识、材料知识、工艺知识、加工知识;步骤4中利用案例名称、设备名称、设备知识、材料知识、工艺知识、加工知识,这6类数据采用步骤3中相同的识别模型识别出该文本对应工艺层中的热加工工艺,对应方法层中的实时方法,对应零件层中的零件。
3.如权利要求1所述的一种用于热加工工艺设计的知识图谱自动构建方法,其特征在于,所述步骤1中针对工艺卡片的文本提取网络结构依次为:STN空间变换网络、2个5x5卷积层、2个全连接层、输出层。
CN202211425511.9A 2022-11-15 2022-11-15 一种用于热加工工艺设计的知识图谱自动构建方法 Active CN116431818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211425511.9A CN116431818B (zh) 2022-11-15 2022-11-15 一种用于热加工工艺设计的知识图谱自动构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211425511.9A CN116431818B (zh) 2022-11-15 2022-11-15 一种用于热加工工艺设计的知识图谱自动构建方法

Publications (2)

Publication Number Publication Date
CN116431818A true CN116431818A (zh) 2023-07-14
CN116431818B CN116431818B (zh) 2023-12-05

Family

ID=87086040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211425511.9A Active CN116431818B (zh) 2022-11-15 2022-11-15 一种用于热加工工艺设计的知识图谱自动构建方法

Country Status (1)

Country Link
CN (1) CN116431818B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941716A (zh) * 2019-11-05 2020-03-31 北京航空航天大学 一种基于深度学习的信息安全知识图谱的自动构建方法
CN111444351A (zh) * 2020-03-24 2020-07-24 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置
CN113987212A (zh) * 2021-11-17 2022-01-28 武汉理工大学 一种数控加工领域工艺数据的知识图谱构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941716A (zh) * 2019-11-05 2020-03-31 北京航空航天大学 一种基于深度学习的信息安全知识图谱的自动构建方法
CN111444351A (zh) * 2020-03-24 2020-07-24 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置
CN113987212A (zh) * 2021-11-17 2022-01-28 武汉理工大学 一种数控加工领域工艺数据的知识图谱构建方法

Also Published As

Publication number Publication date
CN116431818B (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN109741347B (zh) 一种基于卷积神经网络的迭代学习的图像分割方法
CN113220919B (zh) 一种大坝缺陷图像文本跨模态检索方法及模型
CN111062451B (zh) 一种基于文本引导图模型的图像描述生成方法
CN112347284B (zh) 一种组合商标图像检索方法
CN111274814B (zh) 一种新型的半监督文本实体信息抽取方法
CN111027443B (zh) 一种基于多任务深度学习的票据文本检测方法
CN114491036A (zh) 一种基于自监督和有监督联合训练的半监督文本分类方法及系统
CN112465820A (zh) 基于语义分割的融合全局上下文信息的水稻病害检测方法
CN116431818B (zh) 一种用于热加工工艺设计的知识图谱自动构建方法
CN115829983B (zh) 一种基于知识蒸馏的高速工业场景视觉质量检测方法
CN116450852A (zh) 基于深度学习的桥梁管养知识图谱自动构建方法
CN110929013A (zh) 一种基于bottom-up attention和定位信息融合的图片问答实现方法
CN113284086A (zh) 电力稀缺缺陷图像生成及检测方法、装置及相关设备
CN116825210B (zh) 基于多源生物数据的哈希检索方法、系统、设备和介质
CN117132997B (zh) 一种基于多头注意力机制和知识图谱的手写表格识别方法
CN116739949B (zh) 一种胚胎图像的卵裂球边缘增强处理方法
CN116778280A (zh) 基于小样本的桥梁裂缝识别模型训练方法及装置
CN116229493B (zh) 跨模态的图片文本命名实体识别方法、系统及电子设备
CN117829142A (zh) 一种开发者社区平台的贴文标记方法
CN114138329A (zh) 一种基于TextCNN的软件自承认技术债务识别方法
Liao et al. Multi-grained Chinese spelling error correction for electricity nameplate text recognition
CN117494707A (zh) 用于钢材标准数据的复杂嵌套实体抽取方法、介质及设备
CN117710998A (zh) 一种基于深度学习的票据、表格文本实时识别方法
CN114550197A (zh) 一种端子排图像检测信息匹配方法
CN117649200A (zh) 一种作品版权登记的人工智能审核系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant