CN116523039B - 连铸知识图谱的生成方法及装置、存储介质、终端 - Google Patents

连铸知识图谱的生成方法及装置、存储介质、终端 Download PDF

Info

Publication number
CN116523039B
CN116523039B CN202310471241.3A CN202310471241A CN116523039B CN 116523039 B CN116523039 B CN 116523039B CN 202310471241 A CN202310471241 A CN 202310471241A CN 116523039 B CN116523039 B CN 116523039B
Authority
CN
China
Prior art keywords
node
nodes
continuous casting
parameters
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310471241.3A
Other languages
English (en)
Other versions
CN116523039A (zh
Inventor
余炯
包忞立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huayuan Computing Technology Shanghai Co ltd
Original Assignee
Huayuan Computing Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huayuan Computing Technology Shanghai Co ltd filed Critical Huayuan Computing Technology Shanghai Co ltd
Priority to CN202310471241.3A priority Critical patent/CN116523039B/zh
Publication of CN116523039A publication Critical patent/CN116523039A/zh
Application granted granted Critical
Publication of CN116523039B publication Critical patent/CN116523039B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种连铸知识图谱的生成方法及装置、存储介质、终端,所述方法包括:获取连铸生产线的相关性分析图;基于所述相关性分析图进行节点选取,获得相关节点序列,所述相关节点序列中相邻两个节点在所述相关性分析图中通过所述边连接;对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合;生成所述连铸知识图谱,其中,所述连铸知识图谱包括多个主节点,所述主节点和所述相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系。通过本发明提供的方案,能够实现简洁、有效的相关性挖掘。

Description

连铸知识图谱的生成方法及装置、存储介质、终端
技术领域
本发明涉及数据处理技术领域,尤其涉及一种连铸知识图谱的生成文本匹配方法及装置、存储介质、终端。
背景技术
钢铁产业作为国民经济的基础原材料产业,在经济发展中具有重要地位。在钢铁厂生产各类钢铁产品过程中,使钢水凝固成型有两种方法:传统的模铸法和连续铸钢(Continuous Steel Casting)法。与传统方法相比,连铸技术具有大幅提高金属收得率和铸坯质量,节约能源等显著优势。
随着控制技术的发展,连铸生产线的自动化程度越来越高,控制过程越来越复杂,连铸生产线涉及的工艺相关的参数和质量相关的参数的数量非常多,挖掘这些参数之间的相关性对于连铸生产过程中进行质量溯源、质量优化等具有重要意义。
发明内容
本发明的技术目的在于提供一种连铸知识图谱的生成方法及装置、存储介质、终端,能够实现简洁、有效的相关性挖掘。
有鉴于此,本发明实施例提供一种连铸知识图谱的生成方法,所述方法包括:获取连铸生产线的相关性分析图,所述相关性分析图包括多个节点以及边,其中,所述节点对应所述连铸生产线的参数,所述参数为工艺参数和/或质量参数,所述边用于指示连接的节点对应参数之间的相关性;基于所述相关性分析图进行节点选取,获得相关节点序列,所述相关节点序列中相邻两个节点在所述相关性分析图中通过所述边连接;对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合;生成所述连铸知识图谱,其中,所述连铸知识图谱包括多个主节点,所述主节点和所述相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系,每个主节点连接有第一次节点,所述第一次节点的内容为所述主节点对应的参数当前值。
可选的,所述边具有权重值,所述权重值用于指示连接的节点对应参数之间的相关程度,基于所述相关性分析图进行节点选取,获得相关节点序列包括:步骤一:从所述多个节点中选取初始节点,并将所述初始节点作为当前节点;步骤二:为所述当前节点构建虚拟停止节点,所述当前节点和所述虚拟停止节点之间的边的权重值为第一设定值;步骤三:选取下一个节点,所述下一个节点和所述当前节点之间的边的权重值为所述当前节点所连接的各条边中所述权重值最大的边;步骤四:判断是否满足停止条件,若满足,则获得所述相关节点序列,否则将所述下一个节点作为所述当前节点,并返回至所述步骤二,其中,所述停止条件为选取的节点数量达到第二设定值,或者,所述下一个节点为所述虚拟停止节点。
可选的,所述从所述多个节点中选取初始节点包括:接收用户输入的第一搜索指令,所述第一搜索指令包括:第一目标参数;将所述第一目标参数对应的节点作为所述初始节点。
可选的,对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合包括:针对所述相关节点序列的各个节点进行数据抽取,得到多条节点信息,每条节点信息包括节点对应的参数类型和参数当前值;将所述多条节点信息输入至词向量模型,得到所述词向量模型输出的各条节点信息的词向量;根据所述多条节点信息的词向量进行聚类,得到所述至少一个节点集合。
可选的,生成所述连铸知识图谱包括:对于同一个节点集合中任意两条节点信息,计算所述两条节点信息的词向量之间的距离,并将所述距离作为所述两条节点信息对应的主节点之间的连接权重。
可选的,生成所述连铸知识图谱包括:获取一条或多条工艺规则信息;若所述工艺规则信息用于描述单个参数的特征,则为所述单个参数对应主节点设置第二次节点,所述第二次节点的内容为所述参数的特征;若所述工艺规则信息用于描述多种参数之间的关系,则在所描述的多种参数对应的主节点之间设置连接关系。
可选的,所述方法还包括:接收用户输入的第二搜索指令,所述第二搜索指令包括第二目标参数;响应于所述第二搜索指令,在所述连铸知识图谱中进行查询,得到查询结果,所述查询结果包括关联参数的信息,在所述连铸知识图谱中所述关联参数对应的主节点和所述第二目标参数对应的主节点之间具有连接关系;输出所述查询结果。
可选的,获取连铸生产线的相关性分析图包括:获取所述连铸生产线的历史生产数据,所述历史生产数据包括多种参数在多个历史时刻的取值;将所述历史生产数据输入至预先训练的图模型,得到所述相关性分析图,其中,所述图模型的惩罚参数值为可选范围内的最小值。
本发明实施例还提供一种连铸知识图谱的生成装置,所述装置包括:第一获取模块,用于获取连铸生产线的相关性分析图,所述相关性分析图包括多个节点以及边,其中,所述节点对应所述连铸生产线的参数,所述参数为工艺参数和/或质量参数,所述边用于指示连接的节点对应参数之间的相关性;节点选取模块,用于基于所述相关性分析图进行节点选取,获得相关节点序列,所述相关节点序列中相邻两个节点在所述相关性分析图中通过所述边连接;聚类模块,用于对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合;图谱生成模块,用于生成所述连铸知识图谱,其中,所述连铸知识图谱包括多个主节点,所述主节点和所述相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系,每个主节点连接有第一次节点,所述第一次节点的内容为所述主节点对应的参数当前值。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述的连铸知识图谱的生成方法的步骤。
本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述的连铸知识图谱的生成方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明实施例提供一种连铸知识图谱的生成方法,在本发明实施例的方案中,获取连铸生产线的相关性分析图,相关性分析图包括多个节点以及边,其中,节点对应连铸生产线的参数,边用于指示连接的节点对应参数之间的相关性。进一步,基于相关性分析图进行节点选取,获得相关节点序列,由于相关节点序列中相邻两个节点在相关性分析图中通过边连接,由此能够确保相关节点序列中相邻两个节点对应参数之间的相关性;然后对相关节点序列中的各个节点进行聚类,并基于聚类结果生成连铸知识图谱。其中,连铸知识图谱包括多个主节点,主节点和相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系。
由此,上述方案利用初步挖掘得到的相关性分析图进行二次挖掘,对提取自相关性分析图的相关节点序列中的节点进行聚类,并根据聚类结果生成连铸知识图谱,使得参数之间的强相关关系被突出,弱相关关系被弱化,实现简洁、有效的相关性挖掘。
此外,连铸知识图谱中每个主节点连接有第一次节点,第一次节点的内容为主节点对应的参数当前值。因此,本发明实施例的方案能够在连铸生产线实时状态查询或监控的场景中,能够向用户提供简洁、有效的查询结果,避免向用户输出的查询结果出现冗余、繁杂的问题,有利于提高用户的使用体验。
进一步,本发明实施例的方案中,在节点选取的过程中,一方面,将当前节点所连接的各条边中权重值最大的边连接的另一个节点作为下一个节点,有利于保证相关节点序列中相邻节点之间的强相关性。另一方面,设置虚拟停止节点,在选择到虚拟停止节点时结束节点选取,由于选取过程中是将边权重最大的节点作为下一个节点,若选择到虚拟停止节点则说明当前节点和其他连接的节点之间的相关性均较弱,因此停止选取,也有利于保证相关性节点序列中节点之间的强相关性,使得连铸知识图谱中所体现的强相关性更加准确。
进一步,本发明实施例的方案中,将用户输入的第一搜索指令包含的第一目标参数对应的节点设置为初始节点,能够根据用户感兴趣的参数生成连铸知识图谱,使得生成的连铸知识图谱更加有针对性,满足用户特定的需求。
进一步,本发明实施例的方案中,基于词向量模型输出的词向量进行聚类,相较于直接基于节点信息进行聚类的方案而言,有利于提高聚类的效率。
进一步,本发明实施例的方案中,获取工艺规则信息,并根据工艺规则信息和聚类结果一并生成连铸知识图谱。也即,上述方案中,在数据挖掘的基础上引入专家经验信息,有利于使生成的连铸知识图谱包含的信息更加准确、全面。
附图说明
图1是本发明实施例中第一种连铸知识图谱的生成方法的流程示意图;
图2是图1中步骤S11的一种具体实施方式的流程示意图;
图3是本发明实施例中第一种相关性分析图的示意图;
图4是本发明实施例中第二种相关性分析图的示意图;
图5是本发明实施例中第三种相关性分析图的示意图;
图6是本发明实施例中第四种相关性分析图的示意图;
图7是图1中步骤S12的一种具体实施方式的流程示意图;
图8是本发明实施例中一种连铸知识图谱的生成装置的结构示意图。
具体实施方式
如背景技术所述,挖掘连铸生产线涉及的工艺相关的参数和质量相关的参数之间的相关性具有重要研究意义。
由于连铸生产线涉及的参数种类非常多,直接将现有的数据挖掘方法应用于连铸生产的场景中,得到的挖掘结果容易出现相关性不突出的问题,例如,某种工艺参数可能和其他20多种工艺参数具有相关性,其他20多种工艺参数中每种工艺参数又与其他多种的工艺参数相关等等。这种情况下,用户也无法应用相关性不突出的挖掘结果,容易出现质量排查错误或工艺参数设置错误的情况。在连铸生产线实时状态查询或监控的场景中,用户对于相关性挖掘的有效性和简洁性的需求尤其突出。
有鉴于此,本发明实施例提供一种连铸知识图谱的生成方法,在本发明实施例的方案中,利用初步挖掘得到的相关性分析图进行二次挖掘,对提取自相关性分析图的相关节点序列中的节点进行聚类,并根据聚类结果生成连铸知识图谱,使得参数之间的强相关关系被突出,弱相关关系被弱化,实现简洁、有效的相关性挖掘。
此外,连铸知识图谱中每个主节点连接有第一次节点,第一次节点的内容为主节点对应的参数当前值。因此,本发明实施例的方案能够在连铸生产线实时状态查询或监控的场景中,能够向用户提供简洁、有效的查询结果,避免向用户输出的查询结果出现冗余、繁杂的问题,有利于提高用户的使用体验。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参照图1,图1是本发明实施例中一种连铸知识图谱的生成方法的流程示意图。图1示出的方法可以由终端执行,所述终端可以是各种具有数据处理能力的设备,例如,可以是手机、计算机、平板电脑、物联网设备、服务器等,但并不限于此。图1示出的方法可以包括如下步骤:
步骤S11:获取连铸生产线的相关性分析图;
步骤S12:基于所述相关性分析图进行节点选取,获得相关节点序列,所述相关节点序列中相邻两个节点在所述相关性分析图中通过所述边连接;
步骤S13:对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合;
步骤S14:生成所述连铸知识图谱,其中,所述连铸知识图谱包括多个主节点,所述主节点和所述相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系,每个主节点连接有第一次节点,所述第一次节点的内容为所述主节点对应的参数当前值。
在步骤S11中,先获取连铸生产线的相关性分析图。
示例性的,所述相关性分析图可以是预先生成并存储于数据库中的,响应于用户输入的生成触发指令,可以从数据库中读取所述相关性分析图。所述生成触发指令可以是指用于触发生成本发明实施例中的连铸知识图谱的指令。
又示例性的,所述相关性分析图可以是响应于用户输入的生成触发指令生成的。也即,相关性分析图可以是实时生成的。本发明实施例中的用户额可以是工艺工程师,也可以是其他连铸生产线的相关人员,本实施例对此并不限制。
在本发明实施例的方案中,相关性分析图可以包括多个节点,以及节点之间的边,其中,所述节点对应参数,具体的,节点和参数可以是一一对应的。所述边具有权重值,所述边可以用于指示边连接的节点所对应的参数之间的相关性,所述权重值用于指示所述边连接的节点所对应的参数之间的相关程度。
需要说明的是,本发明实施例的方案中,参数可以是指工艺参数和/或质量参数。其中,工艺参数可以是指连铸生产线上采用的工艺参数。例如,工艺参数可以包括:氩气量、铸造速度、拉速、结晶器液位、热流密度、喷淋水量等。质量参数可以是指对连铸坯的质量进行描述的参数。例如,质量参数可以包括:中心偏析、角裂、纵裂、边部偏析等。
在具体实施中,相关性分析图中所包含的节点可以取决于输入的历史生产数据中包含的参数的种类。
在其他实施例中,相关性分析图也可以通过逆协方差矩阵来表示,逆协方差矩阵可以是M×M的矩阵,M为上述节点的数量,M为正整数。其中,矩阵中的非零元素可以表示两个节点之间的边,矩阵中的零元素可以表示两个节点之间没有边。
关于步骤S11以及相关性分析图的更多内容可以参见下文关于图2至图6的具体描述。
在步骤S12中,可以对相关性分析图进行节点选取,得到相关节点序列。所述相关节点序列中相邻两个节点在相关性分析图中通过边连接。也即,相关节点序列中相邻两个节点对应的参数之间具有相关性。进一步地,由于相邻两个节点在相关性分析图中通过边连接,因此,相关节点序列中任意两个节点在相关性分析图中均为间接连接的关系,所述任意两个节点对应的参数也可以视为具有相关性。
参照图7,图7是图1中步骤S12的一种具体实施方式的流程示意图。下面结合图7对节点选取的具体方法进行非限制性的描述。图7示出的步骤S12可以包括步骤S71至步骤S75。
步骤S71,从所述多个节点中选取初始节点,并将所述初始节点作为当前节点。
示例性的,可以在相关性分析图的多个节点中随机选取一个节点作为初始节点。
又示例性的,在步骤S12之前,可以接收用户输入的第一搜索指令,所述第一搜索指令包括:第一目标参数;相应的,步骤S71中可以将第一目标参数对应的节点作为初始节点。例如,第一搜索指令也可以是上述的生成触发指令,也即,上述的生成触发指令可以包括第一目标参数。采用这样的方案,能够根据用户感兴趣的参数生成连铸知识图谱,使得生成的连铸知识图谱更加有针对性,满足用户特定的需求。
步骤S72,为所述当前节点构建虚拟停止节点,所述当前节点和所述虚拟停止节点之间的边的权重值为第一设定值。
具体的,虚拟停止节点并非是真实存在于相关性分析图中的节点。当前节点和虚拟停止节点之间的边的权重值可以是预先设定的,例如,可以是0.2。
可选的,还可以将当前节点连接的各条边的权重值进行归一化处理,其中,进行归一化处理的各条边包括当前节点和虚拟停止节点之间的边。
步骤S73,选取下一个节点。
示例性的,所述下一个节点和所述当前节点之间的边的权重值为所述当前节点所连接的各条边中所述权重值最大的边。
具体的,可以将当前节点连接的各条边中权重值最大的边所连接的节点作为下一个节点。其中,步骤S73中当前节点连接的各条边包括当前节点和虚拟停止节点之间的边。采用这样的方案有利于保证相关节点序列中相邻节点之间的强相关性。
又示例性的,也可以从当前节点连接的各个节点中随机选取一个节点作为下一个节点。其中,步骤S73中当前节点连接的各个节点包括虚拟停止节点。
步骤S74,判断是否满足停止条件。
其中,所述停止条件为选取的节点数量达到第二设定值,或者,所述下一个节点为所述虚拟停止节点。需要说明的是,本实施例对于第一设定值、第二设定值的具体取值并不限制。
如果判断结果为是,也即,满足停止条件,则可以获得相关节点序列。如果判断结果为否,则继续执行步骤S75。
步骤S75,将下一个节点作为当前节点,并返回至所述步骤S72。
由上,可以获得相关节点序列,且相关节点序列中的任意两个节点之间均具有相关性。在具体实施中,通过步骤S12可以得到一个或多个相关节点序列。例如,也可以多次地执行步骤12,以获得多个相关节点序列,并基于多个相关节点序列中所包含的节点生成一个连铸知识图谱。
需要说明的是,在其他实施例中,也可以采用随机游走方法从相关分析图中获取相关节点序列。
继续参照图1,在步骤S13中,可以对相关节点序列中的各个节点进行聚类,得到至少一个节点集合,其中,每个节点集合可以包括一个或多个节点对应的参数类型。
作为一种可能的实现方式,可以将相关节点序列的各个节点对应的参数类型输入至词向量模型(word to vector,简称word2vec),得到词向量模型输出的各个节点对应的参数类型的词向量。参数类型是指参数名称,例如,结晶器液位等。
由此,利用词向量模型可以将每个参数名称都表示为高维空间内的一个向量,作为该节点的向量表表示。由此可以将自然语言文本的聚类问题转化为向量聚类的问题。在连铸场景中,一般有数百个工艺参数和数十种质量参数。利用词向量模型也可以起到降维的作用,输出的向量长度远小于初始向量长度。示例性的,本发明实施例的方案中,可以将词向量长度设定为32维。
需要说明的是,本发明实施例对于词向量模型并不进行限制,词向量模型可以是现有的各种能够将自然语言文本转化为向量的模型。
进一步地,可以基于各个节点对应参数类型的词向量表示进行聚类,得到至少一个节点集合。
示例性的,可以采用现有的各种适当的聚类算法进行聚类,例如,最大最小距离聚类算法、K近邻(K-Neighbors)聚类算法、K均值(K-Means)聚类算法等。
更具体地,可以用欧式距离来衡量两个节点的向量之间的距离,然后基于欧氏距离,采用最大最小距离聚类算法来对各个节点进行聚类。
在连铸场景中,相关的参数通常在参数名称上也具有一定的相似性,例如,工艺参数“拉速”与工艺参数“铸造速度”的语义相近,拉速值高对应铸造速度高,这两种工艺参数的语义相近,且在工艺上的相关性较强。又例如,“结晶器进水温度”与“结晶器出水温度”的语义相近,且在工艺上的相关性较强,结晶器进水温度变化会相应导致结晶器出水温度变化。为此,本发明的方案中,通过参数名称之间的相似性来对连铸参数进行聚类,能够准确、高效地实现连铸参数的聚类。
作为另一种可能的实现方式,在步骤S13中,可以针对相关节点序列的各个节点进行数据抽取,得到多条节点信息,每条节点信息包括节点对应的参数类型和参数当前值;然后将多条节点信息输入至词向量模型,得到词向量模型输出的各条节点信息的词向量;根据多条节点信息的词向量进行聚类,得到至少一个节点集合。
与上文中的实现方式不同,本实现方式中不仅将节点对应的参数类型和参数当前值一并输入至词向量模型。其中,参数当前值是指参数的当前取值。
例如,抽取到的多条节点信息分别为“浇铸长度为243.22m”、“结晶器液位为4.5mm”、“拉速大小是1.5m/s”等。将这些节点信息输入至词向量模型,词向量模型可以先对各条节点信息进行分词,通过分词可以得到:浇铸长度/为/243.22/m,结晶器/液位/为/4.5/mm,拉速/大小/是/1.5/m/s等。进一步地,词向量模型计算这些词的向量:浇铸长度=[x1,x2,…,xn],为=[y1,y2,…,yn],243.22=[z1,z2,…,zn],结晶器=[a1,a2,…,an],液位=[b1,b2,…,bn]等。进一步地,可以对同一条节点信息中词的向量表示进行整合,从而得到节点信息的词向量表示。
需要说明的是,本发明实施例中获得节点对应的参数类型的词向量或节点信息的词向量的具体过程可以是基于现有的词向量提取方法,本实施例对此并不限制。
进一步地,可以根据各条节点信息的词向量表示进行聚类。下面示例性地以采用最大最小聚类算法对多条节点信息进行聚类的过程进行具体描述。
最大最小聚类算法中先选择一个样本作为第1个聚类中心,然后选择与第1个聚类中心最远的样本作为第2个聚类中心。重复前述步骤来找到其他聚类中心,直到没有新的聚类中心为止。最后将样本按最小距离原则归入最近的类。具体可以包括如下步骤:
步骤a.随机选择一个向量点,作为第一个类的聚类中心Z1,例如选择“浇铸长度为243.22m”类作为聚类中心Z1点。
步骤b.选择与步骤a中距离最远的样本点,作为第二个类的聚类中心Z2,例如,通过计算确定Z1类和各类之间的最远的样本点,如:“结晶器液位为4.5mm”作为聚类中心Z2。
步骤c.逐个计算每个向量点到所有聚类中心的距离,并把所有的最短的距离记录下来。
步骤d.在这些最短距离中挑选最大的值,如果这个最大值大于γ×||Z1-Z2||,其中,0≤γ≤1,则将这个最大距离所对应的另一个样本点作为新的聚类中心;否则整个算法结束。
步骤e.重复步骤c和步骤d的操作,直到步骤d中不再出现新的聚类中心。
步骤f.将所有的向量样本归到与样本自身最近的聚类中心。
步骤g.聚类结束。
在聚类完毕后,工艺参数之间有相同的词向量工艺参数将聚类在一起,由此可以根据每种词向量的类型进行分类统计。例如:“结晶器液位为XXX”,“结晶器温度为XXX”为“结晶器”工艺类型的工艺参数,可以被聚类为一类工艺参数。“浇铸长度为XXX”,“浇铸距离为XXX”,“浇铸速度为XXX”,可以被聚类为一类工艺产生。还可以将结晶器、浇铸类型分为一类进行分类处理,得到相关连铸工艺参数值的分类模型。其中“XXX”用于表示具体的数值。
由上,通过步骤S13,可以得到至少一个节点集合,每个节点集合对应聚类得到的一个类,同一个节点集合中包含的各个节点对应的参数属于同一个类,也即,属于同一个节点集合的参数类型之间具有强相关性。
在步骤S14中,可以基于至少一个节点集合生成连铸知识图谱。也即,可以根据聚类结果生成连铸知识图谱。
在本发明的一实施例中,所述连铸知识图谱包括多个主节点,所述主节点和相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系,每个主节点连接有第一次节点,第一次节点的内容为所述主节点对应的参数当前值。其中,主节点之间的连接关系可以通过“边”来表示。
对于同一个节点集合中任意两条节点信息,可以计算两条节点信息的词向量之间的距离,并将计算得到距离作为所述两条节点信息对应的主节点之间的连接权重。
上述方案中,基于步骤S13中的聚类结果,定义连铸知识图谱中主节点与主节点之间的关系。属于同一个类的参数类型在连铸知识图谱中具有连接关系,不属于同一个类的参数类型在连铸知识图谱中不具有连接关系。此外,每个主节点还连接有第一次节点,并通过第一次节点体现参数当前值。由此,可以得到基于数据产生的质量参数及工艺参数的知识图谱。需要说明的是,不同主节点的第一次节点之间没有连接关系。也即,相关节点序列的各个节点之间强相关关系在连铸知识图谱中被体现,但弱相关关系被忽略,从而实现简洁、有效的相关性挖掘。
在本发明的另一实施例中,可以根据专家经验和上述的聚类结果,生成连铸知识图谱。
具体而言,可以获取一条或多条工艺规则信息。其中,工艺规则信息可以体现专家经验,也即,工艺规则信息可以是人工对连铸生产涉及的工艺参数和质量参数进行归纳总结得到的。
在具体实施中,工艺规则信息可以是预先存储于数据库中的,工艺规则信息可以是采用标准规则的形式进行存储的。具体的,可以对初始经验文本进行标准化处理,得到标准规则形式的工艺规则信息。
例如,初始经验文本可以是:结晶器温度在800与1000范围内。对该初始经验文本进行标准化处理,标准化处理过程中可以先提取出“Temp(结晶器)<800&&Temp(结晶器)>1000”规则形式,然后进一步转化为标准规则形式“|结晶器|温度|最小值|800,|结晶器|温度|最大值|1000”。由此,可以将人为输入的经验文本采用标准的分词后的方式进行存储。
作为一种可能的实现方式,工艺规则信息可以用于描述单个参数的特征,则可以为该条工艺规则信息所描述的工艺参数对应的主节点设置第二次节点,第二次节点的内容记为该参数的特征。
例如,工艺规则信息描述单个工艺参数的取值范围,则可以为该工艺采纳数对应的主节点设置两个第二次节点,其中一个第二次节点的内容为最大值,另一个第二次节点的内容为最小值。由此,结合第一次节点对应的参数当前值,可以直观地获知处于异常的工艺参数。
作为另一种可能的实现方式,工艺规则信息可以用于描述多种参数之间的关系,则可以在所描述的多种参数对应的主节点之间设置连接关系。具体的,若基于聚类结果生成的连铸知识图谱中所述多种参数之间已有连接关系,则可以不进行处理,若基于聚类结果生成的连铸知识图谱中所述多种参数之间尚未有连接关系,则可以根据工艺规则信息设置主节点之间的连接关系。
例如,工艺规则信息描述“结晶器温度”和“结晶器液位”这两项工艺参数都属于结晶器相关,为此,可以根据该工艺规则信息在“结晶器温度”和“结晶器液位”对应的主节点之间设置连接关系。
由上,可以采用专家经验对基于聚类结果得到的连铸知识图谱进行优化,得到更为全面、准确的连铸知识图谱,能够展现更多的信息。
在其他实施例中,连铸知识图谱还可以包括一个或多个类节点,其中,每个类节点连接至少一个主节点,类节点和上述的节点集合一一对应。类节点连接的主节点对应的参数类型属于该类节点对应的节点集合。
例如,主节点“结晶器温度”和“结晶器液位”可以均与类节点“结晶器”连接。由此,连铸知识图谱可以直观地体现多种参数的分类情况。
进一步的,可以向用户显示连铸知识图谱。
进一步地,还可以接收用户输入的第二搜索指令,所述第二搜索指令可以包括第二目标参数,第二目标参数可以是用户感兴趣的参数。响应于接收到的第二搜索指令,可以采用图搜索的方式在所连铸知识图谱中进行查询,得到查询结果,然后向用户输出查询结果。其中,查询结果可以包括第二目标参数的信息,还可以包括关联参数的信息。在所述连铸知识图谱中关联参数对应的主节点和第二目标参数对应的主节点之间具有连接关系,和/或,在连铸知识图谱中对应的主节点和第二目标参数对应的主节点连接于同一个类节点。
其中,第二目标参数的信息可以包括连铸知识图谱中第二目标参数对应的主节点连接的第一次节点和/或第二次节点的节点内容,类似的,关联参数的信息可以包括关联参数对应的主节点所连接的第一次节点和/或第二次节点的节点内容。
上述方案进行连铸工艺知识图谱的生成,并通过生成的知识图谱进行进一步的分析和数据查询。具体而言,由于已有在该条件下具备结合专家经验和已有词向量分类模型情况下的连铸知识图谱,因此针对某类工艺段,当需要进行知识图谱的向量搜索时,可以直接通过工艺关键字定义(也即,用户输入第二目标参数)进行相应的搜索,通过工艺关键字搜索来获取该工艺关键字下的搜索内容,可以供工艺人员或者相关工程师进行详细分析当前连铸系统状态的信息,而且同时该信息具有强相关性和工艺一致性,通过这种方式下知识的梳理可以达到简洁有效归类的效果。
本发明实施例中生成的连铸知识图谱可以用于连铸生产线的工艺参数控制,例如在设置工艺参数时,可以根据已经设置的工艺参数以及该相关性分析图进行相关的其他工艺参数的自动设置,或者对已经设置的各个参数进行校验。本发明实施例中生成的相关性分析图也可用于质量排查,例如在排查质量参数时,可以根据异常的质量参数以及该相关分析图,对相关的其他质量参数进行自动排查。
参照图2,图2是图1中步骤S11的一种具体实施方式的示意图。下面结合图2对步骤S11进行具体说明。图2示出的步骤S11可以包括步骤S111和步骤S112。
步骤S111:获取所述连铸生产线的历史生产数据,所述历史生产数据包括多种参数在多个历史时刻的取值;
步骤S112:将所述历史生产数据输入至预先训练的图模型,得到所述相关性分析图。
在步骤S111中,可以从数据库中获取连铸生产线的历史生产数据。示例性的,可以从数据库中获取上一炉次的历史生产数据。或者,可以获取最近N个炉次的历史生产数据,N为正整数。
具体的,历史生产数据可以包括多种工艺参数在多个历史时刻的取值,和/或,历史生产数据还可以包括多种质量参数在多个历史时刻的取值。
示例性的,所述历史生产数据可以包括N个样本集合,例如,1个样本集合可以对应1个炉次。其中,每个样本集合可以包括D个工艺参数集合和K个质量参数集合,第n个样本中第d个工艺参数值可以表示为xn,d,第n个样本中第k个质量参数值可以表示为yn,k,d为工艺参数种类的索引,k为质量参数种类的索引,n为样本集合的索引。非限制性的,D+K=M。
可选的,在步骤S112之前,可以先对历史生产数据进行预处理。
示例性的,可以对工艺参数值进行异常检测,并剔除异常的工艺参数值。具体的,可以计算每种工艺参数在多个历史时刻的取值的均值和标准差。对于每个工艺参数的取值,若该取值偏离均值超过预设倍数(例如3倍)的标准差,则可以将该取值视为异常值,因此,可以剔除该取值。此外,还可以对剔除异常值之后的工艺参数值进行归一化处理。
又示例性的,对于分类类型的质量参数数据,可以将其转换为数值类型,以得到质量参数值。例如,质量参数的原始数据为中心偏析、无中心偏析,转换后的质量参数值为1、0。
在步骤S112中,可以将历史生产数据或者经过预处理的历史生产数据输入至预先训练的图模型中。
具体而言,终端可以预先部署有图模型,所述图模型可以是经过预先训练得到的模型,图模型可以是指能够基于输入数据生成图的模型,所述图是一种包含节点(node)和边(edge)的数据结构。本发明实施例的方案中,图模型所生成的图可以是无向图。由此,所述图模型可以是指生成无向图的模型。例如,所述图模型可以是最小绝对收缩和选择算子(Least absolute shrinkage and selection operator,简称LASSO)模型。
此外,本发明实施例中的图模型可以配置有可调节的惩罚参数,所述惩罚参数也可以被称为“惩罚项”。为便于描述,下文将惩罚参数记为ρ。
本发明实施例的方案中,惩罚参数ρ的取值不同生成的图的稀疏程度不同,也即,惩罚参数的取值决定了图的稀疏程度。具体的,ρ越大,生成的图越稀疏,ρ越小,生成的图越稠密。
作为一种可能的实现方式,可以预先配置有惩罚参数ρ的可选范围,所述可选范围可以是指取值范围,在生成相关性分析图之前,可以先将惩罚参数ρ设置为可选范围内的最小值。例如,可选范围为1~10,则ρ=1。
示例性的,若接收到上述的生成触发指令,响应于生成触发指令,可以将惩罚参数ρ设置为可选范围内的最小值。
作为另一种可能的实现方式,可以基于用户输入的期望值和/或用户选择的数据挖掘模式,设置图模型的惩罚参数。
具体而言,可以预先设置有第一挖掘模式和第二挖掘模式以供用户进行选择,若用户选择第一挖掘模式,则生成相关性分析图后,可以输出相关性分析图,也即,向用户显示相关性分析图。若用户选择第二挖掘模式,则生成相关性分析图后可以继续基于相关性分析图生成连铸知识图谱,然后向用户显示连铸知识图谱。
也即,若用户选择第一挖掘模式,则在执行步骤S111和步骤S112之后,输出相关性分析图,可以不再执行图1中的步骤S12至步骤S14。或者,输出相关性分析图之后,若用户进一步选择第二挖掘模式(例如,在向用户显示相关性分析图的过程中检测到用户选择第二挖掘模式),则可以继续执行步骤S12至步骤S14,继续生成连铸知识图谱。
若用户选择第二挖掘模式,则在执行步骤S111和步骤S112之后,继续执行步骤S12至步骤S14。在这种情况下,生成相关性分析图之后,可以不向用户显示相关性分析图。区别于上文提到的“进一步选择第二挖掘模式”,此处的“选择第二挖掘模式”可以是直接选择第二挖掘模式,所述直接选择第二挖掘模式可以理解为并非以前一次的选择为第一挖掘模式为基础。
下面对用户选择不同挖掘模式的情况进行具体描述。
情况一:用户选择第一挖掘模式。
在具体实施中,用户选择第一挖掘模式时,还可以一并输入期望值。进一步地,可以根据用户输入的期望值,设置图模型的惩罚参数。其中,所述期望值用于表征用户期望的稀疏程度。作为一种可选的方式,用户直接设置期望的惩罚参数值。
具体的,查询触发指令所包含的期望值可以是惩罚参数值。也即,查询触发指令可以包括ρ,例如,ρ=1。在这种情况下,S13中,可以直接将查询触发指令所包含的期望值设置为图模型的惩罚参数。
作为一种可能的实现方式,可以向用户提供多个可选的惩罚参数值,用户可以从多个可选的惩罚参数值中选择一个作为期望值,也即,查询触发指令包含用户选择的惩罚参数值。
示例性的,可以向用户输出第一惩罚参数值和第二惩罚参数值以供用户选择。其中,第一惩罚参数值可以小于第二惩罚参数值。例如,第一惩罚参数值可以为1,第一惩罚参数值可以为100。
其中,第一惩罚参数值可以是惩罚参数的取值范围的最小值,第二惩罚参数值可以是惩罚参数的取值范围的最大值。采用第二惩罚参数值时,能够挖掘出参数之间的强相关关系,采用第一惩罚参数值时,能够挖掘出所有参数之间的整体相关关系。
在本发明的另一实施例中,用户设置期望的稀疏程度。
具体的,期望值可以是用户期望的稀疏程度的取值。示例性的,期望值可以是表示稀疏程度的百分数。也即,在这种场景下,期望值并不是惩罚参数值,而是描述稀疏程度的百分数等。例如,所述期望值可以为20%,说明用户期望生成的图中显示有20%的边。
在这种情况下,在步骤S112之前,可以先确定查询触发指令中的期望值匹配的惩罚参数值,然后将期望值匹配的惩罚参数值设置为图模型的惩罚参数。其中,期望值匹配的惩罚参数值可以是指采用所述匹配的惩罚参数值时图的稀疏程度为所述期望值。
在具体实施中,若用户输入的期望值处于预先设置的第一默认值和第二默认值之间,则可以在第一惩罚参数值和第二惩罚参数值之间搜索所述期望值匹配的惩罚参数。其中,第一默认值用于表征图模型采用第一惩罚参数值时所述相关性分析图的稀疏程度,第二默认值用于表征图模型采用第二惩罚参值时相关性分析图的稀疏程度。也即,第一惩罚参数值是第一默认值匹配的惩罚参数值,第二惩罚参数值是第二默认值匹配的惩罚参数值,第一默认值、第二默认值、第一惩罚参数值和第二惩罚参数值均可以是预先设置的。例如,第一惩罚参数值可以为1,第一默认值为90%,第二惩罚参数值可以为10,第二默认值为1%。
示例性的,可以采用二分法,在第一惩罚参数值和第二惩罚参数值之间搜索所述期望值匹配的惩罚参数。在其他实施例中,也可以采用其他的搜索算法在第一惩罚参数值和第二惩罚参数值之间搜索期望值匹配的惩罚参数。
进一步地,可以将搜索到的惩罚参数值设置为图模型的惩罚参数。例如,期望值可以为20%,通过搜索得到匹配的ρ=80,则可以将ρ设置为8。
若用户输入的期望值未处于预设设置的第一默认值和第二默认值之间,则可以提醒用户重新输入。
考虑到如果用户不具备图模型的相关知识,用户无法清楚地知晓惩罚参数的取值和稀疏程度之间的具体关系,用户直接设置惩罚参数可能无法获得期望的稀疏程度,有可能需要多次的尝试才能获得期望的相关性分析图。为此,本发明实施例的方案中,用户可以输入期望的稀疏程度,然后查找与期望的稀疏程度相匹配的惩罚参数值,也即,惩罚参数的具体取值对于用户而言是不可见的,有利于快速地获得用户期望的相关性分析图,便于用户的使用。
进一步地,根据用户输入的期望值设置惩罚参数之后,可以将历史生产数据输入至图模型中,得到图模型输出的相关性分析图。
作为一种具体方式,相关性分析图可以仅包括工艺节点。工艺节点之间的边可用于指示工艺参数之间的相关程度。由此,相关性分析图能够帮助用户挖掘并分析工艺参数之间的关系。
参照图3和图4,图3是本发明实施例中第一种相关性分析图的示意图,图4是本发明实施例中第二种相关性分析图的示意图。图3和图4示出的相关性分析图中仅包括多个工艺节点,未包括质量节点。其中,图3示出的相关性分析图的稀疏程度小于图4示出的相关性分析图的稀疏程度。也即,图3示出的相关性分析图比图4示出的相关性分析图更稠密。
图3和图4示出的工艺参数包括:铸造速度、热流密度、结晶器液位、喷淋水量、氩气量、拉速。更具体地,惩罚参数ρ=1时,生成图3所示的相关性分析图。惩罚参数ρ=10时,生成的图4所示的相关性分析图。
非限制性的,惩罚参数ρ=1时生成的相关性分析图可视为整体工艺参数相似性分析种类图,惩罚参数ρ=10时生成的相关性分析图可视为最大工艺参数相似性计算分析图。
本发明实施例的方案中,随着惩罚参数的取值越大,生成的相关性分析图越稀疏,相关性分析图中边所表征的相关性越高,从而能够挖掘出相关性较高的工艺参数对。也即,如果两种工艺参数之间的相关性较弱,则惩罚参数的取值较大时,这两种工艺参数对应的节点之间没有边。
在另一具体实施方式中,相关性分析图可以包括工艺节点和质量节点。
参照图5和图6,图5是本发明实施例中第三种相关性分析图的示意图,图6是本发明实施例中第四种相关性分析图的示意图。图5和图6示出的相关性分析图中既包括多个工艺节点,又包括多个质量节点。其中,图5示出的相关性分析图的稀疏程度小于图6示出的相关性分析图的稀疏程度。
具体的,除了图3和图4中的工艺参数外,图5和图6所示的相关性分析图还包括多个质量节点,所述多个质量节点对应的质量参数分别为:中心偏析、角裂、纵裂、边部偏析。
图5和图6示出的相关性分析图中,工艺节点和工艺节点之间边的权重值可以表征工艺参数之间的相关程度,工艺节点和质量节点之间边的权重值可以表征工艺参数和质量参数之间的相关程度,质量节点和质量节点之间边的权重值可以表征质量参数之间的相关程度。
上述的相关性分析图能够帮助用户挖掘并分析出工艺参数的改进方案来降低质量异常出现频率。如图6所示,中心偏析和角裂之间的相关程度较高,这两种质量参数又都和结晶器液面相关,影响到结晶器液面的工艺参数包括铸造速度、热流密度、喷淋水量。工艺工程师基于这些相关性信息,在设置工艺参数时兼顾各个相关的质量参数或工艺参数,从而能够更优地对参数进行设置优化,避免因满足某一种质量参数的需求而引起另一种质量参数的异常。
更具体地,惩罚参数ρ=1时,可以生成图5所示的相关性分析图。惩罚参数ρ=10时,可以生成的图6所示的相关性分析图。非限制性的,惩罚参数ρ=1时生成的相关性分析图可视为结合质量参数相关的工艺参数相关性生成学习图;惩罚参数ρ=10时生成的相关性分析图可视为最大质量参数相关的工艺参数相关性生成学习图。
如图6所示,当惩罚参数的取值较大时,可以获得多个子图。图6示出的相关性分析图可以包括第三子图和第四子图,第三子图包括边部偏析、氩气量、拉速和纵裂对应的节点,第四子图包括:铸造速度、热流密度、结晶器液位、喷淋水量、中心偏析和角裂对应的节点。
情况二:用户选择第一挖掘模式后,进一步选择第二挖掘模式。
作为一种可能的方式,若检测到用户进一步选择第二挖掘模式,则可以先判断当前的惩罚参数值是否支持生成连铸知识图谱。
具体而言,用于生成连铸知识图谱的相关性分析图应当比较稠密,若用户输入的期望值对应的惩罚参数值较大导致当前的相关性分析图较为稀疏,则无法基于相关性分析图进一步提取强相关性的相关节点序列。
为此,可以先判断当前的惩罚参数值是否支持生成连铸知识图谱。
示例性的,可以预先配置有限制阈值,若当前的惩罚参数值(也即,生成相关性分析图的惩罚参数值)大于或等于限制阈值,则可以将惩罚参数值设置为第一设定值,所述第一设定值可以是限制阈值,也可以是其他值,本实施例对此并不限制,所述第一设定值小于当前的惩罚参数值。进一步地,将惩罚参数设置为第一设定值之后,重新生成相关性分析图。并基于新生成的相关性分析图执行步骤S12至步骤S14,得到连铸知识图谱。
若当前的惩罚参数值小于限制阈值,则可以基于当前的相关性分析图执行步骤S12至步骤S14,得到连铸知识图谱。
作为另一种可能的方式,若检测到用户进一步选择第二挖掘模式,则可以将惩罚参数设置为上述可选范围的最小值,以重新生成相关性分析图。并基于新生成的相关性分析图执行步骤S12至步骤S14,得到连铸知识图谱。
情况三:用户直接选择第二挖掘模式。
示例性的,用户可以无需输入期望值,若检测到用户选择第二挖掘模式,则可以将惩罚参数设置为上述可选范围的最小值,以生成相关性分析图,并基于相关性分析图执行步骤S12至步骤S14,得到连铸知识图谱。
又示例性的,用户可以输入期望值,在这种情况下,用户输入的期望值可以是惩罚参数值。若检测到用户选择第二挖掘模式,则可以将用户输入的期望值与限制阈值进行比较。若期望值大于或等于限制阈值,则可以将惩罚参数设置为第一设定值,若期望值小于限制阈值,则可以将惩罚参数设置为期望值。进一步地,设置完成之后,可以生成相关性分析图,并基于相关性分析图执行步骤S12至步骤S14,得到连铸知识图谱。
需要说明的是,在其他实施例中,图模型也可以配置有固定的惩罚参数。
下面结合图5对本发明中的一个具体实施方式进行具体描述。
具体而言,生成图5示出的相关性分析图之后,可以采用随机游走的方式生成相关节点序列:铸造速度-结晶器液位-角裂;喷淋水量-铸造速度-结晶器液位-中心偏析-角裂;热流密度-铸造速度-结晶器液位;边部偏析-亚气量-拉速;纵裂-拉速-氩气量。然后用这些序列通过Word2Vec模型生成序列中节点名称的词向量。也即,此处的词为序列中的节点名称,例如“拉速”、“结晶器液位”等。由此,词向量模型输出每个词的向量表征,即为各个节点的向量表征。通过这种方式,可以将“拉速”、“结晶器液位”等工艺参数,对应到各自的向量表征上面。
接下来基于各项参数的向量表征来通过最大最小距离算法来聚类。最大最小距离算法会自动计算出类别的个数,不需要预先手动输入。进一步得到的聚类结果为:类别1.氩气量、拉速、纵裂;类别2.边部偏析;类别3.热流密度、铸造速度、喷淋水量、结晶器液位、角裂、中心偏析。
进一步基于聚类结果,建立连铸知识图谱。同一类别中参数对应的主节点之间有边连接。
进一步可以基于连铸知识图谱进行辅助查询。
例如,工艺人员查询了结晶器液位,那么就会同时展示与结晶器液位有关的其他工艺参数,包括热流密度、铸造速度、喷淋水量。如果工艺人员查询了角裂等质量参数信息,就会展示与其相关的结晶器液位、热流密度、铸造速度、喷淋水量等工艺参数信息。
可以理解的是,在具体实施中,上述方法可以采用软件程序的方式实现,该软件程序运行于芯片或芯片模组内部集成的处理器中;或者,该方法可以采用硬件或者软硬结合的方式来实现,例如用专用的芯片或芯片模组来实现,或者,用专用的芯片或芯片模组结合软件程序来实现。
参照图8,图8是本发明实施例中一种连铸知识图谱的生成装置的结构示意图。如图8所示,图8示出的装置可以包括:
第一获取模块81,用于获取连铸生产线的相关性分析图,所述相关性分析图包括多个节点以及边,其中,所述节点对应所述连铸生产线的参数,所述参数为工艺参数和/或质量参数,所述边用于指示连接的节点对应参数之间的相关性;
节点选取模块82,用于基于所述相关性分析图进行节点选取,获得相关节点序列,所述相关节点序列中相邻两个节点在所述相关性分析图中通过所述边连接;
聚类模块83,用于对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合;
图谱生成模块84,用于生成所述连铸知识图谱,其中,所述连铸知识图谱包括多个主节点,所述主节点和所述相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系,每个主节点连接有第一次节点,所述第一次节点的内容为所述主节点对应的参数当前值。
关于本发明实施例中的用于连铸生产线的相关性查询装置的工作原理、工作方法和有益效果等更多内容,可以参照上文关于用于连铸生产线的相关性查询方法的相关描述,在此不再赘述。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述的连铸知识图谱的生成方法的步骤。所述存储介质可以包括ROM、RAM、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。
本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述的连铸知识图谱的生成方法的步骤。所述终端包括但不限于手机、计算机、平板电脑等终端设备。
应理解,本发明实施例中,所述处理器可以为中央处理单元(central processingunit,简称CPU),该处理器还可以是其他通用处理器、数字信号处理器(digital signalprocessor,简称DSP)、专用集成电路(application specific integrated circuit,简称ASIC)、现成可编程门阵列(field programmable gate array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
还应理解,本发明实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,简称ROM)、可编程只读存储器(programmable ROM,简称PROM)、可擦除可编程只读存储器(erasable PROM,简称EPROM)、电可擦除可编程只读存储器(electricallyEPROM,简称EEPROM)或闪存。易失性存储器可以是随机存取存储器(random accessmemory,简称RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(random access memory,简称RAM)可用,例如静态随机存取存储器(staticRAM,简称SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronousDRAM,简称SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,简称DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,简称ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,简称SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,简称DR RAM)
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机程序可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法、装置和系统,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的;例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。例如,对于应用于或集成于芯片的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应用于或集成于芯片模组的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,不同的模块/单元可以位于芯片模组的同一组件(例如芯片、电路模块等)或者不同组件中,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片模组内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应用于或集成于终端的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,不同的模块/单元可以位于终端内同一组件(例如,芯片、电路模块等)或者不同组件中,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于终端内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,表示前后关联对象是一种“或”的关系。
本发明实施例中出现的“多个”是指两个或两个以上。本发明实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本发明实施例中对设备个数的特别限定,不能构成对本发明实施例的任何限制。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (9)

1.一种连铸知识图谱的生成方法,其特征在于,所述方法包括:
获取连铸生产线的相关性分析图,所述相关性分析图包括多个节点以及边,其中,所述节点对应所述连铸生产线的参数,所述参数为工艺参数和/或质量参数,所述边用于指示连接的节点对应参数之间的相关性;
基于所述相关性分析图进行节点选取,获得相关节点序列,所述相关节点序列中相邻两个节点在所述相关性分析图中通过所述边连接;
对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合;
生成所述连铸知识图谱,其中,所述连铸知识图谱包括多个主节点,所述主节点和所述相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系,每个主节点连接有第一次节点,所述第一次节点的内容为所述主节点对应的参数当前值;
其中,所述边具有权重值,所述权重值用于指示连接的节点对应参数之间的相关程度,基于所述相关性分析图进行节点选取,获得相关节点序列包括:
步骤一:从所述多个节点中选取初始节点,并将所述初始节点作为当前节点;
步骤二:为所述当前节点构建虚拟停止节点,所述当前节点和所述虚拟停止节点之间的边的权重值为第一设定值;
步骤三:选取下一个节点,所述下一个节点和所述当前节点之间的边的权重值为所述当前节点所连接的各条边中所述权重值最大的边;
步骤四:判断是否满足停止条件,若满足,则获得所述相关节点序列,否则将所述下一个节点作为所述当前节点,并返回至所述步骤二,其中,所述停止条件为选取的节点数量达到第二设定值,或者,所述下一个节点为所述虚拟停止节点;
其中,对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合包括:
针对所述相关节点序列的各个节点进行数据抽取,得到多条节点信息,每条节点信息包括节点对应的参数类型和参数当前值;
将所述多条节点信息输入至词向量模型,得到所述词向量模型输出的各条节点信息的词向量;
根据所述多条节点信息的词向量进行聚类,得到所述至少一个节点集合。
2.根据权利要求1所述的方法,其特征在于,所述从所述多个节点中选取初始节点包括:
接收用户输入的第一搜索指令,所述第一搜索指令包括:第一目标参数;
将所述第一目标参数对应的节点作为所述初始节点。
3.根据权利要求1所述的方法,其特征在于,生成所述连铸知识图谱包括:对于同一个节点集合中任意两条节点信息,计算所述两条节点信息的词向量之间的距离,并将所述距离作为所述两条节点信息对应的主节点之间的连接权重。
4.根据权利要求1所述的方法,其特征在于,生成所述连铸知识图谱包括:获取一条或多条工艺规则信息;
若所述工艺规则信息用于描述单个参数的特征,则为所述单个参数对应主节点设置第二次节点,所述第二次节点的内容为所述参数的特征;
若所述工艺规则信息用于描述多种参数之间的关系,则在所描述的多种参数对应的主节点之间设置连接关系。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收用户输入的第二搜索指令,所述第二搜索指令包括第二目标参数;
响应于所述第二搜索指令,在所述连铸知识图谱中进行查询,得到查询结果,所述查询结果包括关联参数的信息,在所述连铸知识图谱中所述关联参数对应的主节点和所述第二目标参数对应的主节点之间具有连接关系;
输出所述查询结果。
6.根据权利要求1所述的方法,其特征在于,获取连铸生产线的相关性分析图包括:
获取所述连铸生产线的历史生产数据,所述历史生产数据包括多种参数在多个历史时刻的取值;
将所述历史生产数据输入至预先训练的图模型,得到所述相关性分析图,其中,所述图模型的惩罚参数值为可选范围内的最小值。
7.一种连铸知识图谱的生成装置,其特征在于,所述装置包括:
第一获取模块,用于获取连铸生产线的相关性分析图,所述相关性分析图包括多个节点以及边,其中,所述节点对应所述连铸生产线的参数,所述参数为工艺参数和/或质量参数,所述边用于指示连接的节点对应参数之间的相关性;
节点选取模块,用于基于所述相关性分析图进行节点选取,获得相关节点序列,所述相关节点序列中相邻两个节点在所述相关性分析图中通过所述边连接;
聚类模块,用于对所述相关节点序列中的各个节点进行聚类,得到至少一个节点集合;
图谱生成模块,用于生成所述连铸知识图谱,其中,所述连铸知识图谱包括多个主节点,所述主节点和所述相关节点序列中的节点一一对应,每个主节点的内容为该主节点对应的参数类型,属于同一个节点集合的节点对应的主节点之间具有连接关系,每个主节点连接有第一次节点,所述第一次节点的内容为所述主节点对应的参数当前值;
其中,所述边具有权重值,所述权重值用于指示连接的节点对应参数之间的相关程度,所述节点选取模块包括:
用于执行步骤一的子模块,所述步骤一包括:从所述多个节点中选取初始节点,并将所述初始节点作为当前节点;
用于执行步骤二的子模块,所述步骤二包括:为所述当前节点构建虚拟停止节点,所述当前节点和所述虚拟停止节点之间的边的权重值为第一设定值;
用于执行步骤三的子模块,所述步骤三包括:选取下一个节点,所述下一个节点和所述当前节点之间的边的权重值为所述当前节点所连接的各条边中所述权重值最大的边;
用于执行步骤四的子模块,所述步骤四包括:判断是否满足停止条件,若满足,则获得所述相关节点序列,否则将所述下一个节点作为所述当前节点,并返回至所述步骤二,其中,所述停止条件为选取的节点数量达到第二设定值,或者,所述下一个节点为所述虚拟停止节点;
所述聚类模块包括:
用于针对所述相关节点序列的各个节点进行数据抽取,得到多条节点信息,每条节点信息包括节点对应的参数类型和参数当前值的子模块;
用于根据所述多条节点信息的词向量进行聚类,得到所述至少一个节点集合的子模块。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时,执行权利要求1至6中任一项所述的连铸知识图谱的生成方法的步骤。
9.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行权利要求1至6中任一项所述的连铸知识图谱的生成方法的步骤。
CN202310471241.3A 2023-04-26 2023-04-26 连铸知识图谱的生成方法及装置、存储介质、终端 Active CN116523039B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310471241.3A CN116523039B (zh) 2023-04-26 2023-04-26 连铸知识图谱的生成方法及装置、存储介质、终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310471241.3A CN116523039B (zh) 2023-04-26 2023-04-26 连铸知识图谱的生成方法及装置、存储介质、终端

Publications (2)

Publication Number Publication Date
CN116523039A CN116523039A (zh) 2023-08-01
CN116523039B true CN116523039B (zh) 2024-02-09

Family

ID=87393555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310471241.3A Active CN116523039B (zh) 2023-04-26 2023-04-26 连铸知识图谱的生成方法及装置、存储介质、终端

Country Status (1)

Country Link
CN (1) CN116523039B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108073673A (zh) * 2017-05-15 2018-05-25 北京华宇元典信息服务有限公司 一种基于机器学习的法律知识图谱构建方法、装置、系统和介质
CN110807103A (zh) * 2019-10-18 2020-02-18 中国银联股份有限公司 知识图谱构建方法、装置、电子设备及存储介质
CN111324643A (zh) * 2020-03-30 2020-06-23 北京百度网讯科技有限公司 知识图谱的生成方法、关系挖掘方法、装置、设备和介质
WO2020143326A1 (zh) * 2019-01-11 2020-07-16 平安科技(深圳)有限公司 知识数据存储方法、装置、计算机设备和存储介质
CN112528037A (zh) * 2020-12-04 2021-03-19 北京百度网讯科技有限公司 基于知识图谱的边关系预测方法、装置、设备及存储介质
CN113064999A (zh) * 2021-03-19 2021-07-02 南方电网调峰调频发电有限公司信息通信分公司 基于it设备运维的知识图谱构建算法、系统、设备及介质
CN113420157A (zh) * 2021-05-27 2021-09-21 冶金自动化研究设计院 基于知识图谱的钢铁产品表面纵裂纹缺陷溯源分析方法
CN113704326A (zh) * 2021-08-30 2021-11-26 中国银联股份有限公司 基于知识图谱的异常结构挖掘方法、装置及可读存储介质
CN114745286A (zh) * 2022-04-13 2022-07-12 电信科学技术第五研究所有限公司 基于知识图谱技术面向动态网络智能网络态势感知系统
CN115204572A (zh) * 2022-05-25 2022-10-18 华院计算技术(上海)股份有限公司 改进的基于时空对齐的Castrip数字画像生成与构建方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109964224A (zh) * 2016-09-22 2019-07-02 恩芙润斯公司 用于语义信息可视化和指示生命科学实体之间显著关联的时间信号推断的系统、方法和计算机可读介质
US11082434B2 (en) * 2019-04-06 2021-08-03 International Business Machines Corporation Inferring temporal relationships for cybersecurity events
US11853904B2 (en) * 2020-03-26 2023-12-26 Accenture Global Solutions Limited Agnostic creation, version control, and contextual query of knowledge graph
US20220108188A1 (en) * 2020-10-01 2022-04-07 International Business Machines Corporation Querying knowledge graphs with sub-graph matching networks

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108073673A (zh) * 2017-05-15 2018-05-25 北京华宇元典信息服务有限公司 一种基于机器学习的法律知识图谱构建方法、装置、系统和介质
WO2020143326A1 (zh) * 2019-01-11 2020-07-16 平安科技(深圳)有限公司 知识数据存储方法、装置、计算机设备和存储介质
CN110807103A (zh) * 2019-10-18 2020-02-18 中国银联股份有限公司 知识图谱构建方法、装置、电子设备及存储介质
CN111324643A (zh) * 2020-03-30 2020-06-23 北京百度网讯科技有限公司 知识图谱的生成方法、关系挖掘方法、装置、设备和介质
CN112528037A (zh) * 2020-12-04 2021-03-19 北京百度网讯科技有限公司 基于知识图谱的边关系预测方法、装置、设备及存储介质
CN113064999A (zh) * 2021-03-19 2021-07-02 南方电网调峰调频发电有限公司信息通信分公司 基于it设备运维的知识图谱构建算法、系统、设备及介质
CN113420157A (zh) * 2021-05-27 2021-09-21 冶金自动化研究设计院 基于知识图谱的钢铁产品表面纵裂纹缺陷溯源分析方法
CN113704326A (zh) * 2021-08-30 2021-11-26 中国银联股份有限公司 基于知识图谱的异常结构挖掘方法、装置及可读存储介质
CN114745286A (zh) * 2022-04-13 2022-07-12 电信科学技术第五研究所有限公司 基于知识图谱技术面向动态网络智能网络态势感知系统
CN115204572A (zh) * 2022-05-25 2022-10-18 华院计算技术(上海)股份有限公司 改进的基于时空对齐的Castrip数字画像生成与构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Node Classification Meets Link Prediction on Knowledge Graphs;Ralph Abboud等;《arXiv》;第1-20页 *
大规模知识图谱的查询处理技术研究;郭欣彤;《中国博士学位论文全文数据库信息科技辑》(第2期);第I138-132页 *

Also Published As

Publication number Publication date
CN116523039A (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN110024097B (zh) 基于机器学习的半导体制造良率预测系统和方法
CN109063217B (zh) 电力营销系统中的工单分类方法、装置及其相关设备
CN112889042A (zh) 机器学习中超参数的识别与应用
JPWO2016079972A1 (ja) 要因分析装置、要因分析方法とプログラム、及び、要因分析システム
CN112235327A (zh) 异常日志检测方法、装置、设备和计算机可读存储介质
KR20190072652A (ko) 정보 처리 장치 및 정보 처리 방법
CN110895533B (zh) 一种表单映射方法、装置、计算机设备和存储介质
CN113360711B (zh) 视频理解任务的模型训练和执行方法、装置、设备及介质
CN110362798B (zh) 裁决信息检索分析方法、装置、计算机设备和存储介质
CN113807004B (zh) 基于数据挖掘的刀具寿命预测方法、装置及系统
CN115146607B (zh) 评论信息情感偏好识别模型训练方法、识别方法及设备
Giannetti et al. A novel variable selection approach based on co-linearity index to discover optimal process settings by analysing mixed data
CN115576999B (zh) 基于云平台的任务数据处理方法、装置、设备及存储介质
CN114692778A (zh) 用于智能巡检的多模态样本集生成方法、训练方法及装置
CN117235137B (zh) 一种基于向量数据库的职业信息查询方法及装置
CN116523039B (zh) 连铸知识图谱的生成方法及装置、存储介质、终端
CN110263291A (zh) 一种工业数据趋势识别方法和系统
CN117453805A (zh) 一种不确定性数据的可视化分析方法
CN106407332B (zh) 基于人工智能的搜索方法和装置
CN116401281A (zh) 一种sql查询时间预测方法、装置、设备及介质
CN116432835A (zh) 客户流失预警归因方法、装置、计算机设备及存储介质
CN114139643B (zh) 一种基于机器视觉的单甘酯质量检测方法及系统
CN113535458B (zh) 异常误报的处理方法及装置、存储介质、终端
CN116069967A (zh) 图片处理方法、装置、电子设备及存储介质
CN116541436B (zh) 用于连铸生产线的相关性查询方法及装置、介质、终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant