CN115168605A - 图谱的确定方法和装置、存储介质及电子装置 - Google Patents
图谱的确定方法和装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN115168605A CN115168605A CN202210742676.2A CN202210742676A CN115168605A CN 115168605 A CN115168605 A CN 115168605A CN 202210742676 A CN202210742676 A CN 202210742676A CN 115168605 A CN115168605 A CN 115168605A
- Authority
- CN
- China
- Prior art keywords
- task
- information
- query
- map
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/358—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/42—Syntactic analysis
- G06F8/427—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/71—Version control; Configuration management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computer Security & Cryptography (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Debugging And Monitoring (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种图谱的确定方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该图谱的确定方法包括:获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;根据所述元数据信息创建目标节点;在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;将所述图谱和所述元数据信息进行打包得到任务知识图谱,可以解决现有技术中无法对数据链路复杂的任务进行快速的数据查询等问题。
Description
技术领域
本发明涉及智慧家庭领域,具体而言,涉及一种图谱的确定方法和装置、存储介质及电子装置。
背景技术
数据产出的准确性和及时性,在一定程度上依赖与任务是否正常运行,作业元数据,作为整个数据链路的指导方向,其错综复杂,利用传统的处理方法难以胜任,链路复杂时,检索性能和准确性都会严重下降。此外,任务链路错综复杂,在传统数据库存储的情况下,表设计复杂,并且查询使用比较麻烦,在体量比较大的情况下,检索所读将大大下降。
针对相关技术中,无法对数据链路复杂的任务进行快速的数据查询等问题,尚未提出有效的技术方案。
发明内容
本发明实施例提供了一种图谱的确定方法和装置、存储介质及电子装置,以至少解决相关技术中,无法对数据链路复杂的任务进行快速的数据查询等问题。
根据本发明的一个实施例,提供了一种图谱的确定方法,包括:获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;根据所述元数据信息创建目标节点;在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;将所述图谱和所述元数据信息进行打包得到任务知识图谱。
在一个示例性实施例中,将所述图谱和所述元数据信息进行打包得到任务知识图谱之后,上述方法还包括:将所述任务知识图谱存储在数据库中,并设置所述任务知识图谱的查询入口;其中,所述查询入口包括以下至少之一:任务查询入口、输出表查询入口、应用查询入口;通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息。
在一个示例性实施例中,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:在所述任务查询入口接收到查询指令的情况下,获取所述任务知识图谱中所有任务链路中不同节点的运行状态以及所述不同节点中每一个节点对应的运行时长,其中,所述任务知识图谱包含不同任务对应的数据链路;基于所述运行状态和所述运行时长生成所述任务知识图谱对应的任务运行图谱;使用预设的状态标识对所述任务运行图谱中的任务运行图谱进行可视化标识,将完成标识的任务运行图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:在所述输出表查询入口接收到查询指令的情况下,确定所述查询指令携带的待查询输出表的查询信息;根据所述查询信息确定当前待查询输出表在所述任务知识图谱中所有任务链路中的具体位置以及所述当前待查询输出表的运行情况;基于所述具体位置和所述运行情况生成可视化输出表,将所述可视化输出表作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:在所述应用查询入口接收到查询指令的情况下,确定所述查询指令对应的应用需求信息;其中,所述应用需求信息用于指示获取与应用对应的链路信息;根据所述应用需求信息在所述任务知识图谱中确定支持所述应用的多条目标数据链路,以及确定所述多条目标数据链路中每一条数据链路当前的运行情况和所述多条目标数据链路中每一条数据链路的运行时长,所述目标数据链路为所述任务知识图谱包含不同任务对应的数据链路的部分链路;使用所述多条目标数据链路、所述多条目标数据链路中每一条链路当前的运行情况、所述多条目标数据链路中每一条链路的运行时长构建应用支持图谱,将所述应用支持图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,根据所述元数据信息创建目标节点之后,上述方法还包括:获取所述目标节点对应元数据信息的更新信息;对所述更新信息进行解析,得到待更新属性;使用所述待更新属性对所述目标节点进行属性信息的变更,其中,所述属性信息用于对目标节点进行描述。
在一个示例性实施例中,在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱之后,上述方法还包括:获取所述目标节点对应的当前运行时间以及当前运行结果;在所述当前运行时间大于预设阈值的情况下,确定所述目标节点为超长节点,在所述图谱中为所述超长节点设置优化策略;在所述当前运行结果指示任务运行失败的情况下,生成提示信息,其中,所述提示信息用于指示对当前图谱中的目标节点为无效节点。
根据本发明的另一个实施例,提供了一种图谱的确定装置,包括:获取模块,用于获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;创建模块,用于根据所述元数据信息创建目标节点;连接模块,用于在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;打包模块,用于将所述图谱和所述元数据信息进行打包得到任务知识图谱。
在一个示例性实施例中,上述装置还包括:查询模块,用于将所述任务知识图谱存储在数据库中,并设置所述任务知识图谱的查询入口;其中,所述查询入口包括以下至少之一:任务查询入口、输出表查询入口、应用查询入口;通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息。
在一个示例性实施例中,上述查询模块,还用于在所述任务查询入口接收到查询指令的情况下,获取所述任务知识图谱中所有任务链路中不同节点的运行状态以及所述不同节点中每一个节点对应的运行时长,其中,所述任务知识图谱包含不同任务对应的数据链路;基于所述运行状态和所述运行时长生成所述任务知识图谱对应的任务运行图谱;使用预设的状态标识对所述任务运行图谱中的任务运行图谱进行可视化标识,将完成标识的任务运行图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,上述查询模块,还用于在所述输出表查询入口接收到查询指令的情况下,确定所述查询指令携带的待查询输出表的查询信息;根据所述查询信息确定当前待查询输出表在所述任务知识图谱中所有任务链路中的具体位置以及所述当前待查询输出表的运行情况;基于所述具体位置和所述运行情况生成可视化输出表,将所述可视化输出表作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,上述查询模块,还用于在所述应用查询入口接收到查询指令的情况下,确定所述查询指令对应的应用需求信息;其中,所述应用需求信息用于指示获取与应用对应的链路信息;根据所述应用需求信息在所述任务知识图谱中确定支持所述应用的多条目标数据链路,以及确定所述多条目标数据链路中每一条数据链路当前的运行情况和所述多条目标数据链路中每一条数据链路的运行时长,所述目标数据链路为所述任务知识图谱包含不同任务对应的数据链路的部分链路;使用所述多条目标数据链路、所述多条目标数据链路中每一条链路当前的运行情况、所述多条目标数据链路中每一条链路的运行时长构建应用支持图谱,将所述应用支持图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,上述装置还包括:更新模块,用于获取所述目标节点对应元数据信息的更新信息;对所述更新信息进行解析,得到待更新属性;使用所述待更新属性对所述目标节点进行属性信息的变更,其中,所述属性信息用于对目标节点进行描述。
在一个示例性实施例中,上述装置还包括:识别模块,用于获取所述目标节点对应的当前运行时间以及当前运行结果;在所述当前运行时间大于预设阈值的情况下,确定所述目标节点为超长节点,在所述图谱中为所述超长节点设置优化策略;在所述当前运行结果指示任务运行失败的情况下,生成提示信息,其中,所述提示信息用于指示对当前图谱中的目标节点为无效节点。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,获取不同任务对应的元数据信息,其中,元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;根据元数据信息创建目标节点;在确定不同任务之间的逻辑关系的情况下,使用预设的模式图结构对目标节点进行连接,得到包含不同任务的图谱;将图谱和元数据信息进行打包得到任务知识图谱,即将不同任务对应的整个任务链路关系写入图谱中,利用图谱对应的模式图结构对复杂的任务链路关系进行保留,使得可以使用确定出的任务知识图谱进行任务对应数据的快速查询,因此,可以解决现有技术中无法对数据链路复杂的任务进行快速的数据查询等问题,进一步的,该任务知识图谱支持多层关系的查询,并且响应速度相对于传统数据库也能得到很大的提升,配合前端将形成任务及时查询,任务链路及时查看的能力,将整个任务网络更加便利的呈现在前端,方便开发运维人员及时发现问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种图谱的确定方法的硬件环境示意图;
图2是根据本发明实施例的图谱的确定方法的流程图;
图3是根据本发明可选实施例的任务元数据管理的时序图;
图4是根据本发明实施例的图谱的确定装置的结构框图;
图5是根据本发明实施例的另一图谱的确定装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种图谱的确定方法。该图谱的确定方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述图谱的确定方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
在本实施例中提供了一种图谱的确定方法,图2是根据本发明实施例的图谱的确定方法的流程图,该流程包括如下步骤:
步骤S202,获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;
步骤S204,根据所述元数据信息创建目标节点;
可选的,在确定元数据信息的情况下,可以在目标应用程序中生成目标节点,该目标节点记录了某一个任务在当前时间对应的任务运行情况以及该任务的内容信息。例如,当是视频处理流程,任务运行情况可以是此时视频被处理的状态,如,处理了30%的视频数据,内容信息可以是处理后的视频的数据格式以及视频对应的视频名称,上述内容仅仅只是举例并不限定上述方法。
步骤S206,在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;
步骤S208,将所述图谱和所述元数据信息进行打包得到任务知识图谱。
通过上述步骤,获取不同任务对应的元数据信息,其中,元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;根据元数据信息创建目标节点;在确定不同任务之间的逻辑关系的情况下,使用预设的模式图结构对目标节点进行连接,得到包含不同任务的图谱;将图谱和元数据信息进行打包得到任务知识图谱,即将不同任务对应的整个任务链路关系写入图谱中,利用图谱对应的模式图结构对复杂的任务链路关系进行保留,使得可以使用确定出的任务知识图谱进行任务对应数据的快速查询,因此,可以解决现有技术中无法对数据链路复杂的任务进行快速的数据查询等问题,进一步的,该任务知识图谱支持多层关系的查询,并且响应速度相对于传统数据库也能得到很大的提升,配合前端将形成任务及时查询,任务链路及时查看的能力,将整个任务网络更加便利的呈现在前端,方便开发运维人员及时发现问题。
作为一种可选的实施例,为了提升对不同任务对应的元数据信息的获取效率,可以通过设置分布式数据流引擎进行元数据信息的获取,使得可以通过以数据并行和流水线方式执行任意元数据信息的数据流获取,增强元数据信息的获取效率;并且还可以对分布式数据流引擎配置自动获取流程,在分布式数据流引擎启动读取功能的情况下,允许分布式数据流引擎直接进行不同任务对应的元数据信息的采集。
在一个示例性实施例中,将所述图谱和所述元数据信息进行打包得到任务知识图谱之后,上述方法还包括:将所述任务知识图谱存储在数据库中,并设置所述任务知识图谱的查询入口;其中,所述查询入口包括以下至少之一:任务查询入口、输出表查询入口、应用查询入口;通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息。
例如,在任务知识图谱在数据库中存储时,可以设置任务知识图谱的任务查询入口;具体的,以任务节点,进行关联任务、工作流等节点,获取到整个任务链路中,运行到节点情况以及运行时长。还可以设置任务知识图谱的输出表查询入口;具体的,以输出表节点,进行关联任务、工作流等节点,获取该输出表在整个任务链路中具体位置以及运行情况;还可以设置任务知识图谱的应用查询入口;具体的,以应用节点,进行关联输出表、任务、工作流等节点,获取该上层应用拥有几条任务链路以及每条链路当前的运行情况以及运行时长;最终通过支持从三个入口进行查询任务运行情况,及时发现,任务运行超长节点、任务运行失败节点以及任务运行到那个点位等情况,方便开发、运维、产品等人员查询和发现整个任务链路中的问题,及时优化调整。
在一个示例性实施例中,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:在所述任务查询入口接收到查询指令的情况下,获取所述任务知识图谱中所有任务链路中不同节点的运行状态以及所述不同节点中每一个节点对应的运行时长,其中,所述任务知识图谱包含不同任务对应的数据链路;基于所述运行状态和所述运行时长生成所述任务知识图谱对应的任务运行图谱;使用预设的状态标识对所述任务运行图谱中的任务运行图谱进行可视化标识,将完成标识的任务运行图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:在所述输出表查询入口接收到查询指令的情况下,确定所述查询指令携带的待查询输出表的查询信息;根据所述查询信息确定当前待查询输出表在所述任务知识图谱中所有任务链路中的具体位置以及所述当前待查询输出表的运行情况;基于所述具体位置和所述运行情况生成可视化输出表,将所述可视化输出表作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:在所述应用查询入口接收到查询指令的情况下,确定所述查询指令对应的应用需求信息;其中,所述应用需求信息用于指示获取与应用对应的链路信息;根据所述应用需求信息在所述任务知识图谱中确定支持所述应用的多条目标数据链路,以及确定所述多条目标数据链路中每一条数据链路当前的运行情况和所述多条目标数据链路中每一条数据链路的运行时长,所述目标数据链路为所述任务知识图谱包含不同任务对应的数据链路的部分链路;使用所述多条目标数据链路、所述多条目标数据链路中每一条链路当前的运行情况、所述多条目标数据链路中每一条链路的运行时长构建应用支持图谱,将所述应用支持图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,根据所述元数据信息创建目标节点之后,上述方法还包括:获取所述目标节点对应元数据信息的更新信息;对所述更新信息进行解析,得到待更新属性;使用所述待更新属性对所述目标节点进行属性信息的变更,其中,所述属性信息用于对目标节点进行描述。
在一个示例性实施例中,在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱之后,上述方法还包括:获取所述目标节点对应的当前运行时间以及当前运行结果;在所述当前运行时间大于预设阈值的情况下,确定所述目标节点为超长节点,在所述图谱中为所述超长节点设置优化策略;在所述当前运行结果指示任务运行失败的情况下,生成提示信息,其中,所述提示信息用于指示对当前图谱中的目标节点为无效节点。
为了更好的理解上述图谱的确定方法的过程,以下结合几个可选实施例对上述图谱的确定方法流程进行说明。
作为一种可选的实施例,提出了一种基于知识图谱的任务元数据管理的方法,基于知识图谱的任务元数据管理,在图谱强大的算力和图结构关系下,将任务元数据关联出来形成一个巨大的任务网络,提升检索和管理的能力。即针对链路的错综复杂,将整个任务链路关系,写入图谱中,形成任务知识图谱,在图结构的加持下,复杂的关系将被保留下来,并且支持多层关系的查询,并且响应速度也能得到很大的提升,配合前端将形成任务及时查询,任务链路及时查看的能力。
可选的,在实际应用中,基于知识图谱作为存储介质和计算引擎,flink(相当于实施例中的分布式数据流引擎)实时捕获任务元数据库binlog,将获取到的结果实时写入图库中,另外调用实体、关系创建逻辑脚本,完成图结构创建,将任务元数据形成图网络,便于前端调用,获取任务链路运行情况以及任务多条链路关系。将整个任务网络更加便利的呈现在前端,方便开发运维人员及时发现问题,以及了解任务运行的位置。
图3是根据本发明可选实施例的任务元数据管理的时序图;包括以下步骤:
步骤1、管理对象(actor)启动程序(flink);
步骤2.1、flink集群调用数据服务器中AZK配置库中的任务运行日志表;具体包括:Flink-CDC任务运行信息:采用CDC监控Binlog的形式,采集任务的运行情况;Flink-Jdbc工程维度信息:采用Flink-Jdbc连接数据库,获取任务对应工程的维度信息,主要获取工程描述信息;
步骤2.2、AZK配置库实时返回任务的运行情况;
步骤2.3、flink集群阶段性请求工程元数据;
步骤2.4、返回工程元数据;
步骤3.5、按照逻辑判断,创建新增节点以及更新节点-关系状态;即进行任务知识图谱构建:按照图模式,进行创建实体关系,完成任务链路的网络;按照任务元数据的捕获情况,及时更新图谱的实体属性信息;
步骤3.6、定期更新各节点关系至Neo4j图形数据库;
步骤4.1、图形数据库按照任务,运行状态数据;可选的,任务知识图谱的任务查询入口的运行方式为:以任务节点,进行关联任务、工作流等节点,获取到整个任务链路中,运行到节点情况以及运行时长。
步骤4.2、图形数据库按照输出表,运行状态数据;可选的,任务知识图谱的输出表查询入口的运行方式为:以输出表节点,进行关联任务、工作流等节点,获取该输出表在整个任务链路中具体位置以及运行情况。
步骤4.3、图形数据库按照应用,运行状态数据;可选的,任务知识图谱的应用查询入口的运行方式为:以应用节点,进行关联输出表、任务、工作流等节点,获取该上层应用拥有几条任务链路以及每条链路当前的运行情况以及运行时长。
步骤5、在前端上进行结果的可视化呈现。
也就是说,通过上述方法,利用知识图谱作为存储介质和计算引擎,使用flink读取任务元数据库,获取任务运行元数据信息,按照图模式图,创建实体和关系,写入图库中,初始化完毕后,按照增量形式进行更新实体和关系,图谱存储完毕后,按照三个入口进行供前端使用,任务端、输出表端、应用端,支持开发、运维、产品等人员通过前端进行查看使用。此外,还可以实时获取任务元数据,实现图谱的增量更新。
综上,通过上述方案,对于错综复杂的任务链路,将任务链路的任务元数据提取出来形成任务知识图谱,进而通过任务知识图谱进行任务链路中任务元数据监控和使用的整体管理,进一步的,当任务链路中出现现问题,也可以及时发现,为找到优化突破点等方面提供数据支持,另提供实时能力,将整个链路的处理时效性提升到亚秒级别。实现了将任务元数据形成图网络,便于前端调用获取任务链路运行情况以及任务多条链路关系。将整个任务网络更加便利的呈现在前端,方便开发运维人员及时发现问题,以及了解任务运行的位置。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述图谱的确定。
在本实施例中还提供了一种图谱的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的图谱的确定装置的结构框图,如图4所示,该装置包括:
获取模块42,用于获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;
创建模块44,用于根据所述元数据信息创建目标节点;
连接模块46,用于在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;
打包模块48,用于将所述图谱和所述元数据信息进行打包得到任务知识图谱。
通过上述装置,获取不同任务对应的元数据信息,其中,元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;根据元数据信息创建目标节点;在确定不同任务之间的逻辑关系的情况下,使用预设的模式图结构对目标节点进行连接,得到包含不同任务的图谱;将图谱和元数据信息进行打包得到任务知识图谱,即将不同任务对应的整个任务链路关系写入图谱中,利用图谱对应的模式图结构对复杂的任务链路关系进行保留,使得可以使用确定出的任务知识图谱进行任务对应数据的快速查询,因此,可以解决现有技术中无法对数据链路复杂的任务进行快速的数据查询等问题,进一步的,该任务知识图谱支持多层关系的查询,并且响应速度相对于传统数据库也能得到很大的提升,配合前端将形成任务及时查询,任务链路及时查看的能力,将整个任务网络更加便利的呈现在前端,方便开发运维人员及时发现问题。
可选的,图5是根据本发明实施例的另一图谱的确定装置的结构框图,不仅包括图4中的所有模块,还包括:更新模块52、识别模块54、查询模块56。
在一个示例性实施例中,上述装置还包括:查询模块,用于将所述任务知识图谱存储在数据库中,并设置所述任务知识图谱的查询入口;其中,所述查询入口包括以下至少之一:任务查询入口、输出表查询入口、应用查询入口;通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息。
在一个示例性实施例中,上述查询模块,还用于在所述任务查询入口接收到查询指令的情况下,获取所述任务知识图谱中所有任务链路中不同节点的运行状态以及所述不同节点中每一个节点对应的运行时长,其中,所述任务知识图谱包含不同任务对应的数据链路;基于所述运行状态和所述运行时长生成所述任务知识图谱对应的任务运行图谱;使用预设的状态标识对所述任务运行图谱中的任务运行图谱进行可视化标识,将完成标识的任务运行图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,上述查询模块,还用于在所述输出表查询入口接收到查询指令的情况下,确定所述查询指令携带的待查询输出表的查询信息;根据所述查询信息确定当前待查询输出表在所述任务知识图谱中所有任务链路中的具体位置以及所述当前待查询输出表的运行情况;基于所述具体位置和所述运行情况生成可视化输出表,将所述可视化输出表作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,上述查询模块,还用于在所述应用查询入口接收到查询指令的情况下,确定所述查询指令对应的应用需求信息;其中,所述应用需求信息用于指示获取与应用对应的链路信息;根据所述应用需求信息在所述任务知识图谱中确定支持所述应用的多条目标数据链路,以及确定所述多条目标数据链路中每一条数据链路当前的运行情况和所述多条目标数据链路中每一条数据链路的运行时长,所述目标数据链路为所述任务知识图谱包含不同任务对应的数据链路的部分链路;使用所述多条目标数据链路、所述多条目标数据链路中每一条链路当前的运行情况、所述多条目标数据链路中每一条链路的运行时长构建应用支持图谱,将所述应用支持图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
在一个示例性实施例中,上述装置还包括:更新模块,用于获取所述目标节点对应元数据信息的更新信息;对所述更新信息进行解析,得到待更新属性;使用所述待更新属性对所述目标节点进行属性信息的变更,其中,所述属性信息用于对目标节点进行描述。
在一个示例性实施例中,上述装置还包括:识别模块,用于获取所述目标节点对应的当前运行时间以及当前运行结果;在所述当前运行时间大于预设阈值的情况下,确定所述目标节点为超长节点,在所述图谱中为所述超长节点设置优化策略;在所述当前运行结果指示任务运行失败的情况下,生成提示信息,其中,所述提示信息用于指示对当前图谱中的目标节点为无效节点。
在本发明的描述中,需要理解的是,术语中“中心”、“上”、“下”、“前”、“后”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或组件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连接”、“相连”应做广义理解,例如,可以是固定连接,也可以是拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以是通过中间媒介间接相连,可以是两个组件内部的连通。当组件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明的具体含义。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;
S2,根据所述元数据信息创建目标节点;
S3,在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;
S4,将所述图谱和所述元数据信息进行打包得到任务知识图谱。
在一个示例性实施例中,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
在一个示例性实施例中,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;
S2,根据所述元数据信息创建目标节点;
S3,在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;
S4,将所述图谱和所述元数据信息进行打包得到任务知识图谱。
在一个示例性实施例中,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,在一个示例性实施例中,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种图谱的确定方法,其特征在于,包括:
获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;
根据所述元数据信息创建目标节点;
在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;
将所述图谱和所述元数据信息进行打包得到任务知识图谱。
2.根据权利要求1所述的方法,其特征在于,将所述图谱和所述元数据信息进行打包得到任务知识图谱之后,所述方法还包括:
将所述任务知识图谱存储在数据库中,并设置所述任务知识图谱的查询入口;其中,所述查询入口包括以下至少之一:任务查询入口、输出表查询入口、应用查询入口;
通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息。
3.根据权利要求2所述的方法,其特征在于,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:
在所述任务查询入口接收到查询指令的情况下,获取所述任务知识图谱中所有任务链路中不同节点的运行状态以及所述不同节点中每一个节点对应的运行时长,其中,所述任务知识图谱包含不同任务对应的数据链路;
基于所述运行状态和所述运行时长生成所述任务知识图谱对应的任务运行图谱;
使用预设的状态标识对所述任务运行图谱中的任务运行图谱进行可视化标识,将完成标识的任务运行图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
4.根据权利要求2所述的方法,其特征在于,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:
在所述输出表查询入口接收到查询指令的情况下,确定所述查询指令携带的待查询输出表的查询信息;
根据所述查询信息确定当前待查询输出表在所述任务知识图谱中所有任务链路中的具体位置以及所述当前待查询输出表的运行情况;
基于所述具体位置和所述运行情况生成可视化输出表,将所述可视化输出表作为数据信息,并将所述数据信息发送至可视化显示界面。
5.根据权利要求2所述的方法,其特征在于,通过所述查询入口接收前端的查询指令,并从所述任务知识图谱中获取与所述查询指令匹配的数据信息,包括:
在所述应用查询入口接收到查询指令的情况下,确定所述查询指令对应的应用需求信息;其中,所述应用需求信息用于指示获取与应用对应的链路信息;
根据所述应用需求信息在所述任务知识图谱中确定支持所述应用的多条目标数据链路,以及确定所述多条目标数据链路中每一条数据链路当前的运行情况和所述多条目标数据链路中每一条数据链路的运行时长,所述目标数据链路为所述任务知识图谱包含不同任务对应的数据链路的部分链路;
使用所述多条目标数据链路、所述多条目标数据链路中每一条链路当前的运行情况、所述多条目标数据链路中每一条链路的运行时长构建应用支持图谱,将所述应用支持图谱作为数据信息,并将所述数据信息发送至可视化显示界面。
6.根据权利要求1所述的方法,其特征在于,根据所述元数据信息创建目标节点之后,所述方法还包括:
获取所述目标节点对应元数据信息的更新信息;
对所述更新信息进行解析,得到待更新属性;
使用所述待更新属性对所述目标节点进行属性信息的变更,其中,所述属性信息用于对目标节点进行描述。
7.根据权利要求1所述的方法,其特征在于,在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱之后,所述方法还包括:
获取所述目标节点对应的当前运行时间以及当前运行结果;
在所述当前运行时间大于预设阈值的情况下,确定所述目标节点为超长节点,在所述图谱中为所述超长节点设置优化策略;
在所述当前运行结果指示任务运行失败的情况下,生成提示信息,其中,所述提示信息用于指示对当前图谱中的目标节点为无效节点。
8.一种图谱的确定装置,其特征在于,包括:
获取模块,用于获取不同任务对应的元数据信息,其中,所述元数据信息包括以下至少之一:任务的运行信息、任务的工程维度信息;
创建模块,用于根据所述元数据信息创建目标节点;
连接模块,用于在确定所述不同任务之间的逻辑关系的情况下,使用预设的模式图结构对所述目标节点进行连接,得到包含不同任务的图谱;
打包模块,用于将所述图谱和所述元数据信息进行打包得到任务知识图谱。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序由处理器运行时执行权利要求1至7中任一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210742676.2A CN115168605A (zh) | 2022-06-28 | 2022-06-28 | 图谱的确定方法和装置、存储介质及电子装置 |
PCT/CN2022/141686 WO2024001113A1 (zh) | 2022-06-28 | 2022-12-23 | 图谱的确定方法和装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210742676.2A CN115168605A (zh) | 2022-06-28 | 2022-06-28 | 图谱的确定方法和装置、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115168605A true CN115168605A (zh) | 2022-10-11 |
Family
ID=83486575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210742676.2A Pending CN115168605A (zh) | 2022-06-28 | 2022-06-28 | 图谱的确定方法和装置、存储介质及电子装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115168605A (zh) |
WO (1) | WO2024001113A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024001113A1 (zh) * | 2022-06-28 | 2024-01-04 | 青岛海尔科技有限公司 | 图谱的确定方法和装置、存储介质及电子装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10621838B2 (en) * | 2017-12-15 | 2020-04-14 | Google Llc | External video clip distribution with metadata from a smart-home environment |
CN108768728B (zh) * | 2018-05-31 | 2022-09-02 | 康键信息技术(深圳)有限公司 | 运维任务处理方法、装置、计算机设备和存储介质 |
CN111782824B (zh) * | 2020-08-14 | 2024-04-19 | 中国工商银行股份有限公司 | 信息查询方法、装置、系统和介质 |
CN111813963B (zh) * | 2020-09-10 | 2020-12-22 | 平安国际智慧城市科技股份有限公司 | 知识图谱构建方法、装置、电子设备及存储介质 |
CN114510611B (zh) * | 2022-04-20 | 2022-07-05 | 中信证券股份有限公司 | 一种构建元数据血缘图谱的方法、装置及相关设备 |
CN115168605A (zh) * | 2022-06-28 | 2022-10-11 | 青岛海尔科技有限公司 | 图谱的确定方法和装置、存储介质及电子装置 |
-
2022
- 2022-06-28 CN CN202210742676.2A patent/CN115168605A/zh active Pending
- 2022-12-23 WO PCT/CN2022/141686 patent/WO2024001113A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024001113A1 (zh) * | 2022-06-28 | 2024-01-04 | 青岛海尔科技有限公司 | 图谱的确定方法和装置、存储介质及电子装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2024001113A1 (zh) | 2024-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110659109B (zh) | 一种openstack集群虚拟机监控系统及方法 | |
CN111600746B (zh) | 网络故障定位方法、装置及设备 | |
US9170960B2 (en) | Location of computing assets within an organization | |
CN111030840A (zh) | 一种生成拓扑图的方法、装置、电子设备及存储介质 | |
CN115687349A (zh) | 数据库表的生成方法及装置、存储介质及电子装置 | |
CN110928984A (zh) | 一种知识图谱的构建方法、装置、终端及存储介质 | |
CN109802842B (zh) | 应用拓扑的生成方法及相关设备 | |
CN115168605A (zh) | 图谱的确定方法和装置、存储介质及电子装置 | |
CN104866650B (zh) | 一种创建抽象设备的方法和装置 | |
CN106682210B (zh) | 日志文件查询方法及装置 | |
CN106446289B (zh) | 基于Pinpoint的信息查询方法和装置 | |
CN110874365B (zh) | 一种信息查询方法及其相关设备 | |
CN113239074B (zh) | 物理端口定位方法、装置、电子设备及存储介质 | |
CN101605049B (zh) | 网管数据统计分析指标的处理方法和装置、数据管理系统 | |
CN114430367B (zh) | 物联网的数据采集方法、装置、计算机设备及存储介质 | |
CN104503735A (zh) | 一种电网系统标准化数据交换接口一致性校验方法 | |
CN112395340B (zh) | 一种数据资产管理方法及装置 | |
EP3591481B1 (en) | Device configuration management apparatus, system, and program | |
CN109710605B (zh) | 一种设备信息自动化采集装置以及方法 | |
CN112749189A (zh) | 数据查询方法及装置 | |
CN112436993B (zh) | 一种基于配置文件分析的vpn专线发现的方法及装置 | |
CN117743461A (zh) | 数据同步方法和装置、存储介质及电子装置 | |
CN117170769B (zh) | 面向物联网传感器资源融合服务动态生成方法及装置 | |
Nascimento | A database for appliances real-life energy performance and consumption assessment | |
CN116301767A (zh) | 接口文件的生成方法、装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |