CN115017882A - 数据血缘关系确定方法、装置、电子设备及存储介质 - Google Patents
数据血缘关系确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115017882A CN115017882A CN202210774048.2A CN202210774048A CN115017882A CN 115017882 A CN115017882 A CN 115017882A CN 202210774048 A CN202210774048 A CN 202210774048A CN 115017882 A CN115017882 A CN 115017882A
- Authority
- CN
- China
- Prior art keywords
- analyzed
- data
- statement
- determining
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例公开了一种数据血缘关系确定方法、装置、电子设备及存储介质。该方法包括:获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句;针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板;通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。本发明实施例的技术方案,解决了现有确定数据血缘的方式存在局限性的问题,实现了能够确定各种语法规则数据的血缘关系,从而突破了现有技术的局限性。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据血缘关系确定方法、装置、电子设备及存储介质。
背景技术
现有技术中,确定数据血缘关系的方式,通常是针对特定语法规则的数据进行解析,进而确定数据的血缘关系。一旦数据的语法规则发生改变,现有数据血缘关系的确定方式就难以确定数据的血缘关系。因此,现有确定数据血缘的方式存在局限性的问题。
发明内容
本发明提供了一种数据血缘关系确定方法、装置、电子设备及存储介质,以实现能够确定各种语法规则数据的血缘关系,从而突破了现有技术的局限性。
根据本发明的一方面,提供了一种数据血缘关系确定方法,该方法包括:
获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句;
针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板;
通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。
可选地,所述方法包括:
接收用户针对各语句格式输入的自定义数据血缘规则,并将每个所述自定义血缘规则作为单独的数据血缘解析模板。
可选地,所述方法还包括:
将各所述数据血缘解析模板存储至自定义数据血缘解析引擎;
所述确定与所述语句格式对应的数据血缘解析模板,包括:
确定在所述自定义数据血缘解析引擎中与所述语句格式对应的数据血缘解析模板。
可选地,所述方法还包括:
接收用户输入的数据血缘解析文本,将所述数据血缘解析文本作为待解析文本,并存储至预先创建的解析队列中;
所述获取待解析文本,包括:
从所述解析队列中获取所述待解析文本。
可选地,所述通过调用所述数据血缘解析模板对所述待解析语句进行解析,包括:
确定所述待解析语句的优先级;
根据所述优先级,调用所述数据血缘解析模板对所述待解析语句进行解析。
可选地,所述通过调用所述数据血缘解析模板对所述待解析语句进行解析,包括:
确定所述待解析语句的语句复杂度;
如果所述语句复杂度超过复杂度阈值,则利用所述数据血缘解析模板采用多线程对所述待解析语句进行解析。
可选地,所述待解析语句的语句格式包括:可扩展标记语言格式、数据交换格式以及结构化查询语言数据库语句格式中的至少一种。
根据本发明的另一方面,提供了一种数据血缘关系确定装置。该装置包括:
待解析语句确定模块,用于获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句;
解析模板确定模块,用于针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板;
血缘关系确定模块,用于通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的数据血缘关系确定方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的数据血缘关系确定方法。
本发明实施例的技术方案,通过获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句。进而可以针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板。在确定数据血缘解析模板后,可以通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系,本发明实施例的技术方案,解决了现有确定数据血缘的方式存在局限性的问题,实现了能够确定各种语法规则数据的血缘关系,从而突破了现有技术的局限性。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种数据血缘关系确定方法的流程示意图;
图2为本发明实施例二提供的一种可选的数据血缘关系确定方法的流程示意图;
图3为本发明实施例三提供的一种数据血缘关系确定装置的结构示意图;
图4为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
实施例一
图1为本发明实施例一提供的一种数据血缘关系确定方法的流程示意图,本实施例可适用于确定数据血缘关系的场景,该方法可以由数据血缘关系确定装置来执行,该数据血缘关系确定装置可以采用硬件和/或软件的形式实现,该数据血缘关系确定装置可配置于诸如计算机或者服务器等的电子设备中。如图1所示,本实施例的方法包括:
S110、获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句。
其中,待解析文本可以为存储有一条或多条待解析语句的文本。待解析语句可以用于确定数据之间的血缘关系。待解析语句的语句格式可以包括可扩展标记语言格式(Extensible Markup Language,XML)、数据交换格式(JavaScript Object Notation,JSON)以及结构化查询语言数据库语句格式(Structured Query Language,SQL)中的至少一种。
在本发明实施例中,获取待解析文本的方式有多种,例如,可以是通过接收用户上传的待解析文本,进而可以获取待解析文本;或者,可以是接收用户输入的待解析语句,并可以基于待解析语句生成待解析文本,从而可以得到待解析文本。
可选地,本发明实施例的技术方案还包括:接收用户输入的数据血缘解析文本,将所述数据血缘解析文本作为待解析文本,并存储至预先创建的解析队列中。其中,解析队列可以理解为用于存储待解析本文的队列。在本发明实施例中,将待解析文本存储至解析队列,可统一管理待解析文本,从而便于后续待解析文本的获取。相应的,所述获取待解析文本,包括:从所述解析队列中获取所述待解析文本。
S120、针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板。
待解析语句的语句格式可以理解为待解析语句的语法格式。示例性的,待解析语句的语句格式可以为JSON格式;或者,可以为XML格式;亦或者,可以为SQL格式。针对不同的语法格式对应不同的数据血缘解析模板。在本发明实施例中,每种语法格式对应一种数据血缘解析模板,也就是说,语句格式与数据血缘解析模板之间的对应关系为一对一。数据血缘解析模板可以是预先基于各语法格式的数据血缘解析规则进行配置后得到的模板,可以用于识别待解析文本中的待解析语句,并进行解析。数据血缘解析规则中可配置或定义的信息包括但不限于数据处理规则信息、数据血缘解析的文本格式信息以及自定义函数规则信息。
具体的,针对每种待解析语句,可以对待解析语句的语法规则进行分析。进而可以确定待解析语句的语法格式,也就是说,可以确定待解析语句的语句格式。在确定待解析语句的语句格式后,可以从各预先配置的数据血缘解析模板中确定与所述语句格式对应的数据血缘解析模板。
可选地,可以通过下述方式配置数据血缘解析模板:
接收用户针对各语句格式输入的自定义数据血缘规则,并将每个所述自定义血缘规则作为单独的数据血缘解析模板。其中,自定义数据血缘规则可以理解为根据用户对语句格式的需求预先定义的数据血缘规则。
可选地,在得到各数据血缘解析模板后,可以将各数据血缘解析模板存储至自定义数据血缘解析引擎中。其中,自定义数据血缘解析引擎可以是根据实际需求配置的数据血缘解析引擎。自定义数据血缘解析引擎中注册数据血缘解析模板的数量可以是一个或多个。
在此基础上,所述确定与所述语句格式对应的数据血缘解析模板,包括:确定在所述自定义数据血缘解析引擎中与所述语句格式对应的数据血缘解析模板。
可选地,自定义数据血缘解析引擎中还可以注册自定义函数。这样做能够准确地对以SQL格式来描述的数据转换过程的待解析语句进行解析,便于数据血缘任务解析时,识别、并正确解析自定义函数。
需要说明的是,本发明实施例中,通过针对不同语句格式配置不同的数据血缘解析模板,可实现能够确定各种语法规则数据的血缘关系,从而突破了现有技术的局限性。
S130、通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。
在一个实施例中,所述通过调用所述数据血缘解析模板对所述待解析语句进行解析,包括:确定所述待解析语句的优先级;根据所述优先级,调用所述数据血缘解析模板对所述待解析语句进行解析。
其中,待解析语句中包含待解析语句的优先级。待解析语句的优先级可以通过待解析语句进行解析后得到。
具体的,在得到待解析语句后,可以对待解析语句进行解析。进而可以得到待解析语句的优先级。在得到待解析语句后,可以基于待解析语句的优先级调用数据血缘解析模板对所述待解析语句进行解析,也就是说,可以通过自定义数据血缘解析引擎对待解析语句记性解析。
在另一个实施例中,所述通过调用所述数据血缘解析模板对所述待解析语句进行解析,包括:确定所述待解析语句的语句复杂度;如果所述语句复杂度超过复杂度阈值,则利用所述数据血缘解析模板采用多线程对所述待解析语句进行解析。
其中,语句复杂度可以理解为待解析语句的复杂度。确定待解析语句的语句复杂度可以是基于预设复杂度确定规则对待解析语句进行分析后得到的复杂度。预设复杂度确定规则可以根据实际需求进行设定,如,可以针对待解析语句中所涉及到数据库或数据集的数量设定相应的复杂度;或者,可以针对待解析语句中所涉及到的数据表的数量设定相应的复杂度;亦或者,可以针对待解析语句中所涉及到的字段的数量设定相应的复杂度。可以理解的是,可以针对待解析语句中所涉及到数据库或数据集的数量、所涉及到的数据表的数量以及所涉及到的字段的数量中的至少两个因素设定相应的复杂度。复杂度阈值可以根据实际需求设置,在此不做具体限定。
具体的,基于预设复杂度确定规则对待解析语句进行分析,进而可以确定待解析语句的复杂度,也就是说,可以确定待解析语句的语句复杂度。进而可以将语句复杂度和复杂度阈值进行数据比较。如果语句复杂度超过复杂度阈值,则可以利用数据血缘解析模板采用多线程对待解析语句进行解析,可提升数据血缘解析的效率,更加快速的确定数据之间的血缘关系,进一步提升了数据血缘关系确定的效率。
本发明实施例的技术方案,通过获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句。进而可以针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板。在确定数据血缘解析模板后,可以通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。本发明实施例的技术方案,解决了现有确定数据血缘的方式存在局限性的问题,实现了能够确定各种语法规则数据的血缘关系,从而突破了现有技术的局限性。
实施例二
作为发明实施例的一种可选实例,本发明实施例提供了一种数据血缘关系确定方法的流程示意图。其具体实施方式可以参见下述实施例。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图2所示,从数据血缘任务管理队列中获取数据血缘任务。在获取到数据血缘任务后,通过调用数据血缘解析引擎对获取到的数据血缘任务进行解析。进而可以生成数据血缘解析结果。
其中,数据血缘解析引擎中可以注册自定义的数据血缘解析模板和自定义的函数。数据血缘任务可以是用户输入的任务,当检测到用户输入数据血缘任务后,可以将数据血缘任务加载至数据血缘任务管理队列。
其中,数据血缘任务可以理解为待解析文本中所包含的待解析语句。数据血缘任务管理队列可以理解为解析队列。数据血缘解析引擎可以理解为自定义数据血缘解析引擎。数据血缘解析结果可以理解为待解析语句中各数据之间的血缘关系。自定义的数据血缘解析模板可以理解为数据血缘解析模板。自定义的函数可以理解为自定义函数。
本发明实施例的技术方案,通过从数据血缘任务管理队列中获取数据血缘任务。在获取到数据血缘任务后,通过调用数据血缘解析引擎对获取到的数据血缘任务进行解析。进而可以生成数据血缘解析结果。本发明实施例的技术方案,解决了现有确定数据血缘的方式存在局限性的问题,实现了能够确定各种语法规则数据的血缘关系,从而突破了现有技术的局限性。
实施例三
图3为本发明实施例三提供的一种数据血缘关系确定装置的结构示意图。如图2所示,该装置包括:待解析语句确定模块310、解析模板确定模块320和血缘关系确定模块330。
其中,待解析语句确定模块310,用于获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句;
解析模板确定模块320,用于针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板;
血缘关系确定模块330,用于通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。
本发明实施例的技术方案,通过待解析语句确定模块获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句。进而可以通过解析模板确定模块,针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板。在确定数据血缘解析模板后,可以通过血缘关系确定模块,调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。本发明实施例的技术方案,解决了现有确定数据血缘的方式存在局限性的问题,实现了能够确定各种语法规则数据的血缘关系,从而突破了现有技术的局限性。
可选的,该装置还包括:数据血缘解析模板生成模块,用于:接收用户针对各语句格式输入的自定义数据血缘规则,并将每个所述自定义血缘规则作为单独的数据血缘解析模板。
可选的,该装置还包括:数据血缘解析引擎得到模块,用于:将各所述数据血缘解析模板存储至自定义数据血缘解析引擎;解析模板确定模块320,用于确定在所述自定义数据血缘解析引擎中与所述语句格式对应的数据血缘解析模板。
可选的,该装置还包括:待解析文本存储模块,用于:接收用户输入的数据血缘解析文本,将所述数据血缘解析文本作为待解析文本,并存储至预先创建的解析队列中;待解析语句确定模块310,用于从所述解析队列中获取所述待解析文本。
可选的,血缘关系确定模块330,用于确定所述待解析语句的优先级;根据所述优先级,调用所述数据血缘解析模板对所述待解析语句进行解析。
可选的,血缘关系确定模块330,用于确定所述待解析语句的语句复杂度;如果所述语句复杂度超过复杂度阈值,则利用所述数据血缘解析模板采用多线程对所述待解析语句进行解析。
可选的,所述待解析语句的语句格式包括:可扩展标记语言格式、数据交换格式以及结构化查询语言数据库语句格式中的至少一种。
本发明实施例所提供的数据血缘关系确定装置可执行本发明任意实施例所提供的数据血缘关系确定方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述数据血缘关系确定装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如数据血缘关系确定方法。
在一些实施例中,数据血缘关系确定方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的数据血缘关系确定方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据血缘关系确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种数据血缘关系确定方法,其特征在于,包括:
获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句;
针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板;
通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。
2.根据权利要求1所述的方法,其特征在于,所述方法包括:
接收用户针对各语句格式输入的自定义数据血缘规则,并将每个所述自定义血缘规则作为单独的数据血缘解析模板。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将各所述数据血缘解析模板存储至自定义数据血缘解析引擎;
所述确定与所述语句格式对应的数据血缘解析模板,包括:
确定在所述自定义数据血缘解析引擎中与所述语句格式对应的数据血缘解析模板。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收用户输入的数据血缘解析文本,将所述数据血缘解析文本作为待解析文本,并存储至预先创建的解析队列中;
所述获取待解析文本,包括:
从所述解析队列中获取所述待解析文本。
5.根据权利要求1所述的方法,其特征在于,所述通过调用所述数据血缘解析模板对所述待解析语句进行解析,包括:
确定所述待解析语句的优先级;
根据所述优先级,调用所述数据血缘解析模板对所述待解析语句进行解析。
6.根据权利要求1所述的方法,其特征在于,所述通过调用所述数据血缘解析模板对所述待解析语句进行解析,包括:
确定所述待解析语句的语句复杂度;
如果所述语句复杂度超过复杂度阈值,则利用所述数据血缘解析模板采用多线程对所述待解析语句进行解析。
7.根据权利要求1所述的方法,其特征在于,所述待解析语句的语句格式包括:可扩展标记语言格式、数据交换格式以及结构化查询语言数据库语句格式中的至少一种。
8.一种数据血缘关系确定装置,其特征在于,包括:
待解析语句确定模块,用于获取待解析文本,其中,所述待解析文本中包含至少一种待解析语句;
解析模板确定模块,用于针对每种待解析语句,确定所述待解析语句的语句格式,并确定与所述语句格式对应的数据血缘解析模板;
血缘关系确定模块,用于通过调用所述数据血缘解析模板对所述待解析语句进行解析,得到所述待解析语句中各数据之间的血缘关系。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的数据血缘关系确定方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的数据血缘关系确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210774048.2A CN115017882A (zh) | 2022-07-01 | 2022-07-01 | 数据血缘关系确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210774048.2A CN115017882A (zh) | 2022-07-01 | 2022-07-01 | 数据血缘关系确定方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115017882A true CN115017882A (zh) | 2022-09-06 |
Family
ID=83078265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210774048.2A Pending CN115017882A (zh) | 2022-07-01 | 2022-07-01 | 数据血缘关系确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115017882A (zh) |
-
2022
- 2022-07-01 CN CN202210774048.2A patent/CN115017882A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113836314B (zh) | 知识图谱构建方法、装置、设备以及存储介质 | |
US11442930B2 (en) | Method, apparatus, device and storage medium for data aggregation | |
CN114816578B (zh) | 基于配置表的程序配置文件生成方法、装置及设备 | |
CN112860356A (zh) | 一种api调用控制方法、装置、电子设备和存储介质 | |
CN113609100A (zh) | 数据存储方法、数据查询方法、装置及电子设备 | |
CN115048352B (zh) | 一种日志字段提取方法、装置、设备和存储介质 | |
CN115544010A (zh) | 一种映射关系确定方法、装置、电子设备及存储介质 | |
CN115017882A (zh) | 数据血缘关系确定方法、装置、电子设备及存储介质 | |
CN115309730A (zh) | 数据审核方法、装置、电子设备及存储介质 | |
CN112989797B (zh) | 模型训练、文本扩展方法,装置,设备以及存储介质 | |
CN115080607A (zh) | 一种结构化查询语句的优化方法、装置、设备及存储介质 | |
CN114218313A (zh) | 数据管理方法、装置、电子设备、存储介质及产品 | |
CN115481594A (zh) | 计分板实现方法、计分板、电子设备及存储介质 | |
CN113360672A (zh) | 用于生成知识图谱的方法、装置、设备、介质和产品 | |
CN116401269A (zh) | 一种数据查询方法、装置、电子设备及存储介质 | |
CN115858325B (zh) | 一种项目日志的调整方法、装置、设备和存储介质 | |
CN113835893B (zh) | 数据处理的方法、装置、设备、存储介质及程序产品 | |
CN113901094B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN115129673A (zh) | 一种日志处理方法、装置、电子设备及存储介质 | |
CN117827840A (zh) | 一种索引创建方法、装置、电子设备及存储介质 | |
CN115981657A (zh) | 代码生成方法、装置、电子设备及可读介质 | |
US9600502B1 (en) | Evaluating a database design and modifications thereto | |
CN114398130A (zh) | 页面展示方法、装置、设备和存储介质 | |
CN116820656A (zh) | 一种大屏界面生成方法、装置、设备及存储介质 | |
CN115220722A (zh) | 一种后端国际化的方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |