CN107463555A - 删除中间层数据的方法、系统和装置 - Google Patents

删除中间层数据的方法、系统和装置 Download PDF

Info

Publication number
CN107463555A
CN107463555A CN201610384293.7A CN201610384293A CN107463555A CN 107463555 A CN107463555 A CN 107463555A CN 201610384293 A CN201610384293 A CN 201610384293A CN 107463555 A CN107463555 A CN 107463555A
Authority
CN
China
Prior art keywords
node
data
completion
daily record
mart modeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610384293.7A
Other languages
English (en)
Other versions
CN107463555B (zh
Inventor
颜博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201610384293.7A priority Critical patent/CN107463555B/zh
Publication of CN107463555A publication Critical patent/CN107463555A/zh
Application granted granted Critical
Publication of CN107463555B publication Critical patent/CN107463555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种删除中间层数据的方法、系统和装置,其中,所述方法包括:在执行数据加工任务时,根据数据血缘关系,建立具有多个节点的数据血缘关系树型结构图;根据所述血缘关系树型结构图,建立节点之间的父子关系表;记录数据加工完成日志,所述日志至少包括一个或多个完成节点;分析所述数据加工完成日志的完成节点,根据所述完成节点,从所述父子关系表中查询得到所述完成节点的父节点;根据所述父节点查询所述数据加工完成日志;判断所述数据加工完成日志中是否包含了所述完成节点的父节点,如果包含,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。本发明在数据加工过程中自动删除中间层数据,释放资源。

Description

删除中间层数据的方法、系统和装置
技术领域
本发明涉及数据处理技术领域,具体地说,涉及一种在复杂数据加工中,删除中间层数据的方法、系统和装置。
背景技术
在数据仓库、大数据(Big Data)等复杂的数据加工场景中,在将原始数据加工成目标数据的过程中,需要经过若干个中间加工步骤。在加工的过程中,除了数据源与结果数据以外,还会生成各种中间数据,业界通常称之为中间层。
中间层虽然是组成复杂数据加工的一个重要层次,然而,中间层除了利于数据的加工与计算,本身存在的价值并不大,反而会加大数据建设的开销,增加存储与管理成本。如果在数据加工中能删除中间层中不再使用的数据,将为企业节省一大笔用于存储数据的开销,从而减低企业的运营成本。
传统的复杂数据加工遵循逐层加工原则,对数据分层次进行加工,并保留中间加工过程的数据。在部分具体的场景中,当判断中间层已经不再使用时,在加工完成之后,手动在程序里添加数据删除的代码,从而完成中间层的数据删除。
由于大部分时候保留中间层数据,这种情形会导致大量的数据冗余,并且增加中间层模型的管理成本。对于目前删除中间层数据的方法,需要在程序中手动添加删除代码,不够灵活,并且增加了程序维护成本。
发明内容
本发明要解决的技术问题在于,针对现有技术中的不足,提供一种在复杂数据加工中删除中间层数据的方法、系统和装置,在数据加工完成之后自动删除中间层数据,释放资源。
为了解决上述技术问题,根据本发明的一个方面,本发明提供了一种删除数据加工时产生的中间层数据的方法,其中,包括:
在执行数据加工任务时,根据数据血缘关系,建立具有多个节点的数据血缘关系树型结构图;
根据所述血缘关系树型结构图,建立节点之间的父子关系表;
记录数据加工完成日志,所述日志至少包括一个或多个完成节点;
分析所述数据加工完成日志的完成节点,根据所述完成节点,从所述父子关系表中查询得到所述完成节点的父节点;
根据所述父节点查询所述数据加工完成日志;
判断所述数据加工完成日志中是否包含了所述完成节点的父节点,如果包含,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。
优选地,所述数据加工完成日志还包括完成节点对应的完成时间。
优选地,所述分析所述数据加工完成日志的完成节点的步骤包括:
按完成节点的完成时间,从完成时间最早的完成节点开始分析。
优选地,血缘关系树型结构图包括多个代表源数据的叶子节点、多个代表中间层数据的中间节点和一个代表目标数据的根节点;
所述数据节点加工完成日志中的完成节点为中间节点或根节点。
优选地,从所述父子关系表中查询所述完成节点的父节点之前,判断所述完成节点是否为根节点,如果不是根节点,查询所述完成节点的父节点,如果是根节点,结束对该完成节点的分析。
优选地,所述父节点为一个或多个,当为多个时,在所述判断所述数据加工完成日志中是否包含了所述完成节点的父节点步骤中,判断数据加工完成日志中是否包含了所述完成节点的所有父节点,在数据加工完成日志中包含了所述完成节点的所有父节点时,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。
为了解决上述技术问题,根据本发明的另一个方面,本发明提供了一种删除数据加工时产生的中间层数据的系统,其中,包括:
数据血缘关系树型结构图建立模块,用于根据数据加工任务的数据,建立数据血缘关系树型结构图;
父子关系表建立模块,与所述数据血缘关系树型结构图建立模块相连接,用于建立节点之间的父子关系表;
数据加工完成日志记录模块,用于记录完成数据加工的节点;
中间层扫描模块,分析数据加工完成日志中的完成节点,确定可以删除的节点;和
删除模块,用于根据所述中间层扫描模块发送的触发信息,删除节点数据,并从数据加工完成日志中删除所述节点。
优选地,所述中间层扫描模块包括:
节点提取单元,用于从所述数据加工完成日志中提取待分析的完成节点;
查询单元,用于根据所述待分析的完成节点,从所述父子关系表中获取与其对应的父节点,并根据所述父节点,查询所述数据加工完成日志,确定所述数据加工完成日志是否包含了所述父节点;
删除触发单元,用于在当所述数据加工完成日志包含了所述父节点时,向所述删除模块发送触发信息。
为了解决上述技术问题,根据本发明的又一个方面,本发明提供了一种删除中间层数据的装置,至少包括存储器和处理器,所述存储器用于存储数据和指令,所述处理器用于执行所述指令,其中,所述处理器根据所述指令被配置为:
在执行数据加工任务时,根据数据血缘关系,建立具有多个节点的数据血缘关系树型结构图;
根据所述血缘关系树型结构图,建立节点之间的父子关系表;
记录数据加工完成日志,所述日志至少包括一个或多个完成节点;
分析所述数据加工完成日志的完成节点,根据所述完成节点,从所述父子关系表中查询得到所述完成节点的父节点;
根据所述父节点查询所述数据加工完成日志,判断所述数据加工完成日志中是否包含了所述完成节点的父节点,如果包含,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。
本发明将对中间层数据的删除独立于数据加工程序,不用在数据加工中再增加删除数据的代码,并且可以做到中间数据的即时删除,在第一时间释放不必要的存储空间,降低了企业运营成本。
附图说明
通过参照以下附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1为本发明所述删除数据加工时产生的中间层数据的系统的结构原理框图;
图2为本发明所述数据血缘关系树型结构示意图;
图3为本发明所述删除数据加工时产生的中间层数据的方法的流程示意图;
图4为本发明所述中间层扫描模块的结构原理框图;和
图5为本发明所述删除数据加工时产生的中间层数据装置的结构原理框图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程没有详细叙述。另外附图不一定是按比例绘制的。
附图中的流程图、框图图示了本发明实施例的系统、方法、装置的可能的体系框架、功能和操作,流程图和框图上的方框可以代表一个模块、程序段或仅仅是一段代码,所述模块、程序段和代码都是用来实现规定逻辑功能的可执行指令。也应当注意,所述实现规定逻辑功能的可执行指令可以重新组合,从而生成新的模块和程序段。因此附图的方框以及方框顺序只是用来更好的图示实施例的过程和步骤,而不应以此作为对发明本身的限制。
本发明提供了一种删除数据加工时产生的中间层数据的方法和系统,无需在数据加工程序中嵌入删除代码,也可以达到即时删除中间层数据的效果。如图1所示,所述系统包括:数据血缘关系树型结构图建立模块1、父子关系表建立模块2、数据加工完成日志记录模块3、中间层扫描模块4和删除模块5。
其中,数据血缘关系树型结构图建立模块1用于根据数据加工任务的数据,建立数据血缘关系树型结构图;如图2所示,为程序中方便使用,命名为T1。其中,节点S代表源数据,是数据加工过程中形成所述树型结构图中的叶子节点,由于其为源数据,所以是需要保留的数据。节点T是数据加工过程中的目标,是树型结构图加工中的根节点,也是需要保留的数据。而节点M是在数据加工过程中形成的中间层,这个层次的数据是可以删除的。
其中,所述数据血缘关系记录了数据在数据流中的演化,记载了对数据处理的整个历史,包括数据加工中的数据的来源、去向。通常通过数据追踪来获得数据在数据流中的演化过程,可以采用最基本父子关系进行记录。
所述父子关系表建立模块2与所述数据血缘关系树型结构图建立模块1相连接,用于建立节点之间的父子关系表。例如,根据图2所示的树型结构图,可以得到如下表1所述的父子关系表,为程序中方便使用,命名为T2:
表1
通过表1可知,除了根节点T,其他每一个节点都有父节点,父子节点关系也有多种情况:一个父节点有多个子节点,或一个子节点有多个父节点,如节点M2有两个父节点M3和M4。
数据加工完成日志记录模块3用于记录完成数据加工的节点。由于图2中的叶子节点数据是源数据,因而不需要记录叶子节点的完成情况,只记录中间节点和根节点的数据加工完成情况。通常,在数据加工过程中,每完成一个节点数据的加工,则在数据加工完成日志中记录一条记录。所述记录至少包括已完成数据加工的节点,通常还包括该节点完成数据加工的时间,如表2所示,为程序中方便使用,命名为T3:
表2
节点(Node) 完成时间(Y-M-D-H-M-S)
M1 XXXX-XX-XX-XX-XX-XX
M2 XXXX-XX-XX-XX-XX-XX
...... ......
中间层扫描模块4分析数据加工完成日志中的完成节点,确定可以删除的节点。确定可删除节点的原则是:如果数据中间层节点对应的父节点数据加工完全完成,则意味着该中间层节点的数据已经符合删除条件,即可以执行删除了。此时,中间层扫描模块4会发送删除操作的触发信息给所述的删除模块5,所述的删除模块5根据所述中间层扫描模块4发送的触发信息,删除相应的节点数据,并从数据加工完成日志中删除所述节点。
在本发明所述的在删除中间层数据的系统中,所述中间层扫描模块4如图4所示,包括:节点提取单元41、查询单元42和删除触发单元43。其中,所述节点提取单元41从所述数据加工完成日志中提取待分析的完成节点;所述查询单元42根据所述待分析的完成节点,从所述父子关系表1中获取与其对应的父节点,并根据所述父节点,查询所述数据加工完成日志,确定所述数据加工完成日志是否包含了所述父节点;所述删除触发单元43在当所述数据加工完成日志包含了所述父节点时,向所述删除模块5发送触发信息。
具体的删除中间层数据的方法如图3所示,所述方法包括:
步骤S1,在执行数据加工任务时,根据数据血缘关系,建立具有多个节点的数据血缘关系树型结构图;
步骤S2,根据所述血缘关系树型结构图,建立节点之间的父子关系表;
步骤S3,记录数据加工完成日志,所述日志至少包括一个或多个完成节点;
步骤S4,从数据加工完成日志中取一完成节点分析。其中,提取完成时间最早的数据节点。如果有完成时间相同的数据节点,任意取一条。例如,具体提取语句如下:
Select Node from
(Select Node from T3 order by Time desc)T
limit 1;
把执行结果放到变量[完成节点],定义为Finish_node
步骤S5,判断当前所取的完成节点Finish_node是否为根节点,如果是根节点,则跳至步骤S10,判断数据加工完成日志中是否还有未分析的节点,如有,返回步骤S4。如没有,则结束。如果所取的完成节点Finish_node不是根节点,则跳到步骤S6。
步骤S6,根据所述完成节点,从所述父子关系表中查询得到所述完成节点的父节点。具体地SQL语句如下:
Select T2.Father_Node from T2 where T2.Node=Finish_node
将执行结果放到变量[完成节点的父节点],定义为Father_of_Finish_Node
步骤S7,根据所述父节点查询所述数据加工完成日志;
步骤S8,判断所有父节点(Father_of_Finish_Node)是否全部完全存在,若完全存在,即证明该完成节点Finish_node对应的父节点完全加工完成,该完成数据节点Finish_node满足删除条件;执行步骤S9。如果不符合,跳至步骤10,判断数据加工完成日志中是否还有未分析的节点,如有,返回步骤S4。如没有,则结束。
步骤S9,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。然后执行步骤S10。
通过上述系统和方法的实施例可见,本发明无需在数据加工程序中写入删除中间层数据的代码,本发明可以根据数据加工过程中的具体情况,随时删除不必要的中间层数据,无需人为添加删除代码,不需要进行程序维护,因此与现有技术相比,既可以随时释放存储空间,又减少了维护成本。
本发明还提供了一种删除中间层数据的装置,如图5所示。所述装置至少包括处理器100和存储器101。其中,存储器101用于存储数据和指令,所述处理器100用于执行所述指令,其中,所述处理器根据所述指令被配置为如图3所示。具体地,所述存储器103存储所述数据血缘关系树型结构图、父子关系表和数据加工完成日志,所述处理器按照如图3所示的流程完成中间层数据的删除。
本发明将对中间层数据的删除独立于数据加工程序,不用在数据加工中再增加删除数据的代码,并且可以做到中间数据的即时删除,在第一时间释放不必要的存储空间,降低企业运营成本。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种删除数据加工时产生的中间层数据的方法,其中,包括:
在执行数据加工任务时,根据数据血缘关系,建立具有多个节点的数据血缘关系树型结构图;
根据所述血缘关系树型结构图,建立节点之间的父子关系表;
记录数据加工完成日志,所述日志至少包括一个或多个完成节点;
分析所述数据加工完成日志的完成节点,根据所述完成节点,从所述父子关系表中查询得到所述完成节点的父节点;
根据所述父节点查询所述数据加工完成日志,判断所述数据加工完成日志中是否包含了所述完成节点的父节点,如果包含,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。
2.如权利要求1所述的删除中间层数据的方法,其中,所述数据加工完成日志还包括完成节点对应的完成时间。
3.如权利要求2所述的删除中间层数据的方法,其中,所述分析所述数据加工完成日志的完成节点的步骤包括:
按完成节点的完成时间,从完成时间最早的完成节点开始分析。
4.如权利要求1所述的删除中间层数据的方法,其中,血缘关系树型结构图包括多个代表源数据的叶子节点、多个代表中间层数据的中间节点和一个代表目标数据的根节点;
所述数据节点加工完成日志中的完成节点为中间节点或根节点。
5.如权利要求4所述的删除中间层数据的方法,其中,从所述父子关系表中查询所述完成节点的父节点之前,判断所述完成节点是否为根节点,如果不是根节点,查询所述完成节点的父节点,如果是根节点,结束对该完成节点的分析。
6.如权利要求4所述的删除中间层数据的方法,其中,所述父节点为一个或多个,当为多个时,在所述判断所述数据加工完成日志中是否包含了所述完成节点的父节点步骤中,判断数据加工完成日志中是否包含了所述完成节点的所有父节点,在数据加工完成日志中包含了所述完成节点的所有父节点时,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。
7.一种删除数据加工时产生的中间层数据的系统,其中,包括:
数据血缘关系树型结构图建立模块,用于根据数据加工任务的数据,建立数据血缘关系树型结构图;
父子关系表建立模块,与所述数据血缘关系树型结构图建立模块相连接,用于根据所述数据血缘关系树型结构图,建立节点之间的父子关系表;
数据加工完成日志记录模块,用于记录在数据加工任务时,完成数据加工的完成节点;
中间层扫描模块,分析数据加工完成日志中的完成节点,确定可以删除的节点;和
删除模块,用于根据所述中间层扫描模块发送的触发信息,删除完成节点数据,并从数据加工完成日志中删除所述完成节点。
8.如权利要求7所述的在删除中间层数据的系统,其中,所述中间层扫描模块包括:
节点提取单元,用于从所述数据加工完成日志中提取待分析的完成节点;
查询单元,用于根据所述待分析的完成节点,从所述父子关系表中获取与其对应的父节点,并根据所述父节点,查询所述数据加工完成日志,确定所述数据加工完成日志是否包含了所述父节点;和
删除触发单元,用于在当所述数据加工完成日志包含了所述父节点时,向所述删除模块发送触发信息。
9.一种删除中间层数据的装置,至少包括存储器和处理器,所述存储器用于存储数据和指令,所述处理器用于执行所述指令,其中,所述处理器根据所述指令被配置为:
在执行数据加工任务时,根据数据血缘关系,建立具有多个节点的数据血缘关系树型结构图;
根据所述血缘关系树型结构图,建立节点之间的父子关系表;
记录数据加工完成日志,所述日志至少包括一个或多个完成节点;
分析所述数据加工完成日志的完成节点,根据所述完成节点,从所述父子关系表中查询得到所述完成节点的父节点;
根据所述父节点查询所述数据加工完成日志,判断所述数据加工完成日志中是否包含了所述完成节点的父节点,如果包含,删除所述完成节点的数据,并从所述数据加工完成日志中删除所述完成节点。
CN201610384293.7A 2016-06-01 2016-06-01 删除中间层数据的方法、系统和装置 Active CN107463555B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610384293.7A CN107463555B (zh) 2016-06-01 2016-06-01 删除中间层数据的方法、系统和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610384293.7A CN107463555B (zh) 2016-06-01 2016-06-01 删除中间层数据的方法、系统和装置

Publications (2)

Publication Number Publication Date
CN107463555A true CN107463555A (zh) 2017-12-12
CN107463555B CN107463555B (zh) 2020-09-04

Family

ID=60544601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610384293.7A Active CN107463555B (zh) 2016-06-01 2016-06-01 删除中间层数据的方法、系统和装置

Country Status (1)

Country Link
CN (1) CN107463555B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502589A (zh) * 2019-08-20 2019-11-26 阿里巴巴集团控股有限公司 一种节点血缘关系确定方法、装置以及电子设备
CN110618989A (zh) * 2019-08-15 2019-12-27 中国平安财产保险股份有限公司 信息处理方法、信息处理装置及相关产品
CN113127478A (zh) * 2019-12-31 2021-07-16 奇安信科技集团股份有限公司 数据内生血缘关系的分析方法、装置和计算机设备
CN113282678A (zh) * 2021-03-30 2021-08-20 杭州数梦工场科技有限公司 数据血缘关系展示方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050182776A1 (en) * 2004-02-18 2005-08-18 Clark Yennie Time-addressed database management system
US7490084B2 (en) * 2004-09-24 2009-02-10 Oracle Corporation Deferred incorporation of updates for spatial indexes
US20120265744A1 (en) * 2001-08-08 2012-10-18 Gary Charles Berkowitz Knowledge-based e-catalog procurement system and method
CN103226618A (zh) * 2013-05-21 2013-07-31 焦点科技股份有限公司 基于数据集市挖掘的相关词提取方法及系统
CN104615759A (zh) * 2015-02-13 2015-05-13 厦门雅迅网络股份有限公司 一种不同业务系统平台间的数据同步方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120265744A1 (en) * 2001-08-08 2012-10-18 Gary Charles Berkowitz Knowledge-based e-catalog procurement system and method
US20050182776A1 (en) * 2004-02-18 2005-08-18 Clark Yennie Time-addressed database management system
US7490084B2 (en) * 2004-09-24 2009-02-10 Oracle Corporation Deferred incorporation of updates for spatial indexes
CN103226618A (zh) * 2013-05-21 2013-07-31 焦点科技股份有限公司 基于数据集市挖掘的相关词提取方法及系统
CN104615759A (zh) * 2015-02-13 2015-05-13 厦门雅迅网络股份有限公司 一种不同业务系统平台间的数据同步方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110618989A (zh) * 2019-08-15 2019-12-27 中国平安财产保险股份有限公司 信息处理方法、信息处理装置及相关产品
CN110618989B (zh) * 2019-08-15 2023-09-08 中国平安财产保险股份有限公司 信息处理方法、信息处理装置及相关产品
CN110502589A (zh) * 2019-08-20 2019-11-26 阿里巴巴集团控股有限公司 一种节点血缘关系确定方法、装置以及电子设备
CN110502589B (zh) * 2019-08-20 2023-12-01 创新先进技术有限公司 一种节点血缘关系确定方法、装置以及电子设备
CN113127478A (zh) * 2019-12-31 2021-07-16 奇安信科技集团股份有限公司 数据内生血缘关系的分析方法、装置和计算机设备
CN113282678A (zh) * 2021-03-30 2021-08-20 杭州数梦工场科技有限公司 数据血缘关系展示方法及装置

Also Published As

Publication number Publication date
CN107463555B (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
WO2017096892A1 (zh) 索引构建方法、查询方法及对应装置、设备、计算机存储介质
CN106611064B (zh) 分布式关系数据库的数据处理方法和装置
CN107463555A (zh) 删除中间层数据的方法、系统和装置
CN107301214B (zh) 在hive中数据迁移方法、装置及终端设备
CN107784030B (zh) 一种处理连接查询的方法及装置
US20140101167A1 (en) Creation of Inverted Index System, and Data Processing Method and Apparatus
CN104021205B (zh) 一种建立微博索引的方法及装置
CN106649503A (zh) 一种基于sql的查询方法及系统
CN109062936B (zh) 一种数据查询方法、计算机可读存储介质及终端设备
CN110275889B (zh) 一种适用于机器学习的特征处理方法及装置
CN107807932A (zh) 一种基于路径枚举的层级数据管理方法和系统
CN107515922A (zh) 一种数据管理方法及系统
CN105630934A (zh) 一种数据统计方法及系统
CN110597821A (zh) 数据仓库表结构变更方法及装置
CN111400275B (zh) 一种定制并自动进行数据老化的方法
CN110569315A (zh) 基于数据仓库的数据处理方法和装置
CN104484375B (zh) 在项目分析流程中自动建立数据库的方法及系统
CN106776704B (zh) 统计信息收集方法和装置
JP5206268B2 (ja) ルール作成プログラム、ルール作成方法及びルール作成装置
CN104376055B (zh) 一种基于分片技术的大模型数据比较方法
CN116089518A (zh) 一种数据模型抽取方法及系统、终端、介质
WO2016107297A1 (zh) MapReduce 平台上基于本地密度的聚类方法
CN113641654B (zh) 一种基于实时事件的营销处置规则引擎方法
CN108920256A (zh) 检核任务执行方法及装置
CN104991963B (zh) 文件处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant