CN116594628A - 数据溯源方法、装置和计算机设备 - Google Patents

数据溯源方法、装置和计算机设备 Download PDF

Info

Publication number
CN116594628A
CN116594628A CN202310568471.1A CN202310568471A CN116594628A CN 116594628 A CN116594628 A CN 116594628A CN 202310568471 A CN202310568471 A CN 202310568471A CN 116594628 A CN116594628 A CN 116594628A
Authority
CN
China
Prior art keywords
data
analyzed
elements
original
tracing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310568471.1A
Other languages
English (en)
Inventor
李兴华
俞鹏
何星
姚佳佳
杨芳亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Bank Co Ltd
CIB Fintech Services Shanghai Co Ltd
Original Assignee
Industrial Bank Co Ltd
CIB Fintech Services Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Bank Co Ltd, CIB Fintech Services Shanghai Co Ltd filed Critical Industrial Bank Co Ltd
Priority to CN202310568471.1A priority Critical patent/CN116594628A/zh
Publication of CN116594628A publication Critical patent/CN116594628A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/427Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • G06F16/86Mapping to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/34Graphical or visual programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种数据溯源方法、装置、计算机设备、存储介质和计算机程序产品。所述数据溯源方法包括:获取待识别数据;对待识别数据进行解析,得到待分析元素;从预先存储的数据溯源分布结构中匹配到待分析元素对应的原始元素;待分析元素与数据溯源分布结构中的原始元素来自不同的数据源;建立原始元素与待分析元素的跨库映射关系,并将待分析元素作为新的原始元素存储进数据溯源分布结构,通过该种设置,使得不同源的数据能够自动进行溯源关联,从而在后续调取数据溯源关系时,能够为用户提供更全面、完整的相关数据,从而为数据分析提供更准确全面的参考。

Description

数据溯源方法、装置和计算机设备
技术领域
本申请涉及数据处理技术领域,特别是涉及一种数据溯源方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着各行各业数字化转型进程的推进,数据孤岛逐渐被统一且规范的大数据平台所融合,这不仅提升了相关人员的效率,而且在数据一致性、安全性上也有非常大的提升,但大量不同源数据的融合,势必会带来大量的数据分析工作。开发人员不仅需要面对繁多的表间关联查询,还需要对多源数据进行抽取清洗转换。
数据血缘作为元数据管理的核心能力,在数据分析领域中扮演了非常重要的角色,用户可以借助血缘分析功能对数据的生命周期进行分析,对数据在数据仓库中的流转进行追踪,这样可以及时且高效的追溯到问题可能发生的地方,然而,数据血缘的追溯处理难度较大,如何高效准确的实现数据血缘追溯仍是一个极大的技术难题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够高效准确的进行自动化数据血缘追溯的数据溯源方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本申请提供了一种数据溯源方法,包括:
获取待识别数据;
对所述待识别数据进行解析,得到待分析元素;
从预先存储的数据溯源分布结构中匹配到所述待分析元素对应的原始元素;所述待分析元素与所述数据溯源分布结构中的原始元素来自不同的数据源;
建立所述原始元素与所述待分析元素的跨库映射关系,并将所述待分析元素作为新的原始元素存储进所述数据溯源分布结构。
在其中一个实施例中,所述对所述待识别数据进行解析,得到待分析元素,包括:
从预先设置的至少一种解析规则中,匹配到所述待识别数据对应的解析规则;
采用匹配到的解析规则,解析所述待识别数据,得到待分析数据;
从所述待分析数据中提取出待分析元素。
在其中一个实施例中,所述从所述待分析数据中提取出待分析元素,包括:
对所述待分析数据进行拆分处理,得到待分析单词;
将各所述待分析单词进行组合,得到所述待分析元素。
在其中一个实施例中,所述将所述待分析元素作为新的原始元素存储进所述数据溯源分布结构,还包括:
根据所述待分析元素与所述原始元素的跨库映射关系,将所述待分析元素的溯源信息与所述原始元素的溯源信息关联存储。
在其中一个实施例中,还包括:
接收溯源信息查询指令;
根据所述溯源信息查询指令携带的身份标签,从所述数据溯源分布结构中匹配到对应的原始元素;
获取匹配到的原始元素对应的溯源信息。
在其中一个实施例中,所述原始元素包括词汇、短语、表中的至少一种;
与所述原始元素对应的身份标签包括分别与所述词汇、所述短语、所述表对应的至少一种身份子标签;
所述根据所述溯源信息查询指令携带的身份标签,从所述数据溯源分布结构中匹配到对应的原始元素,包括:
根据所述身份子标签,从所述数据溯源分布结构中匹配到对应的原始元素。
第二方面,本申请还提供了一种数据溯源装置,包括:
获取模块,用于获取待识别数据;
解析模块,用于对所述待识别数据进行解析,得到待分析元素;
匹配模块,用于从预先存储的数据溯源分布结构中匹配到所述待分析元素对应的原始元素;所述待分析元素与所述数据溯源分布结构中的原始元素来自不同的数据源;
存储模块,用于建立所述原始元素与所述待分析元素的跨库映射关系,并将所述待分析元素作为新的原始元素存储进所述数据溯源分布结构。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的数据溯源方法。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的数据溯源方法。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序产品被处理器执行时实现上述任一实施例所述的数据溯源方法。
上述数据溯源方法、装置、计算机设备、存储介质和计算机程序产品,能够对待识别数据进行解析后,获取词汇、字段、表等能够作为可视化图像中节点的对象作为待分析元素,随后调取与待识别数据所在数据库不同的其他数据库对应的数据溯源分布结构,并从该数据溯源分布结构中提取出所有原始元素,并将待分析元素与原始元素进行比对,若存在原始元素与待分析元素相匹配,则建立匹配到的原始元素与待分析元素之间的映射关系,以完成跨库映射,随后将待分析元素存入该数据溯源分布结构中,以便后续调取数据溯源关系时,能够为用户提供更全面、完整的相关数据,从而为数据分析提供更准确全面的参考。
附图说明
图1为一个实施例中数据溯源方法的应用环境图;
图2为一个实施例中数据溯源方法的应用环境图;
图3为另一个实施例中数据溯源方法的流程示意图;
图4为又一个实施例中数据溯源方法的流程示意图;
图5为一个实施例中数据溯源装置的结构示意图;
图6为另一个实施例中数据溯源装置中解析模块的结构示意图;
图7为又一个实施例中数据溯源装置中提取单元的结构示意图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的数据溯源方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。
例如,数据溯源方法应用于终端102,终端102可以从服务器104的数据存储系统中获取待识别数据;并对待识别数据进行解析,得到待分析元素;随后终端102从预先存储的数据溯源分布结构中匹配到待分析元素对应的原始元素;待分析元素与数据溯源分布结构中的原始元素来自不同的数据源;最后建立原始元素与待分析元素的跨库映射关系,并将待分析元素作为新的原始元素存储进数据溯源分布结构,其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端102和服务器104可以通过有线或无线通信方式进行直接或间接的连接,例如通过网络连接。
又例如,数据溯源方法应用于服务器104,服务器104可以从数据存储系统中获取待识别数据;并对待识别数据进行解析,得到待分析元素;随后服务器104从预先存储的数据溯源分布结构中匹配到待分析元素对应的原始元素;待分析元素与数据溯源分布结构中的原始元素来自不同的数据源;最后建立原始元素与待分析元素的跨库映射关系,并将待分析元素作为新的原始元素存储进数据溯源分布结构。可以理解的是,数据存储系统可为独立的存储设备,或者该数据存储系统位于服务器上,或者该数据存储系统位于另一终端上。
在一个实施例中,提供了一种数据溯源方法,本实施例以该数据溯源方法应用于处理器进行举例说明,可以理解的是,该处理器可位于终端或服务器上。
如图2所示,该数据溯源方法包括:
步骤202、获取待识别数据。
待识别数据指的可以是原始的开发代码。
作为示例,用户可以选择某个接口或某种服务对应的所有开发代码作为待识别数据。
步骤204、对待识别数据进行解析,得到待分析元素。
待分析元素指的可以是词汇、字段、表等对象。
具体地,待分析元素可以是具体的表名称、表编号等。
不同语法的代码具有不同的规则、关键字、语序、逻辑,处理器可以采用待识别数据使用的解析方法,对待识别数据进行解析,得到词汇、字段、表等对象作为待分析元素。
步骤206、从预先存储的数据溯源分布结构中匹配到待分析元素对应的原始元素;待分析元素与数据溯源分布结构中的原始元素来自不同的数据源。
数据溯源分布结构可以是保存有多个原始元素的可视化图像,例如可以是分布式图数据库,数据溯源分布结构用于向用户直接展示不同原始元素之间的溯源关系,数据的溯源关系描述了数据的来源和去向,以及数据在多个处理过程中的转换过程,数据溯源是使数据发挥价值的重要基础能力。
本实施例中的数据溯源分布结构可以展示来源于统一数据库的原始元素之间的溯源关系,不同数据库的数据可以分别对应一个数据溯源分布结构,处理器可以根据预先设置的、默认的数据库,获取该数据库的数据溯源分布结构进行待分析元素的匹配,也可以接收用户在步骤206前输入的数据库选择指令,并根据数据库选择指令,调取对应的数据库的数据溯源分布结构用于进行待分析元素的匹配。又或者,可以是调取除待识别数据对应的数据库外,其余所有数据库的数据溯源分布结构用于进行待分析元素的匹配。
原始元素指的可以是存储在数据溯源分布结构中的词汇、字段、表等能够作为节点的对象。具体地,原始元素可以是具体的表名称、表编号等。
作为示例,待分析元素携带有第一元素标签,第一元素标签可以为字母、字符或数字中的至少一种组成,用以唯一标识待分析元素;原始元素携带有第二元素标签,第二元素标签同样可以为字母、字符或数字中的至少一种组成,用以唯一标识原始元素。处理器在获取到待分析元素后,进一步获取各待分析元素携带的第一元素标签,并从数据溯源分布结构中提取出数据溯源分布结构包含的各原始元素携带的第二元素标签,随后将第一元素标签与第二元素标签进行比对匹配,若标签内容一致,则当前第二元素标签对应的原始元素是待分析元素匹配到的原始元素。
原始元素对应的数据与待分析元素对应的数据来源于不同的数据源,即原始元素和待分析元素处于不同的数据库中,本实施例用于在一个数据库对应的数据溯源分布结构中,匹配到另一数据库中的数据相关的对象。
步骤208、建立原始元素与待分析元素的跨库映射关系,并将待分析元素作为新的原始元素存储进数据溯源分布结构。
本实施例中,处理器在匹配到待分析元素对应的原始元素后,可以建立待分析元素与匹配到的原始元素之间的一一对应关系,以建立跨库映射,随后将待分析元素作为一个新的对象存入数据溯源分布结构中,用于实现不同数据库中数据的自动溯源,并进一步数据血缘的自动更新和扩展。
在上述数据溯源方法中,处理器能够对待识别数据进行解析后,获取词汇、字段、表等能够作为可视化图像中节点的对象作为待分析元素,随后调取与待识别数据所在数据库不同的其他数据库对应的数据溯源分布结构,并从该数据溯源分布结构中提取出所有原始元素,并将待分析元素与原始元素进行比对,若存在原始元素与待分析元素相匹配,则建立匹配到的原始元素与待分析元素之间的映射关系,以完成跨库映射,随后将待分析元素存入该数据溯源分布结构中,以便后续调取数据溯源关系时,能够为用户提供更全面、完整的相关数据,从而为数据分析提供更准确全面的参考。
如图3,在一些可选的实施例中,步骤204包括:
步骤2042、从预先设置的至少一种解析规则中,匹配到待识别数据对应的解析规则;
步骤2044、采用匹配到的解析规则,解析待识别数据,得到待分析数据;
步骤2046、从待分析数据中提取出待分析元素。
进一步地,如图4所示,步骤2044包括:步骤20442、对待分析数据进行拆分处理,得到待分析单词;步骤20444、将各待分析单词进行组合,得到待分析元素。
作为示例,处理器根据待识别数据的语法种类,从预先设置的至少一种解析规则中匹配到对应的一种。
处理器随后采用解析规则对待识别数据进行词法分析、语法分析和语义分析,在词法分析步骤,处理器依次扫描待识别数据中包含的字符,并根据预先保存的构词规则识别待分析单词,并将识别到的待分析单词序列存储;随后处理器遍历存储的待分析单词,将各待分析单词进行随意组合,得到语法短语,形成抽象语法树;最后处理器对抽象语法树的结构进行解析,从而审查各语法短语的语义正确性,若语法短语的语义正确性审查成功,则将语法短语作为待分析元素。
在一些可选的实施例中,数据溯源方法还包括:
根据待分析元素与原始元素的跨库映射关系,将待分析元素的溯源信息与原始元素的溯源信息关联存储。
溯源信息指的是对数据及信息资源的描述性信息,溯源信息具备描述数据属性的作用,能够用来指示存储位置、历史数据、资源查找、文件记录等。其能够识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
在一些可选的实施例中,数据溯源方法还包括:
接收溯源信息查询指令;
根据溯源信息查询指令携带的身份标签,从数据溯源分布结构中匹配到对应的原始元素;
获取匹配到的原始元素对应的溯源信息。
溯源信息查询指令指的是调取任一数据溯源分布结构中原始元素相关信息的指令,其用于调取数据相关的血缘信息。具体地,溯源信息可以包含任一原始元素相关的表间关系、字段间关系、表与字段间关系、join关联关系。
身份标签可以为字母、字符或数字中的至少一种组成,用于唯一标识溯源信息查询指令想要查询的元素。
作为示例,处理器在接收到溯源信息查询指令后,可以将溯源信息查询指令携带的身份信息与数据溯源分布结构中原始元素携带的第二元素标签进行匹配,并将匹配成功的第二元素标签对应的原始元素作为溯源信息查询指令想要查询的元素,随后调取该元素对应的溯源信息,完成溯源信息的查询和调取。
在一些可选的实施例中,原始元素包括词汇、短语、表中的至少一种;
与原始元素对应的身份标签包括分别与词汇、短语、表对应的至少一种身份子标签;
根据溯源信息查询指令携带的身份标签,从数据溯源分布结构中匹配到对应的原始元素,包括:
根据身份子标签,从数据溯源分布结构中匹配到对应的原始元素。
在一种实施例中,原始元素还可以包含视图、存储过程、函数实体等多种维度,相应的,身份标签包括分别与视图、存储过程、函数实体等对应的身份子标签。
本实施例中,用户能够根据发出针对不同维度的原始元素的溯源信息查询指令,从而实现溯源信息的分层查询、调取,实现了溯源信息的细化分层处理。
在此基础上,处理器可以预先为不同维度内容的原始元素分配不同种类的第二元素标签,则在接收到针对不同维度的原始元素的溯源信息查询指令时,处理器可以首先根据溯源信息查询指令携带的身份子标签符合的种类,快速确定溯源信息查询指令需要调取的元素的维度,从而能够直接将身份子标签与该维度的原始元素携带的第二元素标签进行匹配,略去了将身份子标签与其他维度的原始元素携带的第二元素标签进行匹配的过程,加快了溯源信息的调取速度。
上述数据溯源方法中,处理器能够对待识别数据进行解析后,获取词汇、字段、表等能够作为可视化图像中节点的对象作为待分析元素,随后调取与待识别数据所在数据库不同的其他数据库对应的数据溯源分布结构,并从该数据溯源分布结构中提取出所有原始元素,并将待分析元素与原始元素进行比对,若存在原始元素与待分析元素相匹配,则建立匹配到的原始元素与待分析元素之间的映射关系,以完成跨库映射,随后将待分析元素存入该数据溯源分布结构中,以便后续调取数据溯源关系时,能够为用户提供更全面、完整的相关数据,从而为数据分析提供更准确全面的参考;并且,处理器能够为不同维度的原始元素分配不同种类的标签,从而实现在接收到溯源信息查询指令时,能够根据身份子标签快速确定相应维度的原始元素,略去了将身份子标签与其他维度的原始元素携带的第二元素标签进行匹配的过程,加快了溯源信息的调取速度。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的数据溯源方法的数据溯源装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个数据溯源访问装置实施例中的具体限定可以参见上文中对于数据溯源方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种数据溯源装置500,包括:获取模块502、解析模块504、匹配模块506和存储模型508,其中:
获取模块502用于获取待识别数据;
解析模块504用于对待识别数据进行解析,得到待分析元素;
匹配模块506用于从预先存储的数据溯源分布结构中匹配到待分析元素对应的原始元素;待分析元素与数据溯源分布结构中的原始元素来自不同的数据源;
存储模块508用于建立原始元素与待分析元素的跨库映射关系,并将待分析元素作为新的原始元素存储进数据溯源分布结构。
如图6所示,在一些可选的实施例中,解析模块504包括:
匹配单元5042,用于从预先设置的至少一种解析规则中,匹配到待识别数据对应的解析规则;
解析单元5044,用于采用匹配到的解析规则,解析待识别数据,得到待分析数据;
提取单元5046,用于从待分析数据中提取出待分析元素。
如图7所示,在一些可选的实施例中,提取单元5046包括:
拆分部件50462,用于对待分析数据进行拆分处理,得到待分析单词;
组合部件50464,用于将各待分析单词进行组合,得到待分析元素。
在一些可选的实施例中,存储模块508还被配置为:
根据待分析元素与原始元素的跨库映射关系,将待分析元素的溯源信息与原始元素的溯源信息关联存储。
在一些可选的实施例中,存储模块508还被配置为:
接收溯源信息查询指令;
根据溯源信息查询指令携带的身份标签,从数据溯源分布结构中匹配到对应的原始元素;
获取匹配到的原始元素对应的溯源信息。
在一些可选的实施例中,原始元素包括词汇、短语、表中的至少一种;
与原始元素对应的身份标签包括分别与词汇、短语、表对应的至少一种身份子标签;
存储模块508还被配置为:
根据身份子标签,从数据溯源分布结构中匹配到对应的原始元素。
上述数据溯源装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种数据溯源方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如下各个步骤:
获取待识别数据;
对待识别数据进行解析,得到待分析元素;
从预先存储的数据溯源分布结构中匹配到待分析元素对应的原始元素;待分析元素与数据溯源分布结构中的原始元素来自不同的数据源;
建立原始元素与待分析元素的跨库映射关系,并将待分析元素作为新的原始元素存储进数据溯源分布结构。
在一些可选的实施例中,计算机程序被处理器执行时还用于实现:
从预先设置的至少一种解析规则中,匹配到待识别数据对应的解析规则;
采用匹配到的解析规则,解析待识别数据,得到待分析数据;
从待分析数据中提取出待分析元素。
在一些可选的实施例中,计算机程序被处理器执行时还用于实现:
对待分析数据进行拆分处理,得到待分析单词;
将各待分析单词进行组合,得到待分析元素。
在一些可选的实施例中,计算机程序被处理器执行时还用于实现:
根据待分析元素与原始元素的跨库映射关系,将待分析元素的溯源信息与原始元素的溯源信息关联存储。
在一些可选的实施例中,计算机程序被处理器执行时还用于实现:
接收溯源信息查询指令;
根据溯源信息查询指令携带的身份标签,从数据溯源分布结构中匹配到对应的原始元素;
获取匹配到的原始元素对应的溯源信息。
在一些可选的实施例中,原始元素包括词汇、短语、表中的至少一种;
与原始元素对应的身份标签包括分别与词汇、短语、表对应的至少一种身份子标签;
计算机程序被处理器执行时还用于实现:
根据身份子标签,从数据溯源分布结构中匹配到对应的原始元素。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序产品被处理器执行时实现如下各个步骤:获取待识别数据;
对待识别数据进行解析,得到待分析元素;
从预先存储的数据溯源分布结构中匹配到待分析元素对应的原始元素;待分析元素与数据溯源分布结构中的原始元素来自不同的数据源;
建立原始元素与待分析元素的跨库映射关系,并将待分析元素作为新的原始元素存储进数据溯源分布结构。
在一些可选的实施例中,计算机程序被处理器执行时还用于实现:
从预先设置的至少一种解析规则中,匹配到待识别数据对应的解析规则;
采用匹配到的解析规则,解析待识别数据,得到待分析数据;
从待分析数据中提取出待分析元素。
在一些可选的实施例中,计算机程序被处理器执行时还用于实现:
对待分析数据进行拆分处理,得到待分析单词;
将各待分析单词进行组合,得到待分析元素。
在一些可选的实施例中,计算机程序被处理器执行时还用于实现:
根据待分析元素与原始元素的跨库映射关系,将待分析元素的溯源信息与原始元素的溯源信息关联存储。
在一些可选的实施例中,计算机程序被处理器执行时还用于实现:
接收溯源信息查询指令;
根据溯源信息查询指令携带的身份标签,从数据溯源分布结构中匹配到对应的原始元素;
获取匹配到的原始元素对应的溯源信息。
在一些可选的实施例中,原始元素包括词汇、短语、表中的至少一种;
与原始元素对应的身份标签包括分别与词汇、短语、表对应的至少一种身份子标签;
计算机程序被处理器执行时还用于实现:
根据身份子标签,从数据溯源分布结构中匹配到对应的原始元素。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据溯源方法,其特征在于,包括:
获取待识别数据;
对所述待识别数据进行解析,得到待分析元素;
从预先存储的数据溯源分布结构中匹配到所述待分析元素对应的原始元素;所述待分析元素与所述数据溯源分布结构中的原始元素来自不同的数据源;
建立所述原始元素与所述待分析元素的跨库映射关系,并将所述待分析元素作为新的原始元素存储进所述数据溯源分布结构。
2.根据权利要求1所述的方法,其特征在于,所述对所述待识别数据进行解析,得到待分析元素,包括:
从预先设置的至少一种解析规则中,匹配到所述待识别数据对应的解析规则;
采用匹配到的解析规则,解析所述待识别数据,得到待分析数据;
从所述待分析数据中提取出待分析元素。
3.根据权利要求2所述的方法,其特征在于,所述从所述待分析数据中提取出待分析元素,包括:
对所述待分析数据进行拆分处理,得到待分析单词;
将各所述待分析单词进行组合,得到所述待分析元素。
4.根据权利要求1所述的方法,其特征在于,所述将所述待分析元素作为新的原始元素存储进所述数据溯源分布结构,还包括:
根据所述待分析元素与所述原始元素的跨库映射关系,将所述待分析元素的溯源信息与所述原始元素的溯源信息关联存储。
5.根据权利要求1所述的方法,其特征在于,还包括:
接收溯源信息查询指令;
根据所述溯源信息查询指令携带的身份标签,从所述数据溯源分布结构中匹配到对应的原始元素;
获取匹配到的原始元素对应的溯源信息。
6.根据权利要求5所述的方法,其特征在于,所述原始元素包括词汇、短语、表中的至少一种;
与所述原始元素对应的身份标签包括分别与所述词汇、所述短语、所述表对应的至少一种身份子标签;
所述根据所述溯源信息查询指令携带的身份标签,从所述数据溯源分布结构中匹配到对应的原始元素,包括:
根据所述身份子标签,从所述数据溯源分布结构中匹配到对应的原始元素。
7.一种数据溯源装置,其特征在于,包括:
获取模块,用于获取待识别数据;
解析模块,用于对所述待识别数据进行解析,得到待分析元素;
匹配模块,用于从预先存储的数据溯源分布结构中匹配到所述待分析元素对应的原始元素;所述待分析元素与所述数据溯源分布结构中的原始元素来自不同的数据源;
存储模块,用于建立所述原始元素与所述待分析元素的跨库映射关系,并将所述待分析元素作为新的原始元素存储进所述数据溯源分布结构。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的数据溯源方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的数据溯源方法的步骤。
10.一种计算机程序产品,其特征在于,所述计算机程序产品,包括计算机程序,该计算机程序产品被处理器执行时实现权利要求1至6中任一项所述的数据溯源方法的步骤。
CN202310568471.1A 2023-05-19 2023-05-19 数据溯源方法、装置和计算机设备 Pending CN116594628A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310568471.1A CN116594628A (zh) 2023-05-19 2023-05-19 数据溯源方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310568471.1A CN116594628A (zh) 2023-05-19 2023-05-19 数据溯源方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN116594628A true CN116594628A (zh) 2023-08-15

Family

ID=87598709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310568471.1A Pending CN116594628A (zh) 2023-05-19 2023-05-19 数据溯源方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN116594628A (zh)

Similar Documents

Publication Publication Date Title
US11899681B2 (en) Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium
CN111078776A (zh) 数据表的标准化方法、装置、设备及存储介质
CN105550206B (zh) 结构化查询语句的版本控制方法及装置
CN106648569B (zh) 目标序列化实现方法和装置
US20160292275A1 (en) System and method for extracting and searching for design
US10489024B2 (en) UI rendering based on adaptive label text infrastructure
CN109710220B (zh) 关系型数据库查询方法、装置、设备及存储介质
WO2021253641A1 (zh) 着色语言翻译方法
CN112084270A (zh) 一种数据血缘处理方法、装置、存储介质及设备
CN113962597A (zh) 一种数据分析方法、装置、电子设备及存储介质
CN116467433A (zh) 面向多源数据的知识图谱可视化方法、装置、设备及介质
CN115438740A (zh) 一种多源数据的汇聚融合方法和系统
CN116243914A (zh) 国际化软件开发的方法、国际化软件开发系统及服务器
CN112970011A (zh) 记录查询优化中的谱系
CN111475534B (zh) 一种数据查询方法及相关设备
CN117972048A (zh) 一种问答处理方法及装置
US8607201B2 (en) Augmenting visualization of a call stack
CN113722550B (zh) 一种关系图谱的实现方法、装置、电子设备及存储介质
CN109753533A (zh) 一种多源关系型数据库客户端开发方法及装置
CN116594628A (zh) 数据溯源方法、装置和计算机设备
CN114816408A (zh) 信息处理方法及装置
CN115114297A (zh) 数据轻量存储及查找方法、装置、电子设备及存储介质
CN110471708B (zh) 基于可重用组件的配置项获取的方法及装置
CN110209885B (zh) 一种图查询方法及系统
CN110750569A (zh) 数据提取方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination