CN111309972B - 一种数据处理方法、装置、终端设备及存储介质 - Google Patents

一种数据处理方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN111309972B
CN111309972B CN202010115230.8A CN202010115230A CN111309972B CN 111309972 B CN111309972 B CN 111309972B CN 202010115230 A CN202010115230 A CN 202010115230A CN 111309972 B CN111309972 B CN 111309972B
Authority
CN
China
Prior art keywords
data
sub
category
objects
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010115230.8A
Other languages
English (en)
Other versions
CN111309972A (zh
Inventor
刘均
邓蒙召
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Launch Technology Co Ltd
Original Assignee
Shenzhen Launch Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Launch Technology Co Ltd filed Critical Shenzhen Launch Technology Co Ltd
Priority to CN202010115230.8A priority Critical patent/CN111309972B/zh
Publication of CN111309972A publication Critical patent/CN111309972A/zh
Application granted granted Critical
Publication of CN111309972B publication Critical patent/CN111309972B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于计算机技术领域,提供了一种数据处理方法、装置、终端设备及存储介质,所述数据处理方法包括:获取以预设格式存储的源数据;解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。通过上述方法能够高效筛选出具有相互包含关系的数据类别。

Description

一种数据处理方法、装置、终端设备及存储介质
技术领域
本申请属于计算机技术领域,尤其涉及一种数据处理方法、装置、终端设备及存储介质。
背景技术
目前,常见的开源数据通常以预设格式进行存储,例如汽车厂家提供的基于开放的诊断交互格式标准的可扩展标记语言(XML)格式存储的车源数据。由于预设格式的车源数据通常以数据类别定义标签,导致不同数据类别之间的车源数据可能存在相互包含关系。而现有技术中,很难高效筛选出具有相互包含关系的数据类别,影响数据使用的完整性和准确性。因此,如何快速高效地筛选出具有相互包含关系的数据类别是亟待解决的技术问题。
发明内容
本申请的目的在于提供一种数据处理方法、装置、终端设备及存储介质,旨在解决现有技术中很难高效筛选出具有相互包含关系的数据类别的问题。
本申请实施例的第一方面提了一种数据处理方法,包括:
获取以预设格式存储的源数据;
解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;
根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;
基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。
在一种可选的实现方式中,所述获取以预设格式存储的源数据,包括:
获取以可扩展标记语言格式存储的源数据,所述源数据包括不同的预设可扩展标记语言标签,各个所述预设可扩展标记语言标签与各个所述父标签相互对应,且各个所述预设可扩展标记语言标签对应所述源数据的不同数据类别。
在一种可选的实现方式中,所述解析所述源数据,确定所述源数据中各个父标签对应的数据类别,包括:
解析所述源数据,分别获取所述源数据包含的所有所述预设可扩展标记语言标签对应的所述数据类别,其中,各个所述预设可扩展标记语言标签对应的所述数据类别分别为各个所述父标签对应的数据类别。
在一种可选的实现方式中,在所述根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对之后,包括:
将所述键值对存储至预先生成的第一关联容器;其中,以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象,将各个所述第一对象对应的所述数据类别和各个所述第一对象的子对象对应的数据子类别关系存储至所述第一关联容器。
在一种可选的实现方式中,所述基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,包括:
调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别。
在一种可选的实现方式中,所述调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别,包括:
通过所述递归函数的第一层循环,遍历所述第一关联容器中的所有第一对象;
通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象;
分别获取所述第二层循环遍历到的各个所述第一对象的子对象包含的对象;
若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别。
在一种可选的实现方式中,在所述基于所述数据类别与数据子类别之间的键值对,确定目标数据类别之后,还包括:
将所有所述目标数据类别存入预先生成的第二关联容器;
判断所述第二关联容器中的所有第一对象的子对象是否均为预设数据类别;
若是,则确定所述第二层循环结束;
若否,则通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象,直至所述第二关联容器中的所有第一对象的子对象均为预设数据子类别,确定所述第二层循环结束。
本申请实施例的第二方面提了一种数据处理装置,包括:
获取模块,用于获取以预设格式存储的源数据;
解析模块,用于解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;
构建模块,用于根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;
确定模块,用于基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。
在一种可选的实现方式中,所述获取模块具体用于:
获取以可扩展标记语言格式存储的源数据,所述源数据包括不同的预设可扩展标记语言标签,各个所述预设可扩展标记语言标签与各个所述父标签对应,且各个所述预设可扩展标记语言标签对应所述源数据的不同数据类别。
在一种可选的实现方式中,所述解析模块具体用于:
解析所述源数据,分别获取所述源数据包含的所有所述预设可扩展标记语言标签对应的所述数据类别,其中,各个所述预设可扩展标记语言标签对应的所述数据类别分别为各个所述父标签对应的数据类别。
在一种可选的实现方式中,还包括:
第一存储模块,用于将所述键值对存储至预先生成的第一关联容器;其中,以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象,将各个所述第一对象对应的所述数据类别和各个所述第一对象的子对象对应的数据子类别关系存储至所述第一关联容器。
在一种可选的实现方式中,所述确定模块具体用于:
调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别。
在一种可选的实现方式中,所述确定模块,包括:
第一遍历子单元,用于通过所述递归函数的第一层循环,遍历所述第一关联容器中的所有第一对象;
第二遍历子单元,用于通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象;
获取子单元,用于分别获取所述第二层循环遍历到的各个所述第一对象的子对象包含的对象;
确定子单元,用于在若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别。
在一种可选的实现方式中,还包括:
第二存储模块,用于将所有所述目标数据类别存入预先生成的第二关联容器;
判断模块,用于判断所述第二关联容器中的所有第一对象的子对象是否均为预设数据类别;
若是,则确定所述第二层循环结束;
若否,则通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象,直至所述第二关联容器中的所有第一对象的子对象均为预设数据子类别,确定所述第二层循环结束。
本申请实施例的第三方面提了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述方法的步骤。
本申请实施例的第四方面提了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面所述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:通过解析以预设格式存储的源数据,确定所述源数据包含的各个父标签对应的数据类别;并构建各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别之间的键值对;进一步基于所述数据类别与数据子类别之间的键值对,确定具有相互包含关系的所述数据类别和所述数据子类别。能够从源数据中快速高效地筛选出具有相互包含关系的数据类别。
附图说明
图1示出了本申请第一实施例提供的数据处理方法的实现流程图;
图2是图1中S104的具体实现流程图;
图3是本申请第二实施例提供的数据处理方法的实现流程图;
图4是本申请第三实施例提供的数据处理方法的实现流程图;
图5是本申请第四实施例提供的数据处理装置的结构示意图;
图6是本申请第五实施例提供的终端设备的示意图。
具体实施方式
为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于”另一个元件,它可以是直接连接到另一个元件或间接连接至该另一个元件上。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
需要说明的是,在现有技术中,针对具有相互包含关系的数据类型,通常借助于一个递归函数,通过很多层的循环嵌套,逐级递归查询一系列数据类型中存在相互包含关系的数据类型。当确定一系列数据类型中的成员变量全部为简单数据类型如整数、小数、字符串等时,所述一系列数据类型被直接认为不存在具有相互包含关系的数据类型。假设数据类型A1和A2中的成员变量包含数据类型B、C、D,数据类型B、C、D的成员变量分别包含E、F、G,为了确认相互包含关系,需要先在一个循环中判断A1和A2这一层类型是否和自己的成员变量类型存在相互包含关系,在第一次循环的过程中,需要进一步将B、C、D和A1或A2进行类型比较,在第二次循环中,需要进一步将E、F、G分别和B、C、D对比确认,如此数层循环嵌套,直至循环到的类型都不再包含其他对象类型,递归结束,才能找出所有具有互相包含关系的类型。上述这种方法只能快速筛选出一个为数不多的数据类型系列,无法适应查询大量数据类型的情况,因为数据量大会导致循环嵌套层次太深并且每一级循环次数都很大,查询速度过低直接导致筛选时间过长,影响整个程序的运行效率。本申请为了解决筛选大量数据类型相互包含关系效率过低的问题,而提出一种数据处理方法。
如图1所示,图1是本申请第一实施例提供的数据处理方法的实现流程图,为了便于说明,仅示出了与本实施例相关的部分,详述如下:
S101,获取以预设格式存储的源数据。
可以理解地,在实际应用中,各种开源数据通常以预设格式进行存储,例如汽车诊断数据,通常为可扩展标记语言格式(XML)的车源文件,在本实例中,假设所述预设格式为所述可扩展标记语言格式,所述可扩展标记语言格式对应有可扩展标记语言标签,各个所述可扩展标记语言标签对应所述源数据的不同数据类型。
对应地,S101具体包括:
获取以可扩展标记语言格式存储的源数据,所述源数据包括不同的预设可扩展标记语言标签,各个所述预设可扩展标记语言标签与各个所述父标签对应,且各个所述预设可扩展标记语言标签对应所述源数据的不同数据类别。
S102,解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别。
作为示例而非限定,对所述源数据进行解析的过程中,为所述源数据包含的各个所述预设可扩展标记语言标签定义一个数据类型,例如以所述可扩展标记语言标签的标签名为定义的数据类型的类名,由于所述可扩展标记语言标签与所述父标签相互对应,因此,各个所述可扩展标记语言标签的数据类型对应为各个所述父标签的数据类型。
具体地,作为可选的实现方式,所述S102具体包括:
解析所述源数据,分别获取所述源数据包含的所有所述预设可扩展标记语言标签对应的所述数据类别,其中,各个所述预设可扩展标记语言标签对应的所述数据类别分别为各个所述父标签对应的数据类别。
S103,根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对。
作为示例而非限定,以各个所述父标签作为所述键值对的键值,分别以各个所述父标签各自对应的子标签对应的数据子类别为各个所述键值对应的值。需要说明的是,在一可选的实现方式中,可以将各个所述父标签各自对应的子标签分别存储至预设的集合容器中,例如set容器中,并以各个所述预设的集合容器包含的对象为各个所述键值对应的值,得到所述数据类别与数据子类别之间的键值对。
S104,基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。
可以理解地,键值对的键值和键值对应的值之间具有相互映射的关系,可以通过遍历所述键值和键值对应的值来确定具有相互包含关系的所述数据类别和所述数据子类别。
在本实施例中,将所述键值对存储至预设的第一关联容器中,得到所述第一关联容器的对象,具体地,以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象,将各个所述第一对象对应的所述数据类别和各个所述第一对象的子对象对应的数据子类别关系存储至所述第一关联容器。
并通过调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别。
作为示例而非限定,所述第一关联容器为map关联容器(mapClass2ElementClasses),该map关联容器用于存放所述源数据的数据类别和数据子类别构成的键值对。
如图2所示,是图1中S104的具体实现流程图。由图2可知,S104包括S1041~S1044,详述如下:
S1041,通过所述递归函数的第一层循环,遍历所述第一关联容器中的所有第一对象。
作为示例而非限定,所述递归函数包含多层for循环,在本实施例中,通过所述递归函数的第一层循环,例如最外层的for循环,遍历所述第一关联容器中的所有第一对象。
S1042,通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象。
对应地,通过所述递归函数的第二层for循环,分别遍历所述第一层for循环遍历到的各个所述第一对象的子对象。
S1043,分别获取所述第二层循环遍历到的各个所述第一对象的子对象包含的对象。
具体地,从所述第一关联容器中,分别获取各个所述第一对象的子对象包含的对象。
S1044,若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别。
作为示例而非限定,通过调用预设的集合容器例如set容器的查询函数来判断该预设的集合容器中是否包含第一层循环遍历到的键值(父标签),如果预设的集合容器中包含有第一层循环遍历到的键值,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为具有相互包含关系的所述目标数据类别。
在本实施例中,通过预设的第一关联容器(map容器)存储由源数据包含的数据类别和数据子类别构成的键值对,进一步将数据子类别存储至预设的集合容器(set容器),并通过递归函数遍历所述第一关联容器的方式来获取具有相互包含关系的数据类别,由于第一关联容器和集合容器查找的时间复杂度为O(logN),而简单的for循环的时间复杂度为O(n),因此,在递归循环中采用这两种容器结合的方式来去比较,相比简单的for循环,能够极大幅度改进检索效率。提高筛选出具有相互包含关系的数据类别的效率。
通过上述分析可知,本申请实施例提供的数据处理方法,通过解析以预设格式存储的源数据,确定所述源数据包含的各个父标签对应的数据类别;并构建各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别之间的键值对;进一步基于所述数据类别与数据子类别之间的键值对,确定具有相互包含关系的所述数据类别和所述数据子类别。能够从源数据中快速高效地筛选出具有相互包含关系的数据类别。
图3是本申请第二实施例提供的数据处理方法的实现流程图。由图3可知,本实施例与图1所示实施例相比,S301~S303与S101~S103以及S305与S104的具体实现过程相同,不同之处在于,在S303之后还包括S304,需要说明的是,S304与S305为顺序执行关系,详述如下:S304,将所述键值对存储至预先生成的第一关联容器;其中,以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象,将各个所述第一对象对应的所述数据类别和各个所述第一对象的子对象对应的数据子类别关系存储至所述第一关联容器。
图4是本申请第三实施例提供的数据处理方法的实现流程图。由图4可知,本实施例与图3所示实施例相比,S401~S405与S301~S305的具体实现过程相同,不同之处在于,在S405之后还包括S406~S407。详述如下:
S406,将所有所述目标数据类别存入预先生成的第二关联容器。
作为示例而非限定,所述第二关联容器为预设的另一个map容器(mapMutualIncludedClasses),在本实例中,将所述具有相互包含关系的目标数据类别存储至所述第二关联容器中。
S407,判断所述第二关联容器中的所有第一对象的子对象是否均为预设数据类别;
若是,则确定所述第二层循环结束;
若否,则通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象,直至所述第二关联容器中的所有第一对象的子对象均为预设数据子类别,确定所述第二层循环结束。
具体地,所述预设的数据类别为整数、小数、字符串中的至少一种数据类别,常称为简单数据类别,由于第二关联容器的查找时间复杂度相较于简单的递归函数中的for循环的查找时间复杂度来说,能够极大幅度改进检索效率,因此,在本实施例中,通过将具有相互包含关系的目标数据类别存入第二关联容器,判断所有第一对象的子对象是否为预设的数据类别,能够提高筛选具有相互包含关系数据类别的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图5是本申请第四实施例提供的数据处理装置的结构示意图。由图5可知,本申请实施例提供的数据处理装置5包括:
获取模块501,用于获取以预设格式存储的源数据;
解析模块502,用于解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;
构建模块503,用于根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;
确定模块504,用于基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。
在一种可选的实现方式中,所述获取模块501,具体用于:
获取以可扩展标记语言格式存储的源数据,所述源数据包括不同的预设可扩展标记语言标签,各个所述预设可扩展标记语言标签与各个所述父标签对应,且各个所述预设可扩展标记语言标签对应所述源数据的不同数据类别。
在一种可选的实现方式中,所述解析模块502,具体用于:
解析所述源数据,分别获取所述源数据包含的所有所述预设可扩展标记语言标签对应的所述数据类别,其中,各个所述预设可扩展标记语言标签对应的所述数据类别分别为各个所述父标签对应的数据类别。
在一种可选的实现方式中,还包括:
第一存储模块,用于将所述键值对存储至预先生成的第一关联容器;其中,以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象,将各个所述第一对象对应的所述数据类别和各个所述第一对象的子对象对应的数据子类别关系存储至所述第一关联容器。
在一种可选的实现方式中,所述确定模块504,具体用于:
调用预设的递归函数遍历所述第一关联容器,从所述第一关联容器中获取所述目标数据类别。
在一种可选的实现方式中,所述确定模块504,包括:
第一遍历子单元,用于通过所述递归函数的第一层循环,遍历所述第一关联容器中的所有第一对象;
第二遍历子单元,用于通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象;
获取子单元,用于分别获取所述第二层循环遍历到的各个所述第一对象的子对象包含的对象;
确定子单元,用于在若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别。
在一种可选的实现方式中,还包括:
第二存储模块,用于将所有所述目标数据类别存入预先生成的第二关联容器;
判断模块,用于判断所述第二关联容器中的所有第一对象的子对象是否均为预设数据类别;
若是,则确定所述第二层循环结束;
若否,则通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象,直至所述第二关联容器中的所有第一对象的子对象均为预设数据子类别,确定所述第二层循环结束。
图6是本申请第五实施例提供的终端设备的示意图。如图6所示,该实施例提供的终端设备6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62,例如数据处理程序。所述处理器60执行所述计算机程序62时实现上述各个数据处理方法实施例中的步骤,例如图1所示的步骤101至104。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各模块/单元的功能,例如图5所示模块501至504的功能。
示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述终端设备6中的执行过程。例如,所述计算机程序62可以被分割成获取模块、解析模块、构建模块、确定模块(虚拟装置中的模块),各模块具体功能如下:
获取模块,用于获取以预设格式存储的源数据;
解析模块,用于解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;
构建模块,用于根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;
确定模块,用于基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别。
所述终端设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备6可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端设备6的示例,并不构成对终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备6还可以包括输入输出设备、网络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器61也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述终端设备6所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (8)

1.一种数据处理方法,其特征在于,包括:
获取以预设格式存储的源数据;
解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;
根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;其中,以各个所述父标签作为所述键值对的键值,分别以各个所述父标签各自对应的子标签对应的数据子类别为各个所述键值对应的值;
基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别;
所述基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,包括:
通过预设的递归函数的第一层循环,遍历预设的第一关联容器中的所有第一对象;其中,以各个父标签作为第一关联容器中的第一对象,以各个父标签各自对应的子标签作为各个第一对象的子对象,将各个第一对象对应的数据类别和各个第一对象的子对象对应的数据子类别关系存储至第一关联容器;
通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象;
分别获取所述第二层循环遍历到的各个所述第一对象的子对象包含的对象;
若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别;其中,所述若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别,包括:通过调用预设的集合容器的查询函数来判断所述预设的集合容器中是否包含第一层循环遍历到的键值,如果所述预设的集合容器中包含有第一层循环遍历到的键值,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为具有相互包含关系的所述目标数据类别。
2.如权利要求1所述的数据处理方法,其特征在于,所述获取以预设格式存储的源数据,包括:
获取以可扩展标记语言格式存储的源数据,所述源数据包括不同的预设可扩展标记语言标签,各个所述预设可扩展标记语言标签与各个所述父标签相互对应,且各个所述预设可扩展标记语言标签对应所述源数据的不同数据类别。
3.如权利要求2所述的数据处理方法,其特征在于,所述解析所述源数据,确定所述源数据中各个父标签对应的数据类别,包括:
解析所述源数据,分别获取所述源数据包含的所有所述预设可扩展标记语言标签对应的所述数据类别,其中,各个所述预设可扩展标记语言标签对应的所述数据类别分别为各个所述父标签对应的数据类别。
4.如权利要求3所述的数据处理方法,其特征在于,在所述根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对之后,包括:
将所述键值对存储至预先生成的第一关联容器。
5.如权利要求4所述的数据处理方法,其特征在于,在所述基于所述数据类别与数据子类别之间的键值对,确定目标数据类别之后,还包括:
将所有所述目标数据类别存入预先生成的第二关联容器;
判断所述第二关联容器中的所有第一对象的子对象是否均为预设数据类别;
若是,则确定所述第二层循环结束;
若否,则通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象,直至所述第二关联容器中的所有第一对象的子对象均为预设数据子类别,确定所述第二层循环结束。
6.一种数据处理装置,其特征在于,包括:
获取模块,用于获取以预设格式存储的源数据;
解析模块,用于解析所述源数据,确定所述源数据包含的各个父标签对应的数据类别;
构建模块,用于根据各个所述父标签对应的数据类别和各个所述父标签各自对应的子标签对应的数据子类别,构建数据类别与数据子类别之间的键值对;其中,以各个所述父标签作为所述键值对的键值,分别以各个所述父标签各自对应的子标签对应的数据子类别为各个所述键值对应的值;
确定模块,用于基于所述数据类别与数据子类别之间的键值对,确定目标数据类别,所述目标数据类别包括具有相互包含关系的所述数据类别和所述数据子类别;
所述确定模块,包括:
第一遍历子单元,用于通过预设的递归函数的第一层循环,遍历预设的第一关联容器中的所有第一对象;其中,所述第一关联容器中存储有键值对;以各个所述父标签作为所述第一关联容器中的第一对象,以各个所述父标签各自对应的子标签作为各个所述第一对象的子对象;
第二遍历子单元,用于通过所述递归函数的第二层循环,分别遍历所述第一层循环遍历到的各个所述第一对象的子对象;
获取子单元,用于分别获取所述第二层循环遍历到的各个所述第一对象的子对象包含的对象;
确定子单元,用于若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别;其中,所述若有所述第一对象的子对象包含的对象中有所述第一对象,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为所述目标数据类别,包括:通过调用预设的集合容器的查询函数来判断所述预设的集合容器中是否包含第一层循环遍历到的键值,如果所述预设的集合容器中包含有第一层循环遍历到的键值,则确定所述第一对象对应的数据类别和所述子对象对应的数据子类别为具有相互包含关系的所述目标数据类别。
7.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
CN202010115230.8A 2020-02-25 2020-02-25 一种数据处理方法、装置、终端设备及存储介质 Active CN111309972B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010115230.8A CN111309972B (zh) 2020-02-25 2020-02-25 一种数据处理方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010115230.8A CN111309972B (zh) 2020-02-25 2020-02-25 一种数据处理方法、装置、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN111309972A CN111309972A (zh) 2020-06-19
CN111309972B true CN111309972B (zh) 2023-06-30

Family

ID=71161912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010115230.8A Active CN111309972B (zh) 2020-02-25 2020-02-25 一种数据处理方法、装置、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN111309972B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112445491A (zh) * 2020-11-19 2021-03-05 深圳市元征科技股份有限公司 文件序列处理方法、装置、终端设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614140A (zh) * 2018-12-17 2019-04-12 泰康保险集团股份有限公司 配置数据处理方法及装置、电子设备、存储介质
CN110162509A (zh) * 2019-04-26 2019-08-23 平安普惠企业管理有限公司 文件比对方法、装置、计算机设备及存储介质
CN110263222A (zh) * 2019-06-25 2019-09-20 深圳市元征科技股份有限公司 一种数据获取方法、装置、设备及介质
CN110427538A (zh) * 2019-07-30 2019-11-08 北京奇艺世纪科技有限公司 一种数据查询方法、存储方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325201A (zh) * 2018-08-15 2019-02-12 北京百度网讯科技有限公司 实体关系数据的生成方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614140A (zh) * 2018-12-17 2019-04-12 泰康保险集团股份有限公司 配置数据处理方法及装置、电子设备、存储介质
CN110162509A (zh) * 2019-04-26 2019-08-23 平安普惠企业管理有限公司 文件比对方法、装置、计算机设备及存储介质
CN110263222A (zh) * 2019-06-25 2019-09-20 深圳市元征科技股份有限公司 一种数据获取方法、装置、设备及介质
CN110427538A (zh) * 2019-07-30 2019-11-08 北京奇艺世纪科技有限公司 一种数据查询方法、存储方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
唐友."6.3 二叉树的遍历".《数据结构与算法》.哈尔滨:哈尔滨工业大学出版社,2019,第142-143页. *
雷小锋 等."8.3.3.2 关联容器".《C++语言探索发现学习教程》.徐州:中国矿业大学出版社,2015,第324-327页. *

Also Published As

Publication number Publication date
CN111309972A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN107704265B (zh) 一种面向业务流可配置的规则生成方法
CN107644323B (zh) 一种面向业务流的智能审核系统
US8615526B2 (en) Markup language based query and file generation
WO2017107853A1 (zh) 一种数据监控管理方法、数据监控方法及系统
CN110795455A (zh) 依赖关系解析方法、电子装置、计算机设备及可读存储介质
US20140173559A1 (en) Identifying differences between source codes of different versions of a software when each source code is organized using incorporated files
CN110601880A (zh) 一种云平台、业务处理方法、命令接口及计算机设备
CN111309972B (zh) 一种数据处理方法、装置、终端设备及存储介质
CN111078276B (zh) 应用程序的冗余资源处理方法、装置、设备及存储介质
CN112181430A (zh) 代码变更统计方法、装置、电子设备及存储介质
CN115729817A (zh) 测试用例库的生成及优化方法、装置、电子设备和存储介质
CN113608955B (zh) 一种日志记录方法、装置、设备及存储介质
Bonifati et al. DiscoPG: property graph schema discovery and exploration
CN112068874B (zh) 软件项目持续集成方法、装置、终端设备和存储介质
CN107256167B (zh) 应用于应用系统迁移的升级控制方法及升级控制设备
CN113535798A (zh) 基于大数据挖掘的网络训练方法及数字内容中心
CN114490724B (zh) 处理数据库查询语句的方法和装置
CN112445816B (zh) 车辆诊断数据引用方法、装置、终端设备及存储介质
CN111159262A (zh) 自动驾驶仿真数据处理方法和装置
CN106796598A (zh) 管理层级实体的计算
CN109284268A (zh) 一种快速解析日志的方法、系统及电子设备
CN111736848B (zh) 包冲突定位方法、装置、电子设备及可读存储介质
CN114157662A (zh) 一种云平台参数适配方法、装置、终端设备及储存介质
CN115705462A (zh) Drc测试图形生成方法、装置、电子设备及存储介质
CN111831659A (zh) 一种检查索引的方法、装置及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant