CN112966040A - 一种转换数据结构的方法、装置、终端以及存储介质 - Google Patents
一种转换数据结构的方法、装置、终端以及存储介质 Download PDFInfo
- Publication number
- CN112966040A CN112966040A CN202110338704.XA CN202110338704A CN112966040A CN 112966040 A CN112966040 A CN 112966040A CN 202110338704 A CN202110338704 A CN 202110338704A CN 112966040 A CN112966040 A CN 112966040A
- Authority
- CN
- China
- Prior art keywords
- data
- tree
- converted
- tree node
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于计算机技术领域,提供了一种转换数据结构的方法、装置、终端及存储介质,包括:获取待转换数据,待转换数据包括表形数据;在待转换数据中提取多个树节点,每个树节点用于表示待转换数据中与树节点对应的文本内容;确定各个树节点之间的层级关系;基于该层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。上述方式,这种以树形结构存储各个树节点的方式,使目标转换数据可以直观地体现出各个数据之间的逻辑层次关系,提升了目标转换数据的展示效果。
Description
技术领域
本申请属于计算机技术领域,尤其涉及一种转换数据结构的方法、装置、终端以及存储介质。
背景技术
表形数据结构是一种常用的数据存储方式,这种数据存储方式以表格行为单位进行数据存储。其存储结构简单,便于新增数据、修改数据以及删除数据等操作。因此,这种数据存储方式深受人们喜爱,广泛应用于各种业务场景。
然而,也正是由于这种数据存储方式存储结构简单,导致通过该数据存储方式存储得到的数据,展示效果不佳,不能直观体现出各个数据之间的逻辑层次关系。
发明内容
有鉴于此,本申请实施例提供了一种转换数据结构的方法、装置、终端以及存储介质,以解决传统的数据存储方式存储结构简单,导致通过该数据存储方式存储得到的数据,展示效果不佳,不能直观体现出各个数据之间的逻辑层次关系的问题。
本申请实施例的第一方面提供了一种转换数据结构的方法,包括:
获取待转换数据,所述待转换数据包括表形数据;
在待转换数据中提取多个树节点,每个树节点用于表示所述待转换数据中与所述树节点对应的文本内容;
确定各个树节点之间的层级关系;
基于所述层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。
可选地,所述待转换数据包括多个数据类型,所述在待转换数据中提取多个树节点,包括:
获取所述多个数据类型与预设层级结构之间的对应关系;
基于所述对应关系,将所述待转换数据分组,得到多个分组数据,每个分组数据包括的多个文本内容属于同一层级;
在每个分组数据中提取多个树节点。
可选地,所述确定各个树节点之间的层级关系,包括:
确定每个分组数据对应的层级;
确定各个层级之间的包含关系,以及确定每个层级对应的树节点;
基于各个层级之间的包含关系以及每个层级对应的树节点,确定各个树节点之间的层级关系。
可选地,所述在每个分组数据中提取多个树节点,包括:
对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容;
基于每个分组数据对应的目标文本内容,确定每个分组数据对应的树节点。
可选地,所述对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容,包括:
采用Stream流对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容。
可选地,所述基于所述层级关系,将每个树节点以树形结构进行存储,得到目标转换数据,包括:
基于所述层级关系,将每个层级对应的树节点,以树形结构逐层进行存储,得到所述目标转换数据。
本申请实施例的第二方面提供了一种转换数据结构的装置,包括:
第一获取单元,用于获取待转换数据,所述待转换数据包括表形数据;
第一提取单元,用于在待转换数据中提取多个树节点,每个树节点用于表示所述待转换数据中与所述树节点对应的文本内容;
确定单元,用于确定各个树节点之间的层级关系;
存储单元,用于基于所述层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。
本申请实施例的第三方面提供了一种转换数据结构的终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面所述的方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的方法的步骤。
本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在终端上运行时,使得终端执行上述第一方面所述的方法的步骤。
本申请实施例提供的一种转换数据结构的方法、装置、终端以及存储介质,具有以下有益效果:
终端获取待转换数据,待转换数据包括表形数据;在待转换数据中提取多个树节点,每个树节点用于表示待转换数据中与树节点对应的文本内容;确定各个树节点之间的层级关系;基于该层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。上述方式中,在待转换数据中提取了待存储的树节点,且确定了各个树节点之间的层级关系,并基于该层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。这种以树形结构存储各个树节点的方式,使目标转换数据可以直观地体现出各个数据之间的逻辑层次关系,提升了目标转换数据的展示效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种转换数据结构的方法的示意流程图;
图2是本申请实施例提供的对待转换数据自定义修改的示意图;
图3是本申请一实施例提供的表形数据示意图;
图4是本申请一实施例提供的另一种表形数据示意图;
图5是本申请一实施例提供的另一种表形数据对应关系示意图;
图6是本申请一实施例提供的一种树形结构数据示意图;
图7是本申请一实施例提供的一种目标转换数据示意图;
图8是本申请又一实施例提供的一种转换数据结构的方法的示意性流程图;
图9是本申请一实施例提供的一种划分数据示意图;
图10是本申请一实施例提供的一种转换数据结构的装置的示意图;
图11是本申请另一实施例提供的一种转换数据结构的终端的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
表形数据结构是一种常用的数据存储方式,这种数据存储方式以表格行为单位进行数据存储。例如,在某些业务场景下,直接通过文字符作为数据,来实现数据的录入和保存等快速操作这种以表格行作为单位进行数据存储的操作方式,直接以文字符格式作为数据内容,在新增和修改数据时,没有太多复杂的条件约束,在有效满足业务数据前提下,可以使业务数据实现灵活的扩展和调整。因此,这种数据存储方式深受人们喜爱,广泛应用于各种业务场景。
然而,也正是由于这种数据存储方式存储结构简单,导致通过该数据存储方式存储得到的数据,展示效果不佳,不能直观体现出各个数据之间的逻辑层次关系。
有鉴于此,本申请提供了一种转换数据结构的方法,该方法中,获取待转换数据,该待转换数据包括表形数据;在待转换数据中提取多个树节点,每个树节点用于表示该待转换数据中与该树节点对应的文本内容;确定各个树节点之间的层级关系;基于该层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。
上述方式中,在待转换数据中提取了待存储的树节点,且确定了各个树节点之间的层级关系,并基于该层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。这种以树形结构存储各个树节点的方式,使目标转换数据可以直观地体现出各个数据之间的逻辑层次关系,提升了目标转换数据的展示效果。
请参见图1,图1是本申请实施例提供的一种转换数据结构的方法的示意流程图。本实施例中转换数据结构的方法的执行主体为基于转换数据结构的终端,终端包括但不限于智能手机、平板电脑、计算机、个人数字助理(Personal Digital Assistant,PDA)、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、独立的服务器、分布式服务器、服务器集群或云服务器等,还可以包括台式电脑等终端。如图1所示的转换数据结构的方法可包括S101~S104,各个步骤的具体实现原理如下。
S101:获取待转换数据,该待转换数据包括表形数据。
待转换数据可以包括表形数据、线性数据等。其中,表形数据是指以表形数据结构存储的数据,即以表格行为单位进行数据存储的数据;线性数据是指以线性结构存储的数据,例如,线性表、一维数组等。
待转换数据可以是预先存储在终端文件中的数据,也可以由其他设备发送至本终端的数据。可选地,对于待转换数据可根据实际情况实时更新,即随时对该待转换数据进行自定义操作,例如,对该待转换数据进行增加、删除、合并、调整等操作。
以待转换数据为表形数据为例进行说明。通常对表形数据的操作都是在某单元格预设的选项中选取一个选项,作为该单元格对应的文本内容。例如,某个单元格需要填写出生年份,通常为在该单元格预设的所有年份选项中选取一个年份,作为该单元格对应的文本内容。当有多个需要新增的文本内容时,也都是在需要新增的文本内容对应的单元格中填写数据,或者在需要新增的文本内容对应的单元格中选取选项。这样对于新增的文本内容,前者每次需要查找对应的单元格,若表格过于长,当前页面挡住了表格头,在新增文本内容时每次都需要将表格拉至最顶端查看表格头之后再填写,步骤太过于繁琐;或者只能在预设的选项中选择,局限性太强,不利于用户新增数据,用户体验感较差。
本实施例中,用户可以以文本方式直接自定义输入,实现对待转换数据的新增、修改等操作。请参见图2,图2是本申请实施例提供的对待转换数据自定义修改的示意图。
如图2所示,在某个地图新增点位的场景中,采集到地图新增点位的相关数据后,在系统中选择新增数据选项,弹出图示的表格后,在该表格中填写相关数据。其中,设备区域、间隔电压、间隔名称、设备类型、小类设备、设备名称、识别类型、表计类型、发热类型、保存类型、设备外观类型、点位名称为表形数据包含的各个数据类型,也可以理解为表形数据的表格头。将采集的相关数据(如图中的一区、220V、间隔A、一类设备类型、小类设备AA等)对应填入各个数据类型后面,填写时用户可自定义填写,不会对填写的数据有所局限。填写完成后,点击右下角的确定,终端会分析表中的数据类型以及用户填写的数据,将这些数据对应存储在之前的表形数据中,实现对表形数据的自定义修改。请参见图3,图3是本申请一实施例提供的表形数据示意图。采用上述的方式对表形数据进行自定义修改后,可得到图3中的表形数据。图3中的序号可随着表格中文本内容的增加或减少更新。此处仅为示例性说明,对此不做限定。
示例性地,转换数据结构的终端在检测到转换数据结构指令时,获取待转换数据。转换数据结构指令用于指示终端获取待转换数据,并将待转换数据转换为以目标格式的形式存储的目标转换数据。转换数据结构指令可以由用户触发,如用户点击终端中的转换数据结构选项。
获取待转换数据可以是,终端根据转换数据结构指令中包含的文件标识,获取该文件标识对应的文件,并提取该文件中的待转换数据。也可以是用户上传至该终端的待转换数据。此处仅为示例性说明,对此不做限定。
S102:在待转换数据中提取多个树节点,每个树节点用于表示待转换数据中与该树节点对应的文本内容。
每个树节点用于表示待转换数据中与该树节点对应的文本内容。如图3所示的表形数据中,每个树节点用于表示一个单元格中的文本内容,也可以理解为每个树节点对应一个单元格中的文本内容。例如图3所示,在待转换数据中提取的多个树节点可以为A区、一区、东城区、间隔B、间隔C等,A区、一区、东城区、间隔B、间隔C这些分别为表形数据单元格中的文本内容。此处仅为示例性说明,对此不做限定。
示例性地,以待转换数据为表形数据为例进行说明。可以对待转换数据的单元格中的文本内容进行去重处理,在去重处理后的文本内容中选择一些文本内容作为树节点。例如,图3中的设备区域、间隔电压、间隔名称、设备类型、小类设备、设备名称、识别类型、表计类型、发热类型、保存类型、设备外观类型为表形数据包含的各个数据类型,也可以理解为表形数据的表格头。除这些数据类型外,对其它单元格中的文本内容进行去重处理,选择去重处理后属于设备区域和间隔名称这两个数据类型的文本内容作为树节点,即在待转换数据中提取的树节点为A区、一区、东城区、西城区、风控区、间隔B、间隔C、间隔A。也可以选择去重处理后各个数据类型下的文本内容作为树节点,还可以选择去重处理后用户预挑选的数据类型下的文本内容作为树节点。可根据实际情况提取需要的树节点,此处仅为示例性说明,对此不做限定。
可选地,也可以先获取用户预挑选的数据类型下的文本内容,每个文本内容对应一个预设树节点,对这些预设树节点进行去重处理,得到提取的多个树节点。此处仅为示例性说明,对此不做限定。例如,先获取设备区域和间隔名称这两个数据类型下的所有文本内容,每个文本内容对应一个预设树节点,得到多个表现形式为A区、一区、东城区、西城区等的预设树节点,对这些预设树节点进行去重处理,得到A区、一区、东城区、西城区、风控区、间隔B、间隔C、间隔A这些树节点。此处仅为示例性说明,对此不做限定。
可选地,待转换数据包括多个数据类型,还可获取多个数据类型与预设层级结构之间的对应关系;基于该对应关系,将待转换数据分组,得到多个分组数据,每个分组数据包括的多个文本内容属于同一层级;在每个分组数据中提取多个树节点。
S103:确定各个树节点之间的层级关系。
各个树节点之间的层级关系,可以理解为各个树节点之间的包含关系,或者各个树节点之间的逻辑层次关系,或者各个树节点之间的上下位关系。
示例性地,预先设定各个数据类型之间的层级关系,获取各个树节点对应的数据类型之间的层级关系,根据各个树节点对应的数据类型之间的层级关系,确定各个树节点之间的层级关系。
请参见图4,图4是本申请一实施例提供的另一种表形数据示意图。例如,预先设定图4中的设备区域、间隔名称、设备名称、设备类型、小类设备、点位名称这些数据类型之间的层级关系。如图4所示,设备区域对应第一层,间隔名称对应第二层,设备名称对应第五层,设备类型对应第三层,小类设备对应第四层,点位名称对应第六层,即设备区域这一数据类型下的文本内容包含间隔名称这一数据类型下的文本内容,间隔名称这一数据类型下的文本内容包含设备类型这一数据类型下的文本内容,以此类推。也可以理解为,设备区域这一数据类型下的文本内容为间隔名称这一数据类型下的文本内容的上位,间隔名称这一数据类型下的文本内容为设备类型这一数据类型下的文本内容的上位,以此类推。
延用S102中的例子,在待转换数据中提取的多个树节点为A区、一区、东城区、西城区、风控区、间隔B、间隔C、间隔A。其中,A区、一区、东城区、西城区、风控区这些树节点对应的数据类型为设备区域,间隔B、间隔C、间隔A这些树节点对应的数据类型为间隔名称。设备区域为间隔名称的上位,所以树节点A区与树节点间隔B之间的层级关系为:树节点A区包含树节点间隔B,树节点A区与树节点间隔C之间的层级关系为:树节点A区包含树节点间隔C。以此类推,确定各个树节点之间的层级关系。
可选地,还可获取多个数据类型与预设层级结构之间的对应关系;基于该对应关系,将待转换数据分组,得到多个分组数据,每个分组数据包括的多个文本内容属于同一层级;确定每个分组数据对应的层级;确定各个层级之间的包含关系,以及确定每个层级对应的树节点;基于各个层级之间的包含关系以及每个层级对应的树节点,确定各个树节点之间的层级关系。
S104:基于该层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。
基于各个树节点之间的层级关系,将每个树节点以树形结构进行存储,得到数据为目标转换数据。树形结构也成树形数据结构,是具有层次的嵌套结构。树形结构可表示层次关系,也可表示从属关系、并列关系。树形结构指的是数据元素之间存在着“一对多”的树形关系的数据结构,是一类重要的非线性数据结构。
请参见图5,图5是本申请一实施例提供的另一种表形数据对应关系示意图。例如,树节点A区包含树节点间隔B,树节点A区包含树节点间隔C,树节点间隔B包含树节点A类设备类型,树节点间隔B包含树节点B类设备类型,树节点间隔C包含树节点B类设备类型,树节点A类设备类型包含树节点小类设备DD,树节点B类设备类型包含树节点小类设备EE,树节点小类设备DD包含树节点设备名称EE,树节点小类设备EE包含树节点设备名称ZZ,树节点设备名称EE包含树节点点位1017,树节点设备名称EE包含树节点点位1018,树节点设备名称EE包含树节点点位1019,树节点设备名称ZZ包含树节点点位1020,树节点设备名称ZZ包含树节点点位1021。树节点风控区包含树节点间隔A,树节点间隔A包含树节点A类设备类型,树节点A类设备类型包含树节点小类设备DD,树节点小类设备DD包含树节点设备名称EE,树节点设备名称EE包含树节点点位1016。
将树节点A区作为树形结构的第一层节点进行存储;将树节点风控区作为树形结构的第一层节点与树节点A区并列存储;将树节点间隔B作为树形结构的第二层节点存储在树节点A区的下方;将树节点间隔C作为树形结构的第二层节点存储在树节点A区的下方,且与树节点A区的下方的树节点间隔B并列存储;将树节点A类设备类型作为树形结构的第三层节点存储在树节点间隔B的下方,将树节点B类设备类型作为树形结构的第三层节点存储在树节点间隔B的下方,且与树节点间隔B下方的树节点A类设备类型并列存储;将树节点A类设备类型包含的树节点小类设备DD作为树形结构的第四层节点存储在树节点A类设备类型的下方;将树节点B类设备类型包含的树节点小类设备DD作为树形结构的第四层节点存储在树节点B类设备类型的下方;将树节点设备名称EE作为树形结构的第五层节点存储在树节点小类设备DD的下方;将树节点设备名称ZZ作为树形结构的第五层节点存储在树节点小类设备EE的下方;将树节点点位1017作为树形结构的第六层节点存储在树节点设备名称EE的下方;将树节点点位1020作为树形结构的第六层节点存储在树节点设备名称ZZ的下方。用同样的方式存储与刚才存储的树节点同层级的其他树节点。例如,一区、东城区、西城区、风控区这些树节点都是与树节点A区通层级的树节点,即一区、东城区、西城区、风控区这些树节点都属于第一层节点,可与树节点A区并列存储。此处仅为示例性说明,对此不做限定。
请参见图6,图6是本申请一实施例提供的一种树形结构数据示意图。如图6所示的存储方式,存储一区、东城区、西城区、风控区这些树节点,并用同样的方式存储其余剩余的树节点。
请参见图7,图7是本申请一实施例提供的一种目标转换数据示意图。将每个树节点以树形结构进行存储后,得到如图7所示的目标转换数据。值得说明的是,图7示出的只是目标转换数据中的一部分,仅是示例性说明,对此不做限定。
本实施例中,在待转换数据中提取了待存储的树节点,且确定了各个树节点之间的层级关系,并基于该层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。这种以树形结构存储各个树节点的方式,使目标转换数据可以直观地体现出各个数据之间的逻辑层次关系,提升了目标转换数据的展示效果。
如图8所示,图8是本申请又一实施例提供的一种转换数据结构的方法的示意性流程图,可选地,在一种可能的实现方式中,上述S102可包括S1021~S1023,具体如下:
S1021:获取多个数据类型与预设层级结构之间的对应关系。
待转换数据包括多个数据类型,预设层级结构为用户根据实际需求设置的每个数据类型所属的层级。如图4所示,设备区域、间隔电压、间隔名称、设备类型、小类设备、设备名称、识别类型、表计类型、发热类型、保存类型、设备外观类型、点位名称为表形数据包含的各个数据类型。预设层级结构可以包括第一层、第二层、第三层、第四层、第五层、第六层。多个数据类型与预设层级结构之间的对应关系为:设备区域对应第一层、间隔名称对应第二层、设备类型对应第三层、小类设备对应第四层、设备名称对应第五层、点位名称对应第六层。
值得说明的是,每个数据类型对应的预设层级结构,可根据实际情况进行调整,确定了数据类型对应的层级结构,也就确定了该数据类型下的文本内容对应的树节点所属的层级。例如,设备区域对应第一层,设备区域这一数据类型对应的A区、一区、东城区、西城区、风控区这些树节点都属于第一层节点。此处仅为示例性说明,对此不作限定。
S1022:基于该对应关系,将待转换数据分组,得到多个分组数据,每个分组数据包括的多个文本内容属于同一层级。
基于多个数据类型与预设层级结构之间的对应关系,对待转换数据进行分组处理。示例性地,设备区域对应第一层、间隔名称对应第二层、设备类型对应第三层、小类设备对应第四层、设备名称对应第五层、点位名称对应第六层。对待转换数据进行分组,得到六个分组数据。分别是以设备区域为表格头,包含该设备区域这一数据类型下所有文本内容的分组数据,以间隔名称为表格头,包含该间隔名称这一数据类型下所有文本内容的分组数据,以设备类型为表格头,包含该设备类型这一数据类型下所有文本内容的分组数据,以小类设备为表格头,包含该小类设备这一数据类型下所有文本内容的分组数据,以设备名称为表格头,包含该设备名称这一数据类型下所有文本内容的分组数据,以点位名称为表格头,包含该点位名称这一数据类型下所有文本内容的分组数据。
其中,每个分组数据包括的多个文本内容属于同一层级。示例性地,设备区域对应的分组数据包括的A区、一区、东城区、西城区、风控区这些文本内容属于同一层级。从另一层面来说,A区、一区、东城区、西城区、风控区这些作为树节点时,都属于同一层级的树节点,相应地,将这些树节点以树形结构存储时,它们是并列存储的关系。其余的分组数据均类似,此处不再赘述。此处仅为示例性说明,对此不作限定。
S1023:在每个分组数据中提取多个树节点。
在每个分组数据中提取多个树节点,可以是先对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容;基于每个分组数据对应的目标文本内容,确定每个分组数据对应的树节点。
也可以是先获取每个分组数据包含的所有文本内容,每个文本内容对应一个预设树节点,对这些预设树节点进行去重处理,得到提取的多个树节点。例如,先获取设备区域对应的分组数据包含的所有文本内容,每个文本内容对应一个预设树节点,得到多个表现形式为A区、一区、东城区、西城区等的预设树节点,对这些预设树节点进行去重处理,得到A区、一区、东城区、西城区、风控区这些树节点。此处仅为示例性说明,对此不做限定。
可选地,在一种可能的实现方式中,上述S1023可包括S10231~S10232,具体如下:
S10231:对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容。
去除每个分组数据中包含的文本内容中重复的文本内容,即对于每个分组数据中同样的文本内容只保留一种。经过去重处理后,每个分组数据中剩下的文本内容均为目标文本内容。每个目标文本内容对应第一个树节点,也就是说,经过去重处理后,每个分组数据对应的目标文本内容均作为树节点。
示例性地,以设备区域对应的分组数据为例进行说明,如图3所示,设备区域包含的文本内容具体为:7个A区、3个一区、2个东城区、1个西城区、2个风控区。对设备区域对应的分组数据进行去重处理,得到1个A区、1个一区、1个东城区、1个西城区、1个风控区,即得到该分组数据对应的目标文本内容。此处仅为示例性说明,对此不做限定。
S10232:基于每个分组数据对应的目标文本内容,确定每个分组数据对应的树节点。
示例性地,以设备区域对应的分组数据为例进行说明,该分组数据对应的目标文本内容分别为:A区、一区、东城区、西城区、风控区。每个目标文本内容对应一个树节点,即该分组数据对应的树节点分别为:A区、一区、东城区、西城区、风控区。此处仅为示例性说明,对此不做限定。
上述实施例中,先对每个分组数据进行去重处理,再根据去重处理结果确定每个分组数据对应的树节点,提升了对数据的处理速度,提高了提取树节点的效率。进而将这些树节点存储以树形结构存储后,得到的目标转换数据一目了然,可以直观地显示出各个树节点之间的逻辑层次关系,也直观地体现出各个文本内容之间的逻辑层次关系。
可选地,在一种可能的实现方式中,可采用Stream流对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容。
Stream流为一种工具,用户只要给出需要对其包含的元素执行什么操作,比如“过滤掉长度大于10的字符串”、“获取每个字符串的首字母”、“过滤掉重复数据”等,Stream流便可执行相应地操作。具体地实现方式基于Stream流对应的代码实现,将每个分组数据、需要进行的去重操作与Stream流对应的代码结合,可实现对每个分组数据进行去重处理,Stream流输出的数据即为该分组数据对应的目标文本内容。
上述实施例中,采用Stream流对每个分组数据进行去重处理,基于Stream流的便携性,加快了对分组数据去重处理的速度,进而提高了提取树节点的效率。
可选地,在一种可能的实现方式中,上述S103可包括S1031~S1033,具体如下:
S1031:确定每个分组数据对应的层级。
每个分组数据对应的层级,可以理解为每个分组数据包含的文本内容对应的树节点所对应的层级,也就是说,确定了该分组数据对应的层级,相当于确定的该分组数据包含的文本内容对应的树节点所属的层级。
示例性地,可根据用户对每个分组数据预设的层级,确定每个分组数据对应的层级;也可以获取每个分组数据对应的数据类型,根据多个数据类型与预设层级结构之间的对应关系,确定每个分组数据对应的层级。
例如,分组数据包括以设备区域为表格头,包含该设备区域这一数据类型下所有文本内容的分组数据,以间隔名称为表格头,包含该间隔名称这一数据类型下所有文本内容的分组数据。设备区域预设的层级为第一层、间隔名称预设的层级为第二层。
S1032:确定各个层级之间的包含关系,以及确定每个层级对应的树节点。
根据每个分组数据对应的层级,可确定各个层级之间的包含关系。例如,分组数据设备区域对应第一层、分组数据间隔名称对应第二层、分组数据设备类型对应第三层、分组数据小类设备对应第四层、分组数据设备名称对应第五层、分组数据点位名称对应第六层。第一层包含第二层,第二层包含第三层,第三层包含第四层,以此类推。
确定每个层级对应的树节点,即确定属于第一层的设备区域这一分组数据对应的树节点。可以先对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容;基于每个分组数据对应的目标文本内容,确定每个分组数据对应的树节点。也可以是先获取每个分组数据包含的所有文本内容,每个文本内容对应一个预设树节点,对这些预设树节点进行去重处理,得到提取的多个树节点。具体的处理方式可参考S102中的描述,此处不再赘述。
S1033:基于各个层级之间的包含关系以及每个层级对应的树节点,确定各个树节点之间的层级关系。
可选地,在确定各个树节点之间的层级关系时,可对表形数据进行多次划分,延用S102中的例子,设备区域对应第一层、间隔名称对应第二层、设备类型对应第三层、小类设备对应第四层、设备名称对应第五层、点位名称对应第六层。设备区域对应的树节点为A区、一区、东城区、西城区、风控区,分别以每个树节点为依据,采用递归的方式继续划分表形数据。请参见图9,图9是本申请一实施例提供的一种划分数据示意图。如图9所示,以设备区域对应的树节点A区为依据,划分得到数据组1,由于设备区域对应第一层、间隔名称对应第二层,那么间隔名称包含的文本内容为设备区域包含的文本内容的下位,再基于数据组1,可以确定树节点A区包含的树节点为间隔B和间隔C;同理,以设备区域对应的树节点一区为依据,划分得到数据组2,基于数据组2可以确定树节点一区包含的树节点为间隔B和间隔A;以设备区域对应的树节点东城区为依据,划分得到数据组3,基于数据组3可以确定树节点东城区包含的树节点为间隔A;以设备区域对应的树节点风控区为依据,划分得到数据组4,基于数据组4可以确定树节点风控区包含的树节点为间隔A。以此类推,采用递归的方式,设备类型对应第三层,那么设备类型包含的文本内容为间隔名称包含的文本内容的下位,以树节点间隔B为依据,继续进行数据划分,基于划分结果可确定,树节点间隔B包含的树节点为A类设备类型和B类设备类型。同理,可确定各个树节点之间的层级关系。此处仅为示例性说明,对此不做限定。
上述实施方式中,确定分组数据对应的层级时,基于用户预设的层级或多个数据类型与预设层级结构之间的对应关系确定,可根据实际情况对预设的层级以及对应关系进行调整,进而使得确定的各个分组数据对应的层级也相应灵活调整,进一步使确定的各个树节点之间的层级关系灵活调整,再基于各个树节点之间的层级关系对每个树节点进行存储后,可得到不同展示效果的目标转换数据。该方式实现了对待转换数据的多种调整,进行丰富了目标转换数据的展示效果,可满足用户的不同展示需求,提升了用户体验感。
可选地,在一种可能的实现方式中,上述S104可包括:基于该层级关系,将每个层级对应的树节点,以树形结构逐层进行存储,得到目标转换数据。
逐层进行存储是指,先存储完属于同一层级的所有树节点之后,再存储属于下一层级的所有树节点,以此类推,直至所有的树节点都存储完毕。
示例性地,如图7所示,第一层设备区域对应的树节点为:A区、一区、东城区、西城区、风控区。将树节点A区、一区、东城区、西城区、风控区作为树形结构的第一层节点并列存储。第一层间隔名称对应的树节点为:间隔B、间隔C、间隔A,其中,树节点A区包含树节点间隔B、间隔C,将树节点间隔B、间隔C在树节点A区的下方并列存储;树节点风控区包含树节点间隔A,将树节点间隔A存储在树节点风控区的下方。以此类推,逐层将所有树节点都以树形结构存储完成,得到目标转换数据。
上述方式中,逐层存储每个树节点,不容易遗漏任何一个树节点,保证了目标转换数据的完整性。且逐层存储的方式更利于终端执行存储操作,加快了数据结构转换的速度。
请参见图10,图10是本申请一实施例提供的一种转换数据结构的装置的示意图。该装置包括的各单元用于执行图1、图8对应的实施例中的各步骤。具体请参阅图1、图8各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图10,包括:
第一获取单元210,用于获取待转换数据,所述待转换数据包括表形数据;
第一提取单元220,用于在待转换数据中提取多个树节点,每个树节点用于表示所述待转换数据中与所述树节点对应的文本内容;
确定单元230,用于确定各个树节点之间的层级关系;
存储单元240,用于基于所述层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。
可选地,所述待转换数据包括多个数据类型,所述第一提取单元220包括:
第二获取单元,用于获取所述多个数据类型与预设层级结构之间的对应关系;
分组单元,用于基于所述对应关系,将所述待转换数据分组,得到多个分组数据,每个分组数据包括的多个文本内容属于同一层级;
第二提取单元,用于在每个分组数据中提取多个树节点。
可选地,所述确定单元230具体用于:
确定每个分组数据对应的层级;
确定各个层级之间的包含关系,以及确定每个层级对应的树节点;
基于各个层级之间的包含关系以及每个层级对应的树节点,确定各个树节点之间的层级关系。
可选地,所述第二提取单元包括:
去重处理单元,用于对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容;
树节点确定单元,用于基于每个分组数据对应的目标文本内容,确定每个分组数据对应的树节点。
可选地,所述去重处理单元具体用于:
采用Stream流对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容。
可选地,所述存储单元240具体用于:
基于所述层级关系,将每个层级对应的树节点,以树形结构逐层进行存储,得到所述目标转换数据。
请参见图11,图11是本申请另一实施例提供的一种转换数据结构的终端的示意图。如图11所示,该实施例的转换数据结构的终端3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机指令32。所述处理器30执行所述计算机指令32时实现上述各个转换数据结构的方法实施例中的步骤,例如图1所示的S101至S104。或者,所述处理器30执行所述计算机指令32时实现上述各实施例中各单元的功能,例如图10所示单元310至340功能。
示例性地,所述计算机指令32可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器31中,并由所述处理器30执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机指令段,该指令段用于描述所述计算机指令32在所述转换数据结构的终端3中的执行过程。例如,所述计算机指令32可以被分割为第一获取单元、第一提取单元、确定单元以及存储单元,各单元具体功能如上所述。
所述转换数据结构的终端可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图6仅仅是转换数据结构的终端3的示例,并不构成对转换数据结构的终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述转换数据结构的终端还可以包括输入输出终端、网络接入终端、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器31可以是所述转换数据结构的终端的内部存储单元,例如转换数据结构的终端的硬盘或内存。所述存储器31也可以是所述转换数据结构的终端的外部存储终端,例如所述转换数据结构的终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器31还可以既包括所述转换数据结构的终端的内部存储单元也包括外部存储终端。所述存储器31用于存储所述计算机指令以及所述终端所需的其他程序和数据。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机存储介质,计算机存储介质可以是非易失性,也可以是易失性,该计算机存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述各个转换数据结构的方法实施例中的步骤。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种转换数据结构的方法,其特征在于,包括:
获取待转换数据,所述待转换数据包括表形数据;
在待转换数据中提取多个树节点,每个树节点用于表示所述待转换数据中与所述树节点对应的文本内容;
确定各个树节点之间的层级关系;
基于所述层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。
2.如权利要求1所述的方法,其特征在于,所述待转换数据包括多个数据类型,所述在待转换数据中提取多个树节点,包括:
获取所述多个数据类型与预设层级结构之间的对应关系;
基于所述对应关系,将所述待转换数据分组,得到多个分组数据,每个分组数据包括的多个文本内容属于同一层级;
在每个分组数据中提取多个树节点。
3.如权利要求2所述的方法,其特征在于,所述确定各个树节点之间的层级关系,包括:
确定每个分组数据对应的层级;
确定各个层级之间的包含关系,以及确定每个层级对应的树节点;
基于各个层级之间的包含关系以及每个层级对应的树节点,确定各个树节点之间的层级关系。
4.如权利要求2所述的方法,其特征在于,所述在每个分组数据中提取多个树节点,包括:
对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容;
基于每个分组数据对应的目标文本内容,确定每个分组数据对应的树节点。
5.如权利要求4所述的方法,其特征在于,所述对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容,包括:
采用Stream流对每个分组数据进行去重处理,得到每个分组数据对应的目标文本内容。
6.如权利要求3所述的方法,其特征在于,所述基于所述层级关系,将每个树节点以树形结构进行存储,得到目标转换数据,包括:
基于所述层级关系,将每个层级对应的树节点,以树形结构逐层进行存储,得到所述目标转换数据。
7.一种转换数据结构的装置,其特征在于,包括:
第一获取单元,用于获取待转换数据,所述待转换数据包括表形数据;
第一提取单元,用于在待转换数据中提取多个树节点,每个树节点用于表示所述待转换数据中与所述树节点对应的文本内容;
确定单元,用于确定各个树节点之间的层级关系;
存储单元,用于基于所述层级关系,将每个树节点以树形结构进行存储,得到目标转换数据。
8.如权利要求7所述的方法,其特征在于,所述待转换数据包括多个数据类型,所述在待转换数据中提取多个树节点,所述第一提取单元包括:
第二获取单元,用于获取所述多个数据类型与预设层级结构之间的对应关系;
分组单元,用于基于所述对应关系,将所述待转换数据分组,得到多个分组数据,每个分组数据包括的多个文本内容属于同一层级;
第二提取单元,用于在每个分组数据中提取多个树节点。
9.一种转换数据结构的终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110338704.XA CN112966040A (zh) | 2021-03-29 | 2021-03-29 | 一种转换数据结构的方法、装置、终端以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110338704.XA CN112966040A (zh) | 2021-03-29 | 2021-03-29 | 一种转换数据结构的方法、装置、终端以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112966040A true CN112966040A (zh) | 2021-06-15 |
Family
ID=76279686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110338704.XA Pending CN112966040A (zh) | 2021-03-29 | 2021-03-29 | 一种转换数据结构的方法、装置、终端以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966040A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113609822A (zh) * | 2021-08-13 | 2021-11-05 | 深圳我家云网络科技有限公司 | 一种跨业务树形数据转换方法以及相关设备 |
CN113779937A (zh) * | 2021-09-27 | 2021-12-10 | 平安资产管理有限责任公司 | 基于人工智能的文本内容转换方法、装置、设备和介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04195467A (ja) * | 1990-11-28 | 1992-07-15 | Fuji Xerox Co Ltd | 木構造図表示方式 |
CN103793470A (zh) * | 2013-12-31 | 2014-05-14 | 远光软件股份有限公司 | 一种数据处理方法和装置 |
CN109284289A (zh) * | 2018-09-11 | 2019-01-29 | 深圳市网安计算机安全检测技术有限公司 | 数据集处理方法、装置、计算机设备及存储介质 |
CN110458412A (zh) * | 2019-07-16 | 2019-11-15 | 阿里巴巴集团控股有限公司 | 风险监控数据的生成方法和装置 |
CN111124883A (zh) * | 2019-11-15 | 2020-05-08 | 苏州浪潮智能科技有限公司 | 一种基于树形表格的测试用例库引入方法、系统及设备 |
WO2021003921A1 (zh) * | 2019-07-10 | 2021-01-14 | 平安科技(深圳)有限公司 | 数据处理方法及终端设备 |
CN112433712A (zh) * | 2020-11-09 | 2021-03-02 | 金蝶软件(中国)有限公司 | 报表展示方法、装置、计算机设备和存储介质 |
-
2021
- 2021-03-29 CN CN202110338704.XA patent/CN112966040A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04195467A (ja) * | 1990-11-28 | 1992-07-15 | Fuji Xerox Co Ltd | 木構造図表示方式 |
CN103793470A (zh) * | 2013-12-31 | 2014-05-14 | 远光软件股份有限公司 | 一种数据处理方法和装置 |
CN109284289A (zh) * | 2018-09-11 | 2019-01-29 | 深圳市网安计算机安全检测技术有限公司 | 数据集处理方法、装置、计算机设备及存储介质 |
WO2021003921A1 (zh) * | 2019-07-10 | 2021-01-14 | 平安科技(深圳)有限公司 | 数据处理方法及终端设备 |
CN110458412A (zh) * | 2019-07-16 | 2019-11-15 | 阿里巴巴集团控股有限公司 | 风险监控数据的生成方法和装置 |
CN111124883A (zh) * | 2019-11-15 | 2020-05-08 | 苏州浪潮智能科技有限公司 | 一种基于树形表格的测试用例库引入方法、系统及设备 |
CN112433712A (zh) * | 2020-11-09 | 2021-03-02 | 金蝶软件(中国)有限公司 | 报表展示方法、装置、计算机设备和存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113609822A (zh) * | 2021-08-13 | 2021-11-05 | 深圳我家云网络科技有限公司 | 一种跨业务树形数据转换方法以及相关设备 |
CN113779937A (zh) * | 2021-09-27 | 2021-12-10 | 平安资产管理有限责任公司 | 基于人工智能的文本内容转换方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609186B (zh) | 信息处理方法及装置、终端设备及计算机可读存储介质 | |
US10642515B2 (en) | Data storage method, electronic device, and computer non-volatile storage medium | |
US9972105B2 (en) | Visualization of data clusters | |
CN107766309B (zh) | 数据表格生成方法、装置以及存储介质、电子装置 | |
CN107977346B (zh) | 一种pdf文档编辑方法及终端设备 | |
CN110717088A (zh) | 基于电子文档的设备管理方法、装置、设备和存储介质 | |
CN112966040A (zh) | 一种转换数据结构的方法、装置、终端以及存储介质 | |
CN110674227A (zh) | 数据可视化图表和页面的生成方法、系统、介质及终端 | |
CN110728123B (zh) | 一种报表生成方法、系统及相关设备 | |
CN110309248B (zh) | 一种基于Voronoi图的交通道路网络自动划分交通小区的方法 | |
CN103002061A (zh) | 一种长域名与短域名互相转化的方法及装置 | |
CN113051460A (zh) | 基于Elasticsearch的数据检索方法、系统、电子设备及存储介质 | |
CN107943912B (zh) | 一种响应式资源目录数据可视化管理方法、终端及装置 | |
CN112650529B (zh) | 可配置生成移动端app代码的系统及方法 | |
CN107391044A (zh) | 一种云硬盘的创建方法及创建装置 | |
CN112364617A (zh) | 文件信息的处理方法、装置、电子设备和存储介质 | |
CN112149506A (zh) | 结合rpa和ai的图像中的表格生成方法、设备及存储介质 | |
CN115471582A (zh) | 地图生成方法、装置、计算机设备及存储介质 | |
CN115718879A (zh) | 数据治理方法、装置以及存储介质 | |
CN115858463A (zh) | 一种数据管理方法、装置、设备及存储介质 | |
CN115544979A (zh) | 一种行政地址提取方法、装置和设备及存储介质 | |
CN105095225A (zh) | 文件数据的获取方法和装置 | |
US10339107B2 (en) | Multi-level colocation and processing of spatial data on MapReduce | |
CN105095276B (zh) | 一种挖掘最大重复序列的方法及装置 | |
JP6994138B2 (ja) | 情報管理装置並びにファイル管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |