CN117271853A - 一种复杂数据处理方法、装置、电子设备及存储介质 - Google Patents
一种复杂数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117271853A CN117271853A CN202311443979.5A CN202311443979A CN117271853A CN 117271853 A CN117271853 A CN 117271853A CN 202311443979 A CN202311443979 A CN 202311443979A CN 117271853 A CN117271853 A CN 117271853A
- Authority
- CN
- China
- Prior art keywords
- data
- complex
- template
- primary screening
- filtered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000012216 screening Methods 0.000 claims abstract description 118
- 238000012545 processing Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000001914 filtration Methods 0.000 claims abstract description 24
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Stored Programmes (AREA)
Abstract
本申请公开了一种复杂数据处理方法、装置、电子设备及存储介质,涉及数据处理技术领域。其中,该方法包括:解析目标数据模板得到目标数据模板的格式对象,目标数据模板为对待过滤复杂数据进行处理之后需保留数据的模板;基于格式对象的数据类型对待过滤复杂数据进行初次筛选得到初筛数据;基于初筛数据的键值信息对初筛数据进行再次筛选得到目标数据。本申请提供的技术方案,可以对各种复杂数据块的统一过滤处理,不用定制化的编写特定的过滤程序,就可以降低开发人员设计和调试过滤程序的难度,提升软件开发效率。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种复杂数据处理方法、装置、电子设备及存储介质。
背景技术
在现代软件体系中网络通信扮演着重要角色,其速度直接影响软件体验。在复杂数据的通信中,过滤掉不必要的数据信息是提升网络通信效率的重要方式。现有技术中,由于每种复杂数据的格式独特,通常需要编写特定的过滤程序实现对每个数据块的过滤,这种方式处理速度慢,且影响软件开发效率。
发明内容
本申请提供了一种复杂数据处理方法、装置、电子设备及存储介质,可以对各种复杂数据块的统一过滤处理,不用定制化的编写特定的过滤程序,就可以降低开发人员设计和调试过滤程序的难度,提升软件开发效率。
第一方面,本申请提供了一种复杂数据处理方法,该方法包括:
解析目标数据模板得到所述目标数据模板的格式对象,所述目标数据模板为对待过滤复杂数据进行处理之后需保留数据的模板;
基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据;
基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据。
进一步的,所述解析目标数据模板得到所述目标数据模板的格式对象,包括:确定所述目标数据模板中字段的第一数据类型;若所述第一数据类型为对象,则将所述字段确定为所述格式对象;若所述第一数据类型为字符串,则获取所述字符串的地址后缀,确定所述地址后缀对应的解析器,基于所述解析器解析所述目标数据模板得到所述格式对象。
进一步的,所述格式对象的数量为多个;所述基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据,包括:针对当前格式对象,从所述待过滤复杂数据中获取对应的第一数据块,从所述目标数据模板中获取对应的第二数据块;确定所述第二数据块的第二数据类型,采用预设筛选规则基于所述第二数据类型对所述第一数据块进行筛选得到中间数据;依次遍历完多个格式对象,得到多个中间数据,并将所述多个中间数据合并之后作为所述初筛数据。
进一步的,所述采用预设筛选规则基于所述第二数据类型对所述第一数据块进行筛选得到中间数据,包括:若所述第二数据类型不是对象且不是数组,则将所述第一数据块作为所述中间数据;若所述第二数据类型是对象,则将所述第一数据块作为新的待过滤复杂数据,并重复执行所述基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据的操作;若所述第二数据类型是数组,则基于所述第二数据块中首个数组元素的数据类型对所述第一数据块进行筛选得到中间数据。
进一步的,所述基于所述第二数据块中首个数组元素的数据类型对所述第一数据块进行筛选得到中间数据,包括:确定所述第二数据块中首个数组元素的第三数据类型;若所述第三数据类型是对象,则将所述第一数据块中的每个数组元素分别作为新的待过滤复杂数据,并分别重复执行所述基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据的操作;若所述第三数据类型不是对象,则将所述第一数据块作为所述中间数据。
进一步的,所述所述初筛数据中包括多个键值名;所述基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据,包括:针对当前键值名,从所述初筛数据中获取对应的键值信息;确定所述键值信息是否包含于预先配置的过滤数据值库;若包含,则删除所述当前键值名;依次遍历完多个键值名,从而得到所述目标数据。
进一步的,在所述确定所述键值信息是否包含于预先配置的过滤数据值库之前,还包括:确定所述键值信息的第四数据类型;若所述第四数据类型为字符串,则执行所述确定所述键值信息是否包含于预先配置的待过滤数据值库的操作;若所述第四数据类型为对象或数组,则将所述键值信息作为新的初筛数据,并重复执行所述基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据的操作。
第二方面,本申请提供了一种复杂数据处理装置,该装置包括:
模板解析模块,用于解析目标数据模板得到所述目标数据模板的格式对象,所述目标数据模板为对待过滤复杂数据进行处理之后需保留数据的模板;
第一处理模块,用于基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据;
第二处理模块,用于基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据。
第三方面,本申请提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例所述的复杂数据处理方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本申请任意实施例所述的复杂数据处理方法。
为了解决背景技术中现有技术的缺陷,本申请实施例提供了一种复杂数据处理方法,执行该方法能够带来以下有益效果:本发明通过对用户预先配置的目标数据模板进行解析,以便提取出目标数据模板的格式对象;深度遍历目标数据模板的格式对象,先基于格式对象所对应数据块的数据类型,对待过滤复杂数据进行初次筛选;再基于用户配置的过滤数据值库和初筛数据的键值信息,对待过滤复杂数据进行再次筛选,从而实现了对复杂数据的过滤。相比于现有技术,本申请仅需配置目标数据模板,可以对各种复杂数据块的统一过滤处理,不用定制化的编写特定的过滤程序,就可以降低开发人员设计和调试过滤程序的难度,提升软件开发效率。
需要说明的是,上述计算机指令可以全部或者部分存储在计算机可读存储介质上。其中,计算机可读存储介质可以与复杂数据处理装置的处理器封装在一起,也可以与复杂数据处理装置的处理器单独封装,本申请对此不做限定。
本申请中第二方面、第三方面以及第四方面的描述,可以参考第一方面的详细描述;并且,第二方面、第三方面以及第四方面的描述的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其他特征将通过以下的说明书而变得容易理解。
可以理解的是,在使用本申请各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本申请所涉及个人信息的类型、使用范围以及使用场景等告知用户并获得用户的授权。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种复杂数据处理方法的第一流程示意图;
图2为本申请实施例提供的一种复杂数据处理方法的第二流程示意图;
图3为本申请实施例提供的一种复杂数据处理装置的结构示意图;
图4是用来实现本申请实施例的一种复杂数据处理方法的电子设备的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”“第二”“目标”以及“原始”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够实施除了在这里图示或描述之外的顺序。此外,术语“包括”“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本申请实施例提供的一种复杂数据处理方法的第一流程示意图,本实施例可适用于对复杂数据进行过滤处理得到需保留的目标数据。本实施例提供的一种复杂数据处理方法可以由本申请实施例提供的复杂数据处理装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在执行本方法的电子设备中。
参见图1,本实施例的方法包括但不限于如下步骤:
S110、解析目标数据模板得到目标数据模板的格式对象。
其中,目标数据模板为对待过滤复杂数据进行处理之后需保留数据的模板,是用户根据需保留数据预先配置的数据模板,本实施例不限定目标数据模板的文件类型,可选的文件类型包括yaml、xml或json。相同数据的文件内容可以写成不种文件类型的复杂数据模板。格式对象是用户需保留数据的键值名。
具体的,解析目标数据模板得到目标数据模板的格式对象,包括:确定目标数据模板中字段的第一数据类型;若第一数据类型为对象,表明字段就是目标数据模板的格式对象,则将字段确定为格式对象;若第一数据类型为字符串,表明字段是一个模版文件地址,则获取字符串的地址后缀,确定地址后缀对应的解析器,基于该解析器解析目标数据模板中模版文件内容得到格式对象。
示例性的,如果模版文件地址的地址后缀为xml,其对应的解析器为xml2js,使用xml2js将xml文件内容进行解析得到目标数据模板的格式对象;如果模版文件地址的地址后缀为yaml,其对应的解析器为js-yaml,使用js-yaml将yaml文件内容进行解析得到目标数据模板的格式对象;如果模版文件地址的地址后缀为json,其对应的解析器为node,使用node将json文件内容进行解析得到目标数据模板的格式对象。
S120、基于格式对象的数据类型对待过滤复杂数据进行初次筛选得到初筛数据。
可选的,格式对象的数量为多个,如person、country和address。待过滤复杂数据可以是不同类型的数据组合成一个集合体,其中的一个数据块可以有很多层级的数据类型。
具体的,基于格式对象的数据类型对待过滤复杂数据进行初次筛选得到初筛数据,包括:针对当前格式对象,从待过滤复杂数据中获取当前格式对象所对应的第一数据块,从目标数据模板中获取当前格式对象所对应的第二数据块;确定第二数据块的第二数据类型,采用预设筛选规则基于第二数据类型对第一数据块进行筛选得到中间数据;依照此方法,依次遍历完多个格式对象中每个格式对象,从而可以得到多个中间数据;最后,再将多个中间数据合并之后作为初筛数据。
示例性的,假如当前格式对象为person,从待过滤复杂数据中获取关于person的第一数据块,从目标数据模板中获取关于person的第二数据块,判断第二数据块的第二数据类型是数组、字符串还是对象,进而决定对第一数据块的处理方式,基于该处理方式对第一数据块进行处理得到第一中间数据;依照此方法,可以得到当前格式对象为country时对应的第二中间数据,以及当前格式对象为address时对应的第三中间数据;最后,将第一中间数据、第二中间数据和第三中间数据进行合并得到初筛数据。
S130、基于初筛数据的键值信息对初筛数据进行再次筛选得到目标数据。
可选的,初筛数据中包括多个键值名,例如:person中包括height、degree和certificate,certificate中包括startTime和endTime;country中包括province和city;address中包括postalCode。
具体的,基于初筛数据的键值信息对初筛数据进行再次筛选得到目标数据,包括:针对当前键值名,从初筛数据中获取当前键值名所对应的键值信息;确定该键值信息是否包含于预先配置的过滤数据值库;若包含,则删除当前键值名;依照此方法,依次遍历完多个键值名中每个键值名,从而可以得到目标数据。
其中,过滤数据值库是指用户预先配置的想要过滤掉的数据值,如空值、错误值或重复值等。目标数据是指对待过滤复杂数据进行筛选过滤之后需保留的数据。
进一步的,在确定键值信息是否包含于预先配置的过滤数据值库之前,还包括:确定键值信息的第四数据类型;若第四数据类型为字符串,则执行确定该键值信息是否包含于预先配置的待过滤数据值库的操作;若第四数据类型为对象或数组,表明当前键值名的键值信息也是一个待再次过滤的初筛数据,则将键值信息作为新的初筛数据,基于预先配置的过滤数据值库,重复执行基于初筛数据的键值信息对该新的初筛数据进行再次筛选得到目标数据的操作。
本实施例提供的技术方案,通过解析目标数据模板得到目标数据模板的格式对象;基于格式对象的数据类型对待过滤复杂数据进行初次筛选得到初筛数据;基于初筛数据的键值信息对初筛数据进行再次筛选得到目标数据。本发明通过对用户预先配置的目标数据模板进行解析,以便提取出目标数据模板的格式对象;深度遍历目标数据模板的格式对象,先基于格式对象所对应数据块的数据类型,对待过滤复杂数据进行初次筛选;再基于用户配置的过滤数据值库和初筛数据的键值信息,对待过滤复杂数据进行再次筛选,从而实现了对复杂数据的过滤。相比于现有技术,本申请仅需配置目标数据模板,可以对各种复杂数据块的统一过滤处理,不用定制化的编写特定的过滤程序,就可以降低开发人员设计和调试过滤程序的难度,提升软件开发效率。
下面进一步描述本申请实施例提供的复杂数据处理方法,图2为本申请实施例提供的一种复杂数据处理方法的第二流程示意图。本申请实施例是在上述各实施例的基础上进行优化,具体优化为:本实施例在对待过滤复杂数据进行初次筛选的过程中确定当前格式对象对应的中间数据的过程进行详细的解释说明。
参见图2,本实施例的方法包括但不限于如下步骤:
S210、从待过滤复杂数据中获取当前格式对象对应的第一数据块,从目标数据模板中获取当前格式对象对应的第二数据块,确定第二数据块的第二数据类型。
第二数据类型包括不是对象且不是数组、对象或数组中任意一种,假如第二数据类型不是对象且不是数组,则执行步骤S220;假如第二数据类型是对象,则执行步骤S230;假如第二数据类型是数组,则执行步骤S240。
S220、若第二数据类型不是对象且不是数组,则将第一数据块作为中间数据。
在本申请实施例中,如果目标数据模板中当前格式对象对应第二数据块的第二数据类型不是对象且不是数组(如字符串),那么保留待过滤复杂数据中当前格式对象所对应的第一数据块,并将第一数据块作为中间数据。
S230、若第二数据类型是对象,则将第一数据块作为新的待过滤复杂数据,并重复执行基于格式对象的数据类型对该新的待过滤复杂数据进行初次筛选得到初筛数据的操作。
在本申请实施例中,如果目标数据模板中当前格式对象对应第二数据块的第二数据类型是对象,表明第一数据块也是一个需要过滤的待过滤复杂数据,则将第一数据块作为新的待过滤复杂数据,重复执行步骤S210。
S240、若第二数据类型是数组,则确定第二数据块中首个数组元素的第三数据类型。
在本申请实施例中,如果目标数据模板中当前格式对象对应第二数据块的第二数据类型是数组,那么根据第二数据块中首个数组元素的数据类型对第一数据块进行筛选得到中间数据。具体的,先确定第二数据块中首个数组元素的第三数据类型,第三数据类型包括对象或不是对象中任意一种;再决定对第一数据块的处理方式,基于该处理方式对第一数据块进行处理得到中间数据。
假如第二数据块中首个数组元素的第三数据类型是对象,则执行步骤S250;假如第二数据块中首个数组元素的第三数据类型不是对象,则执行步骤S260。
S250、若第三数据类型是对象,则将第一数据块中的每个数组元素分别作为新的待过滤复杂数据,并分别重复执行基于格式对象的数据类型对待过滤复杂数据进行初次筛选得到初筛数据的操作。
在本申请实施例中,假如第二数据块中首个数组元素的第三数据类型是对象,表明第一数据块中每一项也是一个需要过滤的待过滤复杂数据,则将第一数据块中的每个数组元素分别作为新的待过滤复杂数据,并依次分别重复执行步骤S210。
S260、若第三数据类型不是对象,则将第一数据块作为中间数据。
在本申请实施例中,假如第二数据块中首个数组元素的第三数据类型不是对象(如字符串),那么保留待过滤复杂数据中当前格式对象所对应的第一数据块,并将第一数据块作为中间数据。
本实施例提供的技术方案,从待过滤复杂数据中获取当前格式对象对应的第一数据块,从目标数据模板中获取当前格式对象对应的第二数据块,确定第二数据块的第二数据类型;若第二数据类型不是对象且不是数组,则将第一数据块作为中间数据;若第二数据类型是对象,则将第一数据块作为新的待过滤复杂数据,并重复执行基于格式对象的数据类型对该新的待过滤复杂数据进行初次筛选得到初筛数据的操作;若第二数据类型是数组,则确定第二数据块中首个数组元素的第三数据类型;若第三数据类型是对象,则将第一数据块中的每个数组元素分别作为新的待过滤复杂数据,并分别重复执行基于格式对象的数据类型对待过滤复杂数据进行初次筛选得到初筛数据的操作;若第三数据类型不是对象,则将第一数据块作为中间数据。本发明深度遍历用户预先配置的目标数据模板的格式对象,基于格式对象所对应数据块的数据类型,对待过滤复杂数据进行初次筛选得到初筛数据。相比于现有技术,本申请仅需配置目标数据模板,可以对各种复杂数据块的统一过滤处理,不用定制化的编写特定的过滤程序,就可以降低开发人员设计和调试过滤程序的难度,提升软件开发效率。
图3为本申请实施例提供的一种复杂数据处理装置的结构示意图,如图3所示,该装置300可以包括:
模板解析模块310,用于解析目标数据模板得到所述目标数据模板的格式对象,所述目标数据模板为对待过滤复杂数据进行处理之后需保留数据的模板;
第一处理模块320,用于基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据;
第二处理模块330,用于基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据。
进一步的,上述模板解析模块310,可以具体用于:确定所述目标数据模板中字段的第一数据类型;若所述第一数据类型为对象,则将所述字段确定为所述格式对象;若所述第一数据类型为字符串,则获取所述字符串的地址后缀,确定所述地址后缀对应的解析器,基于所述解析器解析所述目标数据模板得到所述格式对象。
可选的,所述格式对象的数量为多个;
进一步的,上述第一处理模块320,可以具体用于:针对当前格式对象,从所述待过滤复杂数据中获取对应的第一数据块,从所述目标数据模板中获取对应的第二数据块;确定所述第二数据块的第二数据类型,采用预设筛选规则基于所述第二数据类型对所述第一数据块进行筛选得到中间数据;依次遍历完多个格式对象,得到多个中间数据,并将所述多个中间数据合并之后作为所述初筛数据。
进一步的,上述第一处理模块320,还可以具体用于:若所述第二数据类型不是对象且不是数组,则将所述第一数据块作为所述中间数据;若所述第二数据类型是对象,则将所述第一数据块作为新的待过滤复杂数据,并重复执行所述基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据的操作;若所述第二数据类型是数组,则基于所述第二数据块中首个数组元素的数据类型对所述第一数据块进行筛选得到中间数据。
进一步的,上述第一处理模块320,还可以具体用于:确定所述第二数据块中首个数组元素的第三数据类型;若所述第三数据类型是对象,则将所述第一数据块中的每个数组元素分别作为新的待过滤复杂数据,并分别重复执行所述基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据的操作;若所述第三数据类型不是对象,则将所述第一数据块作为所述中间数据。
可选的,所述所述初筛数据中包括多个键值名;
进一步的,上述第二处理模块330,可以具体用于:针对当前键值名,从所述初筛数据中获取对应的键值信息;确定所述键值信息是否包含于预先配置的过滤数据值库;若包含,则删除所述当前键值名;依次遍历完多个键值名,从而得到所述目标数据。
进一步的,上述第二处理模块330,还可以具体用于:在所述确定所述键值信息是否包含于预先配置的过滤数据值库之前,确定所述键值信息的第四数据类型;若所述第四数据类型为字符串,则执行所述确定所述键值信息是否包含于预先配置的待过滤数据值库的操作;若所述第四数据类型为对象或数组,则将所述键值信息作为新的初筛数据,并重复执行所述基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据的操作。
本实施例提供的复杂数据处理装置可适用于上述任意实施例提供的复杂数据处理方法,具备相应的功能和有益效果。
图4是用来实现本申请实施例的一种复杂数据处理方法的电子设备的框图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如复杂数据处理方法。
在一些实施例中,复杂数据处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的复杂数据处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行复杂数据处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置和该至少一个输出装置。
用于实施本申请的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)或者包括中间件部件的计算系统(例如,应用服务器)或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)或者包括这种后台部件、中间件部件或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。例如,本领域技术人员可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤;可以并行地执行、顺序地执行或者不同的次序执行本申请中记载的各步骤,只要能够实现本申请的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (10)
1.一种复杂数据处理方法,其特征在于,所述方法包括:
解析目标数据模板得到所述目标数据模板的格式对象,所述目标数据模板为对待过滤复杂数据进行处理之后需保留数据的模板;
基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据;
基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据。
2.根据权利要求1所述的复杂数据处理方法,其特征在于,所述解析目标数据模板得到所述目标数据模板的格式对象,包括:
确定所述目标数据模板中字段的第一数据类型;
若所述第一数据类型为对象,则将所述字段确定为所述格式对象;
若所述第一数据类型为字符串,则获取所述字符串的地址后缀,确定所述地址后缀对应的解析器,基于所述解析器解析所述目标数据模板得到所述格式对象。
3.根据权利要求1所述的复杂数据处理方法,其特征在于,所述格式对象的数量为多个;所述基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据,包括:
针对当前格式对象,从所述待过滤复杂数据中获取对应的第一数据块,从所述目标数据模板中获取对应的第二数据块;
确定所述第二数据块的第二数据类型,采用预设筛选规则基于所述第二数据类型对所述第一数据块进行筛选得到中间数据;
依次遍历完多个格式对象,得到多个中间数据,并将所述多个中间数据合并之后作为所述初筛数据。
4.根据权利要求3所述的复杂数据处理方法,其特征在于,所述采用预设筛选规则基于所述第二数据类型对所述第一数据块进行筛选得到中间数据,包括:
若所述第二数据类型不是对象且不是数组,则将所述第一数据块作为所述中间数据;
若所述第二数据类型是对象,则将所述第一数据块作为新的待过滤复杂数据,并重复执行所述基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据的操作;
若所述第二数据类型是数组,则基于所述第二数据块中首个数组元素的数据类型对所述第一数据块进行筛选得到中间数据。
5.根据权利要求4所述的复杂数据处理方法,其特征在于,所述基于所述第二数据块中首个数组元素的数据类型对所述第一数据块进行筛选得到中间数据,包括:
确定所述第二数据块中首个数组元素的第三数据类型;
若所述第三数据类型是对象,则将所述第一数据块中的每个数组元素分别作为新的待过滤复杂数据,并分别重复执行所述基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据的操作;
若所述第三数据类型不是对象,则将所述第一数据块作为所述中间数据。
6.根据权利要求1所述的复杂数据处理方法,其特征在于,所述所述初筛数据中包括多个键值名;所述基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据,包括:
针对当前键值名,从所述初筛数据中获取对应的键值信息;
确定所述键值信息是否包含于预先配置的过滤数据值库;
若包含,则删除所述当前键值名;
依次遍历完多个键值名,从而得到所述目标数据。
7.根据权利要求6所述的复杂数据处理方法,其特征在于,在所述确定所述键值信息是否包含于预先配置的过滤数据值库之前,还包括:
确定所述键值信息的第四数据类型;
若所述第四数据类型为字符串,则执行所述确定所述键值信息是否包含于预先配置的待过滤数据值库的操作;
若所述第四数据类型为对象或数组,则将所述键值信息作为新的初筛数据,并重复执行所述基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据的操作。
8.一种复杂数据处理装置,其特征在于,所述装置包括:
模板解析模块,用于解析目标数据模板得到所述目标数据模板的格式对象,所述目标数据模板为对待过滤复杂数据进行处理之后需保留数据的模板;
第一处理模块,用于基于所述格式对象的数据类型对所述待过滤复杂数据进行初次筛选得到初筛数据;
第二处理模块,用于基于所述初筛数据的键值信息对所述初筛数据进行再次筛选得到目标数据。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一所述的复杂数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1至7中任一所述的复杂数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311443979.5A CN117271853A (zh) | 2023-11-01 | 2023-11-01 | 一种复杂数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311443979.5A CN117271853A (zh) | 2023-11-01 | 2023-11-01 | 一种复杂数据处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117271853A true CN117271853A (zh) | 2023-12-22 |
Family
ID=89214482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311443979.5A Pending CN117271853A (zh) | 2023-11-01 | 2023-11-01 | 一种复杂数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117271853A (zh) |
-
2023
- 2023-11-01 CN CN202311443979.5A patent/CN117271853A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114116065B (zh) | 获取拓扑图数据对象的方法、装置、及电子设备 | |
CN115249043A (zh) | 数据分析方法、装置、电子设备及存储介质 | |
CN118193389A (zh) | 一种测试案例生成方法、装置、设备、存储介质及产品 | |
CN116185389A (zh) | 一种代码生成方法、装置、电子设备及介质 | |
CN116527652A (zh) | 一种文件格式转换路径的确定方法、装置、设备及介质 | |
CN117271853A (zh) | 一种复杂数据处理方法、装置、电子设备及存储介质 | |
CN115328898A (zh) | 一种数据处理方法、装置、电子设备及介质 | |
CN115454971A (zh) | 数据迁移方法、装置、电子设备及存储介质 | |
CN114817223A (zh) | 业务数据提取方法、装置、电子设备和存储介质 | |
CN113377295A (zh) | 多生产者单消费者的数据存储和读取方法、装置、设备 | |
CN117076332B (zh) | 一种测试用例的测试方法、装置、电子设备及存储介质 | |
CN118567870B (zh) | 批量数据处理方法、装置、设备及存储介质 | |
CN116028228A (zh) | 一种位图内存占用检测方法、装置、设备及存储介质 | |
CN115098520A (zh) | 设备数据更新方法、装置、电子设备及存储介质 | |
CN115983222A (zh) | 基于EasyExcel的文件数据读取方法、装置、设备及介质 | |
CN116400956A (zh) | 一种代码合并信息确定方法、装置、电子设备及存储介质 | |
CN117407044A (zh) | 跨端组件的配置方法、装置、设备及介质 | |
CN117520601A (zh) | 一种图数据库查询方法、装置、存储介质、设备及产品 | |
CN114595339A (zh) | 一种三元组关系变化检测方法、装置、电子设备及介质 | |
CN116932033A (zh) | 一种组件打包方法、装置、电子设备及存储介质 | |
CN114817058A (zh) | 并发风险检测方法、装置、电子设备及存储介质 | |
CN117251419A (zh) | 一种文件监测方法、装置、电子设备及存储介质 | |
CN117406964A (zh) | 数据架构模型设计方法、装置、电子设备和存储介质 | |
CN116186450A (zh) | 一种微前端应用系统、应用渲染方法、设备及存储介质 | |
CN117632734A (zh) | 一种数据库的性能测试方法、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Country or region after: China Address after: Room 6416, Building 13, No. 723 Tongxin Road, Hongkou District, Shanghai 200080 Applicant after: Shanghai Dewu Information Group Co.,Ltd. Address before: Room B6-2005, No. 121 Zhongshan North 1st Road, Hongkou District, Shanghai Applicant before: SHANGHAI SHIZHUANG INFORMATION TECHNOLOGY Co.,Ltd. Country or region before: China |