CN115510827A - 基于行数据类型标签的数据处理方法、装置、设备和介质 - Google Patents

基于行数据类型标签的数据处理方法、装置、设备和介质 Download PDF

Info

Publication number
CN115510827A
CN115510827A CN202211061637.2A CN202211061637A CN115510827A CN 115510827 A CN115510827 A CN 115510827A CN 202211061637 A CN202211061637 A CN 202211061637A CN 115510827 A CN115510827 A CN 115510827A
Authority
CN
China
Prior art keywords
data
field
row
data set
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211061637.2A
Other languages
English (en)
Inventor
许越
张文浜
吴翩翩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kingdee Software China Co Ltd
Original Assignee
Kingdee Software China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kingdee Software China Co Ltd filed Critical Kingdee Software China Co Ltd
Priority to CN202211061637.2A priority Critical patent/CN115510827A/zh
Publication of CN115510827A publication Critical patent/CN115510827A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开基于行数据类型标签的数据处理方法、装置、设备和介质。本发明通过将目标表格中的行数据按不同的分组字段值划分至不同的分组字段数据集,分别将每一分组字段数据集中的行数据按不同的排序字段值划分至不同的排序字段值,得到若干个分组字段数据集及其关联的若干个排序字段数据集,组合操作数据集中所有操作行数据的分组字段值生成操作数据集的行数据类型标签,筛选行数据类型标签与操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集,根据目标分组字段数据集关联的所有排序字段数据集确定各个操作行数据的行序号,对应在目标表格中插入操作数据集,能够快速准确地在表格中插入行数据,有效提高表格数据处理效率。

Description

基于行数据类型标签的数据处理方法、装置、设备和介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于行数据类型标签的数据处理方法、装置、设备和介质。
背景技术
目前,很多业务系统可支持用户针对多种业务场景,在表格中录入多行数据。而来源于业务的多行数据之间往往存在强关联关系,如图1所示,对于金融工具列,用户可录入的金融工具有现金、远期利率协议、期货、互换、债券五大类,根据不同金融工具的属性和业务操作,不同行数据之间的关联关系有:1、期货和远期利率协议两大类数据不能同时存在同一个表格;2、同一类金融工具(除期货外)在同一期限下只能录入一条数据,比如1d(1天)期限下的现金类数据只有一个;3、期货和远期利率协议对应的合约期限均为3m(3个月),但不同的期货合约到期日不一样,体现在表格中的期货合约列,比如当前期货合约到期月是Sep2022,代表2022年9月到期,按照3个月期限计算,下一个合约到期月即为Dec2022,代表2022年12月到期,以此类推。
此时,如果用户需要在表格中录入不同类金融工具的数据或在记录有多行数据的表格中插入新数据,对所有数据进行归类整理操作,包括同类金融工具的数据合并显示,期限从小到大排序,期货或远期利率协议合约到期月从前到后排列,则用户需要先找到指定的行进行数据插入再做后续排序动作,存在很多用户自行判断、检索、审核的操作,且在录入的多行数据之间的关联关系复杂,或者处理的数据量巨大的情况下,用户的操作繁琐度将会成倍增加。且为了实现上述业务场景(即不同行数据之间的关联关系),在用户每录入一行新的数据时,都需要执行业务系统代码来遍历表格中所有行数据进行数据校验,如果某一行某个单元格的数据检验不通过,用户将无法录入下一个单元格的数据,容易限制用户录入数据的顺序。可见,现有业务系统的表格数据处理效率并不高。
发明内容
为了克服现有技术的缺陷,本发明提供一种基于行数据类型标签的数据处理方法、装置、设备和介质,能够快速准确地在表格中插入数据,有效提高表格数据处理效率。
为了解决上述技术问题,第一方面,本发明一实施例提供一种基于行数据类型标签的数据处理方法,包括:
将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集;
分别将每一所述分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个所述分组字段数据集关联的若干个排序字段数据集;
对操作数据集中所有操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签;
从所有所述分组字段数据集中筛选行数据类型标签与所述操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集;其中,所述分组字段数据集的行数据类型标签是根据所述分组字段数据集中任一行数据的分组字段值得到的;
根据所述目标分组字段数据集关联的所有排序字段数据集,确定各个所述操作行数据的行序号,以在所述目标表格中插入所述操作数据集。
进一步地,所述基于行数据类型标签的数据处理方法,还包括:
当无法获取所述目标分组字段数据集时,基于预先定义的业务规则,从所有所述分组字段数据集中筛选行数据类型标签与所述操作数据集的行数据类型标签相邻的分组字段数据集作为相邻分组字段数据集;
根据所述相邻分组字段数据集,确定各个所述操作行数据的行序号,以在所述目标表格中新增所述操作数据集。
进一步地,所述将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集,具体为:
获取所述目标表格,分别提取所述目标表格中每一行数据的分组字段值,将分组字段值相同的行数据及对应行序号划分至同一分组字段数据集,得到若干个所述分组字段数据集。
进一步地,所述分别将每一所述分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个所述分组字段数据集关联的若干个排序字段数据集,具体为:
对于每一所述分组字段数据集,分别提取所述分组字段数据集中每一行数据的排序字段值,将排序字段值相同的行数据及对应行序号划分至同一排序字段数据集,得到各个所述分组字段数据集关联的若干个排序字段数据集。
进一步地,所述对操作数据集中所有操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签,具体为:
分别提取所述操作数据集中每一操作行数据的分组字段值,并根据预设分组字段组合顺序,对各个所述操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签。
进一步地,在所述对操作数据集中所有操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签之后,还包括:
缓存所述操作数据集的行数据类型标签。
进一步地,所述根据所述目标分组字段数据集关联的所有排序字段数据集,确定各个所述操作行数据的行序号,具体为:
对于每一所述操作行数据,提取所述操作行数据的排序字段值,从所述目标分组字段数据集关联的所有排序字段数据集中筛选排序字段值与所述所述操作行数据的排序字段值相邻的行数据作为相邻行数据,并根据所述相邻行数据的行序号,确定所述操作行数据的行序号。
第二方面,本发明一实施例提供一种基于行数据类型标签的数据处理装置,包括:
分组字段数据集获取模块,用于将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集;
排序字段数据集获取模块,用于分别将每一所述分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个所述分组字段数据集关联的若干个排序字段数据集;
行数据类型标签生成模块,用于对操作数据集中所有操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签;
目标分组字段数据集筛选模块,用于从所有所述分组字段数据集中筛选行数据类型标签与所述操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集;其中,所述分组字段数据集的行数据类型标签是根据所述分组字段数据集中任一行数据的分组字段值得到的;
操作数据集插入模块,用于根据所述目标分组字段数据集关联的所有排序字段数据集,确定各个所述操作行数据的行序号,以在所述目标表格中插入所述操作数据集。
第三方面,本发明一实施例提供一种基于行数据类型标签的数据处理设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述存储器与所述处理器耦接,且所述处理器执行所述计算机程序时实现如上所述的基于行数据类型标签的数据处理方法。
第四方面,本发明一实施例提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上所述的基于行数据类型标签的数据处理方法。
第五方面,本发明一实施例提供一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得所述计算机执行如上所述的基于行数据类型标签的数据处理方法。
相比于现有技术,本发明的实施例,具有如下有益效果:
通过将目标表格中的行数据按不同的分组字段值划分至不同的分组字段数据集,分别将每一分组字段数据集中的行数据按不同的排序字段值划分至不同的排序字段值,得到若干个分组字段数据集及各个分组字段数据集关联的若干个排序字段数据集,组合操作数据集中所有操作行数据的分组字段值生成操作数据集的行数据类型标签,从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集,根据目标分组字段数据集关联的所有排序字段数据集确定各个操作行数据的行序号,在目标表格的对应行插入对应操作行数据,完成在目标表格中插入操作数据集,无需等待用户完成判断、检索、审核的操作,也无需在每次在表格中插入行数据时遍历表格中所有行数据进行数据校验,能够快速准确地在表格中插入行数据,有效提高表格数据处理效率。
附图说明
图1为本发明第一实施例中示例的目标表格的示意图;
图2为本发明第一实施例中一种基于行数据类型标签的数据处理方法的流程示意图;
图3为本发明第一实施例中示例的目标表格中的行数据划分情况的示意图;
图4为本发明第一实施例中示例的各个操作数据集的行数据类型标签的示意图;
图5为本发明第一实施例中示例的各个操作数据集的行数据类型标签缓存于列表数据对象的示意图;
图6为本发明第一实施例中示例的插入操作数据集的示意图;
图7为本发明第二实施例中的一种基于行数据类型标签的数据处理装置的结构示意图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,文中的步骤编号,仅为了方便具体实施例的解释,不作为限定步骤执行先后顺序的作用。本实施例提供的方法可以由相关的终端设备和/或服务器执行,且下文均以处理器作为执行主体为例进行说明。
本发明实施例适用于需要在表格中插入数据的场景,其中,对表格的类型不做限定,例如可以是办公软件中的表格,也可以是企业资源计划(Enterprise ResourcePlanning,ERP)系统中的表格,ERP系统包括但不限于生产制造管理系统、供应链系统、人事系统、财务系统、税务系统及审计系统。
如图2所示,第一实施例提供一种基于行数据类型标签的数据处理方法,包括步骤S1~S5:
S1、将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集;
S2、分别将每一分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个分组字段数据集关联的若干个排序字段数据集;
S3、对操作数据集中所有操作行数据的分组字段值进行组合,生成操作数据集的行数据类型标签;
S4、从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集;其中,分组字段数据集的行数据类型标签是根据分组字段数据集中任一行数据的分组字段值得到的;
S5、根据目标分组字段数据集关联的所有排序字段数据集,确定各个操作行数据的行序号,以在目标表格中插入操作数据集。
作为示例性地,在步骤S1中,用户可根据实际的业务需求,预先定义业务规则,包括设置目标表格中行之间的分组关系、各个分组内行之间的排序关系。假设目标表格如图1所示,基于预先定义的业务规则,以涉及到目标表格中行之间的分组关系的金融工具列作为分组字段,将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,具体将目标表格中分组字段值为“现金”的行数据划分至一个分组字段数据集,将目标表格中分组字段值为“期货”的行数据划分至一个分组字段数据集,将目标表格中分组字段值为“债券”的行数据划分至一个分组字段数据集,得到若干个分组字段数据集。
在步骤S2中,基于预先定义的业务规则,以涉及到各个分组内行之间的排序关系的期货合约、FRA、期限列作为排序字段,分别将每一分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,比如将“期货”分组字段数据集中期货合约值为“Sep2022”的行数据划分至一个排序字段数据集,将“期货”分组字段数据集中期货合约值为“Dec2022”的行数据划分至一个排序字段数据集,将“期货”分组字段数据集中期货合约值为“Mar2023”的行数据划分至一个排序字段数据集,得到各个分组字段数据集关联的若干个排序字段数据集。
基于预先定义的业务规则,还可以目标表格中其他字段列作为业务字段。其中,目标表格中的行数据划分情况如图3所示,Key是键值对中的键,用来唯一标识对象,作为查找对象的游标,Value是键值对中的值,代表对于键存储的数据。
在步骤S3中,获取用户输入的操作数据集,基于预先定义的业务规则,分别提取操作数据集中每一操作行数据的分组字段值,得到操作数据集中所有操作行数据的分组字段值,对操作数据集中所有操作行数据的分组字段值进行组合,生成操作数据集的行数据类型标签。由于操作数据集中可能存在至少两个操作行数据的分组字段值相同的情况,在对操作数据集中所有操作行数据的分组字段值进行组合的过程中,可遍历每一操作行数据,判断当前遍历的操作行数据的分组字段值是否与先前遍历的任一操作行数据的分组字段值相同,若是,则直接舍弃当前遍历的操作行数据的分组字段值,以在遍历所有操作行数据后仅对保留的所有操作行数据的分组字段值进行组合,得到操作数据集的行数据类型标签;也可遍历所有操作行数据获取所有操作行数据的分组字段值,先对所有操作行数据的分组字段值进行组合,再对组合而成的分组字段值序列进行去重,得到操作数据集的行数据类型标签,其中,组合顺序可以是遍历顺序或预先定义的业务规则中包含的各个分组之间的排列顺序。
在步骤S4中,分别对每一分组字段数据集中所有行数据的分组字段值进行组合,得到各个分组字段数据集的行数据类型标签。由于分组字段数据集中各个行数据的分组字段值均相同,可直接取分组字段数据集中任一行数据的分组字段值作为对应分组字段数据集的行数据类型标签。从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集,具体地,分别将每一分组字段数据集的行数据类型标签中的一个分组字段值与操作数据集的行数据类型标签中的各个分组字段值进行比对,在一分组字段数据集的分组字段值与操作数据集中的任一分组字段值相同时,将该分组字段数据集作为目标分组字段数据集。
在步骤S5中,基于各个分组字段数据集与各个排序字段数据集之间的关联关系,获取目标分组字段数据集关联的所有排序字段数据集,根据这些排序字段数据集中的各个行数据及对应行序号,确定操作数据集中各个操作行数据的行序号,以在目标表格的对应行插入对应操作行数据,完成在目标表格中插入操作数据集。
假设一操作数据集中有两个操作行数据,这两个操作行数据的分组字段值均不相同,那么该操作数据集的行数据类型标签是由这两个操作行数据的分组字段值组合得到的分组字段值序列,从所有分组字段数据集中筛选行数据类型标签为第一个操作行数据的分组字段值的分组字段数据集,及行数据类型为第二个操作行数据集的分组字段值的分组字段数据集,将筛选出来的分组字段值均作为目标分组字段数据集,对于行数据类型标签为第一个操作行数据的分组字段值的分组字段数据集,即筛选出来的第一个目标分组字段数据集,根据该目标分组字段数据集关联的所有排序字段数据集,确定第一个操作行数据的行序号,同样地,对于行数据类型标签为第二个操作行数据的分组字段值的分组字段数据集,即筛选出来的第二个目标分组字段数据集,根据该目标分组字段数据集关联的所有排序字段数据集,确定第二个操作行数据的行序号,保证各个操作行数据的有序插入。
可以理解的是,在用户输入操作数据集时,可直接针对操作数据集生成一个行数据类型标签,基于操作数据集的行数据类型标签自动在目标表格中的对应行插入对应操作行数据,无需等待用户完成判断、检索、审核的操作,也无需在每次在表格中插入行数据时遍历表格中所有行数据进行数据校验。
本实施例能够快速准确地在表格中插入行数据,有效提高表格数据处理效率。
在优选的实施例当中,所述基于行数据类型标签的数据处理方法,还包括步骤S6~S7:
S6、当无法获取目标分组字段数据集时,基于预先定义的业务规则,从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签相邻的分组字段数据集作为相邻分组字段数据集;
S7、根据相邻分组字段数据集,确定各个操作行数据的行序号,以在目标表格中新增操作数据集。
作为示例性地,在步骤S6中,当所有分组字段数据集的行数据类型标签与操作数据集的行数据类型标签均不对应,无法从所有分组字段数据集中筛选到目标分组字段数据集时,基于预先定义的业务规则,包括各个分组,即行数据类型标签之间的排序关系,从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签的排列位置相邻的分组字段数据集作为相邻分组字段数据集。
假设预先定义的各个分组之间从前到后的排序关系为“现金”、“期货”、“债券”、“互换”,根据如图1所示的目标表格得到的所有分组字段数据集的行数据类型标签分别为“现金”、“期货”、“债券”,操作数据集的行数据类型标签为“互换”。在此情况下,各个分组字段数据集的行数据类型标签与操作数据集的行数据类型标签均不相同,则认为所有分组字段数据集的行数据类型标签与操作数据集的行数据类型标签均不对应,无法从所有分组字段数据集中筛选到目标分组字段数据集,此时改为从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签的排列位置相邻的分组字段数据集作为相邻分组字段数据集,由于“债券”与“互换”的排列位置相邻,因此将“债券”对应的分组字段数据集作为相邻分组字段数据集。
假设预先定义的各个分组之间从前到后的排序关系为“现金”、“期货”、“债券”、“互换”,所有分组字段数据集的行数据类型标签分别为“现金”、“期货”、“互换”,操作数据集的行数据类型标签为“债券”。在此情况下,各个分组字段数据集的行数据类型标签与操作数据集的行数据类型标签均不相同,则认为所有分组字段数据集的行数据类型标签与操作数据集的行数据类型标签均不对应,无法从所有分组字段数据集中筛选到目标分组字段数据集,此时改为从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签的排列位置相邻的分组字段数据集作为相邻分组字段数据集,由于“期货”、“互换”与“债券”的排列位置相邻,因此将“期货”、“互换”对应的分组字段数据集作为相邻分组字段数据集。
可以理解的是,行数据类型标签与操作数据集的行数据类型标签的排列位置相邻的分组字段数据集是指,对于操作数据集行数据类型标签中的每一分组字段值,基于各个分组之间的排序关系,行数据类型标签中分组字段值排在操作数据集行数据类型标签中该分组字段值的排列位置前面和/或后面的分组字段数据集。
在步骤S7中,根据相邻分组字段数据集中的各个行数据及对应行序号,确定操作数据集中各个操作行数据的行序号,以在目标表格的对应行新增对应操作行数据,完成在目标表格中新增操作数据集。
比如,当需要插入一个“互换”金融工具,对于第一个操作行数据,根据“债券”对应的分组字段数据集,即相邻分组字段数据集中各个行数据及对应行序号,得到相邻分组字段数据集中最后一个行数据的行序号为8,进而确定第一个操作行数据的行序号为8+1=9;对于第二个行数据,根据相邻分组字段数据集中最后一个行数据的行序号,以及前面所有操作行数据,即第一个操作行数据的排序字段值和行序号,判断第一个操作行数据与第二个操作行数据的排列顺序,若判定第一个操作行数据排列在第二个操作行数据之前,则确定第二个操作行数据的行序号为8+1+1=10,否则确定第二个操作行数据的行序号为8+1=9,并调整第一个操作行数据的行序号为8+1+1=10;以此类推,直至确定操作数据集中各个操作行数据的行序号,在目标表格的对应行新增对应操作行数据。
本实施例能够快速准确地在表格中新增行数据,有效提高表格数据处理效率。
在优选的实施例当中,所述将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集,具体为:获取目标表格,分别提取目标表格中每一行数据的分组字段值,将分组字段值相同的行数据及对应行序号划分至同一分组字段数据集,得到若干个分组字段数据集。
作为示例性地,基于预先定义的业务规则,以涉及到目标表格中行之间的分组关系的金融工具列作为分组字段,将目标表格中分组字段值相同的行数据及对应行序号划分至同一分组字段数据集,具体将目标表格中分组字段值为“现金”的行数据及对应行序号划分至一个分组字段数据集,将目标表格中分组字段值为“期货”的行数据及对应行序号划分至一个分组字段数据集,将目标表格中分组字段值为“债券”的行数据及对应行序号划分至一个分组字段数据集,得到若干个分组字段数据集。
在优选的实施例当中,所述分别将每一分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个分组字段数据集关联的若干个排序字段数据集,具体为:对于每一分组字段数据集,分别提取分组字段数据集中每一行数据的排序字段值,将排序字段值相同的行数据及对应行序号划分至同一排序字段数据集,得到各个分组字段数据集关联的若干个排序字段数据集。
作为示例性地,基于预先定义的业务规则,以涉及到各个分组内行之间的排序关系的期货合约、FRA、期限列作为排序字段,分别将每一分组字段数据集中排序字段值相同的行数据及对应行序号划分至同一排序字段数据集,比如将“期货”分组字段数据集中期货合约值为“Sep2022”的行数据及对应行序号划分至一个排序字段数据集,将“期货”分组字段数据集中期货合约值为“Dec2022”的行数据及对应行序号划分至一个排序字段数据集,将“期货”分组字段数据集中期货合约值为“Mar2023”的行数据及对应行序号划分至一个排序字段数据集,得到各个分组字段数据集关联的若干个排序字段数据集。
在优选的实施例当中,所述对操作数据集中所有操作行数据的分组字段值进行组合,生成操作数据集的行数据类型标签,具体为:分别提取操作数据集中每一操作行数据的分组字段值,并根据预设分组字段组合顺序,对各个操作行数据的分组字段值进行组合,生成操作数据集的行数据类型标签。
作为示例性地,获取用户输入的操作数据集,基于预先定义的业务规则,分别提取操作数据集中每一操作行数据的分组字段值,得到操作数据集中所有操作行数据的分组字段值。基于预先定义的业务规则,根据各个分组之间的排序关系,预先设置分组字段组合顺序。按照预设分组字段组合顺序,对操作数据集中所有操作行数据的分组字段值进行组合,比如将排列顺序在前的分组对应的分组字段值放在首位,将排列顺序在后的分组对应的分组字段值放在末位,得到分组字段值序列,从而生成操作数据集的行数据类型标签。其中,各个操作数据集的行数据类型标签的示意图如图4所示,Tag是标签。
在优选的实施例当中,在所述对操作数据集中所有操作行数据的分组字段值进行组合,生成操作数据集的行数据类型标签之后,还包括:缓存操作数据集的行数据类型标签。
作为示例性地,在生成操作数据集的行数据类型标签后,将操作数据集的行数据类型标签缓存于列表数据对象。其中,各个操作数据集的行数据类型标签缓存于列表数据对象的示意图如图5所示。
本实施例通过将操作数据集的行数据类型标签缓存于列表数据对象,方便后续再次在目标表格中插入与操作数据集的行数据类型标签一致的新操作数据集时,可直接从列表数据对象中获取行数据类型标签,不必再次组合新操作数据集中各个新操作行数据的分组字段值得到其行数据类型标签,能够进一步快速准确地在表格中插入行数据,有效提高表格数据处理效率。
在优选的实施例当中,所述根据目标分组字段数据集关联的所有排序字段数据集,确定各个操作行数据的行序号,具体为:对于每一操作行数据,提取操作行数据的排序字段值,从目标分组字段数据集关联的所有排序字段数据集中筛选排序字段值与操作行数据的排序字段值相邻的行数据作为相邻行数据,并根据相邻行数据的行序号,确定操作行数据的行序号。
作为示例性地,基于预先定义的业务规则,根据各个分组之间的排序关系,确定操作数据集的行数据类型标签在所有分组字段数据集的行数据类型标签中的位置顺序。分别提取每一操作行数据的排序字段值,从目标分组字段数据集关联的所有排序字段数据集中筛选排序字段值与操作行数据的排序字段值的排列位置相邻的行数据作为相邻行数据,并根据相邻行数据的行序号,确定操作行数据的行序号,执行页面插入。比如,需要新插入一个“债券”金融工具,“债券”的行数据类型标签位于所有分组字段数据集的行数据类型标签的第三组,前两组tag目前共有4行,新插入的债券为期限2y,位于目前的1y之后,因此需要在第4+1+1=6行中执行插入。其中,插入操作数据集的示意图如图6所示。
可以理解的是,排序字段值与操作行数据的排序字段值相邻的行数据,即相邻行数据是指,基于组内各个排序字段值之间的排序关系,排序字段值排在操作行数据的排序字段值的排列位置前面和/或后面的行数据。
基于与第一实施例相同的发明构思,第二实施例提供如图7所示的一种基于行数据类型标签的数据处理装置,包括:分组字段数据集获取模块21,用于将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集;排序字段数据集获取模块22,用于分别将每一分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个分组字段数据集关联的若干个排序字段数据集;行数据类型标签生成模块23,用于对操作数据集中所有操作行数据的分组字段值进行组合,生成操作数据集的行数据类型标签;目标分组字段数据集筛选模块24,用于从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集;其中,分组字段数据集的行数据类型标签是根据分组字段数据集中任一行数据的分组字段值得到的;操作数据集插入模块25,用于根据目标分组字段数据集关联的所有排序字段数据集,确定各个操作行数据的行序号,以在目标表格中插入操作数据集。
在优选的实施例当中,所述基于行数据类型标签的数据处理装置,还包括:相邻分组字段数据集筛选模块,用于当无法获取目标分组字段数据集时,基于预先定义的业务规则,从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签相邻的分组字段数据集作为相邻分组字段数据集;操作数据集新增模块,用于根据相邻分组字段数据集,确定各个操作行数据的行序号,以在目标表格中新增操作数据集。
在优选的实施例当中,分组字段数据集获取模块21,具体用于获取目标表格,分别提取目标表格中每一行数据的分组字段值,将分组字段值相同的行数据及对应行序号划分至同一分组字段数据集,得到若干个分组字段数据集。
在优选的实施例当中,排序字段数据集获取模块22,具体用于对于每一分组字段数据集,分别提取分组字段数据集中每一行数据的排序字段值,将排序字段值相同的行数据及对应行序号划分至同一排序字段数据集,得到各个分组字段数据集关联的若干个排序字段数据集。
在优选的实施例当中,行数据类型标签生成模块23,具体用于分别提取操作数据集中每一操作行数据的分组字段值,并根据预设分组字段组合顺序,对各个操作行数据的分组字段值进行组合,生成操作数据集的行数据类型标签。
在优选的实施例当中,行数据类型标签生成模块23,还用于在所述对操作数据集中所有操作行数据的分组字段值进行组合,生成操作数据集的行数据类型标签之后,缓存操作数据集的行数据类型标签。
在优选的实施例当中,操作数据集插入模块25,具体用于对于每一操作行数据,提取操作行数据的排序字段值,从目标分组字段数据集关联的所有排序字段数据集中筛选排序字段值与操作行数据的排序字段值相邻的行数据作为相邻行数据,并根据相邻行数据的行序号,确定操作行数据的行序号。
基于与第一实施例相同的发明构思,第三实施例提供一种基于行数据类型标签的数据处理设备,包括处理器、存储器以及存储在存储器中且被配置为由处理器执行的计算机程序,存储器与处理器耦接,且处理器执行计算机程序时实现如第一实施例所述的基于行数据类型标签的数据处理方法,且能达到与之相同的有益效果。
基于与第一实施例相同的发明构思,第四实施例提供一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如第一实施例所述的基于行数据类型标签的数据处理方法,且能达到与之相同的有益效果。
基于与第一实施例相同的发明构思,第五实施例提供一种计算机程序产品,计算机程序产品在计算机上运行时,使得计算机执行如第一实施例所述的基于行数据类型标签的数据处理方法,且能达到与之相同的有益效果。
综上所述,实施本发明的实施例,具有如下有益效果:
通过将目标表格中的行数据按不同的分组字段值划分至不同的分组字段数据集,分别将每一分组字段数据集中的行数据按不同的排序字段值划分至不同的排序字段值,得到若干个分组字段数据集及各个分组字段数据集关联的若干个排序字段数据集,组合操作数据集中所有操作行数据的分组字段值生成操作数据集的行数据类型标签,从所有分组字段数据集中筛选行数据类型标签与操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集,根据目标分组字段数据集关联的所有排序字段数据集确定各个操作行数据的行序号,在目标表格的对应行插入对应操作行数据,完成在目标表格中插入操作数据集,无需等待用户完成判断、检索、审核的操作,也无需在每次在表格中插入行数据时遍历表格中所有行数据进行数据校验,能够快速准确地在表格中插入行数据,有效提高表格数据处理效率。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

Claims (10)

1.一种基于行数据类型标签的数据处理方法,其特征在于,包括:
将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集;
分别将每一所述分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个所述分组字段数据集关联的若干个排序字段数据集;
对操作数据集中所有操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签;
从所有所述分组字段数据集中筛选行数据类型标签与所述操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集;其中,所述分组字段数据集的行数据类型标签是根据所述分组字段数据集中任一行数据的分组字段值得到的;
根据所述目标分组字段数据集关联的所有排序字段数据集,确定各个所述操作行数据的行序号,以在所述目标表格中插入所述操作数据集。
2.如权利要求1所述的基于行数据类型标签的数据处理方法,其特征在于,还包括:
当无法获取所述目标分组字段数据集时,基于预先定义的业务规则,从所有所述分组字段数据集中筛选行数据类型标签与所述操作数据集的行数据类型标签相邻的分组字段数据集作为相邻分组字段数据集;
根据所述相邻分组字段数据集,确定各个所述操作行数据的行序号,以在所述目标表格中新增所述操作数据集。
3.如权利要求1所述的基于行数据类型标签的数据处理方法,其特征在于,所述将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集,具体为:
获取所述目标表格,分别提取所述目标表格中每一行数据的分组字段值,将分组字段值相同的行数据及对应行序号划分至同一分组字段数据集,得到若干个所述分组字段数据集。
4.如权利要求1所述的基于行数据类型标签的数据处理方法,其特征在于,所述分别将每一所述分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个所述分组字段数据集关联的若干个排序字段数据集,具体为:
对于每一所述分组字段数据集,分别提取所述分组字段数据集中每一行数据的排序字段值,将排序字段值相同的行数据及对应行序号划分至同一排序字段数据集,得到各个所述分组字段数据集关联的若干个排序字段数据集。
5.如权利要求1所述的基于行数据类型标签的数据处理方法,其特征在于,所述对操作数据集中所有操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签,具体为:
分别提取所述操作数据集中每一操作行数据的分组字段值,并根据预设分组字段组合顺序,对各个所述操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签。
6.如权利要求1所述的基于行数据类型标签的数据处理方法,其特征在于,在所述对操作数据集中所有操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签之后,还包括:
缓存所述操作数据集的行数据类型标签。
7.如权利要求1所述的基于行数据类型标签的数据处理方法,其特征在于,所述根据所述目标分组字段数据集关联的所有排序字段数据集,确定各个所述操作行数据的行序号,具体为:
对于每一所述操作行数据,提取所述操作行数据的排序字段值,从所述目标分组字段数据集关联的所有排序字段数据集中筛选排序字段值与所述所述操作行数据的排序字段值相邻的行数据作为相邻行数据,并根据所述相邻行数据的行序号,确定所述操作行数据的行序号。
8.一种基于行数据类型标签的数据处理装置,其特征在于,包括:
分组字段数据集获取模块,用于将目标表格中分组字段值相同的行数据划分至同一分组字段数据集,得到若干个分组字段数据集;
排序字段数据集获取模块,用于分别将每一所述分组字段数据集中排序字段值相同的行数据划分至同一排序字段数据集,得到各个所述分组字段数据集关联的若干个排序字段数据集;
行数据类型标签生成模块,用于对操作数据集中所有操作行数据的分组字段值进行组合,生成所述操作数据集的行数据类型标签;
目标分组字段数据集筛选模块,用于从所有所述分组字段数据集中筛选行数据类型标签与所述操作数据集的行数据类型标签对应的分组字段数据集作为目标分组字段数据集;其中,所述分组字段数据集的行数据类型标签是根据所述分组字段数据集中任一行数据的分组字段值得到的;
操作数据集插入模块,用于根据所述目标分组字段数据集关联的所有排序字段数据集,确定各个所述操作行数据的行序号,以在所述目标表格中插入所述操作数据集。
9.一种基于行数据类型标签的数据处理设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述存储器与所述处理器耦接,且所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于行数据类型标签的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7任一项所述的基于行数据类型标签的数据处理方法。
CN202211061637.2A 2022-08-31 2022-08-31 基于行数据类型标签的数据处理方法、装置、设备和介质 Pending CN115510827A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211061637.2A CN115510827A (zh) 2022-08-31 2022-08-31 基于行数据类型标签的数据处理方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211061637.2A CN115510827A (zh) 2022-08-31 2022-08-31 基于行数据类型标签的数据处理方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN115510827A true CN115510827A (zh) 2022-12-23

Family

ID=84501331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211061637.2A Pending CN115510827A (zh) 2022-08-31 2022-08-31 基于行数据类型标签的数据处理方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN115510827A (zh)

Similar Documents

Publication Publication Date Title
CN110292775B (zh) 获取差异数据的方法及装置
US10459888B2 (en) Method, apparatus and system for data analysis
CN111553137B (zh) 报告生成方法、装置、存储介质及计算机设备
US20100256985A1 (en) Methods and apparatus for queue-based cluster analysis
CN106844320B (zh) 一种财务报表整合方法和设备
CN109636303B (zh) 一种半自动提取和结构化文档信息的存储方法及系统
CN110781235A (zh) 基于大数据的采购数据处理方法、装置、终端及存储介质
US8335759B2 (en) Work analysis device and recording medium recording work analysis program
US20140379417A1 (en) System and Method for Data Quality Business Impact Analysis
CN113918532A (zh) 画像标签聚合方法、电子设备及存储介质
CN112214473A (zh) 一种数据库间的数据迁移方法及系统
CN115510827A (zh) 基于行数据类型标签的数据处理方法、装置、设备和介质
CN114817171A (zh) 一种埋点数据质量治理方法
CN112559641B (zh) 拉链表的处理方法及装置、可读存储介质、电子设备
CN106126633B (zh) 贵金属数据的处理方法、装置和系统
US9239867B2 (en) System and method for fast identification of variable roles during initial data exploration
CN114168624A (zh) 数据分析方法、计算设备及存储介质
CN115168297A (zh) 绕行日志审计方法及装置
CN112862264A (zh) 企业经营状况分析方法、计算机设备及计算机存储介质
CN110704470A (zh) 一种账单数据排重方法、终端设备及存储介质
CN110517010A (zh) 一种数据处理方法、系统及存储介质
CN111476011A (zh) 文章生成方法、装置及存储介质
US11831490B1 (en) Systems, methods, and media for performing information technology service management correlation for infrastructure environment functions
CN114238351A (zh) 数据更新方法、装置、电子设备及计算机可读存储介质
CN114416805B (zh) 数据核对方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination