CN113705175B - 一种电子表格行列精简的方法、服务器及存储介质 - Google Patents

一种电子表格行列精简的方法、服务器及存储介质 Download PDF

Info

Publication number
CN113705175B
CN113705175B CN202110949656.8A CN202110949656A CN113705175B CN 113705175 B CN113705175 B CN 113705175B CN 202110949656 A CN202110949656 A CN 202110949656A CN 113705175 B CN113705175 B CN 113705175B
Authority
CN
China
Prior art keywords
row
description information
column
electronic table
redundant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110949656.8A
Other languages
English (en)
Other versions
CN113705175A (zh
Inventor
孙苏勇
张泓
郑际树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Hymake Technology Co ltd
Original Assignee
Xiamen Hymake Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Hymake Technology Co ltd filed Critical Xiamen Hymake Technology Co ltd
Priority to CN202110949656.8A priority Critical patent/CN113705175B/zh
Publication of CN113705175A publication Critical patent/CN113705175A/zh
Application granted granted Critical
Publication of CN113705175B publication Critical patent/CN113705175B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种电子表格行列精简的方法、服务器及存储介质,用于将已有电子表格中冗余的行列去除而不影响整体表格的布局,释放部分存储空间。本申请实施例方法包括:读取第一电子表格的行列描述信息;根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格。

Description

一种电子表格行列精简的方法、服务器及存储介质
技术领域
本申请涉及数字化信息技术领域,尤其涉及一种电子表格行列精简的方法、服务器及存储介质。
背景技术
在信息化建设中常涉及大量表格的处理,无论是系统提供数量庞大的表格模板或者是操作者自行设计表格,当表格数量巨大,如果表格中存在大量冗余的行列设计,不仅增加存储空间,也影响后续解析。
目前的发明大多主要针对表格中单元格合并、拆分操作方式的处理,如通过触控、通过鼠标等动作执行合并、拆分动作,是一种主观操作行为,其重点侧重于动作的识别及执行,而不考虑表格中行列的冗余问题。
当前针对电子表格的处理多为合并、拆分操作的识别及执行,并不考虑电子表格整体行列形式上的简化,也即未考虑电子表格空间占用和解析复杂性。
发明内容
本申请实施例提供了一种电子表格行列精简的方法、服务器及存储介质,用于将已有电子表格中冗余的行列去除而不影响整体表格的布局,释放部分存储空间。
本申请第一方面提供一种电子表格行列精简的方法,可以包括:
读取第一电子表格的行列描述信息;
根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;
根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格。
可选的,所述读取第一电子表格的行列描述信息,包括:
获取第一电子表格的最大行列数;
在所述最大行列数超过预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,所述方法还包括:
在所述最大行列数未超过所述预设阈值的情况下,读取当前单元格信息;
在所述当前单元格信息指示为合并单元格的情况下,生成[x,y]的行列描述信息;
在所述当前单元格信息指示不为合并单元格的情况下,生成[x,x]的行列描述信息;
将所述[x,y]的行列描述信息或所述[x,x]的行列描述信息加入目标集合中自动去重,得到去重后的目标集合;
若所述目标集合中的行列数超过所述预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,所述根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息,包括:
根据所述行列描述信息,查找最大的不相交行列排列,以结束位置和起始位置分别与其他行列位置进行比较,去除有交叉的结果,得到冗余行列描述信息。
可选的,所述行列描述信息中的起始位置按照升序排序,结束位置按照升序排序。
可选的,所述根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格,包括:
根据所述冗余行列描述信息由后向前合并,生成第二电子表格。
可选的,所述行列描述信息包括起始位置和结束位置存在交集的行列描述信息。
本申请第二方面提供一种服务器,可以包括:
处理模块,用于读取第一电子表格的行列描述信息;根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格。
可选的,所述处理模块,具体用于获取第一电子表格的最大行列数;在所述最大行列数超过预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,所述处理模块,具体用于在所述最大行列数未超过所述预设阈值的情况下,读取当前单元格信息;在所述当前单元格信息指示为合并单元格的情况下,生成[x,y]的行列描述信息;在所述当前单元格信息指示不为合并单元格的情况下,生成[x,x]的行列描述信息;将所述[x,y]的行列描述信息或所述[x,x]的行列描述信息加入目标集合中自动去重,得到去重后的目标集合;若所述目标集合中的行列数超过所述预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,所述处理模块,具体用于根据所述行列描述信息,查找最大的不相交行列排列,以结束位置和起始位置分别与其他行列位置进行比较,去除有交叉的结果,得到冗余行列描述信息。
可选的,所述行列描述信息中的起始位置按照升序排序,结束位置按照升序排序。
可选的,所述处理模块,具体用于根据所述冗余行列描述信息由后向前合并,生成第二电子表格。
可选的,所述行列描述信息包括起始位置和结束位置存在交集的行列描述信息。
本申请第三方面提供一种服务器,可以包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器和收发器;
所述处理器调用所述存储器中存储的所述可执行程序代码,用于所述处理器和所述收发器执行如本申请第一方面所述的方法。
本申请又一方面提供一种计算机可读存储介质,包括指令,当其在处理器上运行时,使得处理器执行如本申请第一方面所述的方法。
本发明又一方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请第一方面所述的方法。
本发明又一方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请第一方面所述的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
在本发明实施例中,读取第一电子表格的行列描述信息;根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格。可以将已有电子表格中冗余的行列去除而不影响整体表格的布局,释放部分存储空间。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,还可以根据这些附图获得其它的附图。
图1为本申请实施例中所应用的系统结构图;
图2为本申请实施例中的一个总流程示意图;
图3为本申请实施例中电子表格行列精简的方法的一个实施例示意图;
图4为本申请实施例中获取行列描述信息的一个示意图;
图5为本申请实施例中精简算法的一个流程示意图;
图6为本申请实施例中生成第二电子表格的一个示意图;
图7为本发明实施例中服务器的一个实施例示意图;
图8为本申请实施例中服务器的另一个实施例示意图。
具体实施方式
本申请实施例提供了一种电子表格行列精简的方法、服务器及存储介质,用于将已有电子表格中冗余的行列去除而不影响整体表格的布局。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,都应当属于本申请保护的范围。
在本发明实施例中,提出的是针对电子表格进行行列分析,将冗余的行列去除而不改变表格整体布局,经该方法处理后的表格将达到行列表示上的精简形式,以利于存储空间的压缩及后续对电子表格的分析操作。该方法可进一步作为独立服务或已有系统的一部分,形式灵活,可并行化,易于对现有电子表格进行相关处理。
下面对本申请技术方案做进一步的说明。这部分涉及电子表格的关键数据结构描述、行列解析及具体的精简算法,对本技术方案不构成理解障碍的部分将略去。如图1所示,为本申请实施例中所应用的系统结构图,该系统结构可以包括操作层、接口层、服务层、用户接口、服务接口、表格解析器、行列简算法、表格生成器等。
如图2所示,为本申请实施例中的一个总流程示意图。在图2所示中,调用方,也可以称为调用端,准备提交电子表格服务接口;服务方,也可以称为服务端,对电子表格解析生成行列描述,执行行列精简算法生成冗余行列描述,生成电子表格,去除冗余行列,对其他格式进行信息处理。
下面以实施例的方式,对本申请技术方案做进一步的说明,如图3所示,为本申请实施例中电子表格行列精简的方法的一个实施例示意图,该方法实施例可以应用于服务器,可以包括:
301、读取第一电子表格的行列描述信息。
1)电子表格数据结构定义
对于电子表格的主要数据结构定义如下表1所示,该数据结构将作为模板定义及表格编制的基础数据结构:
表1变量及字典构造遵循如下表2所示的数据结构定义:
表2
数据示例如下:
变量及字典定义如下:
服务端(即服务器)返回的数据结构示例如下:
2)表格解析生成行列描述
通过如上的数据定义及描述,可以了解电子表格的格式主要由行列及单元格的数据定义来表示,而其余数据信息、参数字典引用、样式等则基于行列信息来表示,在精简过程中做相关转换处理即可。
冗余行列的定义:当去除某行或某列时,不影响该表格的结构定义及布局,则此行或列为冗余行列。
在实际执行中,将根据所有行列的定义来生成不重复的行列描述,行列描述数据结构定义如下表3所示:
表3
以列描述示例如下:
[[0,0],[0,2],[1,2],[1,4],[3,4],[5,5]]
该结构表示经过解析后,存在如上情况的列定义,起始与结束数字相同的表示该列存在单独的单元格定义,起始与结束不同的表示存在跨列的合并单元格。
为直观理解,给出表格如下表4所示,其列描述信息为如上给出的示例:
表4
本发明执行的结果,即去除冗余的行列,仍用上表4示例,观察可得1、2列因冗余可以合并,3、4列因冗余可以合并,合并后依据原有的列信息,对宽度、编号等进行相应调整,即得到精简后的表格如下表5所示:
表5
下表5的布局形式相比上表4,但列已经达到最精简形式,对行的处理方式相同。
可选的,所述读取第一电子表格的行列描述信息,可以包括:获取第一电子表格的最大行列数;在所述最大行列数超过预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,所述方法还可以包括:
在所述最大行列数未超过所述预设阈值的情况下,读取当前单元格信息;在所述当前单元格信息指示为合并单元格的情况下,生成[x,y]的行列描述信息;在所述当前单元格信息指示不为合并单元格的情况下,生成[x,x]的行列描述信息;将所述[x,y]的行列描述信息或所述[x,x]的行列描述信息加入目标集合中自动去重,得到去重后的目标集合;若所述目标集合中的行列数超过所述预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,所述行列描述信息中的起始位置按照升序排序,结束位置按照升序排序。
可选的,所述行列描述信息包括起始位置和结束位置存在交集的行列描述信息。可以理解的是,将起始位置和结束位置存在交集的部分也可以加入集合中,例如:[3,5]同[4,6]的交集[4,5],该情况将覆盖未单独描述的合并单元格。
可选的,所述行列描述信息中的行列数按规则递增。
示例性的,如图4所示,为本申请实施例中获取行列描述信息的一个示意图。可以理解的是,得到行列描述信息是本发明的数据准备,在图4所示中,描述了跨行列合并情况下的交集处理,只有将交集部分也加入行列描述,才能得到最简结果,但是在实际应用中应考虑到计算代价、处理的复杂度等因素,可保留一定的冗余行列而简化处理过程,此处不做具体限定。
302、根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息。
可选的,所述根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息,可以包括:根据所述行列描述信息,查找最大的不相交行列排列,以结束位置和起始位置分别与其他行列位置进行比较,去除有交叉的结果,得到冗余行列描述信息。
可以理解的是,行列精简算法处理旨在找出可合并的冗余行列,输入上述步骤中得到的行列描述信息,输出可合并的行列描述信息。
精简算法主要为判断行列描述信息中的跨行列情况是否存在交叉,如存在交叉的则不能视为冗余,如[[1,2],[2,3]]交叉于[2,2]则无法视为可合并的冗余行列,而[[1,3],[2,3]]中[2,3]为冗余行列。
示例性的,如图5所示,为本申请实施例中精简算法的一个流程示意图。
精简算法的核心思想是找到最大的不相交行列排列,再以结束位置和起始位置分别与所有行列位置进行比较,去除有交叉的结果,即得到最终的可合并冗余行列。
需要说明的是,在本申请实施例中,对行列的处理是分开进行的,但是行的处理与列的处理方式相同,在实际应用中,需要处理行的情况较少,且行的冗余通常对表格的影响较小,因此可根据需要重点处理列有关的冗余。另外,对于其中的各类比较方法,可根据需要调整,该流程仅为一个示意,对于使用具体算法不做限定(如排序算法、查找算法等)。
303、根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格。
可选的,所述根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格,可以包括:根据所述冗余行列描述信息由后向前合并,生成第二电子表格。
可以理解的是,根据精简算法结果生成表格。按如上示例表格数据得到列描述信息[[0,0],[0,2],[1,2],[1,4],[3,4],[5,5]],经精简处理其结果为[[0,0],[1,2],[3,4],[5,5]],表示可合并的列元组。其中数字相同的表示单列,因此不做处理,而数字不同的,表示可将这些列合并为一列,合并时应从后向前合并,以减少行列变更的影响,同时合并时应保持总的行高列宽及单元格样式等相关信息不受改变。
示例性的,如图6所示,为本申请实施例中生成第二电子表格的一个示意图。在图6所示中,获得冗余行列由后往前遍历,判断起始结束位置是否相同,若不相同,可以继续遍历;若相同,可以合并多行/列为一行/列,计算合并后行高/列宽,遍历影响单元格,正确设置单元格相关宽高及样式等信息。
可以理解的是,关于本申请实施例所提供的方法,可封装为SDK(一般指软件开发工具包)或以独立形式提供服务,使用者可将各类电子表格经过转换以满足本发明方法的输入要求(或其他可以应用该方法的数据输入形式)从而得到冗余行列的信息,进而进行精简操作。
可选的,数据结构定义上可以做相应变形,数据格式上可以用其他协议格式描述(如使用XML(可扩展标记语言)),或在局部算法上微调等。
在本发明实施例中,读取第一电子表格的行列描述信息;根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格。可以将已有电子表格中冗余的行列去除而不影响整体表格的布局,释放部分存储空间。达到以较少的行列来表述电子表格结构。
如图7所示,为本发明实施例中服务器的一个实施例示意图,可以包括:
处理模块701,用于读取第一电子表格的行列描述信息;根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格。
可选的,处理模块701,具体用于获取第一电子表格的最大行列数;在所述最大行列数超过预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,处理模块701,具体用于在所述最大行列数未超过所述预设阈值的情况下,读取当前单元格信息;在所述当前单元格信息指示为合并单元格的情况下,生成[x,y]的行列描述信息;在所述当前单元格信息指示不为合并单元格的情况下,生成[x,x]的行列描述信息;将所述[x,y]的行列描述信息或所述[x,x]的行列描述信息加入目标集合中自动去重,得到去重后的目标集合;若所述目标集合中的行列数超过所述预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,处理模块701,具体用于根据所述行列描述信息,查找最大的不相交行列排列,以结束位置和起始位置分别与其他行列位置进行比较,去除有交叉的结果,得到冗余行列描述信息。
可选的,所述行列描述信息中的起始位置按照升序排序,结束位置按照升序排序。
可选的,处理模块701,具体用于根据所述冗余行列描述信息由后向前合并,生成第二电子表格。
可选的,所述行列描述信息包括起始位置和结束位置存在交集的行列描述信息。
如图8所示,为本申请实施例中服务器的另一个实施例示意图,可以包括:
存储有可执行程序代码的存储器801;
与存储器801耦合的处理器802;
处理器802,用于读取第一电子表格的行列描述信息;根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格。
可选的,处理器802,具体用于获取第一电子表格的最大行列数;在所述最大行列数超过预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,处理器802,具体用于在所述最大行列数未超过所述预设阈值的情况下,读取当前单元格信息;在所述当前单元格信息指示为合并单元格的情况下,生成[x,y]的行列描述信息;在所述当前单元格信息指示不为合并单元格的情况下,生成[x,x]的行列描述信息;将所述[x,y]的行列描述信息或所述[x,x]的行列描述信息加入目标集合中自动去重,得到去重后的目标集合;若所述目标集合中的行列数超过所述预设阈值的情况下,输出所述第一电子表格的行列描述信息。
可选的,处理器802,具体用于根据所述行列描述信息,查找最大的不相交行列排列,以结束位置和起始位置分别与其他行列位置进行比较,去除有交叉的结果,得到冗余行列描述信息。
可选的,所述行列描述信息中的起始位置按照升序排序,结束位置按照升序排序。
可选的,处理器802,具体用于根据所述冗余行列描述信息由后向前合并,生成第二电子表格。
可选的,所述行列描述信息包括起始位置和结束位置存在交集的行列描述信息。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(Solid State Disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (6)

1.一种电子表格行列精简的方法,其特征在于,包括:
读取第一电子表格的行列描述信息;
根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;
根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格;
其中,所述读取第一电子表格的行列描述信息,包括:
获取第一电子表格的最大行列数;
在所述最大行列数超过预设阈值的情况下,输出所述第一电子表格的行列描述信息;
其中,所述根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息,包括:
根据所述行列描述信息,查找最大的不相交行列排列,以结束位置和起始位置分别与其他行列位置进行比较,去除有交叉的结果,得到冗余行列描述信息;
其中,所述方法还包括:
在所述最大行列数未超过所述预设阈值的情况下,读取当前单元格信息;
在所述当前单元格信息指示为合并单元格的情况下,生成[x,y]的行列描述信息;
在所述当前单元格信息指示不为合并单元格的情况下,生成[x,x]的行列描述信息;
将所述[x,y]的行列描述信息或所述[x,x]的行列描述信息加入目标集合中自动去重,得到去重后的目标集合;
若所述目标集合中的行列数超过所述预设阈值的情况下,输出所述第一电子表格的行列描述信息;
其中,所述行列描述信息包括起始位置和结束位置存在交集的行列描述信息。
2.根据权利要求1中任一项所述的方法,其特征在于,所述行列描述信息中的起始位置按照升序排序,结束位置按照升序排序。
3.根据权利要求1中任一项所述的方法,其特征在于,所述根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格,包括:
根据所述冗余行列描述信息由后向前合并,生成第二电子表格。
4.一种服务器,其特征在于,包括:
处理模块,用于读取第一电子表格的行列描述信息;根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息;根据所述冗余行列描述信息,去除所述第一电子表格中的冗余行列,生成第二电子表格;
其中,所述读取第一电子表格的行列描述信息,包括:
获取第一电子表格的最大行列数;
在所述最大行列数超过预设阈值的情况下,输出所述第一电子表格的行列描述信息;
其中,所述根据所述行列描述信息,通过行列精简算法,生成冗余行列描述信息,包括:
根据所述行列描述信息,查找最大的不相交行列排列,以结束位置和起始位置分别与其他行列位置进行比较,去除有交叉的结果,得到冗余行列描述信息;
其中,还包括:
在所述最大行列数未超过所述预设阈值的情况下,读取当前单元格信息;
在所述当前单元格信息指示为合并单元格的情况下,生成[x,y]的行列描述信息;
在所述当前单元格信息指示不为合并单元格的情况下,生成[x,x]的行列描述信息;
将所述[x,y]的行列描述信息或所述[x,x]的行列描述信息加入目标集合中自动去重,得到去重后的目标集合;
若所述目标集合中的行列数超过所述预设阈值的情况下,输出所述第一电子表格的行列描述信息;
其中,所述行列描述信息包括起始位置和结束位置存在交集的行列描述信息。
5.一种服务器,其特征在于,包括:
存储有可执行程序代码的存储器;
以及所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行如权利要求1至3中任一项所述的方法。
6.一种计算机可读存储介质,包括指令,当其在处理器上运行时,使得处理器执行如权利要求1-3中任一项所述的方法。
CN202110949656.8A 2021-08-18 2021-08-18 一种电子表格行列精简的方法、服务器及存储介质 Active CN113705175B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110949656.8A CN113705175B (zh) 2021-08-18 2021-08-18 一种电子表格行列精简的方法、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110949656.8A CN113705175B (zh) 2021-08-18 2021-08-18 一种电子表格行列精简的方法、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN113705175A CN113705175A (zh) 2021-11-26
CN113705175B true CN113705175B (zh) 2024-02-23

Family

ID=78653335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110949656.8A Active CN113705175B (zh) 2021-08-18 2021-08-18 一种电子表格行列精简的方法、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113705175B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050103803A (ko) * 2004-04-27 2005-11-01 안재우 일본어 문자 입력 방법 및 그 장치
JPWO2004062110A1 (ja) * 2002-12-26 2006-05-18 富士通株式会社 データ圧縮方法、プログラム及び装置
JP2007109172A (ja) * 2005-10-17 2007-04-26 Dainippon Printing Co Ltd ファイル生成装置、プログラム及び電子フォームファイル
EP2354964A2 (en) * 2010-02-09 2011-08-10 Konica Minolta Laboratory U.S.A., Inc. Processing styles for spreadsheets
CN103257959A (zh) * 2012-02-15 2013-08-21 深圳市金蝶友商电子商务服务有限公司 生成电子表格报表的方法和装置
CN107656914A (zh) * 2017-10-16 2018-02-02 厦门海迈科技股份有限公司 可配置化的表格生成方法、装置、终端设备及存储介质
CN109189383A (zh) * 2018-08-28 2019-01-11 厦门海迈科技股份有限公司 代码文件的生成方法、装置、计算设备和存储介质
CN109447134A (zh) * 2018-10-11 2019-03-08 平安科技(深圳)有限公司 数据合并方法、装置、计算机设备及存储介质
CN111062259A (zh) * 2019-11-25 2020-04-24 泰康保险集团股份有限公司 表格识别方法和装置
CN111259854A (zh) * 2020-02-04 2020-06-09 北京爱医生智慧医疗科技有限公司 一种文本图像中表格的结构化信息的识别方法及装置
CN111695329A (zh) * 2020-06-12 2020-09-22 深圳前海微众银行股份有限公司 一种通用报表生成方法及装置
CN112183511A (zh) * 2020-12-01 2021-01-05 江西博微新技术有限公司 一种图像导出表格的方法、系统、存储介质及设备
CN112241411A (zh) * 2020-10-23 2021-01-19 湖南省交通规划勘察设计院有限公司 基于cad基础元素的电子表格结构化识别与提取方法
CN112712415A (zh) * 2021-01-19 2021-04-27 青岛檬豆网络科技有限公司 一种基于电子元器件采购bom核价的表格预处理方法
CN113221523A (zh) * 2021-05-14 2021-08-06 北京贝瑞和康生物技术有限公司 处理表格的方法、计算设备和计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4508522B2 (ja) * 2002-07-31 2010-07-21 キヤノン株式会社 投写型表示装置
CN108446264B (zh) * 2018-03-26 2022-02-15 阿博茨德(北京)科技有限公司 Pdf文档中的表格矢量解析方法及装置
CN108470021B (zh) * 2018-03-26 2022-06-03 阿博茨德(北京)科技有限公司 Pdf文档中表格的定位方法及装置
US10691936B2 (en) * 2018-06-29 2020-06-23 Konica Minolta Laboratory U.S.A., Inc. Column inferencer based on generated border pieces and column borders

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2004062110A1 (ja) * 2002-12-26 2006-05-18 富士通株式会社 データ圧縮方法、プログラム及び装置
KR20050103803A (ko) * 2004-04-27 2005-11-01 안재우 일본어 문자 입력 방법 및 그 장치
JP2007109172A (ja) * 2005-10-17 2007-04-26 Dainippon Printing Co Ltd ファイル生成装置、プログラム及び電子フォームファイル
EP2354964A2 (en) * 2010-02-09 2011-08-10 Konica Minolta Laboratory U.S.A., Inc. Processing styles for spreadsheets
CN103257959A (zh) * 2012-02-15 2013-08-21 深圳市金蝶友商电子商务服务有限公司 生成电子表格报表的方法和装置
CN107656914A (zh) * 2017-10-16 2018-02-02 厦门海迈科技股份有限公司 可配置化的表格生成方法、装置、终端设备及存储介质
CN109189383A (zh) * 2018-08-28 2019-01-11 厦门海迈科技股份有限公司 代码文件的生成方法、装置、计算设备和存储介质
CN109447134A (zh) * 2018-10-11 2019-03-08 平安科技(深圳)有限公司 数据合并方法、装置、计算机设备及存储介质
CN111062259A (zh) * 2019-11-25 2020-04-24 泰康保险集团股份有限公司 表格识别方法和装置
CN111259854A (zh) * 2020-02-04 2020-06-09 北京爱医生智慧医疗科技有限公司 一种文本图像中表格的结构化信息的识别方法及装置
CN111695329A (zh) * 2020-06-12 2020-09-22 深圳前海微众银行股份有限公司 一种通用报表生成方法及装置
CN112241411A (zh) * 2020-10-23 2021-01-19 湖南省交通规划勘察设计院有限公司 基于cad基础元素的电子表格结构化识别与提取方法
CN112183511A (zh) * 2020-12-01 2021-01-05 江西博微新技术有限公司 一种图像导出表格的方法、系统、存储介质及设备
CN112712415A (zh) * 2021-01-19 2021-04-27 青岛檬豆网络科技有限公司 一种基于电子元器件采购bom核价的表格预处理方法
CN113221523A (zh) * 2021-05-14 2021-08-06 北京贝瑞和康生物技术有限公司 处理表格的方法、计算设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN113705175A (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
KR101498331B1 (ko) 텍스트 세그먼트를 가진 문서로부터 용어를 추출하기 위한 시스템
US9965460B1 (en) Keyword extraction for relationship maps
CN111026470A (zh) 用于输入数据的验证和转换的系统和方法
CN103221947A (zh) 文本含意辨认装置、文本含意辨认方法和计算机可读记录介质
US20170075863A1 (en) Copying text format pattern
CN111400338A (zh) Sql优化方法、装置、存储介质及计算机设备
US20230401121A1 (en) Fault log classification method and system, and device and medium
US8335757B2 (en) Extracting patterns from sequential data
CN103038762B (zh) 自然语言处理装置、方法
JP4493397B2 (ja) テキスト圧縮装置
CN115130038A (zh) 网页分类方法及装置
CN113705175B (zh) 一种电子表格行列精简的方法、服务器及存储介质
Petukhova et al. TextCL: A Python package for NLP preprocessing tasks
EP3186707B1 (en) Method of and system for processing a user-generated input command
KR20060043583A (ko) 언어 데이터의 로그의 압축 방법 및 시스템
US20100191693A1 (en) Segmenting Sequential Data with a Finite State Machine
US20140075416A1 (en) Graphical conversion between test program languages
JP5010958B2 (ja) データ管理方法、プログラム及び装置
CN112699642B (zh) 复杂医疗文书的索引提取方法及装置、介质及电子设备
CN114201961A (zh) 一种注释预测方法、装置、设备及可读存储介质
KR102215263B1 (ko) Sql 쿼리의 유형을 분류하는 방법, 이상 상황 발생 여부 결정 방법 및 컴퓨팅 디바이스
CN111475403A (zh) 测试脚本的动态生成方法及相关装置
KR102394483B1 (ko) 전자 문서에 오류가 있는지 여부를 판단하는 오류 판단 서비스를 제공하기 위한 서비스 제공 서버 및 그 동작 방법
KR20140147438A (ko) 마크업 파싱 장치, 방법 및 기록 매체
CN115906802B (zh) 一种条件逻辑数据的解析方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant