CN115544995A - 一种表格信息处理方法、装置、电子设备及存储介质 - Google Patents
一种表格信息处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115544995A CN115544995A CN202211226818.6A CN202211226818A CN115544995A CN 115544995 A CN115544995 A CN 115544995A CN 202211226818 A CN202211226818 A CN 202211226818A CN 115544995 A CN115544995 A CN 115544995A
- Authority
- CN
- China
- Prior art keywords
- information
- matching
- row
- processed
- matching result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 32
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000006870 function Effects 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 abstract description 24
- 238000012937 correction Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/183—Tabulation, i.e. one-dimensional positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种表格信息处理方法、装置、电子设备及存储介质。该方法包括;响应于检测到的表格信息比对指令,获取表格信息比对指令对应的第一待处理表格和第二待处理表格,将第一待处理表格中的多个第一行信息分别和第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果,根据目标行匹配结果生成匹配结果表格进行展示。通过自动化处理表格的方法,解决了处理大量数据文本速度慢的难题,提高了处理表格信息的快速性和准确性,帮助设计师更快速、更直观地对数据进行观察和研究。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种表格信息处理方法、装置、电子设备及存储介质。
背景技术
在信息技术自动化处理时代,对于数据处理量的要求越来高。目前,各个领域对于信息处理都需要完全自动化处理,提高对数据处理的高效性。
在处理数据信息中,大量的汽车数据文本需要进行处理,无论是本地数据还是在数据源中获取到有待分析的功能信息。在数量级上都是以万为单位进行数据统计的。在机器学习模型的建立中,不得不借助于Excel强大的统计分析能力,处理大量的数据信息。
在分析大量数据的时候,还是需要人工参与其中,耗费了大量的人力物力,处理数据速度慢。使用Python操作Excel文件后,可以运用到机器学习之中,也可以让平常生活中繁琐的工作自动化处理。能够快速帮助设计师处理数据信息,避免了手动的去分析这些数据。
在实现本发明的过程中,发现现有技术中至少存在以下技术问题:如果数据量非常大,启用顺序写入模式,得到一行数据就立刻写入一行,但不会把所有的数据都保持在内存中。而且在处理时也需要对汽车信息的内容做一些适当的修正,匹配,排序等操作,但上述操作无法自动化实现,导致信息处理效率低。
发明内容
本发明提供了一种表格信息处理方法、装置、电子设备及存储介质,以解决对于大数据量的表格信息处理速度慢和处理准确性低的问题,提高了用户处理大量表格文件的快速性和准确性。
根据本发明的一方面,提供了一种表格信息处理方法,包括:
响应于检测到的表格信息比对指令,获取表格信息比对指令对应的第一待处理表格和第二待处理表格;
将第一待处理表格中的多个第一行信息分别和第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;
根据目标行匹配结果生成匹配结果表格进行展示。
根据本发明的另一方面,提供了一种表格信息处理装置,该装置包括:
处理表格确定模块,用于响应于检测到的表格信息比对指令,获取表格信息比对指令对应的第一待处理表格和第二待处理表格;
行信息匹配模块,用于将第一待处理表格中的多个第一行信息分别和第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;
匹配结果展示模块,用于根据目标行匹配结果生成匹配结果表格进行展示。
根据本发明的另一方面,提供了一种电子设备,电子设备包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被所述至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的表格信息处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的表格信息处理方法。
本发明实施例的技术方案,通过响应于检测到的表格信息比对指令,获取所述表格信息比对指令对应的第一待处理表格和第二待处理表格;将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;根据所述目标行匹配结果生成匹配结果表格进行展示,实现了表格信息的自动化匹配以及结果生成,解决了现有技术中无法自动化执行的技术问题,提高了表格信息处理效率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种表格信息处理方法的流程图;
图2是本发明实施例二提供的一种表格信息处理方法的流程图;
图3是本发明实施例三提供的一种表格信息处理装置的结构示意图;
图4是本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是本发明实施例一提供的一种表格信息处理方法的流程图,本实施例可适用于处理表格文件的情况,尤其适用于对汽车数据文本表格信息进行处理的情形,该方法可以由表格信息处理装置来执行,该表格信息处理装置可以采用硬件和/或软件的形式实现,如该表格信息处理装置可配置于计算机系统中。如图1所示,该方法包括:
S110、响应于检测到的表格信息比对指令,获取表格信息比对指令对应的第一待处理表格和第二待处理表格。
其中,表格信息比对指令可以理解为对两个或多个表格进行信息比对的指令。
可选的,用户可以通过点击表格信息比对控件触发表格信息比对指令。一个实现方式中,用户可以选取用于比对的表格文件后,触发表格信息比对指令,则可以直接根据表格信息比对指令获取第一待处理表格和第二待处理表格;另一个实现方式中,可以预先设置用于比对的表格文件,当检测到表格信息比对指令时,获取预先设置的表格文件确定第一待处理表格和第二待处理表格。需要说明的是,用于比对的表格文件可以为两个或多个,当用于比对的表格文件为两个时,可以直接将用于比对的表格文件分别作为第一待处理表格和第二待处理表格;当用于比对的表格文件为多个时,可以任意获取两个表格文件作为第一待处理表格和第二待处理表格,或基于表格文件获取多组待处理表格并行处理,在此不做限定。
S120、将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果。
在表格文件中,第一列为功能标识,每个功能标识对应的行中的信息为该功能对应的信息,如车型,测试内容等。当需要判断相同功能的异同时,需要获取相同功能对应的行信息进行匹配。基于此,当需要判断第一待处理表格中的功能和第二待处理表格中对应功能的异同时,需要将第一待处理表格中的行信息和第二待处理表格中的行信息进行匹配,根据匹配结果确定对应功能的异同。
表1是一种待处理表格的表格结构示意图。如表1所示,表1中第一列内容为功能信息,每一列对应的行信息为功能对应的信息内容。
表1
特征 | 车型 | 测试 | 控制 |
蓝牙 | _ | _ | _ |
天窗 | _ | _ | _ |
显示 | _ | _ | _ |
可选的,可以获取第一待处理表格中的所有行信息作为对应的多个第一行信息,获取第二待处理表格中的所有行信息作为对应的多个第二行信息,将多个第一行信息和多个第二行信息分别进行匹配,得到每个第一行信息和第二行信息的匹配结果作为单次匹配结果,直到匹配完所有第一行信息和第二行信息后,将所有单次匹配结果作为目标匹配结果。
可选的,所述将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果,包括:
确定所述第一待处理表格中的第一行数量,以及所述第二待处理表格中的第二行数量;
基于所述第一行数量遍历获取各所述第一行信息,基于所述第二行数量遍历获取各所述第二行信息;
将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果;
直到遍历完成,根据各所述行单次匹配结果确定所述目标行匹配结果。
一个实现方式中,可以基于第一待处理表格中的所有行数量作为第一行数量,和第二待处理表格中的所有行数量作为第二行数量配置遍历匹配函数,基于第一行数量和第二行数量构建遍历匹配编码,使得所有第一行信息和所有第二行信息均进行两两匹配。
示例性的,假设多个第一行信息为m1、m2、m3,多个第二行信息为n1、n2、n3,则可以从m1开始,将m1逐次与n1、n2、n3进行匹配,然后将m2逐次与n1、n2、n3进行匹配,最后将m3逐次与n1、n2、n3进行匹配,完成所有第一行信息和所有第二行信息的两两匹配。
可选的,所述确定所述第一待处理表格中的第一行数量,以及所述第二待处理表格中的第二行数量,包括:
将所述第一待处理表格中的功能列项信息转换为第一数字信息,基于所述第一数字信息确定所述第一行数量;
将所述第二待处理表格中的功能列项信息转换为第二数字信息,基于所述第二数字信息确定所述第二行数量。
可以理解的是,表格文件中每个行都有对应的序列,但功能列项信息对应的都是功能描述信息(参照表1中的“蓝牙”、“天窗”、“显示”),具体信息形式为文字或字母。为确定行数量,需要对列项做一次数据转换,将文字或字母形式的功能列项信息换成数字。
示例性的,可以通过如下编码将功能列项信息转换为数字信息:
import openpyxl
from openpyxl.utils import column_index_from_string#将列数字母换成数字
将第一待处理表格中的功能列项信息转换为第一数字信息后,将最大的第一数字信息作为第一行数量,同样,将第二待处理表格中的功能列项信息转换为第二数字信息后,将最大的第二数字信息作为第二行数量。
在一些可选示例中,所述将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果,包括:
通过关键词匹配、同义性匹配和相似性匹配中的至少一种匹配方式将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果。
考虑到行信息的信息内容可能存在不同的匹配方式,基于此,可以通过一种或多种匹配方式对第一行信息和第二行信息进行匹配。如通过关键词匹配、同义性匹配和相似性匹配中的至少一种匹配方式将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果。关键词匹配方式用于对第一行信息和第二行信息的进行关键词匹配,同义性匹配方式用于对第一行信息和第二行信息的进行同义性匹配,相似性匹配方式用于对第一行信息和第二行信息的进行相似性匹配。
可以基于第一待处理表格和第二待处理表格的待匹配功能选取上述一种或多种匹配方式进行匹配。匹配方式越少,匹配处理速度越快。匹配方式越多,匹配结果越准确。
可选的,所述通过关键词匹配、同义性匹配和相似性匹配中的至少一种匹配方式将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果,包括:
通过关键词匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到关键词匹配结果,当所述关键词匹配结果为匹配时,将所述关键词匹配结果作为所述行单次结果;
当所述关键词匹配结果为不匹配时,通过同义性匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到同义性匹配结果,当所述同义性匹配结果为匹配时,将所述同义性匹配结果作为所述行单次结果;
当所述关键词匹配结果为不匹配时,通过相似性匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到相似性匹配结果,并将所述相似性匹配结果作为所述行单次结果。
为了使得匹配结果更加准确,可以结合上述三种方式对第一行信息和第二行信息进行匹配,以关键词,同义性和相似性三个维度来判断,每一个维度都代表一种特征匹配,都有不同的算法,最后所包含的特征也最全面。
可选的,首先通过关键词匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到关键词匹配结果,当所述关键词匹配结果为匹配时,表示第一行信息和第二行信息匹配成功,无需执行后续匹配操作,将所述关键词匹配结果作为所述行单次结果;当所述关键词匹配结果为不匹配时,通过同义性匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到同义性匹配结果,当所述同义性匹配结果为匹配时,表示第一行信息和第二行信息匹配成功,无需执行后续匹配操作,将所述同义性匹配结果作为所述行单次结果;当所述关键词匹配结果为不匹配时,通过相似性匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到相似性匹配结果,直接将所述相似性匹配结果作为所述行单次结果。
其中,关键词匹配以单个词汇层面进行匹配。如果两个特征候选的每个单元都相等,那么它们就是匹配的。同义词匹配基于同义词集进行匹配,相似度匹配基于语义相似度进行匹配。
具体的,关键词匹配中如果两个特征候选的每个单元都相等,那么它们就是匹配的。同义词匹配使用从WordNet单词的同义词集来执行查找匹配特征。在这种方法中,如果两个应用程序特性的术语是同义词,则认为它们是匹配的。例如,“louver”和“skylight”表示匹配。但前两种匹配方式并不能完全保证能覆盖所有的特征匹配。相似度匹配可以通过Word2vec实现,Word2vec是一种通过词嵌入将文本向量化的方法,可以根据不同词向量的余弦距离来判断词之间的相似度程度。词向量之间的余弦值越大,则说明两个词的语义相似度越高;词向量之间的余弦值越小,则语义相似度越低,可以以相似性的数值进行排序呈现。
需要说明的是,上述匹配方式的执行顺序可以调整,如通过同义性匹配、关键词匹配、相似性匹配的顺序,或通过关键词匹配、相似性匹配、同义性匹配的顺序,或通过相似性匹配、关键词匹配、同义性匹配的顺序,或通过相似性匹配、同义性匹配、关键词匹配的顺序,在此不做限定。
S130、根据所述目标行匹配结果生成匹配结果表格进行展示。
在本实施例中,得到目标行匹配结果后,可以基于目标行匹配结果生成匹配结果表格进行展示。具体的生成方式可以为:在第一待处理表格中,对应功能列项信息后一列插入匹配结果列,将与对应的第一行信息进行匹配的匹配结果展示在匹配结果列中;或在第二待处理表格中,对应功能列项信息后一列插入匹配结果列,将与对应的第二行信息进行匹配的匹配结果展示在匹配结果列中;或生成新的表格,在新的表格的行中填充第一待处理表格和/或第二待处理表格对应的匹配结果。
可选的,根据目标行匹配结果生成匹配结果表格进行展示,包括:针对每个目标行匹配结果,根据目标匹配结果关联的行信息确定目标匹配结果对应的结果位置信息,将目标匹配结果添加至匹配结果表格中结果位置信息的关联位置得到匹配结果表格进行展示。
以目标行匹配结果中m1行的第一行信息和n1行的第一行信息的匹配结果为例,可以基于m1、n1确定结果位置信息,如(m1,n1)位置为结果位置信息,或(n1,m1)位置为结果位置信息,然后将m1行的第一行信息和n1行的第一行信息的匹配结果填充至结果位置信息对应的位置;直到所有第一行信息和第二行信息的匹配结果填充完毕,得到匹配结果表格进行展示。上述方法得到的匹配结果表格能够清楚展示第一待处理表格中不同行信息和第二待处理表格中不同行信息的匹配结果,使得目标匹配结果的展示更加清晰准确。
本实施例的技术方案,通过响应于检测到的表格信息比对指令,获取所述表格信息比对指令对应的第一待处理表格和第二待处理表格;将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;根据所述目标行匹配结果生成匹配结果表格进行展示,实现了表格信息的自动化匹配以及结果生成,解决了现有技术中无法自动化执行的技术问题,提高了表格信息处理效率。
实施例二
图2是本发明实施例二提供的一种表格信息处理方法的流程图,本实施例在上述实施例的基础上,增加了对信息进行纠错处理的操作。如图2所示,该方法包括一下具体步骤:
S210、响应于检测到的表格信息比对指令,获取所述表格信息比对指令对应的第一待处理表格和第二待处理表格。
S220、对所述第一待处理表格中的多个初始行信息进行纠错,得到多个所述第一行信息。
S230、对所述第二待处理表格中的多个初始行信息进行纠错,得到多个所述第二行信息。
考虑到表格中的信息也存在拼写错误的情况,导致信息匹配不准确,本实施例中在对行信息进行匹配之前,对行信息进行拼写纠错处理。
其中,对第一待处理表格中的初始行信息进行拼写纠错的方式和对第二待处理表格中的初始行信息进行拼写纠错的方式可以保存一致,使得纠错后的信息匹配更加准确。
可选的,可以基于编辑距离分别对第一待处理表格中的初始行信息进行纠错,得到第一行信息,以及对第二待处理表格中的初始行信息进行纠错,得到第二行信息。具体的纠错方式可以参考现有技术中基于编辑距离进行纠错的方式,在此不再赘述。
S240、将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果。
S250、根据所述目标行匹配结果生成匹配结果表格进行展示。……
本实施例的技术方案,通过在将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配之前,对所述第一待处理表格中的多个初始行信息进行纠错,得到多个所述第一行信息;对所述第二待处理表格中的多个初始行信息进行纠错,得到多个所述第二行信息,避免了拼写错误导致的信息匹配不准确,提高了信息匹配的准确度。
实施例三
图3是本发明实施例三提供的一种表格信息处理装置的结构示意图。如图3所示,该装置包括:待处理表格确定模块310、行信息匹配模块320和匹配结果展示模块330,其中:
待处理表格确定模块310,用于响应于检测到的表格信息比对指令,获取所述表格信息比对指令对应的第一待处理表格和第二待处理表格;
行信息匹配模块320,用于将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;
匹配结果展示模块330,用于根据所述目标行匹配结果生成匹配结果表格进行展示。
本实施例的技术方案,通过响应于检测到的表格信息比对指令,获取所述表格信息比对指令对应的第一待处理表格和第二待处理表格;将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;根据所述目标行匹配结果生成匹配结果表格进行展示,实现了表格信息的自动化匹配以及结果生成,解决了现有技术中无法自动化执行的技术问题,提高了表格信息处理效率。
在上述实施例的基础上,可选的,行信息匹配模块320具体用于:
确定所述第一待处理表格中的第一行数量,以及所述第二待处理表格中的第二行数量;
基于所述第一行数量遍历获取各所述第一行信息,基于所述第二行数量遍历获取各所述第二行信息;
将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果;
直到遍历完成,根据各所述行单次匹配结果确定所述目标行匹配结果。
在上述实施例的基础上,可选的,行信息匹配模块320具体用于:
将所述第一待处理表格中的功能列项信息转换为第一数字信息,基于所述第一数字信息确定所述第一行数量;
将所述第二待处理表格中的功能列项信息转换为第二数字信息,基于所述第二数字信息确定所述第二行数量。
在上述实施例的基础上,可选的,行信息匹配模块320具体用于:
通过关键词匹配、同义性匹配和相似性匹配中的至少一种匹配方式将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果。
在上述实施例的基础上,可选的,行信息匹配模块320具体用于:
通过关键词匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到关键词匹配结果,当所述关键词匹配结果为匹配时,将所述关键词匹配结果作为所述行单次结果;
当所述关键词匹配结果为不匹配时,通过同义性匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到同义性匹配结果,当所述同义性匹配结果为匹配时,将所述同义性匹配结果作为所述行单次结果;
当所述关键词匹配结果为不匹配时,通过相似性匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到相似性匹配结果,并将所述相似性匹配结果作为所述行单次结果。
在上述实施例的基础上,可选的,装置还包括拼写纠错模块,用于:
在将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配之前,对所述第一待处理表格中的多个初始行信息进行纠错,得到多个所述第一行信息;
对所述第二待处理表格中的多个初始行信息进行纠错,得到多个所述第二行信息。
在上述实施例的基础上,可选的,匹配结果展示模块330具体用于:
针对每个所述目标行匹配结果,根据所述目标匹配结果关联的行信息确定所述目标匹配结果对应的结果位置信息,将所述目标匹配结果添加至所述匹配结果表格中所述结果位置信息的关联位置得到所述匹配结果表格进行展示。
本发明实施例所提供的表格信息处理装置可执行本发明任意实施例所提供的表格信息处理方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4是本发明实施例四提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如表格信息处理方法。
在一些实施例中,表格信息处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的表格信息处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行表格信息处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的表格信息处理方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行一种表格信息处理方法,该方法包括:
响应于检测到的表格信息比对指令,获取所述表格信息比对指令对应的第一待处理表格和第二待处理表格;
将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;
根据所述目标行匹配结果生成匹配结果表格进行展示。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种表格信息处理方法,其特征在于,包括:
响应于检测到的表格信息比对指令,获取所述表格信息比对指令对应的第一待处理表格和第二待处理表格;
将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;
根据所述目标行匹配结果生成匹配结果表格进行展示。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果,包括:
确定所述第一待处理表格中的第一行数量,以及所述第二待处理表格中的第二行数量;
基于所述第一行数量遍历获取各所述第一行信息,基于所述第二行数量遍历获取各所述第二行信息;
将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果;
直到遍历完成,根据各所述行单次匹配结果确定所述目标行匹配结果。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第一待处理表格中的第一行数量,以及所述第二待处理表格中的第二行数量,包括:
将所述第一待处理表格中的功能列项信息转换为第一数字信息,基于所述第一数字信息确定所述第一行数量;
将所述第二待处理表格中的功能列项信息转换为第二数字信息,基于所述第二数字信息确定所述第二行数量。
4.根据权利要求2所述的方法,其特征在于,所述将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果,包括:
通过关键词匹配、同义性匹配和相似性匹配中的至少一种匹配方式将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果。
5.根据权利要求4所述的方法,其特征在于,所述通过关键词匹配、同义性匹配和相似性匹配中的至少一种匹配方式将遍历到的第一行信息和所述第二行信息进行匹配,得到行单次匹配结果,包括:
通过关键词匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到关键词匹配结果,当所述关键词匹配结果为匹配时,将所述关键词匹配结果作为所述行单次结果;
当所述关键词匹配结果为不匹配时,通过同义性匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到同义性匹配结果,当所述同义性匹配结果为匹配时,将所述同义性匹配结果作为所述行单次结果;
当所述关键词匹配结果为不匹配时,通过相似性匹配将遍历到的第一行信息和所述第二行信息进行匹配,得到相似性匹配结果,并将所述相似性匹配结果作为所述行单次结果。
6.根据权利要求1所述的方法,其特征在于,在将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配之前,还包括:
对所述第一待处理表格中的多个初始行信息进行纠错,得到多个所述第一行信息;
对所述第二待处理表格中的多个初始行信息进行纠错,得到多个所述第二行信息。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标行匹配结果生成匹配结果表格进行展示,包括:
针对每个所述目标行匹配结果,根据所述目标匹配结果关联的行信息确定所述目标匹配结果对应的结果位置信息,将所述目标匹配结果添加至所述匹配结果表格中所述结果位置信息的关联位置得到所述匹配结果表格进行展示。
8.一种表格信息处理装置,其特征在于,包括:
待处理表格确定模块,用于响应于检测到的表格信息比对指令,获取所述表格信息比对指令对应的第一待处理表格和第二待处理表格;
行信息匹配模块,用于将所述第一待处理表格中的多个第一行信息分别和所述第二待处理表格中的多个第二行信息进行匹配,得到目标行匹配结果;
匹配结果展示模块,用于根据所述目标行匹配结果生成匹配结果表格进行展示。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的表格信息处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的表格信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211226818.6A CN115544995A (zh) | 2022-10-09 | 2022-10-09 | 一种表格信息处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211226818.6A CN115544995A (zh) | 2022-10-09 | 2022-10-09 | 一种表格信息处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115544995A true CN115544995A (zh) | 2022-12-30 |
Family
ID=84731356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211226818.6A Pending CN115544995A (zh) | 2022-10-09 | 2022-10-09 | 一种表格信息处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115544995A (zh) |
-
2022
- 2022-10-09 CN CN202211226818.6A patent/CN115544995A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3575988A1 (en) | Method and device for retelling text, server, and storage medium | |
US20060248052A1 (en) | Data query verification | |
CN111435406A (zh) | 一种纠正数据库语句拼写错误的方法和装置 | |
EP3822818A1 (en) | Method, apparatus, device and storage medium for intelligent response | |
CN115455091A (zh) | 数据生成方法、装置、电子设备和存储介质 | |
CN114816578A (zh) | 基于配置表的程序配置文件生成方法、装置及设备 | |
CN113361240B (zh) | 用于生成目标文章的方法、装置、设备和可读存储介质 | |
CN117633194A (zh) | 大模型提示数据处理方法、装置、电子设备及存储介质 | |
CN113535916A (zh) | 一种基于表格的问答方法、装置及计算机设备 | |
CN111984545A (zh) | 检测单元测试稳定性的方法、装置、电子设备及存储介质 | |
CN115547508B (zh) | 数据校正方法、装置、电子设备及存储介质 | |
CN115525660A (zh) | 一种数据表的校验方法、装置、设备及介质 | |
CN116185389A (zh) | 一种代码生成方法、装置、电子设备及介质 | |
CN115809228A (zh) | 数据比对方法、装置、存储介质及电子设备 | |
CN115454971A (zh) | 数据迁移方法、装置、电子设备及存储介质 | |
CN113901094B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN115328898A (zh) | 一种数据处理方法、装置、电子设备及介质 | |
CN115544995A (zh) | 一种表格信息处理方法、装置、电子设备及存储介质 | |
CN114579580A (zh) | 存储数据的方法、查询数据的方法和装置 | |
CN113821533A (zh) | 数据查询的方法、装置、设备以及存储介质 | |
CN114116688A (zh) | 数据处理与数据质检方法、装置及可读存储介质 | |
CN112307050A (zh) | 一种重复关联计算的识别方法、装置及计算机系统 | |
CN117851575B (zh) | 一种大语言模型问答优化方法、装置、电子设备及存储介质 | |
CN118133794B (zh) | 一种表格配置方法、装置、设备及存储介质 | |
CN113900635B (zh) | 一种代码推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |