CN116562247A - 电子表格内容生成方法、装置和计算机设备 - Google Patents
电子表格内容生成方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN116562247A CN116562247A CN202310537249.5A CN202310537249A CN116562247A CN 116562247 A CN116562247 A CN 116562247A CN 202310537249 A CN202310537249 A CN 202310537249A CN 116562247 A CN116562247 A CN 116562247A
- Authority
- CN
- China
- Prior art keywords
- text
- initial
- type
- determining
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012545 processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 abstract description 9
- 238000004519 manufacturing process Methods 0.000 description 38
- 239000003814 drug Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000009776 industrial production Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
Abstract
本申请提供一种电子表格内容生成方法、装置和计算机设备,属于计算机技术领域。所述方法包括:获取包含待处理表格的图像,并从图像中识别出待处理表格中多个初始文本的属性信息;根据各初始文本的位置信息,确定待处理表格中各初始文本所在的各初始单元格的行列位置;根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,并根据各初始文本的类型确定各初始单元格的类型;根据各初始文本的类型确定至少一个待导入文本,并根据各初始单元格的行列位置、各初始单元格的类型和各待导入文本,生成目标电子表格。本申请可以达到准确生成电子表格中的内容、提高录入产品信息的效率的效果。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种电子表格内容生成方法、装置和计算机设备。
背景技术
随着计算机技术的发展,越来越多的制造行业开始引进了自动化设备,以通过自动化设备实现快速高效的生产。
相关技术中,例如,在生产药品时,需要都需要通过纸质表格或Excel表格来记录药品的基础信息、工艺生产路线、工序记录等信息,而工序记录中记录了生产时的详细信息,比如指令号、批次号、生产日期、开始时间、结束时间、相关设备物料信息、审批人,处理人等信息,这样才能准确地追溯药品的有效期和生产流程。在生产过程中需要通过相应的应用程序获取产品生产时的实际生产情况将药品的生产信息填入表格,比如需要将实际生产药品的日期填入表格进行记录。
然而,相关技术的方案需要相关技术人员将这些纸质文档或者Excel表格全部录入到相应的应用程序中才能使得应用程序将数据填入到表格中,因此,这种方案存在录入产品信息的效率较低的问题。
发明内容
本申请的目的在于提供一种电子表格内容生成方法、装置和计算机设备,可以达到准确生成电子表格中的内容、提高录入产品信息的效率的效果。
本申请的实施例是这样实现的:
本申请实施例的第一方面,提供一种电子表格内容生成方法,包括:
获取包含待处理表格的图像,并从所述图像中识别出所述待处理表格中多个初始文本的属性信息,所述属性信息包括各所述初始文本的文本内容和位置信息;
根据各所述初始文本的位置信息,确定所述待处理表格中各所述初始文本所在的各初始单元格的行列位置;
根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型,并根据各所述初始文本的类型确定各所述初始单元格的类型,所述初始文本的类型包括固定文本类型和可编辑文本类型,所述初始单元格的类型包括固定单元格类型和待输入单元格类型;
根据各所述初始文本的类型确定至少一个待导入文本,并根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格。
可选地,所述根据各所述初始文本的位置信息,确定所述待处理表格中与各所述初始文本对应的各所述初始单元格的行列位置,包括:
获取所述待处理表格中包括的行数和列数;
解析各所述初始文本的位置信息,确定各所述初始文本所在的各初始单元格在所述待处理表格中的行列位置。
可选地,所述根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型,包括:
通过语义识别算法分别确定各所述初始文本的文本内容表征的含义以及所述预设的参考文本的文本内容表征的含义;
确定各所述初始文本的文本内容表征的含义与所述预设的参考文本的文本内容表征的含义之间的第一差异信息;
分别确定各所述初始文本的文本内容的格式以及所述预设的参考文本的文本内容的格式;
确定各所述初始文本的文本内容的格式与所述预设的参考文本的文本内容的格式之间的第二差异信息;
根据所述第一差异信息以及所述第二差异信息,确定各所述初始文本的类型。
可选地,所述根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格,包括:
按照各所述初始单元格的行列位置和各所述初始单元格的类型生成初始电子表格,所述初始电子表格中包括多个目标固定单元格和目标待输入单元格,所述目标待输入单元格用于输入目标应用程序生成的产品信息;
将各所述待导入文本分别输入到与各所述待导入文本对应的各所述目标固定单元格中,将输入各所述待导入文本之后的初始电子表格作为所述目标电子表格。
可选地,所述属性信息还包括各所述文本的精度信息;
所述根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型,包括:
在各所述初始文本的精度信息符合预设条件的情况下,根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型;
在各所述初始文本的精度信息不符合预设条件的情况下,则确定各所述初始文本的类型为可编辑文本类型,并确定各所述初始文本所在的所述初始单元格的类型为待输入单元格类型。
可选地,在根据各所述初始文本的类型确定至少一个待导入文本,并根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格之后,所述方法还包括:
由目标应用程序获取至少一个待处理文本,并确定与各所述待处理文本对应的所述目标电子表格中的各目标待编辑单元格;
分别将各所述待处理文本导入各所述目标待编辑单元格。
本申请实施例的第二方面,提供了一种电子表格内容生成装置,所述电子表格内容生成装置包括:
获取识别模块,用于获取包含待处理表格的图像,并从所述图像中识别出所述待处理表格中多个初始文本的属性信息,所述属性信息包括各所述初始文本的文本内容和位置信息;
第一确定模块,用于根据各所述初始文本的位置信息,确定所述待处理表格中各所述初始文本所在的各初始单元格的行列位置;
第二确定模块,用于根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型,并根据各所述初始文本的类型确定各所述初始单元格的类型,所述初始文本的类型包括固定文本类型和可编辑文本类型,所述初始单元格的类型包括固定单元格类型和待输入单元格类型;
生成模块,用于根据各所述初始文本的类型确定至少一个待导入文本,并根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格。
本申请实施例的第三方面,提供了一种计算机设备,所述计算机设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述第一方面所述的电子表格内容生成方法。
本申请实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的电子表格内容生成方法。
本申请实施例的有益效果包括:
本申请实施例提供的一种电子表格内容生成方法,获取包含待处理表格的图像,并从该图像中识别出该待处理表格中多个初始文本的属性信息,该属性信息包括各初始文本的文本内容和位置信息,这样,就可以识别、提取出该待处理表格中各初始文本的文本内容和位置信息,便于执行后续操作。
根据各初始文本的位置信息,确定该待处理表格中各初始文本所在的各初始单元格的行列位置,由于各初始文本是位于各初始单元格之内的,那么各初始文本在该待处理表格中的位置就可以表征各初始单元格在该待处理表格中的位置,各初始单元格的行列位置还可以指示各初始单元格的大小。另外,在确定各初始单元格的行列位置的情况下就可以确定出各初始单元格在该待处理表格中的布局方式。
根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,并根据各初始文本的类型确定各初始单元格的类型。这样,就可以确定出该待处理表格中各初始单元格的类型和各初始文本的类型,以准确地识别出该待处理表格中哪些初始文本是需要根据实际情况进行修改或填入的,哪些初始文本在表格中是不需要进行修改的,以及哪些初始单元格是用于填入固定单元格类型的文本的,哪些初始单元格是用于填入可编辑文本类型的文本的。
根据各初始文本的类型确定至少一个待导入文本,并根据各初始单元格的行列位置、各初始单元格的类型和各待导入文本,生成目标电子表格。由于各待导入文本包括类型为固定文本类型的所有初始文本,而各初始单元格的行列位置准确地指示了各初始单元格在该待处理表格中的位置,各初始单元格的行列位置还可以指示各初始单元格的尺寸,而各初始单元格的类型可以指示各初始单元格为固定单元格类型或待输入单元格类型,这样就可以确保生成的该目标电子表格中各目标单元格的类型与该待处理表格中各初始单元格的类型相同,各目标单元格的位置与该待处理表格中各初始单元格的位置匹配,并且可以确保将各待导入文本输入到对应的目标单元格中。如此,就可以达到准确生成电子表格中的内容的效果。
另外,在实际的工业生产过程中,通过这样的方式可以将记录的产品的相关信息的纸质表格或Excel表格中的各个单元格和固定文本类型的文本生成在目标电子表格中。那么,在生产过程中需要通过相应的应用程序将产品的实际生产信息填入目标电子表格的情况下,就可以根据该目标电子表格中各待导入文本的文本内容、各目标单元格的类型和位置准确地将产品的实际生产信息填入目标电子表格中对应的目标单元格中,如此,还可以提高录入产品信息的效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的第一种电子表格内容生成方法的流程图;
图2为本申请实施例提供的第二种电子表格内容生成方法的流程图;
图3为本申请实施例提供的第三种电子表格内容生成方法的流程图;
图4为本申请实施例提供的第四种电子表格内容生成方法的流程图;
图5为本申请实施例提供的第五种电子表格内容生成方法的流程图;
图6为本申请实施例提供的一种待处理表格的示意图;
图7为本申请实施例提供的一种目标电子表格的示意图;
图8为本申请实施例提供的一种电子表格内容生成装置的结构示意图;
图9为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在相关技术中,例如,在生产药品时,需要都需要通过纸质表格或Excel表格来记录药品的基础信息、工艺生产路线、工序记录等信息,而工序记录中记录了生产时的详细信息,比如指令号、批次号、生产日期、开始时间、结束时间、相关设备物料信息、审批人,处理人等信息,这样才能准确地追溯药品的有效期和生产流程。在生产过程中需要通过相应的应用程序获取产品生产时的实际生产情况将药品的生产信息填入表格,比如需要将实际生产药品的日期填入表格进行记录。然而,相关技术的方案需要相关技术人员将这些纸质文档或者Excel表格全部录入到相应的应用程序中才能使得应用程序将数据填入到表格中,因此,这种方案存在录入产品信息的效率较低的问题。
为此,本申请实施例提供了电子表格内容生成方法,通过获取包含待处理表格的图像,并从该图像中识别出该待处理表格中多个初始文本的属性信息,根据各初始文本的位置信息,确定该待处理表格中各初始文本所在的各初始单元格的行列位置,根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,并根据各初始文本的类型确定各初始单元格的类型,根据各初始文本的类型确定至少一个待导入文本,并根据各初始单元格的行列位置、各初始单元格的类型和各待导入文本,生成目标电子表格,可以达到准确生成电子表格中的内容、提高录入产品信息的效率的效果。
本申请实施例以应用在计算机设备中的电子表格内容生成方法为例进行说明。但不表明本申请实施例仅能应用于计算机设备生成电子表格内容。
下面对本申请实施例提供的电子表格内容生成方法进行详细地解释说明。
图1为本申请提供的一种电子表格内容生成方法的流程图,该方法可以应用于计算机设备,该计算机设备可以是任意具有处理功能的电子设备。参见图1,本申请实施例提供一种电子表格内容生成方法,包括:
步骤1001:获取包含待处理表格的图像,并从该图像中识别出该待处理表格中多个初始文本的属性信息。
可选地,该待处理表格可以是指任一需要转换为电子表格的表格。该待处理表格可以是纸质表格,也可以是Excel表格。
该图像可以是通过对纸质表格或Excel表格拍照得到的,也可以是通过对Excel表格截图得到的。
该图像可以是红绿蓝(Red-Green-Blue,简称RGB)图像,也可以是二值化图像,还可以是其他任意形式的图像,本申请实施例对此不做限定。
可选地,该属性信息包括各初始文本的文本内容和位置信息。
各初始文本的文本内容可以包括各初始文本中包含的所有字符。
各初始文本的位置信息可以包括各初始文本在该待处理表格中的位置,也可以包括各初始文本中的各个字符在该待处理表格中的位置。
另外,该属性信息还可以包括各初始文本的精度信息,该精度信息用于指示该图像中各初始文本的清晰程度。
值得注意的是,可以通过相关的图像文字识别算法来识别出该图像中的该待处理表格,进而识别出该待处理表格中各初始文本的属性信息,本申请实施例对此不做限定。这样,就可以识别、提取出该待处理表格中各初始文本的文本内容、位置信息以及精度信息,便于执行后续操作。
步骤1002:根据各初始文本的位置信息,确定该待处理表格中各初始文本所在的各初始单元格的行列位置。
可选地,各初始单元格为该待处理文本中用于填写或输入文本的单元格。也即,各初始单元格是表格中行与列的交叉部分。各初始文本的输入和修改都是在单元格中进行的。
各初始单元格的大小、形状可以是相同的,也可以是不同的,本申请实施例对此不做限定。
另外,各初始单元格内可以包含初始文本,也可以不包含初始文本,本申请实施例对此不做限定。根据各初始文本的位置信息还可以确定出该待处理表格中不包含初始文本的初始单元格的行列位置。
另外,各初始单元格的行列位置还可以用于指示各初始单元格在该待处理表格中占据的最小单元格的数量。该最小单元格可以是指该待处理表格中最小尺寸的一个单元格。这样,就还可以通过各初始单元格的行列位置来表征各初始单元格的尺寸,便于执行后续操作。
值得说明的是,由于各初始文本是位于各初始单元格之内的,那么各初始文本在该待处理表格中的位置就可以表征各初始单元格在该待处理表格中的位置。另外,在确定各初始单元格的行列位置的情况下就可以确定出各初始单元格在该待处理表格中的布局方式。
步骤1003:根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,并根据各初始文本的类型确定各初始单元格的类型。
可选地,可以通过比较各初始文本的文本内容和该预设的参考文本的文本内容来确定各初始文本的类型,也可以通过比较各初始文本的文本内容的格式和该预设的参考文本的文本内容的格式来确定各初始文本的类型,本申请实施例对此不做限定。
该预设的参考文本可以是由相关技术人员提前设置的。具体地,可以根据实际的生产行业、生产流程和产品类型设置不同的参考文本,也可以根据该待处理表格中记录的各文本设置不同的参考文本,本申请实施例对此不做限定。
该预设的参考文本的类型可以包括固定文本类型和可编辑文本类型,该预设的参考文本的类型还可以用于指示各初始文本的类型。
可选地,该初始文本的类型也可以包括固定文本类型和可编辑文本类型。
该固定文本类型可以是指在表格中固定的、不需要进行修改或填入的文本类型。
该可编辑文本类型可以是指在表格中需要根据实际的生产流程或产品进行修改或填入内容的文本类型。
该初始单元格的类型包括固定单元格类型和待输入单元格类型。
该固定单元格类型的单元格可以是指在表格中用于填入该固定文本类型的文本的单元格。
该待输入单元格类型的单元格可以是指在表格中用于填入该可编辑文本类型的文本的单元格,也可以是指在表格中需要由相关技术人员进行输入、调整或补充的单元格,本申请实施例对此不做限定。
这样,就可以确定出该待处理表格中各初始单元格的类型和各初始文本的类型,以准确地识别出该待处理表格中哪些初始文本是需要根据实际情况进行修改或填入的,哪些初始文本在表格中是不需要进行修改的,以及哪些初始单元格是用于填入固定单元格类型的文本的,哪些初始单元格是用于填入可编辑文本类型的文本的。如此,可以便于进行后续操作。
步骤1004:根据各初始文本的类型确定至少一个待导入文本,并根据各初始单元格的行列位置、各初始单元格的类型和各待导入文本,生成目标电子表格。
可选地,各待导入文本可以包括类型为固定文本类型的所有初始文本。
该目标电子表格可以是应用程序中生成的一个电子表格,也可以是任一个可以用于输入文本的电子表格,本申请实施例对此不做限定。
可选地,该目标电子表格中包括多个目标单元格和各待导入文本。
值得说明的是,由于各待导入文本包括类型为固定文本类型的所有初始文本,而各初始单元格的行列位置准确地指示了各初始单元格在该待处理表格中的位置,各初始单元格的行列位置还可以指示各初始单元格的尺寸,而各初始单元格的类型可以指示各初始单元格为固定单元格类型或待输入单元格类型,这样就可以确保生成的该目标电子表格中各目标单元格的类型与该待处理表格中各初始单元格的类型相同,各目标单元格的位置与该待处理表格中各初始单元格的位置匹配,并且可以确保将各待导入文本输入到对应的目标单元格中。如此,就可以达到准确生成电子表格中的内容的效果。
在本申请实施例中,通过获取包含待处理表格的图像,并从该图像中识别出该待处理表格中多个初始文本的属性信息,根据各初始文本的位置信息,确定该待处理表格中各初始文本所在的各初始单元格的行列位置,根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,并根据各初始文本的类型确定各初始单元格的类型根据各初始文本的类型确定至少一个待导入文本,并根据各初始单元格的行列位置、各初始单元格的类型和各待导入文本,生成目标电子表格。
其中,获取包含待处理表格的图像,并从该图像中识别出该待处理表格中多个初始文本的属性信息,该属性信息包括各初始文本的文本内容和位置信息,这样,就可以识别、提取出该待处理表格中各初始文本的文本内容和位置信息,便于执行后续操作。
根据各初始文本的位置信息,确定该待处理表格中各初始文本所在的各初始单元格的行列位置,由于各初始文本是位于各初始单元格之内的,那么各初始文本在该待处理表格中的位置就可以表征各初始单元格在该待处理表格中的位置,各初始单元格的行列位置还可以指示各初始单元格的大小。另外,在确定各初始单元格的行列位置的情况下就可以确定出各初始单元格在该待处理表格中的布局方式。
根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,并根据各初始文本的类型确定各初始单元格的类型。这样,就可以确定出该待处理表格中各初始单元格的类型和各初始文本的类型,以准确地识别出该待处理表格中哪些初始文本是需要根据实际情况进行修改或填入的,哪些初始文本在表格中是不需要进行修改的,以及哪些初始单元格是用于填入固定单元格类型的文本的,哪些初始单元格是用于填入可编辑文本类型的文本的。
根据各初始文本的类型确定至少一个待导入文本,并根据各初始单元格的行列位置、各初始单元格的类型和各待导入文本,生成目标电子表格。由于各待导入文本包括类型为固定文本类型的所有初始文本,而各初始单元格的行列位置准确地指示了各初始单元格在该待处理表格中的位置,各初始单元格的行列位置还可以指示各初始单元格的尺寸,而各初始单元格的类型可以指示各初始单元格为固定单元格类型或待输入单元格类型,这样就可以确保生成的该目标电子表格中各目标单元格的类型与该待处理表格中各初始单元格的类型相同,各目标单元格的位置与该待处理表格中各初始单元格的位置匹配,并且可以确保将各待导入文本输入到对应的目标单元格中。如此,就可以达到准确生成电子表格中的内容的效果。
另外,在实际的工业生产过程中,通过这样的方式可以将记录的产品的相关信息的纸质表格或Excel表格中的各个单元格和固定文本类型的文本生成在目标电子表格中。那么,在生产过程中需要通过相应的应用程序将产品的实际生产信息填入目标电子表格的情况下,就可以根据该目标电子表格中各待导入文本的文本内容、各目标单元格的类型和位置准确地将产品的实际生产信息填入目标电子表格中对应的目标单元格中,如此,还可以提高录入产品信息的效率。
一种可能的实现方式中,参见图2,根据各初始文本的位置信息,确定该待处理表格中与各初始文本对应的各初始单元格的行列位置,包括:
步骤1005:获取该待处理表格中包括的行数和列数。
可选地,该待处理表格中包括的行数和列数可以是指该待处理表格中包含的所有单元格的行数和列数。
另外,可以通过相应的表格识别算法来获取该待处理表格中包括的行数和列数。例如,可以通过opencv图像识别检测算法、T-recs算法、语义分割算法等方式来获取该待处理表格中包括的行数和列数,本申请实施例对此不做限定。
步骤1006:解析各初始文本的位置信息,确定各初始文本所在的各初始单元格在该待处理表格中的行列位置。
值得注意的是,由于各初始单元格可能包括一个最小单元格,也可能包括多个最小单元格,因此,各初始单元格在该待处理表格中的行列位置可以只包括一个最小单元格的行列位置,也可以包括多个最小单元格的行列位置,本申请实施例对此不做限定。
这样,就可以准确地确定出各初始单元格在该待处理表格中占据的行数和列数。
一种可能的实现方式中,参见图3,根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,包括:
步骤1007:通过语义识别算法分别确定各初始文本的文本内容表征的含义以及该预设的参考文本的文本内容表征的含义。
可选地,文本内容表征的含义可以是指文本内容的所包含的意义。
该预设的参考文本可以包括各种各样的参考文本,各种预设的参考文本的文本内容可以互不相同。
步骤1008:确定各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义之间的第一差异信息。
该第一差异信息可以是指各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义之间的相似程度或近似程度。
示例性地,该第一差异信息可以是通过计算各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义之间的相似程度或近似程度得到的第一差异值。一般地,该第一差异值越小则可以表征各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义越相似,该第一差异值越大则可以表征各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义越不相似,若该第一差异值为0则可以表征各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义相同。本申请实施例对此不做限定。
步骤1009:分别确定各初始文本的文本内容的格式以及该预设的参考文本的文本内容的格式。
可选地,文本内容的格式可以是指各文本的文本格式。各种类型的文本可以对应不同的文本格式。
示例性地,若一个初始文本为用于记录时间的文本,且该初始文本的文本内容为“2020年01月01日”,那么,就可以确定这个初始文本的文本内容的格式为“xxxx年xx月xx日”,而对应选择的该预设的参考文本也可以为用于记录时间的文本,该预设的参考文本的文本内容的格式可以为“xxxx年xx月xx日”、“xxxx/xx/xx”、“xx/xx/xxxx”等,本申请实施例对此不做限定。
步骤1010:确定各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式之间的第二差异信息。
该第二差异信息可以是指各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式之间的相似程度或近似程度。
示例性地,该第二差异信息可以是通过计算各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式之间的相似程度或近似程度得到的第二差异值。一般地,该第二差异值越小则可以表征各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式表征的含义越相似,该第二差异值越大则可以表征各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式越不相似,若该第二差异值为0则可以表征各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式相同。本申请实施例对此不做限定。
又例如,若各初始文本的文本内容的格式为“xxxx年xx月xx日”,而该预设的参考文本的文本内容的格式为“xxxx年xx月xx日”、“xxxx/xx/xx”或“xx/xx/xxxx”中任意一种,都可以确定该第二差异值为0,也可以确定该第二差异值较小,本申请实施例对此不做限定。
步骤1011:根据该第一差异信息以及该第二差异信息,确定各初始文本的类型。
可选地,可以将该第一差异信息和该第二差异信息进行求和得到差异结果,并且,将各预设的参考文本中与该初始文本的差异结果最小的一个预设的参考文本的类型作为该输入文本匹配的标准文本初始文本的类型,本申请实施例对此不做限定。
值得说明的是,由于该第一差异值越小则可以表征各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义越相似,那么就可以根据该第一差异值确保各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义的相似程度或近似程度较高,而该第二差异值越小则可以表征各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式表征的含义越相似,那么就可以根据该第二差异值各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式的相似程度或近似程度较高。这样,就可以准确地根据预设的参考文本来确定出各初始文本的类型,进而便于后续根据各初始文本的类型确定各初始单元格的类型。
一种可能的实现方式中,参见图4,根据各初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格,包括:
步骤1012:按照各初始单元格的行列位置和各初始单元格的类型生成初始电子表格。
可选地,该初始电子表格中包括多个目标固定单元格和目标待输入单元格。
各目标固定单元格用于输入上述的待导入文本,各目标待输入单元格用于由相关技术人员输入或相应的程序导入实际需要输入的文本。本申请实施例对此不做限定。
具体地,该目标待输入单元格用于输入该目标应用程序生成的产品信息。
也就是说,在该初始电子表格中,仅仅是按照各初始单元格的行列位置生成多个目标单元格,并且按照各初始单元格的类型分别确定出各目标单元格为目标固定单元格或目标待输入单元格。然而,在该初始电子表格的各目标单元格中均是不存在任何文本的。
值得说明的是,按照各初始单元格的行列位置和各初始单元格的类型生成初始电子表格,这样,就可以确保该初始电子表格中的各目标单元格的位置均是与上述待处理表格中初始单元格的位置是对应的,并且准确地指示出各目标单元格为目标固定单元格或目标待输入单元格。
步骤1013:将各待导入文本分别输入到与各待导入文本对应的各目标固定单元格中,将输入各待导入文本之后的初始电子表格作为该目标电子表格。
值得注意的是,在将各待导入文本分别输入到与各待导入文本对应的各目标固定单元格的情况下,也就是将上述的类型为固定文本类型的所有初始文本添加到该初始电子表格中,这样,该初始电子表格中就包括了该待处理表格中所有固定文本类型的初始文本。
这样,可以准确地各初始单元格的类型可以指示各初始单元格为固定单元格类型或待输入单元格类型,这样就可以确保生成的该目标电子表格中各目标单元格的类型与该待处理表格中各初始单元格的类型相同,各目标单元格的位置与该待处理表格中各初始单元格的位置匹配。另外,将各待导入文本分别输入到与各待导入文本对应的各目标固定单元格中,可以确保将各待导入文本输入到对应的目标固定单元格中,这样就可以确保该目标电子表格与该待处理表格的布局相同,且固定文本类型的文本准确地位于相应的目标固定单元格中。如此,就可以达到准确生成电子表格中的内容的效果。
一种可能的实现方式中,属性信息还包括各文本的精度信息。参见图5,根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,包括:
步骤1014:在各初始文本的精度信息符合预设条件的情况下,根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型。
可选地,该精度信息具体可以包括精度值,该精度值还可以用于指示获取的该图像中待处理表格的各初始文本与真实表格中的各文本的接近程度。
该预设条件可以是指各初始文本的精度信息达到预设的精度阈值。该精度阈值可以由相关技术人员根据实际情况进行调整的,本申请实施例对此不做限定。
值得注意的是,若各初始文本的精度信息符合预设条件,则可以表征该图像中待处理表格的各初始文本比较清晰可以供计算机设备进行识别处理,也可以表征该图像中待处理表格的各初始文本与真实表格中的各文本的接近程度较高。
另外,在这种情况下,可以参考上述其他实施例的具体方式来根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,在此不做赘述。
步骤1015:在各初始文本的精度信息不符合预设条件的情况下,则确定各初始文本的类型为可编辑文本类型,并确定各初始文本所在的该初始单元格的类型为待输入单元格类型。
值得注意的是,若各初始文本的精度信息不符合该预设条件,则可以表征该图像中待处理表格的各初始文本不够清晰,无法供计算机设备进行识别处理,也可以表征该图像中待处理表格的各初始文本与真实表格中的各文本的接近程度较低。在这种情况下,就需要相关技术人员进行确认或者通过其他的方式进行重新确认,因此,在生成上述目标电子表格时,不需要将这些精度信息较低的初始文本填入该目标电子表格中的单元格中。这样,可以避免出现错误地确定各初始文本的类型、各初始单元格的类型的情况,进而可以确保生成的该目标电子表格的准确性和可靠性。
一种可能的实现方式中,在根据各所述初始文本的类型确定至少一个待导入文本,并根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格之后,该方法还包括:
由目标应用程序获取至少一个待处理文本,并确定与各待处理文本对应的该目标电子表格中的各目标待编辑单元格。
可选地,该目标应用程序可以是指用于监测、管理、控制、记录产品生产过程的各种信息的应用程序,该应用程序可以在终端设备上运行,也可以在服务器上运行,本申请实施例对此不作限定。
各待处理文本可以是指在实际的生产流程中,需要填入该目标电子表格的文本。
示例性地,若该目标应用程序是一个监测、管理、控制、记录药品生产过程的应用程序,而该目标应用程序可以获取的各待处理文本就可以包括:在药品生产过程中记录药品的指令号、批次号、生产日期、开始生产时间、结束生产时间、相关设备物料信息、审批人、处理人等信息。
一种可能的方式中,确定与各待处理文本对应的该目标电子表格中的各目标待编辑单元格的具体方式可以是通过语义识别算法确定各待处理文本的含义与上述的各待导入文本的含义是否对应,若对应,则确定各待处理文本与各待导入文本对应的目标待编辑单元格对应。
示例性地,若一个待处理文本的文本内容为“2020年01月01日”,而各待导入文本中存在文本内容为“生产日期”的一个文本,那么,就可以确定这个待处理文本与文本内容为“生产日期”的这个待导入文本对应,进而可以确定这个待处理文本与这个待导入文本对应的目标待编辑单元格对应。
分别将各待处理文本导入各目标待编辑单元格。
这样,就可以实现在实际的工业生产过程中,根据该目标电子表格中各待导入文本的文本内容、各目标单元格的类型和位置准确地将产品的实际生产信息填入目标电子表格中对应的目标单元格中,如此,还可以提高录入产品信息的效率和准确性。
一种可能的实现方式中,根据各初始文本的类型确定各初始单元格的类型,包括:
若各初始文本的类型为固定文本类型,则将与各初始文本对应的各初始单元格作为固定单元格。
若各初始文本的类型为可编辑文本类型,则将与各初始文本对应的各初始单元格作为待输入单元格。
也就是说,在上述待处理表格中,若各初始单元格中的初始文本为固定文本类型,那么各初始单元格就是固定单元格。若各初始单元格中的初始文本为可编辑文本类型,那么各初始单元格就是待输入单元格。
一种可能的实现方式中,根据各初始文本的类型确定至少一个待导入文本,包括:
若各初始文本的类型为固定文本类型,则将各初始文本作为该待导入文本。
若各初始文本的类型为可编辑文本类型,则确定各初始文本不为该待导入文本。
也就是说,在生成上述目标电子表格时,只需要将上述待处理表格中固定文本类型的文本作为待导入文本导入目标电子表格中,而可编辑文本类型的文本不需要导入目标电子表格。这样,就可以确保该目标电子表格中需要填入待处理文本的目标待编辑单元格中不存在文本,便于后续由该目标应用程序导入各待处理文本。
为了清楚、直观地对上述各个实施例进行解释说明,本申请实施例还提供了如下图6和图7的示意图。
图6是本申请实施例提供的一种待处理表格的示意图。参见图6,图6示出了一个待处理表格,在这个待处理表格中有多个初始文本W1、多个初始文本W2、多个初始单元格G1以及多个初始单元格G2。
经执行上述的多个实施例中示出的方法可以确定出各文本初始W1的类型为固定文本类型,各初始文本W2的类型为可编辑文本类型,各初始单元格G1的类型为固定单元格类型,各初始单元格G2的类型为待输入单元格类型。
并且,可以确定出在这个待处理表格中有两列、九行单元格,进而可以分别确定出各初始文本W1、各初始文本W2、各初始单元格G1、各初始单元格G2的位置信息或行列位置。
那么,在需要根据各初始文本的类型确定至少一个待导入文本,并根据各初始单元格的行列位置、各初始单元格的类型和各待导入文本,生成目标电子表格的情况下,就可以确定各初始文本W1为需要导入该目标电子表格的待导入文本,而各初始单元格G1为该目标电子表格中的目标固定单元格,而各初始单元格G2为该目标电子表格中的待输入单元格。
因此,可以得到如图7所示的目标电子表格,参见图7,图7中示出了一个目标电子表格,这个目标电子表格是根据图6中示出的待处理表格生成的。在这个待处理表格中有多个待导入文本W3、多个目标固定单元格G3以及多个目标待输入单元格G4。
通过图6和图7可见,在生成的目标电子表格中,各目标固定单元格G3和各目标待输入单元格G4的行列位置与各初始单元格G1和各初始单元格G2的行列位置相同,也就是说,图7中的这个目标电子表格与图6中的待处理表格的布局方式相同。另外,在图7的目标电子表格中,仅仅是将图6的待处理表格中类型为固定文本类型的各文本初始W1作为待导入文本导入了这个目标电子表格中,而类型为可编辑文本类型的各文本初始W2并未导入这个目标电子表格。
另外,图7的目标电子表格中的各目标待输入单元格G4均未输入任何文本,这样,就可以确保该目标电子表格中需要填入待处理文本的目标待编辑单元格中不存在文本,便于后续由该目标应用程序导入各待处理文本。
下述对用以执行的本申请所提供电子表格内容生成方法的装置、设备及计算机可读存储介质等进行说明,其具体的实现过程以及技术效果参见上述,下述不再赘述。
图8是本申请实施例提供的一种电子表格内容生成装置的结构示意图,参见图8,该装置包括:
获取识别模块201,用于获取包含待处理表格的图像,并从该图像中识别出该待处理表格中多个初始文本的属性信息。
可选地,该属性信息包括各初始文本的文本内容和位置信息。
第一确定模块202,用于根据各初始文本的位置信息,确定该待处理表格中各初始文本所在的各初始单元格的行列位置。
第二确定模块203,用于根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型,并根据各初始文本的类型确定各初始单元格的类型。
可选地,该初始文本的类型包括固定文本类型和可编辑文本类型。
该初始单元格的类型包括固定单元格类型和待输入单元格类型。
生成模块204,用于根据各初始文本的类型确定至少一个待导入文本,并根据各初始单元格的行列位置、各初始单元格的类型和各待导入文本,生成目标电子表格。
可选地,第二确定模块203还用于通过语义识别算法分别确定各初始文本的文本内容表征的含义以及该预设的参考文本的文本内容表征的含义。确定各初始文本的文本内容表征的含义与该预设的参考文本的文本内容表征的含义之间的第一差异信息。分别确定各初始文本的文本内容的格式以及该预设的参考文本的文本内容的格式。确定各初始文本的文本内容的格式与该预设的参考文本的文本内容的格式之间的第二差异信息。根据该第一差异信息以及该第二差异信息,确定各初始文本的类型。
第一确定模块202还用于获取该待处理表格中包括的行数和列数。解析各初始文本的位置信息,确定各初始文本所在的各初始单元格在该待处理表格中的行列位置。
生成模块204还用于按照各初始单元格的行列位置和各初始单元格的类型生成初始电子表格。将各待导入文本分别输入到与各待导入文本对应的各目标固定单元格中,将输入各待导入文本之后的初始电子表格作为该目标电子表格。
第二确定模块203还用于在各初始文本的精度信息符合预设条件的情况下,根据各初始文本的文本内容和预设的参考文本,确定各初始文本的类型。在各初始文本的精度信息不符合预设条件的情况下,则确定各初始文本的类型为可编辑文本类型,并确定各初始文本所在的该初始单元格的类型为待输入单元格类型。
另外,生成模块204还可以用于由目标应用程序获取至少一个待处理文本,并确定与各待处理文本对应的该目标电子表格中的各目标待编辑单元格。分别将各待处理文本导入各目标待编辑单元格。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器,或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图9是本申请实施例提供的一种计算机设备的结构示意图。参见图9,计算机设备包括:存储器301、处理器302,存储器301中存储有可在处理器302上运行的计算机程序,处理器302执行计算机程序时,实现上述任意各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
可选地,本申请还提供一种程序产品,例如计算机可读存储介质,包括程序,该程序在被处理器执行时用于执行上述任一电子表格内容生成方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种电子表格内容生成方法,其特征在于,所述方法包括:
获取包含待处理表格的图像,并从所述图像中识别出所述待处理表格中多个初始文本的属性信息,所述属性信息包括各所述初始文本的文本内容和位置信息;
根据各所述初始文本的位置信息,确定所述待处理表格中各所述初始文本所在的各初始单元格的行列位置;
根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型,并根据各所述初始文本的类型确定各所述初始单元格的类型,所述初始文本的类型包括固定文本类型和可编辑文本类型,所述初始单元格的类型包括固定单元格类型和待输入单元格类型;
根据各所述初始文本的类型确定至少一个待导入文本,并根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格。
2.如权利要求1所述的电子表格内容生成方法,其特征在于,所述根据各所述初始文本的位置信息,确定所述待处理表格中与各所述初始文本对应的各所述初始单元格的行列位置,包括:
获取所述待处理表格中包括的行数和列数;
解析各所述初始文本的位置信息,确定各所述初始文本所在的各初始单元格在所述待处理表格中的行列位置。
3.如权利要求1所述的电子表格内容生成方法,其特征在于,所述根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型,包括:
通过语义识别算法分别确定各所述初始文本的文本内容表征的含义以及所述预设的参考文本的文本内容表征的含义;
确定各所述初始文本的文本内容表征的含义与所述预设的参考文本的文本内容表征的含义之间的第一差异信息;
分别确定各所述初始文本的文本内容的格式以及所述预设的参考文本的文本内容的格式;
确定各所述初始文本的文本内容的格式与所述预设的参考文本的文本内容的格式之间的第二差异信息;
根据所述第一差异信息以及所述第二差异信息,确定各所述初始文本的类型。
4.如权利要求1所述的电子表格内容生成方法,其特征在于,所述根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格,包括:
按照各所述初始单元格的行列位置和各所述初始单元格的类型生成初始电子表格,所述初始电子表格中包括多个目标固定单元格和目标待输入单元格,所述目标待输入单元格用于输入目标应用程序生成的产品信息;
将各所述待导入文本分别输入到与各所述待导入文本对应的各所述目标固定单元格中,将输入各所述待导入文本之后的初始电子表格作为所述目标电子表格。
5.如权利要求1-4任一项所述的电子表格内容生成方法,其特征在于,所述属性信息还包括各所述文本的精度信息;
所述根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型,包括:
在各所述初始文本的精度信息符合预设条件的情况下,根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型;
在各所述初始文本的精度信息不符合预设条件的情况下,则确定各所述初始文本的类型为可编辑文本类型,并确定各所述初始文本所在的所述初始单元格的类型为待输入单元格类型。
6.如权利要求1-4任一项所述的电子表格内容生成方法,其特征在于,在根据各所述初始文本的类型确定至少一个待导入文本,并根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格之后,所述方法还包括:
由目标应用程序获取至少一个待处理文本,并确定与各所述待处理文本对应的所述目标电子表格中的各目标待编辑单元格;
分别将各所述待处理文本导入各所述目标待编辑单元格。
7.一种电子表格内容生成装置,其特征在于,所述装置包括:
获取识别模块,用于获取包含待处理表格的图像,并从所述图像中识别出所述待处理表格中多个初始文本的属性信息,所述属性信息包括各所述初始文本的文本内容和位置信息;
第一确定模块,用于根据各所述初始文本的位置信息,确定所述待处理表格中各所述初始文本所在的各初始单元格的行列位置;
第二确定模块,用于根据各所述初始文本的文本内容和预设的参考文本,确定各所述初始文本的类型,并根据各所述初始文本的类型确定各所述初始单元格的类型,所述初始文本的类型包括固定文本类型和可编辑文本类型,所述初始单元格的类型包括固定单元格类型和待输入单元格类型;
生成模块,用于根据各所述初始文本的类型确定至少一个待导入文本,并根据各所述初始单元格的行列位置、各所述初始单元格的类型和各所述待导入文本,生成目标电子表格。
8.如权利要求7所述的电子表格内容生成装置,其特征在于,所述第二确定模块还用于通过语义识别算法分别确定各所述初始文本的文本内容表征的含义以及所述预设的参考文本的文本内容表征的含义;确定各所述初始文本的文本内容表征的含义与所述预设的参考文本的文本内容表征的含义之间的第一差异信息;分别确定各所述初始文本的文本内容的格式以及所述预设的参考文本的文本内容的格式;确定各所述初始文本的文本内容的格式与所述预设的参考文本的文本内容的格式之间的第二差异信息;根据所述第一差异信息以及所述第二差异信息,确定各所述初始文本的类型。
9.一种计算机设备,其特征在于,包括:存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述权利要求1至6任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,实现权利要求1至6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310537249.5A CN116562247A (zh) | 2023-05-11 | 2023-05-11 | 电子表格内容生成方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310537249.5A CN116562247A (zh) | 2023-05-11 | 2023-05-11 | 电子表格内容生成方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116562247A true CN116562247A (zh) | 2023-08-08 |
Family
ID=87489409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310537249.5A Pending CN116562247A (zh) | 2023-05-11 | 2023-05-11 | 电子表格内容生成方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116562247A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116757170A (zh) * | 2023-08-21 | 2023-09-15 | 成都数联云算科技有限公司 | 一种基于JAVA语言的Excel表格导入方法和系统 |
-
2023
- 2023-05-11 CN CN202310537249.5A patent/CN116562247A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116757170A (zh) * | 2023-08-21 | 2023-09-15 | 成都数联云算科技有限公司 | 一种基于JAVA语言的Excel表格导入方法和系统 |
CN116757170B (zh) * | 2023-08-21 | 2023-10-20 | 成都数联云算科技有限公司 | 一种基于JAVA语言的Excel表格导入方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210081601A1 (en) | Cross-Document Intelligent Authoring and Processing, Including Format for Semantically-Annotated Documents | |
CN112016273A (zh) | 文档目录生成方法、装置、电子设备及可读存储介质 | |
CN110210470A (zh) | 商品信息图像识别系统 | |
US11934774B2 (en) | Systems and methods for generating social assets from electronic publications | |
CN116562247A (zh) | 电子表格内容生成方法、装置和计算机设备 | |
CN115391439B (zh) | 文档数据导出方法、装置、电子设备和存储介质 | |
CN112860905A (zh) | 文本信息抽取方法、装置、设备及可读存储介质 | |
CN115018588A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN113190680A (zh) | 一种非结构化数据标记方法、装置、设备及存储介质 | |
CN111444368B (zh) | 构建用户画像的方法、装置、计算机设备及存储介质 | |
CN110704635B (zh) | 一种知识图谱中三元组数据的转换方法及装置 | |
CN111581937A (zh) | 文档生成方法、装置、计算机可读介质及电子设备 | |
US20200327320A1 (en) | System and Method for Processing and Identifying Content in Form Documents | |
CN116127087A (zh) | 一种知识图谱构建方法、装置、电子设备及存储介质 | |
CN113282837B (zh) | 事件分析方法、装置、计算机设备及存储介质 | |
CN112241445B (zh) | 一种标注方法及装置、电子设备、存储介质 | |
CN115130437A (zh) | 一种文档智能填写方法、装置及存储介质 | |
CN115203364A (zh) | 软件故障反馈处理方法、装置、设备及可读存储介质 | |
CN114169306A (zh) | 一种生成电子回执单的方法、装置、设备及可读存储介质 | |
CN113343663A (zh) | 一种票据结构化方法及装置 | |
CN115579096A (zh) | 一种针对药物警戒e2b r3标准报告的自动生成与解析验证方法、系统及存储介质 | |
TWM607472U (zh) | 文字區段標籤系統 | |
CN117933209A (zh) | 信息处理方法、装置、电子设备和可读介质 | |
CN110457659B (zh) | 条款文档生成方法及终端设备 | |
US20230053464A1 (en) | Systems, Methods, and Devices for Automatically Converting Explanation of Benefits (EOB) Printable Documents into Electronic Format using Artificial Intelligence Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |