CN114861614A - 用于填充数据的方法及装置、电子设备、介质 - Google Patents
用于填充数据的方法及装置、电子设备、介质 Download PDFInfo
- Publication number
- CN114861614A CN114861614A CN202210195567.3A CN202210195567A CN114861614A CN 114861614 A CN114861614 A CN 114861614A CN 202210195567 A CN202210195567 A CN 202210195567A CN 114861614 A CN114861614 A CN 114861614A
- Authority
- CN
- China
- Prior art keywords
- data
- cell
- character
- cells
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 4
- 230000008719 thickening Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
- G06F16/287—Visualization; Browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及数据处理技术领域,公开一种用于填充数据的方法,包括:获取用户上传的表格,所述表格内包括若干单元格;获取各单元格内的数据的字符特征;根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;根据各单元格内的数据对应的字段将各单元格内的数据填入所述数据库。这样,根据表格中各单元格内的数据的字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,然后将各单元格内的数据按照对应的字段填入所述数据库,不需要人工确定数据和字段的对应关系,能够对表格数据实现数据库的自动填充,极大的提高了将表格内的数据存储到数据库的效率。本申请还公开一种装置、电子设备和存储介质。
Description
技术领域
本申请涉及数据处理技术领域,例如涉及一种用于填充数据的方法及装置、电子设备、存储介质。
背景技术
现代企业在运营过程中,常常需要整理各种类型的表格文件来记录生产过程中的各种数据,例如,通过Excel表格文件来记录人员、运输、文献、研发数据、资产数据、财务数据等不同类型的数据。为了实现企业的信息化管理,通常需要将这些表格内的数据存储到数据库中,然后利用信息管理系统来调用数据库中的相关数据进行分析、展示等操作。
由于区域差异、业务认知不同等原因,即使针对相同类型的表格,存放数据的格式或数据列的顺序常常千差万别,例如,表格A和表格B均用于存放财务数据,其中表格A的第一列数据是a类数据,第二列数据是b类数据,而表格B的第一列数据是b类数据,第二列数据是a类数据。因此,在将表格内的数据存储到数据库的过程中,对不同的表格需要人为的指定数据列与数据库中各字段的对应关系,这种人工确认的方式效率极低。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于填充数据的方法及装置、电子设备、存储介质,以提高将表格内的数据存储到数据库的效率。
在一些实施例中,所述用于填充数据的方法,包括:获取用户上传的表格,所述表格内包括若干单元格;获取各单元格内的数据的字符特征;根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;根据各单元格内的数据对应的字段将各单元格内的数据填入所述数据库。
在一些实施例中,所述用于填充数据的装置,包括:第一获取模块,被配置为获取用户上传的表格,所述表格内包括若干单元格;第二获取模块,被配置为获取各单元格内的数据的字符特征;确定模块,被配置为根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;填充模块,被配置为根据各单元格内的数据对应的字段将各单元格内的数据填入所述数据库。
在一些实施例中,电子设备,包括处理器和存储有程序指令的存储器,所述处理器被配置为在运行所述程序指令时,执行上述的用于填充数据的方法。
在一些实施例中,存储介质,存储有程序指令,所述程序指令在运行时,执行上述的用于填充数据的方法。
本公开实施例提供的用于填充数据的方法及装置、电子设备、存储介质,可以实现以下技术效果:根据表格中各单元格内的数据的字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,然后将各单元格内的数据按照对应的字段填入所述数据库,不需要人工确定数据和字段的对应关系,能够对表格数据实现数据库的自动填充,极大的提高了将表格内的数据存储到数据库的效率。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一个用于填充数据的方法的示意图;
图2是本公开实施例提供的一个用于填充数据的装置的示意图;
图3是本公开实施例提供的一个电子设备的示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
术语“对应”可以指的是一种关联关系或绑定关系,A与B相对应指的是A与B之间是一种关联关系或绑定关系。
结合图1所示,本公开实施例提供的一种用于填充数据的方法,包括:
步骤S101,获取用户上传的表格,该表格内包括若干单元格;
步骤S102,获取各单元格内的数据的字符特征;
步骤S103,根据各字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;
步骤S104,根据各单元格内的数据对应的字段将各单元格内的数据填入数据库。
采用本公开实施例提供的用于填充数据的方法,根据表格中各单元格内的数据的字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,然后将各单元格内的数据按照对应的字段填入数据库,不需要人工确定数据和字段的对应关系,能够对表格数据实现数据库的自动填充,极大的提高了将表格内的数据存储到数据库的效率。
根据各单元格内的数据对应的字段将各单元格内的数据填入数据库,包括:逐行将表格中各单元格内的数据一一填入数据库中各单元格的数据对应的字段内,或,逐列将表格中各单元格内的数据一一填入数据库中各单元格的数据对应的字段内。
可选地,单元格内的数据的字符特征包括字符串长度。根据字符特征分别确定单元格内的数据在预设的数据库中对应的字段,包括:确定单元格内的数据的字符串长度,对确定的字符串长度在预设的字段表中进行查表操作,获得字符串长度对应的字段,然后将查表获得的字段确定为单元格内的数据在预设的数据库中对应的字段。预设的字段表中存储有字符串长度范围及对应的字段。
可选地,单元格内的数据的字符特征包括字符加粗情况、字体类型、字符颜色和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。根据字符特征分别确定单元格内的数据在预设的数据库中对应的字段,包括:确定单元格内的数据的字符特征,对确定的字符特征在预设的字段表中进行查表操作,获得字符特征对应的字段,然后将查表获得的字段确定为单元格内的数据在预设的数据库中对应的字段。预设的字段表中存储有字符特征及对应的字段。
可选地,根据各字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,包括:
根据各字符特征分别确定不同列单元格内的数据是否为同一数据类型;
在各列单元格内的数据为同一数据类型的情况下,将每列单元格中任意一个单元格确定为备选单元格;
根据各备选单元格中数据的字符特征分别确定各备选单元格内的数据在预设的数据库中对应的字段;
将各备选单元格内的数据在预设的数据库中对应的字段确定为各备选单元格对应的一列单元格中各列单元格内的数据对应的字段。
在填充数据前先确定不同列单元格内的数据是否为同一数据类型,能够对表格内的数据进行核准,避免人工录入表格数据时出错,能够提高填入数据库的数据的准确性。
可选地,根据各字符特征分别确定不同列单元格内的数据是否为同一数据类型,包括:
对每一列单元格,获取各单元格内的数据的字符串长度;
对每一列单元格,将各单元格内的字符特征和各单元格内对应的字符串长度输入预设的数据类型预测模型进行数据类型预测,获得每一列单元格对应的预测结果,预测结果用于表征对每一列单元格中各单元格内的数据是否为同一数据类型,其中,字符特征包括字符加粗情况、字体类型、字符颜色和字符串类型中的一种或多种。
这样,在提高将表格内的数据存储到数据库的效率的同时,还能保证填入数据的准确性。
可选地,数据类型预测模型通过以下方式获取:
获取带有数据类型标签的第一样本数据,第一样本数据包括字符特征样本和字符串长度样本;
将带有数据类型标签的第一样本数据输入预设的第一神经网络模型进行训练,获得数据类型预测模型。
可选地,字符特征样本包括字符加粗情况、字体类型、字符颜色和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。
可选地,根据各字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,包括:
获取用户的用户信息,并获取各单元格的位置信息;
将用户信息、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。
上述实施例中,各单元格对应的字符特征包括字符加粗情况、字体类型、字符颜色、字符串长度和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。
可选地,单元格的位置信息为单元格在表格中的行列信息,例如,第三行第二列,或,(3,2)。(3,2)表示表格中第三行第二列的单元格。可选地,单元格的位置信息为单元格在表格中的列信息,例如,第二列,或,2,其中,2表示表格中第二列的单元格。
可选地,用户信息包括用户的岗位、年龄、性别、工作经历和表格浏览记录中的一种或多种。
可选地,用户信息通过接收用户输入的用户信息并将其存储在预设的用户信息表中。在获取用户上传的表格时,在用户信息表中匹配出该用户对应的用户信息。
在一些实施例中,将用户的岗位、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。即,对表格中的每个单元格,将表格对应的用户的岗位、单元格对应的字符特征及单元格对应的位置信息输入预设的字段预测模型进行字段预测。单元格对应的字符特征包括字符加粗情况、字体类型、字符颜色、字符串长度和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。这样,由于不同的岗位通常有约定成俗的表格填写要求,即,表格中各列数据填写哪些字段(属性值)的数据会因岗位的不同而有不同的要求,因此,结合用户的岗位来确定数据库中相应的字段,在保证数据填充效率的同时进一步保证了填入数据的准确性。
在一些实施例中,将用户的年龄、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。即,对表格中的每个单元格,将表格对应的用户的年龄、单元格对应的字符特征及单元格对应的位置信息输入预设的字段预测模型进行字段预测。单元格对应的字符特征包括字符加粗情况、字体类型、字符颜色、字符串长度和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。这样,由于不同年龄阶段的用户通常有不同的表格填写习惯,即,表格中各列数据填写哪些字段( 属性值)的数据会因年龄的不同而有不同的习惯,因此,结合用户的年龄来确定数据库中相应的字段,在保证数据填充效率的同时进一步保证了填入数据的准确性。
在一些实施例中,将用户的性别、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。即,对表格中的每个单元格,将表格对应的用户的性别、单元格对应的字符特征及单元格对应的位置信息输入预设的字段预测模型进行字段预测。单元格对应的字符特征包括字符加粗情况、字体类型、字符颜色、字符串长度和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。这样,由于不同性别的用户通常有不同的表格填写习惯,即,表格中各列数据填写哪些字段(属性值)的数据会因性别的不同而有不同的习惯,因此,结合用户的性别来确定数据库中相应的字段,在保证数据填充效率的同时进一步保证了填入数据的准确性。
在一些实施例中,将用户的工作经历、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。即,对表格中的每个单元格,将表格对应的用户的工作经历、单元格对应的字符特征及单元格对应的位置信息输入预设的字段预测模型进行字段预测。单元格对应的字符特征包括字符加粗情况、字体类型、字符颜色、字符串长度和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。这样,由于不同工作经历的用户通常有不同的表格填写习惯,即,表格中各列数据填写哪些字段(属性值)的数据会因工作经历的不同而不同,不同的工作经历会常常将表格填写习惯延续到新的工作中,结合用户的工作经历来确定数据库中相应的字段,在保证数据填充效率的同时进一步保证了填入数据的准确性。其中,工作经历包括:时间信息及时间信息对应的岗位信息,或,时间信息及时间信息对应的单位类型。
在一些实施例中,将用户的表格浏览记录、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。即,对表格中的每个单元格,将表格对应的用户的表格浏览记录、单元格对应的字符特征及单元格对应的位置信息输入预设的字段预测模型进行字段预测。单元格对应的字符特征包括字符加粗情况、字体类型、字符颜色、字符串长度和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。这样,由于不同表格浏览记录的用户很大概率会受到不同的表格填写习惯的影响,换句话说,相同的表格浏览记录也会影响到用户以相同的表格填写习惯来处理表格数据,即,表格中各列数据填写哪些字段(属性值)的数据会因表格浏览记录的不同而不同,结合用户的表格浏览记录来确定数据库中相应的字段,在保证数据填充效率的同时进一步保证了填入数据的准确性。其中,工作经历包括:时间信息及时间信息对应的表格名称。
在一些实施例中,在一些实施例中,将用户的岗位、年龄、性别、工作经历和表格浏览记录、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。即,对表格中的每个单元格,将表格对应的用户的岗位、年龄、性别、工作经历和表格浏览记录、单元格对应的字符特征及单元格对应的位置信息输入预设的字段预测模型进行字段预测。单元格对应的字符特征包括字符加粗情况、字体类型、字符颜色、字符串长度和字符串类型中的一种或多种。其中,字符加粗情况用于表征字符是否被加粗,字符串类型包括数字字符串、英文字符串、中文字符串、日期字符串等。
上述实施例,通过用户的岗位、年龄、性别、工作经历和表格浏览记录中的一种或多种体现出用户画像,并根据用户的不同特点确定表格中的数据与数据库中字段的对应关系,从而实现高效而准确的将表格中的数据填入数据库中。
可选地,字段预测模型通过以下方式获取:
获取带有字段标签的第二样本数据,第二样本数据包括用户信息样本、字符特征样本和单元格位置样本;
将带有数据类型标签的第一样本数据输入预设的第二神经网络模型进行训练,获得数据类型预测模型。
可选地,用户信息样本包括用户的岗位、年龄、性别、工作经历和表格浏览记录中的一种或多种。
结合图2所示,本公开实施例提供一种用于填充数据的装置,包括:第一获取模块201,被配置为获取用户上传的表格,所述表格内包括若干单元格;第二获取模块202,被配置为获取各单元格内的数据的字符特征;确定模块203,被配置为根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;填充模块204,被配置为根据各单元格内的数据对应的字段将各单元格内的数据填入所述数据库。
采用本公开实施例提供的用于填充数据的装置,根据表格中各单元格内的数据的字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,然后将各单元格内的数据按照对应的字段填入数据库,不需要人工确定数据和字段的对应关系,能够对表格数据实现数据库的自动填充,极大的提高了将表格内的数据存储到数据库的效率。
结合图3所示,本公开实施例提供一种电子设备,包括处理器(proces sor)300和存储器(memory)301。可选地,该电子设备还可以包括通信接口(CommunicationInterface)302和总线303。其中,处理器300、通信接口302、存储器301可以通过总线903完成相互间的通信。通信接口302可以用于信息传输。处理器300可以调用存储器301中的逻辑指令,以执行上述实施例的用于填充数据的方法。
此外,上述的存储器301中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器301作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器 300通过运行存储在存储器301中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于填充数据的方法。
存储器301可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器301可以包括高速随机存取存储器,还可以包括非易失性存储器。
可选地,电子设备包括:个人计算机、服务器、手机、平板电脑等。
采用本公开实施例提供的电子设备,根据表格中各单元格内的数据的字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,然后将各单元格内的数据按照对应的字段填入数据库,不需要人工确定数据和字段的对应关系,能够对表格数据实现数据库的自动填充,极大的提高了将表格内的数据存储到数据库的效率。
本公开实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为执行上述用于填充数据的方法。
本公开实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述用于填充数据的方法。
上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only
Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a) 、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise )及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
Claims (9)
1.一种用于填充数据的方法,其特征在于,包括:
获取用户上传的表格,所述表格内包括若干单元格;
获取各单元格内的数据的字符特征;
根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;
根据各单元格内的数据对应的字段将各单元格内的数据填入所述数据库。
2.根据权利要求1所述的方法,其特征在于,根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,包括:
根据各所述字符特征分别确定不同列单元格内的数据是否为同一数据类型;
在各列单元格内的数据为同一数据类型的情况下,将每列单元格中任意一个单元格确定为备选单元格;
根据各所述备选单元格中数据的字符特征分别确定各备选单元格内的数据在预设的数据库中对应的字段;
将各备选单元格内的数据在预设的数据库中对应的字段确定为各备选单元格对应的一列单元格中各列单元格内的数据对应的字段。
3.根据权利要求2所述的方法,其特征在于,根据各所述字符特征分别确定不同列单元格内的数据是否为同一数据类型,包括:
对每一列单元格,获取各单元格内的数据的字符串长度;
对每一列单元格,将各单元格内的字符特征和各单元格内对应的字符串长度输入预设的数据类型预测模型进行数据类型预测,获得每一列单元格对应的预测结果,所述预测结果用于表征对每一列单元格中各单元格内的数据是否为同一数据类型。
4.根据权利要求3所述的方法,其特征在于,所述数据类型预测模型通过以下方式获取:
获取带有数据类型标签的第一样本数据,所述第一样本数据包括字符特征样本和字符串长度样本;
将所述带有数据类型标签的第一样本数据输入预设的第一神经网络模型进行训练,获得数据类型预测模型。
5.根据权利要求1所述的方法,其特征在于,根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,包括:
获取所述用户的用户信息,并获取各单元格的位置信息;
将所述用户信息、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。
6.根据权利要求5所述的方法,其特征在于,所述字段预测模型通过以下方式获取:
获取带有字段标签的第二样本数据,所述第二样本数据包括用户信息样本、字符特征样本和单元格位置样本;
将所述带有数据类型标签的第一样本数据输入预设的第二神经网络模型进行训练,获得数据类型预测模型。
7.一种用于填充数据的装置,其特征在于,包括:
第一获取模块,被配置为获取用户上传的表格,所述表格内包括若干单元格;
第二获取模块,被配置为获取各单元格内的数据的字符特征;
确定模块,被配置为根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;
填充模块,被配置为根据各单元格内的数据对应的字段将各单元格内的数据填入所述数据库。
8.一种电子设备,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在运行所述程序指令时,执行如权利要求1至6任一项所述的用于填充数据的方法。
9.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至6任一项所述的用于填充数据的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210195567.3A CN114861614A (zh) | 2022-03-01 | 2022-03-01 | 用于填充数据的方法及装置、电子设备、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210195567.3A CN114861614A (zh) | 2022-03-01 | 2022-03-01 | 用于填充数据的方法及装置、电子设备、介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114861614A true CN114861614A (zh) | 2022-08-05 |
Family
ID=82627613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210195567.3A Pending CN114861614A (zh) | 2022-03-01 | 2022-03-01 | 用于填充数据的方法及装置、电子设备、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114861614A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115544975A (zh) * | 2022-12-05 | 2022-12-30 | 济南丽阳神州智能科技有限公司 | 一种日志格式转换方法及设备 |
CN115641220A (zh) * | 2022-10-09 | 2023-01-24 | 湖北普联东文信息科技有限公司 | 会计自动匹配迁账方法及系统、电子设备、存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1696937A (zh) * | 2004-05-12 | 2005-11-16 | 微软公司 | 智能自动填充 |
CN103020089A (zh) * | 2011-09-27 | 2013-04-03 | 深圳市金蝶友商电子商务服务有限公司 | 一种将excel文件中的数据导入数据库的方法及装置 |
CN109241167A (zh) * | 2018-09-18 | 2019-01-18 | 四川爱联科技有限公司 | 基于bs架构的表格数据导入方法 |
CN112417027A (zh) * | 2020-11-19 | 2021-02-26 | 青岛以萨数据技术有限公司 | 可视化操作数据库的数据处理方法、系统、终端及介质 |
CN112949275A (zh) * | 2021-03-12 | 2021-06-11 | 中国平安财产保险股份有限公司 | 将电子表格导入数据库的方法、装置、设备及存储介质 |
-
2022
- 2022-03-01 CN CN202210195567.3A patent/CN114861614A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1696937A (zh) * | 2004-05-12 | 2005-11-16 | 微软公司 | 智能自动填充 |
CN103020089A (zh) * | 2011-09-27 | 2013-04-03 | 深圳市金蝶友商电子商务服务有限公司 | 一种将excel文件中的数据导入数据库的方法及装置 |
CN109241167A (zh) * | 2018-09-18 | 2019-01-18 | 四川爱联科技有限公司 | 基于bs架构的表格数据导入方法 |
CN112417027A (zh) * | 2020-11-19 | 2021-02-26 | 青岛以萨数据技术有限公司 | 可视化操作数据库的数据处理方法、系统、终端及介质 |
CN112949275A (zh) * | 2021-03-12 | 2021-06-11 | 中国平安财产保险股份有限公司 | 将电子表格导入数据库的方法、装置、设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115641220A (zh) * | 2022-10-09 | 2023-01-24 | 湖北普联东文信息科技有限公司 | 会计自动匹配迁账方法及系统、电子设备、存储介质 |
CN115544975A (zh) * | 2022-12-05 | 2022-12-30 | 济南丽阳神州智能科技有限公司 | 一种日志格式转换方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020186786A1 (zh) | 文件处理方法、装置、计算机设备和存储介质 | |
CN110292775B (zh) | 获取差异数据的方法及装置 | |
CN108399072B (zh) | 应用页面更新方法和装置 | |
CN114861614A (zh) | 用于填充数据的方法及装置、电子设备、介质 | |
CN109388675A (zh) | 数据分析方法、装置、计算机设备及存储介质 | |
US20150019959A1 (en) | Method and apparatus for bidirectional typesetting | |
CN113157947A (zh) | 知识图谱的构建方法、工具、装置和服务器 | |
CN109614599A (zh) | 报表生成方法、装置、计算机设备及存储介质 | |
CN112286934A (zh) | 数据库表导入方法、装置、设备及介质 | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
US10824803B2 (en) | System and method for logical identification of differences between spreadsheets | |
CN112732893A (zh) | 文本信息的提取方法和装置、存储介质和电子设备 | |
CN115391439A (zh) | 文档数据导出方法、装置、电子设备和存储介质 | |
CN112418875B (zh) | 跨平台税务智能客服语料迁移方法及装置 | |
CN111552527A (zh) | 用户界面内文字翻译方法、装置、系统及存储介质 | |
CN104240107A (zh) | 社群数据筛选系统及其方法 | |
CN115202535A (zh) | 一种图标编辑的方法及装置、电子设备、存储介质 | |
CN113515703A (zh) | 信息推荐方法、装置、电子设备及可读存储介质 | |
CN113791860A (zh) | 一种信息转换方法、装置和存储介质 | |
CN112750043A (zh) | 业务数据的推送方法、装置和服务器 | |
CN115268902A (zh) | 用于生成Html页面的方法及装置、设备 | |
CN115270748B (zh) | 文件生成方法、装置、电子设备和存储介质 | |
CN112287184B (zh) | 基于神经网络的迁移标注方法、装置、设备及存储介质 | |
CN115545008B (zh) | 一种谱图文件解析方法、装置、设备及存储介质 | |
CN108228897B (zh) | 文件生成方法以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |