CN113868210A - 一种导入数据的有效性验证方法、系统、设备及存储介质 - Google Patents
一种导入数据的有效性验证方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN113868210A CN113868210A CN202111056415.7A CN202111056415A CN113868210A CN 113868210 A CN113868210 A CN 113868210A CN 202111056415 A CN202111056415 A CN 202111056415A CN 113868210 A CN113868210 A CN 113868210A
- Authority
- CN
- China
- Prior art keywords
- data
- file
- import
- format
- imported
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/178—Techniques for file synchronisation in file systems
- G06F16/1794—Details of file format conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种导入数据的有效性验证方法、系统、设备及存储介质,其中,方法包括:根据排序规则展示所有模板信息,根据所有模板信息确定导入模板;接收上传的导入文件,根据导入文件格式和预设规则对所述导入文件进行校验;导入文件校验通过后,对所述导入文件进行数据转译,获取导入文件对应的导入数据;将所述导入数据写入导入模板中,获取待确认文件;根据模板填写规则,判断所述待确认文件中的数据格式和内容是否存在异常;在所述待确认文件中不存在异常时,确定导入数据有效,并将所述待确认文件标记为确认文件。本发明能够实现导入不同类型文件的数据可读性,提高数据导入成功率;同时能够对导入数据进行有效性验证。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种导入数据的有效性验证方法、系统、设备及存储介质。
背景技术
数据导入就是将存储在文件系统中的外部数据,例如Excel数据或Word数据,导入到信息系统中。数据导入功能通常是信息系统中必备的功能,其重要程度和使用频率都较高。常用的导入机制一般只能本地导入Excel文件格式文件,或者先从系统下载一个预置的导入模版然后再进行导入操作。
但是,现有的导入机制不存在导入数据的有效性验证,在出现不能够识别的文件时,往往会造成导入内容变为乱码,且导入机制的可延展性受到限制,例如:想导入一个图片类型文件,提取数据,结果只支持.xls文件类型导入,容易导致导入文件失败;或者就算按照预置模版进行数据编辑导入,也会因为导入时数据类型、数据格式、数据编码类型导致导入失败。
发明内容
基于此,有必要针对上述技术问题,提供一种导入数据的有效性验证方法、系统、设备及存储介质。
一种导入数据的有效性验证方法,包括以下步骤:根据排序规则展示所有模板信息,根据所有模板信息确定导入模板;接收上传的导入文件,根据导入文件格式和预设规则对所述导入文件进行校验;导入文件校验通过后,对所述导入文件进行数据转译,获取导入文件对应的导入数据;将所述导入数据写入导入模板中,获取待确认文件;根据模板填写规则,判断所述待确认文件中的数据格式和内容是否存在异常;在所述待确认文件中不存在异常时,确定导入数据有效,并将所述待确认文件标记为确认文件。
在其中一个实施例中,所述根据排序规则展示所有模板信息,根据所有模板信息确定导入模板,具体包括:获取所有模板的历史使用信息,所述历史使用信息包括有历史使用频次和导入成功率;根据所述历史使用频次和导入成功率分别所占的比重,对所有模板进行排序,获取所有模板的展示列表并展示。
在其中一个实施例中,所述接收上传的导入文件,根据导入文件格式和预设规则对所述导入文件进行校验,具体包括:接收上传的导入文件,获取所述导入文件的后缀名;根据所述后缀名判断导入文件的数据格式,所述数据格式包括有图片格式、表格格式、PDF格式、word格式和音频格式;获取所述导入模板的模板格式,根据所述模板格式和数据格式对导入文件进行校验;在所述模板格式和数据格式相同时,导入文件的校验通过;在所述模板格式和数据格式不同时,弹出数据格式异常的提示信息。
在其中一个实施例中,所述导入文件校验通过后,对所述导入文件进行数据转译,获取导入文件对应的导入数据,具体包括:根据所述导入文件的数据格式,确定对应的数据转译流程;其中,在所述数据格式为图片格式或PDF格式时,根据光学字符识别技术对导入文件进行数据转译,获取图片导入数据;在所述数据格式为word格式时,根据HTML技术和JAVA技术对导入文件进行数据转译,获取文本导入数据;在所述数据格式为音频格式时,将所述导入文件解析为若干声音单元,根据声学模型和深度学习构建声音识别模型,对所述若干声音单元进行数据转译,获取对应的文字信息,通过语言模型对所述文字信息进行处理,获取音频导入数据。
在其中一个实施例中,所述将所述导入数据写入导入模板中,获取待确认文件,具体包括:分别提取所述导入数据和导入模板中的标题信息,根据所述标题信息分别获取数据关键词和模板关键词;将所述数据关键词与所述模板关键词进行匹配,将关键词匹配的数据信息写入所述导入模板对应列的单元格中,获取待确认文件。
在其中一个实施例中,所述根据模板填写规则判断所述待确认文件中的数据格式和内容是否存在异常,具体包括:判断单元格中数据信息的数据格式与所属列的数据格式是否一致,若不一致,则对所述单元格进行异常标记;根据所属列设置的输入最大字符长度,判断单元格中数据信息的数据长度是否超出所述输入最大字符长度,在所述数据信息的数据长度超过所述输入最大字符长度时,对所述单元格进行异常标记;在所述数据信息的数据格式与所属列的数据格式一致,且数据信息的数据长度在所述输入最大字符长度的范围内时,认定所述单元格不存在异常;在所有单元格均不存在异常时,认定所述待确认文件不存在异常。
在其中一个实施例中,所述根据模板填写规则判断所述待确认文件中的数据格式和内容是否存在异常之后,还包括:在至少一个单元格存在异常标记时,认定所述待确认文件中存在异常;根据所述异常标记筛选出所有的异常内容,并在所述待确认文件写入数据完成后进行显示。
一种导入数据的有效性验证系统,包括:导入模板确定模块,用于根据排序规则展示所有模板信息,根据所有模板信息确定导入模板;导入文件校验模块,用于接收上传的导入文件,根据导入文件格式和预设规则对所述导入文件进行校验;导入数据获取模块,用于在导入文件校验通过后,对所述导入文件进行数据转译,获取导入文件对应的导入数据;导入数据写入模块,用于将所述导入数据写入导入模板中,获取待确认文件;文件判断模块,用于根据模板填写规则,判断所述待确认文件中的数据格式和内容是否存在异常;数据有效确定模块,用于在所述待确认文件中不存在异常时,确定导入数据有效,并将所述待确认文件标记为确认文件。
一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的一种导入数据的有效性验证方法的步骤。
一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的一种导入数据的有效性验证方法的步骤。
相比于现有技术,本发明的优点及有益效果在于:本发明能够实现用户导入不同类型文件的数据可读性,提高数据导入成功率,满足人们在不同场景下的数据导入需求;同时能够对导入数据进行有效性验证,便于对数据进行对应的修改和确认。
附图说明
图1为一个实施例中一种导入数据的有效性验证方法的流程示意图;
图2为一个实施例中一种导入数据的有效性验证系统的结构示意图;
图3为一个实施例中设备的内部结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
在一个实施例中,如图1所示,提供了一种导入数据的有效性验证方法,包括以下步骤:
步骤S101,根据排序规则展示所有模板信息,根据所有模板信息确定导入模板。
具体地,预先设置有多个模板,多个模板中包括有若干文件格式的模板,一个文件格式的模板存在多个。根据排序规则展示所有模板信息,并根据所有模板信息确定导入模板。在确定导入文件时,能够根据导入文件的格式筛选对应的模板信息,模板信息根据排序规则进行展示,然后确定导入模板。
步骤S102,接收上传的导入文件,根据导入文件格式和预设规则对导入文件进行校验。
具体地,接收上传的导入文件,在导入文件长传到服务器时,获取导入文件的后缀名,根据后缀名判断导入文件格式,并结合预设规则对导入文件进行校验,确保导入文件与所选的导入模板的格式一致。
步骤S103,导入文件校验通过后,对导入文件进行数据转译,获取导入文件对应的导入数据。
具体地,在导入文件校验通过后,对导入文件中的内容进行数据转译,获取导入文件对应的导入数据。在进行数据转译的过程中,通过导入文件的格式采用不同的技术进行数据转译。
步骤S104,将导入数据写入导入模板中,获取待确认文件。
具体地,将数据转译获取的导入数据写入导入模板对应的位置,从而获取待确认文件。
步骤S105,根据模板填写规则,判断待确认文件中的数据格式和内容是否存在异常。
具体地,根据导入模板的模板填写规则,判断待确认文件中的数据格式和内容是否存在异常,例如数据格式与模板填写规则对应的格式不同,或数据内容不符合模板填写规则等均认定为存在异常。
步骤S106,在待确认文件中不存在异常时,确定导入数据有效,并将待确认文件标记为确认文件。
具体地,在待确认文件中不存在异常时,确定导入数据有效,即待确认文件中的数据格式和内容均符合模板填写规则,则将待确认文件标记为确认文件,完成导入文件的导入和导入数据的有效性检测。
在本实施例中,根据排序规则展示所有模板信息,并确定导入模板,接收上传的导入文件,根据导入文件格式和预设规则对导入文件进行校验,校验通过后,对导入文件进行数据转译,获取导入文件对应的导入数据,将导入数据写入导入模板中,获取待确认文件,根据模板填写规则,判断待确认文件中的数据格式和内容是否存在异常,在待确认文件中不存在异常时,确定导入数据有效,并将待确认文件标记为确认文件,能够实现用户导入不同类型文件的数据可读性,提高数据导入成功率,满足人们在不同场景下的数据导入需求;同时能够对导入数据进行有效性验证,便于对数据进行对应的修改和确认。
其中,步骤S101具体包括:获取所有模板的历史使用信息,历史使用信息包括有历史使用频次和导入成功率;根据历史使用频次和导入成功率分别所占的比重,对所有模板进行排序,获取所有模板的展示列表并展示。
具体地,获取所有模板的历史使用信息,包括有模板的历史使用频次和导入成功率,根据历史使用频次和导入成功率分别所占的比重,对所有模板进行排序,例如预先设置的历史使用频次占比0.7,导入成功率占比0.3。
在具体使用时,确定需要导入的文件格式后,可以筛选对应格式的模板,从而对符合格式的模板进行排序展示,便于确定导入模板。
其中,步骤S102具体包括:接收上传的导入文件,获取导入文件的后缀名;根据后缀名判断导入文件的数据格式,数据格式包括有图片格式、表格格式、PDF格式、word格式和音频格式;获取导入模板的模板格式,根据模板格式和数据格式对导入文件进行校验;在模板格式和数据格式相同时,导入文件的校验通过;在模板格式和数据格式不同时,弹出数据格式异常的提示信息。
具体地,接收上传的导入文件后,在服务器中获取导入文件的后缀名,根据后缀名能够判断导入文件的数据格式,数据格式可以包括有图片格式、表格格式、PDF格式、word格式和音频格式等,确定选中的导入模板的模板格式,将模板格式与数据格式进行匹配,从而对导入文件和导入模板进行校验,确保导入文件和导入模板选择无误,在模板格式与数据格式相同时,导入文件的校验通过;反之,弹出数据格式异常的提示信息,用户能够根据提示信息查看导入文件和导入模板的格式,从而进行对应的修正操作。
其中,步骤S103具体包括:根据导入文件的数据格式,确定对应的数据转译流程;其中,在导入文件为图片格式或PDF格式时,根据光学字符识别技术对导入文件进行数据转译,获取图片导入数据;在导入文件为word格式时,根据HTML技术和JAVA技术对导入文件进行数据转译,获取文本导入数据;在导入文件为音频格式时,将导入文件解析为若干声音单元,根据声学模型和深度学习构建声音识别模型,对若干声音单元进行数据转译,获取对应的文字信息,通过语言模型对文字信息进行处理,获取音频导入数据。
具体地,根据导入文件的数据格式,启动对应的数据转译流程,在数据转译的过程中会通过逗号进行分行标记。其中,在导入文件的数据格式为图片格式或PDF格式时,根据光学字符识别技术对导入文件进行数据转译,从而获取图片导入数据;在数据格式为word格式时,根据HTML技术和JAVA技术对导入文件进行数据转译,从而获取文本导入数据;在数据格式为音频格式时,将导入文件解析为若干声音单元,根据声学模型和深度学习构建声音识别模型,对若干声音单元进行数据转译,获取对应的文字信息,然后通过语言模型对文字信息进行处理,从而获取音频导入数据。
其中,步骤S104具体包括:分别提取导入数据和导入模板中的标题信息,根据标题信息分别获取数据关键词和模板关键词;将数据关键词与模板关键词进行匹配,将关键词匹配的数据信息写入导入模板对应列的单元格中,获取待确认文件。
具体地,对导入文件进行数据解析获取导入数据后,分别提取导入数据和导入模板中的各列标题关键词,为数据关键词和模板关键词,将数据关键词与模板关键词进行匹配,匹配成功后,将对应的数据写入导入模板对应列的单元格中,重复匹配,将所有导入数据写入导入模板后,完成数据写入,获取待确认文件。若存在匹配不成功的则不进行数据写入。
其中,步骤S105具体包括:判断单元格中数据信息的数据格式与所属列的数据格式是否一致,若不一致,则对单元格进行异常标记;根据所属列设置的输入最大字符长度,判断单元格中数据信息的数据长度是否超出输入最大字符长度,在数据信息的数据长度超过输入最大字符长度时,对单元格进行异常标记;在数据信息的数据格式与所属列的数据格式一致,且数据信息的数据长度在输入最大字符长度的范围内时,认定单元格不存在异常;在所有单元格均不存在异常时,认定待确认文件不存在异常。
具体地,在单元格中进行数据填写后,判断单元格中数据信息的数据格式与所属列的数据格式是否一致,若不一致,则对单元格进行异常标记;同时根据单元格所述列设置的输入最大字符长度,对单元格中数据信息的数据长度进行判断,在数据信息的数据长度超出输入最大字符长度时,对单元格进行异常标记。反之,在单元格中的数据长度在输入最大字符长度范围内,且单元格中数据信息的数据格与所属列的数据格式一致,则表示单元格数据信息正常,数据写入成功;在所有单元格均不存在异常时,认定待确认文件不存在异常。在至少一个单元格存在异常标记时,认定待确认文件存在异常。
其中,在步骤S105之后,还包括:在至少一个单元格存在异常标记时,认定待确认文件中存在异常;根据异常标记筛选出所有的异常内容,并在待确认文件写入数据完成后进行显示。
具体地,在至少一个单元格存在异常标记时,认定待确认文件存在异常,根据异常标记筛选出所有的异常内容,并在待确认文件写入数据完成后进行显示,可以通过弹窗发送文件是否有效的选择信息,选择信息可以是修改后重新上传和确认有效,便于用户进行对应的选择。
如图2所示,提供了一种导入数据的有效性验证系统20,包括:导入模板确定模块21、导入文件校验模块22、导入数据获取模块23、导入数据写入模块24、文件判断模块25和数据有效确定模块26,其中:
导入模板确定模块21,用于根据排序规则展示所有模板信息,根据所有模板信息确定导入模板;
导入文件校验模块22,用于接收上传的导入文件,根据导入文件格式和预设规则对导入文件进行校验;
导入数据获取模块23,用于在导入文件校验通过后,对导入文件进行数据转译,获取导入文件对应的导入数据;
导入数据写入模块24,用于将导入数据写入导入模板中,获取待确认文件;
文件判断模块25,用于根据模板填写规则,判断待确认文件中的数据格式和内容是否存在异常;
数据有效确定模块26,用于在待确认文件中不存在异常时,确定导入数据有效,并将待确认文件标记为确认文件。
在一个实施例中,导入模板确定模块21具体用于:获取所有模板的历史使用信息,历史使用信息包括有历史使用频次和导入成功率;根据历史使用频次和导入成功率分别所占的比重,对所有模板进行排序,获取所有模板的展示列表并展示。
在一个实施例中,导入文件校验模块22具体用于:接收上传的导入文件,获取导入文件的后缀名;根据后缀名判断导入文件的数据格式,数据格式包括有图片格式、表格格式、PDF格式、word格式和音频格式;获取导入模板的模板格式,根据模板格式和数据格式对导入文件进行校验;在模板格式和数据格式相同时,导入文件的校验通过;在模板格式和数据格式不同时,弹出数据格式异常的提示信息。
在一个实施例中,导入数据获取模块23具体用于:根据导入文件的数据格式,确定对应的数据转译流程;其中,在导入文件为图片格式或PDF格式时,根据光学字符识别技术对导入文件进行数据转译,获取图片导入数据;在导入文件为word格式时,根据HTML技术和JAVA技术对导入文件进行数据转译,获取文本导入数据;在导入文件为音频格式时,将导入文件解析为若干声音单元,根据声学模型和深度学习构建声音识别模型,对若干声音单元进行数据转译,获取对应的文字信息,通过语言模型对文字信息进行处理,获取音频导入数据。
在一个实施例中,导入数据写入模块24具体用于:分别提取导入数据和导入模板中的标题信息,根据标题信息分别获取数据关键词和模板关键词;将数据关键词与模板关键词进行匹配,将关键词匹配的数据信息写入导入模板对应列的单元格中,获取待确认文件。
在一个实施例中,文件判断模块25具体用于:判断单元格中数据信息的数据格式与所属列的数据格式是否一致,若不一致,则对单元格进行异常标记;根据所属列设置的输入最大字符长度,判断单元格中数据信息的数据长度是否超出输入最大字符长度,在数据信息的数据长度超过输入最大字符长度时,对单元格进行异常标记;在数据信息的数据格式与所属列的数据格式一致,且数据信息的数据长度在输入最大字符长度的范围内时,认定单元格不存在异常;在所有单元格均不存在异常时,认定待确认文件不存在异常。
在一个实施例中,提供了一种设备,该设备可以是服务器,其内部结构图可以如图3所示。该设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该设备的处理器用于提供计算和控制能力。该设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该设备的数据库用于存储配置模板,还可用于存储目标网页数据。该设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种导入数据的有效性验证方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还可以提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的一种导入数据的有效性验证系统的一部分。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1.一种导入数据的有效性验证方法,其特征在于,包括以下步骤:
根据排序规则展示所有模板信息,根据所有模板信息确定导入模板;
接收上传的导入文件,根据导入文件格式和预设规则对所述导入文件进行校验;
导入文件校验通过后,对所述导入文件进行数据转译,获取导入文件对应的导入数据;
将所述导入数据写入导入模板中,获取待确认文件;
根据模板填写规则,判断所述待确认文件中的数据格式和内容是否存在异常;
在所述待确认文件中不存在异常时,确定导入数据有效,并将所述待确认文件标记为确认文件。
2.根据权利要求1所述的一种导入数据的有效性验证方法,其特征在于,所述根据排序规则展示所有模板信息,根据所有模板信息确定导入模板,具体包括:
获取所有模板的历史使用信息,所述历史使用信息包括有历史使用频次和导入成功率;
根据所述历史使用频次和导入成功率分别所占的比重,对所有模板进行排序,获取所有模板的展示列表并展示。
3.根据权利要求1所述的一种导入数据的有效性验证方法,其特征在于,所述接收上传的导入文件,根据导入文件格式和预设规则对所述导入文件进行校验,具体包括:
接收上传的导入文件,获取所述导入文件的后缀名;
根据所述后缀名判断导入文件的数据格式,所述数据格式包括有图片格式、表格格式、PDF格式、word格式和音频格式;
获取所述导入模板的模板格式,根据所述模板格式和数据格式对导入文件进行校验;
在所述模板格式和数据格式相同时,导入文件的校验通过;
在所述模板格式和数据格式不同时,弹出数据格式异常的提示信息。
4.根据权利要求3所述的一种导入数据的有效性验证方法,其特征在于,所述导入文件校验通过后,对所述导入文件进行数据转译,获取导入文件对应的导入数据,具体包括:
根据所述导入文件的数据格式,确定对应的数据转译流程;
其中,在所述数据格式为图片格式或PDF格式时,根据光学字符识别技术对导入文件进行数据转译,获取图片导入数据;
在所述数据格式为word格式时,根据HTML技术和JAVA技术对导入文件进行数据转译,获取文本导入数据;
在所述数据格式为音频格式时,将所述导入文件解析为若干声音单元,根据声学模型和深度学习构建声音识别模型,对所述若干声音单元进行数据转译,获取对应的文字信息,通过语言模型对所述文字信息进行处理,获取音频导入数据。
5.根据权利要求1所述的一种导入数据的有效性验证方法,其特征在于,所述将所述导入数据写入导入模板中,获取待确认文件,具体包括:
分别提取所述导入数据和导入模板中的标题信息,根据所述标题信息分别获取数据关键词和模板关键词;
将所述数据关键词与所述模板关键词进行匹配,将关键词匹配的数据信息写入所述导入模板对应列的单元格中,获取待确认文件。
6.根据权利要求5所述的一种导入数据的有效性验证方法,其特征在于,所述根据模板填写规则判断所述待确认文件中的数据格式和内容是否存在异常,具体包括:
判断单元格中数据信息的数据格式与所属列的数据格式是否一致,若不一致,则对所述单元格进行异常标记;
根据所属列设置的输入最大字符长度,判断单元格中数据信息的数据长度是否超出所述输入最大字符长度,在所述数据信息的数据长度超过所述输入最大字符长度时,对所述单元格进行异常标记;
在所述数据信息的数据格式与所属列的数据格式一致,且数据信息的数据长度在所述输入最大字符长度的范围内时,认定所述单元格不存在异常;
在所有单元格均不存在异常时,认定所述待确认文件不存在异常。
7.根据权利要求6所述的一种导入数据的有效性验证方法,其特征在于,所述根据模板填写规则判断所述待确认文件中的数据格式和内容是否存在异常之后,还包括:
在至少一个单元格存在异常标记时,认定所述待确认文件中存在异常;
根据所述异常标记筛选出所有的异常内容,并在所述待确认文件写入数据完成后进行显示。
8.一种导入数据的有效性验证系统,其特征在于,包括:
导入模板确定模块,用于根据排序规则展示所有模板信息,根据所有模板信息确定导入模板;
导入文件校验模块,用于接收上传的导入文件,根据导入文件格式和预设规则对所述导入文件进行校验;
导入数据获取模块,用于在导入文件校验通过后,对所述导入文件进行数据转译,获取导入文件对应的导入数据;
导入数据写入模块,用于将所述导入数据写入导入模板中,获取待确认文件;
文件判断模块,用于根据模板填写规则,判断所述待确认文件中的数据格式和内容是否存在异常;
数据有效确定模块,用于在所述待确认文件中不存在异常时,确定导入数据有效,并将所述待确认文件标记为确认文件。
9.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111056415.7A CN113868210A (zh) | 2021-09-09 | 2021-09-09 | 一种导入数据的有效性验证方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111056415.7A CN113868210A (zh) | 2021-09-09 | 2021-09-09 | 一种导入数据的有效性验证方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113868210A true CN113868210A (zh) | 2021-12-31 |
Family
ID=78995167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111056415.7A Pending CN113868210A (zh) | 2021-09-09 | 2021-09-09 | 一种导入数据的有效性验证方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113868210A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115047836A (zh) * | 2022-06-27 | 2022-09-13 | 中国核动力研究设计院 | 基于dcs系统定期试验的试验用例生成和载入方法及系统 |
-
2021
- 2021-09-09 CN CN202111056415.7A patent/CN113868210A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115047836A (zh) * | 2022-06-27 | 2022-09-13 | 中国核动力研究设计院 | 基于dcs系统定期试验的试验用例生成和载入方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111274782B (zh) | 一种文本审核方法、装置、计算机设备及可读存储介质 | |
CN110704633B (zh) | 命名实体识别方法、装置、计算机设备及存储介质 | |
CN109473093B (zh) | 语音识别方法、装置、计算机设备及存储介质 | |
CN107491536B (zh) | 一种试题校验方法、试题校验装置及电子设备 | |
CN112418813B (zh) | 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质 | |
CN109324956B (zh) | 系统测试方法、设备及计算机可读存储介质 | |
CN111598122B (zh) | 数据校验方法、装置、电子设备和存储介质 | |
CN110750637B (zh) | 文本摘要提取方法、装置、计算机设备及存储介质 | |
CN111325031A (zh) | 简历解析方法及装置 | |
CN113868210A (zh) | 一种导入数据的有效性验证方法、系统、设备及存储介质 | |
CN114580346A (zh) | 结合rpa和ai的信息生成方法、装置、电子设备及存储介质 | |
CN112288584B (zh) | 保险报案处理方法、装置、计算机可读介质及电子设备 | |
JP4215255B2 (ja) | デグレード確認検査方法、デグレード確認検査システム、およびそのためのプログラム | |
CN116385189A (zh) | 财务报账单据列账科目匹配度校验方法及系统 | |
US20230178065A1 (en) | Evaluating screen content for accessibility | |
CN115577703A (zh) | 一种证监报送数据校验方法、装置、系统及存储介质 | |
CN112115836A (zh) | 信息校验方法和装置、计算机可读存储介质、电子设备 | |
CN112035666A (zh) | 文本机器人交叉验证优化方法及装置 | |
CN113515588A (zh) | 表单数据检测方法、计算机装置及存储介质 | |
CN112749294B (zh) | 页面隐藏文案识别方法、装置、计算机设备和存储介质 | |
CN110661678B (zh) | 一种异常监控方法和装置 | |
CN107665209A (zh) | 信息推送方法和装置 | |
CN116257603A (zh) | 字词的辅助学习方法、装置、电子设备和存储介质 | |
CN116702762A (zh) | 纠错配置表生成方法、装置、设备及其存储介质 | |
CN115687734A (zh) | 一种网页信息验证方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |