CN115905145A - 文件处理方法、装置、设备及计算机存储介质 - Google Patents

文件处理方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN115905145A
CN115905145A CN202310007466.3A CN202310007466A CN115905145A CN 115905145 A CN115905145 A CN 115905145A CN 202310007466 A CN202310007466 A CN 202310007466A CN 115905145 A CN115905145 A CN 115905145A
Authority
CN
China
Prior art keywords
data
file
source file
preset
splitting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310007466.3A
Other languages
English (en)
Inventor
叶招艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202310007466.3A priority Critical patent/CN115905145A/zh
Publication of CN115905145A publication Critical patent/CN115905145A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种文件处理方法、装置、设备及计算机存储介质。该方法包括:获取待处理的源文件,源文件中包括源文件的文件类型;在源文件的文件类型与预设的文件类型一致的情况下,按照预设的拆分方式拆分源文件中的数据,得到拆分后的多个数据;按照预设的校验规则校验多个数据,得到校验结果;将满足目标条件的校验结果对应的数据存入数据库。本申请能够对获取的源文件进行处理校验再存入数据库,从而提高了用户获取所需数据的效率。

Description

文件处理方法、装置、设备及计算机存储介质
技术领域
本申请属于计算机技术领域,尤其涉及一种文件处理方法、装置、设备及计算机存储介质。
背景技术
企业可能产生大量的源文件,这些源文件可能存在不同的文件格式、类型等,因此当用户对于文件中的数据提出获取需求时,很难及时从海量源文件中找到所需数据,导致用户获取数据的效率低。并且海量的多种不同类型的源文件在后续运维方面也存在运维难度大的问题。
发明内容
本申请实施例提供一种文件处理方法、装置、设备及计算机存储介质,能够与基于对作业系统的优化,提高作业系统的时效性。
第一方面,本申请实施例提供一种文件处理方法,包括:
获取待处理的源文件,源文件中包括源文件的文件类型;
在源文件的文件类型与预设的文件类型一致的情况下,按照预设的拆分方式拆分源文件中的数据,得到拆分后的多个数据;
按照预设的校验规则校验多个数据,得到校验结果;
将满足目标条件的校验结果对应的数据存入数据库。
可选地,预设的拆分方式包括按照分隔符拆分;按照预设的拆分方式对源文件进行拆分,得到拆分后的多个数据,包括:
逐行读取源文件的文件内容,获取源文件中的分隔符;
将源文件中的数据按照分隔符所在的位置进行拆分,得到拆分后的多个数据。
可选地,按照预设的校验规则校验多个数据,得到校验结果,包括:
获取多个数据中每个数据的字符长度;
判断多个数据中每个数据的字符长度是否大于预设字符长度;
将多个数据中字符长度小于等于预设字符长度的目标数据确定为校验结果。
可选地,目标条件包括数据的字段值满足正则规则;将满足目标条件的校验结果对应的数据存入数据库,包括:
获取目标数据的字段值;
将目标数据的字段值满足正则表达式的目标数据存入数据库。
第二方面,本申请实施例提供一种文件处理装置,包括:
获取模块,用于获取待处理的源文件,源文件中包括源文件的文件类型;
拆分模块,用于在源文件的文件类型与预设的文件类型一致的情况下,按照预设的拆分方式拆分源文件中的数据,得到拆分后的多个数据;
校验模块,用于按照预设的校验规则校验多个数据,得到校验结果;
存储模块,用于将满足目标条件的校验结果对应的数据存入数据库。
可选地,预设的拆分方式包括按照分隔符拆分;拆分模块按照预设的拆分方式对源文件进行拆分,得到拆分后的多个数据,包括:
获取模块,还用于逐行读取源文件的文件内容,获取源文件中的分隔符;
拆分模块,还用于将源文件中的数据按照分隔符所在的位置进行拆分,得到拆分后的多个数据。
可选地,校验模块按照预设的校验规则校验多个数据,得到校验结果,包括:
获取模块,还用于获取多个数据中每个数据的字符长度;
判断模块,用于判断多个数据中每个数据的字符长度是否大于预设字符长度;
确定模块,用于将多个数据中字符长度小于等于预设字符长度的目标数据确定为校验结果。
可选地,目标条件包括数据的字段值满足正则规则;存储模块将满足目标条件的校验结果对应的数据存入数据库,包括:
获取模块,还用于获取目标数据的字段值;
存储模块,还用于将目标数据的字段值满足正则表达式的目标数据存入数据库。
第三方面,本申请实施例提供了一种电子设备,设备包括:
处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时用于执行上述第一方面的文件处理方法。
第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现上述第一方面的文件处理方法。
从以上可以看出,本申请在获取了包括多个数据的外部源文件之后,首先会判断源文件的类型,筛选出与预设文件类型相同的文件,能够将不符合目前解析模块的源文件过滤出去,提高了后续文件解析的时效性。然后再对与预设文件类型相同的源文件按照预设的拆分方式进行拆分得到多个数据,对源文件进行拆分是为了将不同的源文件设置为统一配置,方便之后进行运维。最后再对不同的数据根据预设的校验规则进行校验是为了能够对数据进行过滤,筛选出符合规则的数据,从而提高后续用户获取数据时,获取的数据的有效性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一个实施例提供的一种文件处理方法的流程示意图。
图2为本申请一个实施例提供的一种文件处理装置示意图。
图3为本申请实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
需要说明的是,本申请实施例中对数据的获取、存储、使用和处理等,均符合国家法律法规的相关规定。
为了解决现有技术问题,本申请实施例提供了一种文件处理方法、装置、设备及计算机存储介质。下面首先对本申请实施例所提供的文件处理方法进行介绍。
随着互联网技术的发展,计算机应用在众多领域发挥着重要作用,大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。数据的处理成为关键一环,海量数据如何运维成为大众的关注点。目前,不同的企业每天可能都会产生海量的文件,海量文件中可能有不同的文件类型,因此对于不同的文件的运维的成本较高且难度较大。而当用户想要从海量文件中获取所需数据时,很难及时从海量文件中精准找到所需数据,造成获取数据效率低下的问题,亟需可以提高用户获取数据效率的方法。
因此,本申请实施例提供了一种文件处理方法、装置、设备及计算机存储介质,从而能够解决或部分解决上述问题。
图1示出了本申请一个实施例提供的一种文件处理方法的流程示意图。
在一些实施例中,如图1所示,文件处理方法,包括:
S10:获取待处理的源文件,源文件中包括源文件的文件类型。
用户可能会提出在企业的海量源文件中获取数据的需求,因此需要从外部企业先获取待处理的源文件,可以想到的是,源文件可能包括不同的文件类型。例如,银行的信贷部想要获取xx企业各家分公司不同的信誉积分情况,xx公司不同分公司所提供的文件可能是不同类型,例如可能有图像类文件或者文本文件。
S11:在源文件的文件类型与预设的文件类型一致的情况下,按照预设的拆分方式拆分源文件中的数据,得到拆分后的多个数据。
由于外部公司提供的源文件包括了不同类型,因此在确定了批量的外部源文件,并确定了每个源文件的文件类型之后,会判断该源文件的文件类型是否与预设的文件类型一致,例如目前支持获取的文件类型包括Json、XML、xlsx和txt这四种类型的文件,因此在获取了批量的外部源文件之后会将不属于这四种类型的源文件进行删除,可以想到的是,支持获取的文件类型可以人为设置,在此不再赘述。
得到预设文件类型的源文件之后,会按照预设的拆分方式拆分源文件中的数据,预设的拆分方式可以是按照按照指定的字符长度拆分,也可以按照指定分隔符拆分,每个源文件经过拆分之后就得到多个数据。可以想到的是,基于预设的文件类型的不同,不同类型的文件也可以配置不同的拆分方式,并且基于同时获取的不同类型的源文件可以批量进行拆分,提高拆分效率。
S12:按照预设的校验规则校验多个数据,得到校验结果。
在对源文件按照预设的拆分方式进行拆分得到多个数据之后,由于多个数据中可能存在无效数据或者不符合规则的数据,这些数据对于用户在获取所需数据时可能造成干扰影响用户获取数据的时效性和准确性,因此要对拆分后的多个数据进行校验,得到校验结果。
S13:将满足目标条件的校验结果对应的数据存入数据库。
在对数据进行校验时,会设置目标校验条件,最终将满足目标校验条件的校验结果的数据存入数据库中。
在本实施例中,对于获取的源文件,分别进行了筛选和过滤两种操作:先通过获取外部源文件,并确定源文件的文件类型之后,将不符合预设的文件类型的源文件进行删除,保留符合预设文件类型的源文件,完成了对获取的源文件的第一步筛选。之后再通过对源文件按照预设的拆分方式进行拆分,得到多个数据,并对得到的数据按照预设得到校验规则进行校验,并将满足目标条件的校验结果对应的数据存入数据库中,到此完成了对数据的第二步过滤的过程。通过上述的对于源文件的筛选和过滤,能够把错误以及不符合规则的数据进行剔除,以便于后续用户获取到正确有效的数据,提高了用户获取数据的效率和准确率。
在一些实施例中,预设的拆分方式包括按照分隔符拆分;按照预设的拆分方式对源文件进行拆分,得到拆分后的多个数据,包括:
S111:逐行读取源文件的文件内容,获取源文件中的分隔符。
在对源文件进行拆分时,对于每一个源文件,都会先逐行读取源文件的文件内容,获取到源文件中的分隔符,不同文件类型的源文件可能包括不同的分隔符,因此在确定源文件分隔符时,会按照文件类型的不同确定不同的分隔符,并且分隔符的类型也可以人为设置,以txt文件为例,可以将txt文件分隔符的类型设置为分号,因此在逐行读取文件内容时,获取的就会是文件中各个分号所在的位置。可以想到的是,对于txt文件,也可以把分隔符的类型设置为逗号或者句号等等。可以不同文件的类型可以设置不同的分隔符,在此不再赘述。
S112:将源文件中的数据按照分隔符所在的位置进行拆分,得到拆分后的多个数据。
在获取了源文件中的分隔符之后,可以将源文件按照分隔符所在的位置进行拆分,得到多个数据,了可以想到的是,基于不同类型的源文件经过拆分之后就会获得不同类型的多个数据。
在本实施例中,先逐行读取源文件的文容并确定源文件中的分隔符,确定分隔符的过程不只是确定分隔符的类型还确定了每个分隔符所在的位置。然后将源文件按照分隔符所在的位置进行拆分得到多个数据,以此就能将不同类型的源文件全部处理成统一按照分隔符拆分的不同数据,有利于后续用户获取所需数据,提高数据获取的效率。
在一些实施例中,按照预设的校验规则校验多个数据,得到校验结果,包括:
S121:获取多个数据中每个数据的字符长度。
将原文拆分得到多个数据后,可以使用递归函数计算数据的字符长度,之后再将到每个数据都带入递归函数计算该数据的的字符长度。可以想到的是,在源文件进行拆分后可能会有不同字符长度的数据。
S122:判断多个数据中每个数据的字符长度是否大于预设字符长度。
在获取了每个数据的字符长度之后,会判断每个数据的字符长度是否大于预设字符长度,预设字符长度可以人为设置并且不同文件类型的预设字符长度可能不同。
S123:将多个数据中字符长度小于等于预设字符长度的目标数据确定为校验结果。
本申请实施例之后再将计算得到的数据的字符长度与预设字符长度进行比较,将大于预设字符长度的数据进行删除,最终保留字符长度小于预设字符长度的数据作为目标数据,并将此作为校验结果。举例来说,如果预设的字符长度为5,那么大于5的字符长度的数据就会被删除。
通过上述获取数据的字符长度并比较数据的字符长度与预设字符长度的校验过程,能够剔除部分不符合规则的数据,提高后续用户获取到所需数据的准确率。
在一些实施例中,目标条件包括数据的字段值满足正则规则;将满足目标条件的校验结果对应的数据存入数据库,包括:
S131:获取目标数据的字段值。
对于字符长度满足预设字符长度的目标数据,可以想到的是,源文件中的每一个数据在生成是就会自动匹配一个字段值,因此对于每一个目标数据来说都有专属的字段值,因此可以直接获取到每个目标数据的字段值。
S132:将目标数据的字段值满足正则表达式的目标数据存入数据库。
可以预先根据字段值校验规则生成正则表达式,根据正则表达式对文件内容进行字段值校验,可以设置文件字段值必须满足正则表达式,从而达成对目标数据进行校验的过程,最终目标数据的字段值满足正则表达式的目标数据存入数据库。例如,预设的正则表达式可以设置字段值对应的数据类型,在校验中通过判断字段值对应的数据类型与正则表达式中对应校验字段中的字段值进行定义的数据类型是否一致。
通过上述对字段值的校验,可以对目标数据进行进一步筛选,终于得出符合规则的目标数据存入数据库,有利于后续对数据的运维并且用户也能够及时从数据库中获取所需的数据,提高数据获取的效率,一举两得。
作为一种实现方式,本申请实施例为了提高用户获取正确有效的数据的效率,一共从下面三个步骤对源文件进行了处理:第一步本申请实施例在获取了批量的源文件之后先将不符合预设文件类型的源文件进行剔除;第二步将符合预设文件类型的源文件进行拆分得到多个数据,首先校验多个数据中的字符长度,进一步删除大于预设字符长度的数据,得到小于等于预设字符长度的目标数据;第三步获取了小于等于预设字符长度的目标数据的字段值,删除字段值不满足预设正则表达式的目标数据,最终将字段值满足正则表达式的目标数据存入数据库,至此完成了整个对于源文件的处理过程,对于源文件中的数据进行了校验过滤,得到了符合规则的目标数据。
图2示出了本申请一个实施例提供的一种文件处理的装置示意图。
本申请实施例提供一种文件处理装置,包括:
获取模块100,用于获取待处理的源文件,源文件中包括源文件的文件类型.
拆分模块200,用于在源文件的文件类型与预设的文件类型一致的情况下,按照预设的拆分方式拆分源文件中的数据,得到拆分后的多个数据。
校验模块300,用于按照预设的校验规则校验多个数据,得到校验结果。
存储模块400,用于将满足目标条件的校验结果对应的数据存入数据库。
在一些实施例中,预设的拆分方式包括按照分隔符拆分;拆分模块按照预设的拆分方式对源文件进行拆分,得到拆分后的多个数据,包括:
获取模块,还用于逐行读取源文件的文件内容,获取源文件中的分隔符。
拆分模块,还用于将源文件中的数据按照分隔符所在的位置进行拆分,得到拆分后的多个数据。
在一些实施例中,校验模块按照预设的校验规则校验多个数据,得到校验结果,包括:
获取模块,还用于获取多个数据中每个数据的字符长度。
判断模块,用于判断多个数据中每个数据的字符长度是否大于预设字符长度。
确定模块,用于将多个数据中字符长度小于等于预设字符长度的目标数据确定为校验结果。
在一些实施例中,目标条件包括数据的字段值满足正则规则;存储模块将满足目标条件的校验结果对应的数据存入数据库,包括:
获取模块,还用于获取目标数据的字段值。
存储模块,还用于将目标数据的字段值满足正则表达式的目标数据存入数据库。
上述实施例的装置用于实现前述任一实施例中相应的文件处理方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
图3申请实施例提供的一种电子设备的硬件结构示意图。
该电子设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器302可在综合网关容灾设备的内部或外部。在特定实施例中,存储器302是非易失性固态存储器。
在特定实施例中,存储器302包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本申请的第一方面的方法所描述的操作。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现上述实施例中的任意一种文件处理方法。
在一个示例中,该电子设备还可包括通信接口303和总线310。其中,如图3,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
上述实施例的电子设备用于实现前述任一实施例中相应的文件处理方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
另外,结合上述实施例中的文件处理方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种文件处理方法。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或装置。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(装置)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种文件处理方法,其特征在于,包括:
获取待处理的源文件,所述源文件中包括所述源文件的文件类型;
在所述源文件的文件类型与预设的文件类型一致的情况下,按照预设的拆分方式拆分所述源文件中的数据,得到拆分后的多个数据;
按照预设的校验规则校验所述多个数据,得到校验结果;
将满足目标条件的校验结果对应的数据存入数据库。
2.根据权利要求1所述的处理方法,其特征在于,所述预设的拆分方式包括按照分隔符拆分;所述按照预设的拆分方式对所述源文件进行拆分,得到拆分后的多个数据,包括:
逐行读取所述源文件的文件内容,获取所述源文件中的分隔符;
将所述源文件中的数据按照分隔符所在的位置进行拆分,得到拆分后的多个数据。
3.根据权利要求1所述的处理方法,其特征在于,所述按照预设的校验规则校验所述多个数据,得到校验结果,包括:
获取所述多个数据中每个数据的字符长度;
判断所述多个数据中每个数据的字符长度是否大于所述预设字符长度;
将所述多个数据中字符长度小于等于预设字符长度的目标数据确定为校验结果。
4.根据权利要求3所述的处理方法,其特征在于,所述目标条件包括数据的字段值满足正则规则;所述将满足目标条件的校验结果对应的数据存入数据库,包括:
获取所述目标数据的字段值;
将所述目标数据的字段值满足正则表达式的目标数据存入所述数据库。
5.一种文件处理装置,其特征在于,包括:
获取模块,用于获取待处理的源文件,所述源文件中包括所述源文件的文件类型;
拆分模块,用于在所述源文件的文件类型与预设的文件类型一致的情况下,按照预设的拆分方式拆分所述源文件中的数据,得到拆分后的多个数据;
校验模块,用于按照预设的校验规则校验所述多个数据,得到校验结果;
存储模块,用于将满足目标条件的校验结果对应的数据存入数据库。
6.根据权利要求5所述的处理装置,其特征在于,所述预设的拆分方式包括按照分隔符拆分;所述拆分模块按照预设的拆分方式对所述源文件进行拆分,得到拆分后的多个数据,包括:
获取模块,还用于逐行读取所述源文件的文件内容,获取所述源文件中的分隔符;
拆分模块,还用于将所述源文件中的数据按照分隔符所在的位置进行拆分,得到拆分后的多个数据。
7.根据权利要求5所述的处理装置,其特征在于,所述校验模块按照预设的校验规则校验所述多个数据,得到校验结果,包括:
获取模块,还用于获取所述多个数据中每个数据的字符长度;
判断模块,用于判断所述多个数据中每个数据的字符长度是否大于所述预设字符长度;
确定模块,用于将所述多个数据中字符长度小于等于预设字符长度的目标数据确定为校验结果。
8.根据权利要求7所述的处理装置,其特征在于,所述目标条件包括数据的字段值满足正则规则;所述存储模块将满足目标条件的校验结果对应的数据存入数据库,包括:
获取模块,还用于获取所述目标数据的字段值;
存储模块,还用于将所述目标数据的字段值满足正则表达式的目标数据存入所述数据库。
9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-4任意一项所述的文件处理方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-4任意一项所述的文件处理方法。
CN202310007466.3A 2023-01-04 2023-01-04 文件处理方法、装置、设备及计算机存储介质 Pending CN115905145A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310007466.3A CN115905145A (zh) 2023-01-04 2023-01-04 文件处理方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310007466.3A CN115905145A (zh) 2023-01-04 2023-01-04 文件处理方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN115905145A true CN115905145A (zh) 2023-04-04

Family

ID=86484770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310007466.3A Pending CN115905145A (zh) 2023-01-04 2023-01-04 文件处理方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN115905145A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644035A (zh) * 2023-07-21 2023-08-25 中邮消费金融有限公司 文件批量入库方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644035A (zh) * 2023-07-21 2023-08-25 中邮消费金融有限公司 文件批量入库方法、装置、设备及存储介质
CN116644035B (zh) * 2023-07-21 2024-01-26 中邮消费金融有限公司 文件批量入库方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111339151B (zh) 在线考试方法、装置、设备及计算机存储介质
CN112286827B (zh) 一种软件测试方法、设备、电子设备及存储介质
CN115905145A (zh) 文件处理方法、装置、设备及计算机存储介质
CN111339211A (zh) 网络问题分析的方法、装置、设备及介质
CN116069751A (zh) 信息处理方法、装置、设备及计算机可读存储介质
CN115913625A (zh) 信息处理方法、装置、设备、介质及产品
CN115186741A (zh) 一种兴趣点poi融合数据验证的方法、装置及设备
CN114417830A (zh) 风险评价方法、装置、设备及计算机可读存储介质
CN114549159A (zh) 信息配置方法、装置、设备、介质及产品
CN113886131B (zh) 数据检核方法、装置、设备及存储介质
CN114637795A (zh) 报表处理方法、装置、设备、介质及产品
CN118227650A (zh) 数据处理方法、装置、设备、介质及产品
CN118672607A (zh) 组件部署方法、装置、设备、介质及产品
CN115499399A (zh) 一种重复提交请求的处理方法、装置、设备及存储介质
CN114066598A (zh) 信用评级方法、装置、设备及计算机可读存储介质
CN114693417A (zh) 计息自动化数据处理方法、装置、设备及计算机存储介质
CN115456744A (zh) 一种评级调整方法、装置、电子设备及计算机存储介质
CN115344857A (zh) 结果确定方法、装置、设备及存储介质
CN116932345A (zh) 用户操作行为的检测方法和装置
CN118733619A (zh) 信息处理方法、系统、装置和电子设备
CN118132655A (zh) 信息同步方法、装置、设备、存储介质及程序产品
CN115168386A (zh) 一种知识产权数据更新方法、装置、系统以及计算机设备
CN114676290A (zh) 异常群组识别方法及其装置、设备、可读存储介质、产品
CN114579627A (zh) 报文处理方法、装置、设备及计算机存储介质
CN116303337A (zh) 数据迁移的方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination