CN111427899A - 存储文件的方法、装置、设备和计算机可读介质 - Google Patents

存储文件的方法、装置、设备和计算机可读介质 Download PDF

Info

Publication number
CN111427899A
CN111427899A CN202010187109.6A CN202010187109A CN111427899A CN 111427899 A CN111427899 A CN 111427899A CN 202010187109 A CN202010187109 A CN 202010187109A CN 111427899 A CN111427899 A CN 111427899A
Authority
CN
China
Prior art keywords
file
record
program object
persistence
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010187109.6A
Other languages
English (en)
Inventor
任林涛
黄文宝
刘波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202010187109.6A priority Critical patent/CN111427899A/zh
Publication of CN111427899A publication Critical patent/CN111427899A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了存储文件的方法、装置、设备和计算机可读介质,涉及计算机技术领域。该方法的一具体实施方式包括:基于处理文件的编号,获得文件解析策略和持久化策略;按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录;依据所述文件的格式记录,将所述文件转换为程序对象;根据所述持久化策略启动预设数量线程,将所述程序对象进行数据库持久化。该实施方式能够存储多种文件格式的文件。

Description

存储文件的方法、装置、设备和计算机可读介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种存储文件的方法、装置、设备和计算机可读介质。
背景技术
文件存储是一种数据存储方式。若以文件存储的方式保存较为复杂的文件,则可以按照预设文件格式存储文件。基于预设文件格式,解析后进而将文件持久化到数据库中。持久化是指将文件解析生成的数据对象后,在数据库中持久化存储。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:一旦出现文件格式的调整,则已有解析文件和持久化的方式不再适用,存在以下技术问题:无法存储多种文件格式的文件。
发明内容
有鉴于此,本发明实施例提供一种存储文件的方法、装置、设备和计算机可读介质,能够存储多种文件格式的文件。
为实现上述目的,根据本发明实施例的一个方面,提供了一种存储文件的方法,包括:
基于处理文件的编号,获得文件解析策略和持久化策略;
按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录;
依据所述文件的格式记录,将所述文件转换为程序对象;
根据所述持久化策略启动预设数量线程,将所述程序对象进行数据库持久化。
所述基于处理文件的编号,获得文件解析策略和持久化策略之前,包括:
预设文件解析策略、持久化策略与处理文件的编号之间的对应关系。
所述按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录,包括:
按照所述文件解析策略中所述文件的段落标识符,获知文件行信息列表和所述文件的行记录,所述文件行信息列表为空。
所述依据所述文件的格式记录,将所述文件转换为程序对象,包括:
依据所述文件的行记录,将所述文件转换为程序对象。
所述按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录,包括:
按照所述文件解析策略中所述文件的段落标识符,获知文件行信息列表和所述文件的行记录,所述文件行信息列表包括行信息;
利用所述文件中字段间字符标识符解析所述行信息,获知所述行记录的字段信息。
所述依据所述文件的格式记录,将所述文件转换为程序对象,包括:
依据所述文件的行记录,将所述文件转换为程序对象;
基于所述行记录的字段信息,将所述字段信息赋值到所述程序对象中的字段中。
所述基于所述行记录的字段信息,将所述字段信息赋值到所述程序对象中的字段中,包括:
基于所述行记录的字段信息,结合所述文件解析策略中字段信息与程序对象的类的字段的映射关系,将所述字段信息赋值到所述程序对象中的字段中。
所述依据所述文件的格式记录,将所述文件转换为程序对象,包括:
依据所述文件的格式记录和所述文件解析策略,确定所述文件的格式记录对应程序对象的类;
根据所述程序对象的类,生成所述程序对象的类的实体对象列表;
按照所述实体对象列表,反馈所述程序对象。
所述依据所述文件的格式记录和所述文件解析策略,确定所述文件的格式记录对应程序对象的类,包括:
依据所述文件的行记录和所述文件解析策略,确定所述文件的格式记录对应程序对象的类。
所述根据所述持久化策略启动预设数量线程,将所述程序对象进行数据库持久化,包括:
根据所述持久化策略启动预设数量异步线程,将所述程序对象进行数据库持久化。
所述启动预设数量线程,将所述程序对象进行数据库持久化之后,还包括:
持久化的记录数超过预设记录阈值,则向数据库提交事务。
所述预设记录阈值是所述持久化策略中的预先设置参数。
根据本发明实施例的第二方面,提供了一种存储文件的装置,包括:
策略模块,用于基于处理文件的编号,获得文件解析策略和持久化策略;
文件模块,用于按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录;
转换模块,用于依据所述文件的格式记录,将所述文件转换为程序对象;
存储模块,用于根据所述持久化策略启动预设数量线程,将所述程序对象进行数据库持久化。
根据本发明实施例的第三方面,提供了一种存储文件的电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的方法。
根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的方法。
上述发明中的一个实施例具有如下优点或有益效果:基于处理文件的编号,获得文件解析策略和持久化策略;按照文件解析策略中文件的格式标识符,获知文件的格式记录;依据文件的格式记录,将文件转换为程序对象;根据持久化策略启动预设数量线程,将程序对象进行数据库持久化。由于依据文件的格式记录,将文件转换为程序对象。文件的格式记录对应于不同文件格式,因此能够存储多种文件格式的文件。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的存储文件的方法的主要流程的示意图;
图2是根据本发明实施例的获知文件的格式记录的流程示意图;
图3是根据本发明实施例的将文件转换为程序对象的流程示意图;
图4是根据本发明实施例的存储文件的方法的应用场景示意图;
图5是根据本发明实施例的解析文件的流程示意图;
图6是根据本发明实施例的数据库持久化的流程示意图;
图7是根据本发明实施例的存储文件的装置的主要结构的示意图;
图8是本发明实施例可以应用于其中的示例性系统架构图;
图9是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
为了存储文件,持久化技术被广泛应用于各种程序设计的领域当中。通过解析特定格式文件,进而持久化到数据库。
一旦文件格式发生调整,需要重新设置解析文件和持久化的方式,存在重复开发工作。其中,文件格式调整是指在文件记录中新增字段,修改字段,或者调整多个段落之间的顺序等。因此存在无法存储多种文件格式的文件的技术问题。
为了解决无法存储多种文件格式的文件的技术问题,可以采用以下本发明实施例中的技术方案。
参见图1,图1是根据本发明实施例的存储文件的方法主要流程的示意图,按照文件中的格式标识符所获知文件的格式记录,可以将文件转换为程序对象以进行数据库持久化。如图1所示,具体包括以下步骤:
S101、基于处理文件的编号,获得文件解析策略和持久化策略。
对于每个文件而言均有对应的编号,即处理文件的编号。处理文件的编号与文件解析策略和持久化策略相对应。
在本发明的一个实施例中,可以预设文件解析策略、持久化策略与处理文件的编号之间的对应关系。可以理解的是,对于每个处理文件的编号,均存在对应的文件解析策略和持久化策略。
在本发明实施例中存储文件具体涉及两个部分,一部分是解析文件;另一部分是数据库持久化。可以采用文件解析策略解析文件,以及采用持久化策略进行数据库持久化。
在本发明实施例中,文件解析策略记载文件中的格式。持久化策略记载进行数据库持久化涉及的参数。
对于每个文件均可以按照处理文件的编号,获得文件解析策略和持久化策略。
S102、按照文件解析策略中文件的格式标识符,获知文件的格式记录。
文件解析策略中记载文件中的格式,那么可以按照文件解析策略解析文件。具体来说,按照文件解析策略中文件的格式标识符,获知文件的格式记录。
文件中包括多个字段,多个字段组成段落。文件的格式标识符包括段落标识符和字符标识符。以文件的段落标识符分隔段落,以文件的字符标识符分割字符。可以理解的是,即使两个文件的字符均相同,但文件的格式标识符不同,则两个文件也是不同的。
文件的格式记录是记载文件格式的内容。文件的格式记录包括文件中所有格式标识符的位置,即文件的格式记录是文件所有格式标识符的集合。通过文件的格式记录可以获知文件的文件格式。
在本发明的一个实施例中,可以理解的是,文件中的格式标识符包括段落标识符,或段落标识符和字符标识符。按照文件解析策略中文件的段落标识符,获知文件的行记录。
在格式标识符仅包括段落标识符的情况下,也就是说文件的段落发生变化,文件的字符并未发生变化。即,按照文件解析策略中文件的段落标识符,获知文件行信息列表和文件的行记录,文件行信息列表为空。可以按照文件解析策略中文件的段落标识符,获知文件的行记录。
在本发明的另一个实施例中,在格式标识符即包括段落标识符也包括字符标识符的情况下,可以按照以下方式获知文件的格式记录。
参见图2,图2是根据本发明实施例的获知文件的格式记录的流程示意图,具体包括:
S201、按照文件解析策略中文件的段落标识符,获知文件行信息列表和文件的行记录,文件行信息列表包括行信息。
首先,按照文件解析策略中文件的段落标识符,可以获知文件的行记录。此外,还可以获知文件行信息列表。文件行信息列表包括文件中行信息。行信息即包括字符标识符的行所涉及的信息。可以理解的是,若文件中的一行字符间并不包括字符标识符,则在文件行信息列表中并没有该行的行信息;若在文件的一行字符间包括字符标识符,则在文件行信息列表中包括该行的行信息。
S202、利用文件中字段间字符标识符解析行信息,获知行记录的字段信息。
文件行信息列表包括行信息,则说明需要解析行信息;相应的,文件行信息列表为空,则不包括行信息,则说明无需解析行信息。
在确定文件行信息列表包括行信息的情况下,则说明该行存在字符标识符。利用文件中字段间字符标识符解析行信息,获知行记录的字段信息。
在图2的实施例中,格式标识符即包括段落标识符也包括字符标识符的情况下,文件的格式记录不仅包括文件的行记录,还包括行记录的字段信息。也就是说,文件中的段落所涉及文件格式发生变化,文件中的字段所涉及文件格式也发生变化。
S103、依据文件的格式记录,将文件转换为程序对象。
在本发明实施例中,程序对象是由文件的格式记录转化成的格式化的存在程序内存空间的信息。具体来说,可以依据文件的格式记录,将文件转换为程序对象。
参见图3,图3是根据本发明实施例的将文件转换为程序对象的流程示意图,具体包括以下步骤:
S301、依据文件的格式记录和文件解析策略,确定文件的格式记录对应程序对象的类。
在文件解析策略中包括文件的格式记录与程序对象的类的对应关系,依据文件的格式记录和文件解析策略,通过上述对应关系,就能够确定文件的格式记录对应程序对象的类。
在本发明的一个实施例中,文件的格式记录包括文件的行记录,那么可以依据文件的行记录和文件解析策略,确定文件的格式记录对应程序对象的类。
S302、根据程序对象的类,生成程序对象的类的实体对象列表。
对于每一类而言,可以根据程序对象的类,生成程序对象的类的实体对象列表。可以理解的是,实体对象列表涉及多个实体对象。
S303、按照实体对象列表反馈程序对象。
需要输出程序对象,因此可以按照实体对象列表反馈程序对象。
在图3的实施例中,在确定文件的格式记录对应程序对象的类的基础上,进一步按照所生成实体对象列表,反馈程序对象。
在本发明的一个实施例中,在格式标识符仅包括段落标识符的情况下,可以依据文件的行记录,将文件转换为程序对象。具体来说,格式标识符仅包括段落标识符,说明文件的格式记录发生变化,文件的字符并未发生变化。那么,就可以依据文件的行记录,将文件转换为程序对象。
在本发明的一个实施例中,在格式标识符包括段落标识符和字符标识符的情况下,首先,依据文件的行记录,将文件转换为程序对象。然后,基于行记录的字段信息,将字段信息赋值到程序对象中的字段中。
作为一个示例,基于行记录的字段信息,结合文件解析策略中字段信息与程序对象的类的字段的映射关系,将字段信息赋值到程序对象中的字段中。
S104、根据持久化策略启动预设数量线程,将程序对象进行数据库持久化。
持久化策略中包括启动线程的数量,即预设数量。根据持久化策略启动预设数量线程,将程序对象进行数据库持久化。
数据库持久化是将就是将内存中的瞬时数据保存到数据库中,保证即使在设备关机的情况下,防止数据丢失。这样因为,保存在内存中的数据是处于瞬时状态的,而保存在数据库中的数据是处于持久状态的。
在本发明的一个实施例中,根据持久化策略启动预设数量异步线程,将程序对象进行数据库持久化。
对于持久化的数据比较多的情况,可配置多个线程进行异步处理,从而提高持久化的效率。异步处理机制是用于处理的文件较大时,在资源允许的情况下,更高效地持久化文件。其中,资源包括服务器的CPU资源和内存资源等。异步线程数量可根据实际业务场景中被处理文件的大小和资源情况预先在持久化策略设置。
在本发明的一个实施例中,持久化的记录数超过预设记录阈值,则向数据库提交事务。在本发明实施例中,事务是指数据库事务。事务作为单个逻辑工作单元执行的一系列操作,要么完全地执行,要么完全地不执行。
从非功能角度来看,如事务较大,在持久化中如有报错回滚的操作,会占用较多的数据库资源,为此需考虑用较小事务。从业务场景的功能角度来看,文件中所有记录的持久化是否需要作为一个数据库事务提交的原子动作,并根据预估的文件记录数来确定事务大小。基于上述两个角度来决定在具体业务场景中的记录阈值。可以理解的是,记录阈值是持久化策略中的预先设置参数。
在上述本发明的实施例中,基于处理文件的编号,获得文件解析策略和持久化策略;按照文件解析策略中文件的格式标识符,获知文件的格式记录;依据文件的格式记录,将文件转换为程序对象;根据持久化策略启动预设数量线程,将程序对象进行数据库持久化。由于依据文件的格式记录,将文件转换为程序对象。文件的格式记录对应于不同文件格式,因此能够存储多种文件格式的文件。
参见图4,图4是根据本发明实施例的存储文件的方法的应用场景示意图。
其中,调用者可以向调度框架发送处理文件的编号。调度框架转发调用者发送的处理文件的编号至解析器。解析器根据处理文件的编号查询配置文件,获得文件解析策略和持久化策略。将文件解析策略和持久化策略通过处理器发送至调度框架。
调度框架将文件解析策略发送至文件解析处理器以将文件转换为程序对象。调度框架将持久化策略发送至持久化处理器以将上述程序对象进行数据库持久化。
参见图5,图5是根据本发明实施例的解析文件的流程示意图,具体包括以下步骤:
S501、基于处理文件的编号,获得文件解析策略和持久化策略。
按照处理文件的标号,可以从配置文件中获取文件解析策略和持久化策略。
S502、按照文件解析策略读取文件。
文件解析策略中记载文件中的格式,可以按照文件解析策略读取文件。
作为一个示例,文件解析策略可以包括以下内容:
(1)文件中各记录之间的段落标识符。
(2)记录中字段之间字符标识符。
(3)文件中每个行记录对应的程序对象的类。即,文件的行记录与程序对象的类的对应关系。
(4)文件记录的字段信息与程序对象的类的字段的映射关系。需要说明的是,转换后类的字段类型为非字符串类型,需要指定类型转换处理器。
S503、是否包括段落标识符。
判断文件中是否包括段落标识符,文件中包括段落标识符,则执行S504;文件中未包括段落标识符,则结束。
S504、获知文件的行记录和文件行信息列表。
按照文件解析策略中文件的段落标识符,获知文件行信息列表和文件的行记录。
S505、判断文件行信息列表是否为空。
判断文件行信息列表是否为空,文件行信息列表为空,说明文件中并不包括字符标识符;文件行信息列表不为空,说明文件中包括字符标识符。
在文件行信息列表为空的情况下,执行S510;在文件行信息列表不为空的情况下,执行S506。
S506、依次获取行信息。
在文件行信息列表不为空的情况下,可以依次获取每个行信息。
S507、利用字段间字符标识符解析行信息,获知行记录的字段信息。
可以利用字段间字符标识符解析行信息,获知行记录的字段信息。
S508、依据文件的行记录,将文件转换为程序对象。
再依据文件的行记路,将文件转换为程序对象。
S509、基于行记录的字段信息,将字段信息赋值到程序对象中的字段中。
对于行记录的字段信息,可以将上述字段信息赋值到程序对象中的字段中。
S510、确定文件的行记录对应程序对象的类。
可以基于文件解析策略中文件的行记录与程序对象的类的对应关系,确定文件的行记录对应程序对象的类。
S511、反馈程序对象。
反馈程序对象,以进行数据库持久化。
参见图6,图6是根据本发明实施例的数据库持久化的流程示意图,具体包括:
S601、基于处理文件的编号,获得文件解析策略和持久化策略。
按照处理文件的标号,可以从配置文件中获取文件解析策略和持久化策略。
S602、根据持久化策略启动异步线程。
可以根据持久化策略启动异步线程。
作为一个示例,持久化策略包括以下信息:
(1)异步线程数量。
为了更更高效地持久化文件,预设异步线程数量。异步线程数量可根据实际业务场景中被处理文件的大小和资源情况设置。
(2)单事务中处理的记录阈值。在具体业务场景中,预先设置单事务中处理的记录阈值。
(3)数据库表名。
(4)程序对象的类的字段与数据库表中字段的映射关系。
S603、每个异步线程执行持久化操作。
对于每个异步线程,可以分别执行持久化操作。
参见图7,图7是根据本发明实施例的存储文件的装置的主要结构的示意图,存储文件的装置可以实现存储文件的方法,如图7所示,存储文件的装置具体包括:
策略模块701,用于基于处理文件的编号,获得文件解析策略和持久化策略.
文件模块702,用于按照文件解析策略中文件的格式标识符,获知文件的格式记录。
转换模块703,用于依据文件的格式记录,将文件转换为程序对象。
存储模块704,用于根据持久化策略启动预设数量线程,将程序对象进行数据库持久化。
在本发明的一个实施例中,策略模块701,具体用于预设文件解析策略、持久化策略与处理文件的编号之间的对应关系。
在本发明的一个实施例中,文件模块702,具体用于按照文件解析策略中文件的段落标识符,获知文件行信息列表和文件的行记录,文件行信息列表为空。
在本发明的一个实施例中,文件模块702,具体用于依据文件的行记录,将文件转换为程序对象。
在本发明的一个实施例中,文件模块702,具体用于按照文件解析策略中文件的段落标识符,获知文件行信息列表和文件的行记录,文件行信息列表包括行信息;
利用文件中字段间字符标识符解析行信息,获知行记录的字段信息。
在本发明的一个实施例中,文件模块702,具体用于依据文件的行记录,将文件转换为程序对象;
基于行记录的字段信息,将字段信息赋值到程序对象中的字段中。
在本发明的一个实施例中,文件模块702,具体用于基于行记录的字段信息,结合文件解析策略中字段信息与程序对象的类的字段的映射关系,将字段信息赋值到程序对象中的字段中。
在本发明的一个实施例中,转换模块703,具体用于依据文件的格式记录和文件解析策略,确定文件的格式记录对应程序对象的类;
根据程序对象的类,生成程序对象的类的实体对象列表;
按照实体对象列表,反馈程序对象。
在本发明的一个实施例中,转换模块703,具体用于依据文件的行记录和文件解析策略,确定文件的格式记录对应程序对象的类。
在本发明的一个实施例中,存储模块704,具体用于根据持久化策略启动预设数量异步线程,将程序对象进行数据库持久化。
在本发明的一个实施例中,存储模块704,具体用于持久化的记录数超过预设记录阈值,则向数据库提交事务。
在本发明的一个实施例中,预设记录阈值是持久化策略中的预先设置参数。
图8示出了可以应用本发明实施例的存储文件的方法或存储文件的装置的示例性系统架构800。
如图8所示,系统架构800可以包括终端设备801、802、803,网络804和服务器805。网络804用以在终端设备801、802、803和服务器805之间提供通信链路的介质。网络804可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备801、802、803通过网络804与服务器805交互,以接收或发送消息等。终端设备801、802、803上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备801、802、803可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器805可以是提供各种服务的服务器,例如对用户利用终端设备801、802、803所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的存储文件的方法一般由服务器805执行,相应地,存储文件的装置一般设置于服务器805中。
应该理解,图8中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图9,其示出了适于用来实现本发明实施例的终端设备的计算机系统900的结构示意图。图9示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统900包括中央处理单元(CPU)901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有系统900操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
基于处理文件的编号,获得文件解析策略和持久化策略;
按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录;
依据所述文件的格式记录,将所述文件转换为程序对象;
根据所述持久化策略启动预设数量线程,将所述程序对象进行数据库持久化。
根据本发明实施例的技术方案,基于处理文件的编号,获得文件解析策略和持久化策略;按照文件解析策略中文件的格式标识符,获知文件的格式记录;依据文件的格式记录,将文件转换为程序对象;根据持久化策略启动预设数量线程,将程序对象进行数据库持久化。由于依据文件的格式记录,将文件转换为程序对象。文件的格式记录对应于不同文件格式,因此能够存储多种文件格式的文件。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (15)

1.一种存储文件的方法,其特征在于,包括:
基于处理文件的编号,获得文件解析策略和持久化策略;
按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录;
依据所述文件的格式记录,将所述文件转换为程序对象;
根据所述持久化策略启动预设数量线程,将所述程序对象进行数据库持久化。
2.根据权利要求1所述存储文件的方法,其特征在于,所述基于处理文件的编号,获得文件解析策略和持久化策略之前,包括:
预设文件解析策略、持久化策略与处理文件的编号之间的对应关系。
3.根据权利要求1所述存储文件的方法,其特征在于,所述按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录,包括:
按照所述文件解析策略中所述文件的段落标识符,获知文件行信息列表和所述文件的行记录,所述文件行信息列表为空。
4.根据权利要求3所述存储文件的方法,其特征在于,所述依据所述文件的格式记录,将所述文件转换为程序对象,包括:
依据所述文件的行记录,将所述文件转换为程序对象。
5.根据权利要求1所述存储文件的方法,其特征在于,所述按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录,包括:
按照所述文件解析策略中所述文件的段落标识符,获知文件行信息列表和所述文件的行记录,所述文件行信息列表包括行信息;
利用所述文件中字段间字符标识符解析所述行信息,获知所述行记录的字段信息。
6.根据权利要求5所述存储文件的方法,其特征在于,所述依据所述文件的格式记录,将所述文件转换为程序对象,包括:
依据所述文件的行记录,将所述文件转换为程序对象;
基于所述行记录的字段信息,将所述字段信息赋值到所述程序对象中的字段中。
7.根据权利要求6所述存储文件的方法,其特征在于,所述基于所述行记录的字段信息,将所述字段信息赋值到所述程序对象中的字段中,包括:
基于所述行记录的字段信息,结合所述文件解析策略中字段信息与程序对象的类的字段的映射关系,将所述字段信息赋值到所述程序对象中的字段中。
8.根据权利要求1所述存储文件的方法,其特征在于,所述依据所述文件的格式记录,将所述文件转换为程序对象,包括:
依据所述文件的格式记录和所述文件解析策略,确定所述文件的格式记录对应程序对象的类;
根据所述程序对象的类,生成所述程序对象的类的实体对象列表;
按照所述实体对象列表,反馈所述程序对象。
9.根据权利要求8所述存储文件的方法,其特征在于,所述依据所述文件的格式记录和所述文件解析策略,确定所述文件的格式记录对应程序对象的类,包括:
依据所述文件的行记录和所述文件解析策略,确定所述文件的格式记录对应程序对象的类。
10.根据权利要求1所述存储文件的方法,其特征在于,所述根据所述持久化策略启动预设数量线程,将所述程序对象进行数据库持久化,包括:
根据所述持久化策略启动预设数量异步线程,将所述程序对象进行数据库持久化。
11.根据权利要求1所述存储文件的方法,其特征在于,所述启动预设数量线程,将所述程序对象进行数据库持久化之后,还包括:
持久化的记录数超过预设记录阈值,则向数据库提交事务。
12.根据权利要求11所述存储文件的方法,其特征在于,所述预设记录阈值是所述持久化策略中的预先设置参数。
13.一种存储文件的装置,其特征在于,包括:
策略模块,用于基于处理文件的编号,获得文件解析策略和持久化策略;
文件模块,用于按照所述文件解析策略中所述文件的格式标识符,获知所述文件的格式记录;
转换模块,用于依据所述文件的格式记录,将所述文件转换为程序对象;
存储模块,用于根据所述持久化策略启动预设数量线程,将所述程序对象进行数据库持久化。
14.一种存储文件的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的方法。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-12中任一所述的方法。
CN202010187109.6A 2020-03-17 2020-03-17 存储文件的方法、装置、设备和计算机可读介质 Pending CN111427899A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010187109.6A CN111427899A (zh) 2020-03-17 2020-03-17 存储文件的方法、装置、设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010187109.6A CN111427899A (zh) 2020-03-17 2020-03-17 存储文件的方法、装置、设备和计算机可读介质

Publications (1)

Publication Number Publication Date
CN111427899A true CN111427899A (zh) 2020-07-17

Family

ID=71553593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010187109.6A Pending CN111427899A (zh) 2020-03-17 2020-03-17 存储文件的方法、装置、设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN111427899A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112051999A (zh) * 2020-09-03 2020-12-08 中国银行股份有限公司 配置化的下载文件生成方法及装置
CN113590554A (zh) * 2021-08-10 2021-11-02 中国工商银行股份有限公司 文件处理方法、装置、电子设备和存储介质
CN113645287A (zh) * 2021-07-29 2021-11-12 腾讯科技(深圳)有限公司 汽车报文存储方法及装置、汽车报文存储系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6154748A (en) * 1998-04-07 2000-11-28 International Business Machines Corporation Method for visually mapping data between different record formats
US20140143753A1 (en) * 2012-11-20 2014-05-22 International Business Machines Corporation Policy to source code conversion
CN106126224A (zh) * 2016-06-21 2016-11-16 浪潮软件集团有限公司 一种生成程序对象的工具、系统和方法
CN107341135A (zh) * 2017-05-24 2017-11-10 中国科学院信息工程研究所 一种面向通用文本格式的解析方法及工具
CN107784049A (zh) * 2016-12-05 2018-03-09 上海壹账通金融科技有限公司 多格式文件解析的方法和装置
CN108255494A (zh) * 2018-01-30 2018-07-06 平安科技(深圳)有限公司 一种xml文件解析方法、装置、计算机设备及存储介质
CN109284179A (zh) * 2018-08-07 2019-01-29 北京达佳互联信息技术有限公司 解决应用程序卡顿的方法、装置、电子设备及存储介质
CN110377563A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 文件处理方法和装置、以及电子设备和可读存储介质
CN110399089A (zh) * 2018-04-19 2019-11-01 阿里巴巴集团控股有限公司 数据存储方法、装置、设备和介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6154748A (en) * 1998-04-07 2000-11-28 International Business Machines Corporation Method for visually mapping data between different record formats
US20140143753A1 (en) * 2012-11-20 2014-05-22 International Business Machines Corporation Policy to source code conversion
CN106126224A (zh) * 2016-06-21 2016-11-16 浪潮软件集团有限公司 一种生成程序对象的工具、系统和方法
CN107784049A (zh) * 2016-12-05 2018-03-09 上海壹账通金融科技有限公司 多格式文件解析的方法和装置
CN107341135A (zh) * 2017-05-24 2017-11-10 中国科学院信息工程研究所 一种面向通用文本格式的解析方法及工具
CN108255494A (zh) * 2018-01-30 2018-07-06 平安科技(深圳)有限公司 一种xml文件解析方法、装置、计算机设备及存储介质
CN110399089A (zh) * 2018-04-19 2019-11-01 阿里巴巴集团控股有限公司 数据存储方法、装置、设备和介质
CN109284179A (zh) * 2018-08-07 2019-01-29 北京达佳互联信息技术有限公司 解决应用程序卡顿的方法、装置、电子设备及存储介质
CN110377563A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 文件处理方法和装置、以及电子设备和可读存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112051999A (zh) * 2020-09-03 2020-12-08 中国银行股份有限公司 配置化的下载文件生成方法及装置
CN112051999B (zh) * 2020-09-03 2024-04-19 中国银行股份有限公司 配置化的下载文件生成方法及装置
CN113645287A (zh) * 2021-07-29 2021-11-12 腾讯科技(深圳)有限公司 汽车报文存储方法及装置、汽车报文存储系统
CN113645287B (zh) * 2021-07-29 2022-09-20 腾讯科技(深圳)有限公司 汽车报文存储方法及装置、汽车报文存储系统
CN113590554A (zh) * 2021-08-10 2021-11-02 中国工商银行股份有限公司 文件处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN111190888A (zh) 一种管理图数据库集群的方法和装置
CN107491382B (zh) 日志输出方法和装置
CN112527649A (zh) 一种测试用例的生成方法和装置
CN111427899A (zh) 存储文件的方法、装置、设备和计算机可读介质
CN113076153B (zh) 一种接口调用方法和装置
CN111478781B (zh) 一种消息广播的方法和装置
CN108959294B (zh) 一种访问搜索引擎的方法和装置
CN111241189A (zh) 一种同步数据的方法和装置
CN112084042A (zh) 一种消息处理的方法和装置
CN111831536A (zh) 一种自动化测试方法和装置
US9679262B2 (en) Image index routing
CN112149392A (zh) 一种富文本编辑方法和装置
CN113761433B (zh) 业务处理方法和装置
CN111698109A (zh) 监控日志的方法和装置
CN112069771B (zh) 一种用于解析pdf文件中的图片的方法及装置
CN114125066B (zh) 一种处理业务请求的方法和装置
CN113779018A (zh) 一种数据处理方法和装置
CN112688982B (zh) 一种用户请求处理方法和装置
CN113407339A (zh) 资源请求反馈方法、装置、可读存储介质及电子设备
CN113779122A (zh) 导出数据的方法和装置
CN113448652A (zh) 一种请求处理方法和装置
CN110858240A (zh) 一种前端模块加载方法和装置
CN113704222A (zh) 一种处理业务请求的方法和装置
CN112784195A (zh) 一种页面数据发布方法和系统
CN113347052A (zh) 通过访问日志统计用户访问数据的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220923

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.

TA01 Transfer of patent application right