CN114036187A - 文件获取方法、装置、计算机设备和存储介质 - Google Patents

文件获取方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114036187A
CN114036187A CN202111393958.8A CN202111393958A CN114036187A CN 114036187 A CN114036187 A CN 114036187A CN 202111393958 A CN202111393958 A CN 202111393958A CN 114036187 A CN114036187 A CN 114036187A
Authority
CN
China
Prior art keywords
file
template
acquiring
code
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111393958.8A
Other languages
English (en)
Inventor
高浪
刘鹤敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China General Nuclear Power Corp
China Nuclear Power Engineering Co Ltd
CGN Power Co Ltd
Shenzhen China Guangdong Nuclear Engineering Design Co Ltd
Original Assignee
China General Nuclear Power Corp
China Nuclear Power Engineering Co Ltd
CGN Power Co Ltd
Shenzhen China Guangdong Nuclear Engineering Design Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China General Nuclear Power Corp, China Nuclear Power Engineering Co Ltd, CGN Power Co Ltd, Shenzhen China Guangdong Nuclear Engineering Design Co Ltd filed Critical China General Nuclear Power Corp
Priority to CN202111393958.8A priority Critical patent/CN114036187A/zh
Publication of CN114036187A publication Critical patent/CN114036187A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/122File system administration, e.g. details of archiving or snapshots using management policies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种文件获取方法、装置、计算机设备和存储介质。所述方法包括:接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取文件编码所属类别,获取文件编码所属类别映射到的文件调度时间;基于文件调用请求获取目标模板集合,按照文件调用请求选取模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;应用文件调度时间、项目标识与文件编码填充目标模板,得到文件管理信息;在文件调取时间,遵循对应关系,按照项目获取对应的待提取文件。采用本方法,使各项目所需的文件编码数据重组,更高效率地获取到分散的文件,降低重复文件的获取次数,实现高效且精细化管理。

Description

文件获取方法、装置、计算机设备和存储介质
技术领域
本申请涉及文件获取技术领域,特别是涉及一种文件获取方法、装置、计算机设备和存储介质。
背景技术
随着项目数量与专业数量的增多,针对不同项目、相同专业间都有个性化的文件获取需求,这些需求中,有些是固定模式,固定模板、固定参数等标准化数据,有些是个性化数据。为了避免个性化的数据无限扩大,减少设计人员和需求管理人员的工作量,需要进行标准化的归类和处理,将一些具有普遍性、代表性、相似性的需求合并诚一条标准化需求,做到统一管控,减少个性化需求的数量,同时也要做到标准化需求针对不同项目也有不同的计划时间要求,
在传统技术中,主要着眼于宏观层面,将不同的数据存入不同的数据库,构建不同身份操作不同数据库中的数据,避免提资时的数据误操作和混乱。
然而,在目前的传统方法中,当需要获取的文件数量达到一个新的量级时,此时需要更有效的方式进行管控,无法解决复杂、多项目的需求统一管理,设计人员和管理人员的工作量高居不下,无法做到需求的批量策划和精细化管理。
发明内容
基于此,有必要针对上述技术问题,提供一种能够精细化控制进行的文件获取方法、装置、计算机设备和存储介质。
一种文件获取方法,所述方法包括:
接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间;
基于所述文件调用请求获取目标模板集合,按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;
应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,所述文件管理信息用于指示所述文件调度时间、项目标识与待提取文件的对应关系;
在所述文件调取时间,遵循所述对应关系,按照所述项目标识获取对应的待提取文件。
一种文件获取装置,所述装置包括:
获取时间确定模块,用于接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间;
模板获取模块,用于基于所述文件调用请求获取目标模板集合,按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;
对应关系确定模块,用于应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,所述文件管理信息用于指示所述文件调度时间、项目与待提取文件的对应关系;
文件提取模块,用于在所述文件调取时间,遵循所述对应关系,按照所述项目获取对应的待提取文件。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间;
基于所述文件调用请求获取目标模板集合,按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;
应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,所述文件管理信息用于指示所述文件调度时间、项目标识与待提取文件的对应关系;
在所述文件调取时间,遵循所述对应关系,按照所述项目标识获取对应的待提取文件。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间;
基于所述文件调用请求获取目标模板集合,按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;
应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,所述文件管理信息用于指示所述文件调度时间、项目标识与待提取文件的对应关系;
在所述文件调取时间,遵循所述对应关系,按照所述项目标识获取对应的待提取文件。
上述文件获取方法、装置、计算机设备和存储介质,待提取文件类别,确定待提取文件的调度时间,使各项目所需的文件编码数据重组,使分散的数据聚合成具体的类别,降低了获取文件的时间,提高了相关效率;而通过选择模板集合中的模板标识,将各个模板的字段进行组合,得到目标模板,可以增加其兼容性,实现模板的复用,增强本申请的兼容性,降低开发模板的重复过程,提高相关效率,而后,通过填充后的目标模板,同时获取多个项目所需文件的对应关系与调度时间,并在所述待提取文件类别对应的文件调度时间,通过对应关系,获取项目对应的待提取文件,可以更高效率地获取到分散的文件,降低重复文件的获取次数,实现高效且精细化管理。
附图说明
图1为一个实施例中文件获取方法的应用环境图;
图2为一个实施例中文件获取方法的流程示意图;
图3为一个实施例中获取文件调度时间的流程示意图;
图4为另一个实施例中形成目标模板的流程示意图;
图5为一个实施例中得到目标模板的流程示意图;
图6为一个实施例中得到文件管理信息的流程示意图;
图7为一个实施例中修正文件管理信息的流程示意图;
图8为一个实施例中形成中间数据的流程示意图;
图9为一个实施例中形成第一文件获取模板的流程示意图;
图10为一个实施例中文件获取装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的文件获取方法,可以应用于如图1所示的应用环境中。在一个可选的环境,其中,终端102通过网络等通信方式与服务器104进行通信。终端102发出文件调用请求后,服务器104接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间;基于所述文件调用请求获取目标模板集合,按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,所述文件管理信息用于指示所述文件调度时间、项目标识与待提取文件的对应关系;在所述文件调取时间,遵循所述对应关系,按照所述项目标识获取对应的待提取文件。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种文件获取方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取文件编码所属类别,获取文件编码所属类别映射到的文件调度时间。
文件调用请求,其可以是通过某种手段直接生成的请求指令,也可以通过某些函数及相应的条件式生成的。其中,文件调用请求可以是由管理文件的账号发出的;其也可以是在某一个或某些项目所需的文件满足预设文件获取条件后,通过某种映射关系所直接生成的,该预设条件可以是动态调节的,且该预设条件可以是一个或多个项目的所需文件的数量、优先级等任意因素。
文件编码,也可以称为作业编码,是用于充当待提取文件的标识,可以用于文件的分类;其可以是具体文件的通用标识,以降低映射的次数,避免数据冗余;也可以是与通用标识对应的文件提资标识,通过文件提资标识来进行数据获取,以方便获取文件的过程。文件编码可以是待提取文件描述信息,也可以对应于待提取文件描述信息或者属于待提取文件描述信息,待提取文件描述信息也可以是提资专业、提资部门、条目号、提资分类、机组号、作业编码、模板编码等多项待提取文件的描述信息的组合,以进一步增加文件获取的效率。
文件编码所属类别,用于标识待提取文件的调度时间。其可以根据文件优先级而设定,可以项目优先级而设定,可以根据文件相似度而设定,可以根据文件之间的关联度而设定,还可以根据文件编码的范围而设定,也可以是文件完成的出版批次。文件完成的出版批次,用于表征某一类文件的出版时间,该出版时间可以是具体的时间,可以是时间的范围值,还可以是映射得到的数值。
文件调度时间,其可用于提醒各专业人员项目的文件获取期限。各专业人员可以是:提供文件的人员、需求文件的人员、统筹规划人员等一种或多种;文件调度时间可以是准备文件的期限、提资流程节点的期限,和/或,固化流程的期限。
在一可选地实施例中,方法包括生成文件调用请求的步骤,该步骤包括导入标准化清单的步骤:提资管理的账号可以通过手动单条新增标准化清单,或者通过EXCEL批量导入方式新增一条或多条新增标准化清单等相关数据;该标准化清单主要包含需要待提取文件的项目描述信息与待提取文件描述信息,该标准化清单可以对应于项目的设计阶段、子项、系统、提资专业、提资部门、条目号、收资专业、收资部门、关键提资、资料名称、需求描述、提资分类、机组号、作业编码、模板编码等标准化通用字段,标准化通用字段适用于至少部分项目。其中,该标准化清单近似于常规意义上的模板,标准化通用字段是该标准化清单的至少部分字段。
在一可选地实施例中,文件获取管理的账号发出文件调用请求,获取该文件调用请求关联的多个项目编码,再获取项目编码所属待提取文件类别,以获得待提取文件类别映射到的文件调度时间。
步骤204,基于文件调用请求获取目标模板集合,按照文件调用请求选取模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板。
模板集合,其包括至少一个模板组、模板或者一个模板字段;一个模板组中可以包括至少一个模板、至少一个模板字段或者至少一个与模板组相关联的模板标识;一个模板可以包括至少一个模板字段或者至少一个模板相关联的模板标识;模板字段可以是项目的设计阶段、项目标识、待提取文件的文件编码等通用字段,也可以是专门对应于某一种或多种领域或项目的专用字段,专用字段可以是用于表征与该字段关联的关联模板字段。
目标模板,其由至少一个模板所组成,组成该目标模板的模板可以是上述标准化清单,也可以是将上述标准化清单所关联的模板纳入其中。目标模板的作用近似于基石,是构建项目与待获取文件之间的对应关系的基础。
在基于文件调用请求获取目标模板集合的步骤中,可以按照依赖、关联、组合等映射关系,也可以按照某些函数或者模型的计算得到的关系,实现其他类型的对应关系。其中,一个文件调用请求可以对应于一个或多个模板集合,而一个模板集合也可以对应于一个或多个文件调用请求。
按照文件调用请求选取模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板的步骤中,可以通过文件调用请求中的模板编码、模板标识或者某些映射关系,选取一个或多个模板标识,可以得到组合后的目标模板,也可以直接将上述的标准化清单作为模板,不进行模板标识的选取。
步骤206,获取项目标识,应用文件调度时间、项目标识与文件编码填充目标模板,得到文件管理信息,文件管理信息用于指示文件调度时间、项目与待提取文件的对应关系。
项目标识,用于表征需要待提取文件的项目。项目标识本身可以是项目描述信息,也可以属于或者对应于项目描述信息,项目描述信息可以是项目的设计阶段、子项、系统、收资专业、收资部门、需求描述等信息的组合,以明确资料提取的类目,提高信息获取的效率。
文件管理信息,是用于管理文件获取过程的信息。其可以含有项目描述信息与文件描述信息的至少部分信息,用以建立项目与待提取文件之间的对应关系,还可包括文件调度时间,用于指示项目与待提取文件之间获取文件的时间。文件管理信息,可以是被填充的目标模板,也可以是被填充的目标模板所映射到的某些信息。当使用上述标准化清单为主体模板时,所生成的文件管理信息可以称为项目策划清单,而生成文件管理信息的过程,可以称为清单策划。
在一可选地实施例中,应用文件调度时间、项目标识与文件编码填充目标模板的步骤中,是直接将这些信息填充进去,也可以将项目标识与文件编码对应的信息或者所属的信息集合填充到目标模板中。例如:应用项目描述信息与待提取文件描述信息填充目标模板的过程中,可以按照目标模板的字段,将项目描述信息与待提取文件描述信息输入到对应的字段中,直接建立描述信息之间的对应关系;也可以通过目标模板的字段,将项目描述信息与待提取文件描述信息之间的映射关系输入到对应的字段中,间接建立描述信息之间的对应关系;还可以按照目标模板的字段,将项目标识与待提取文件编码输入到对应的字段,再根据项目标识与待提取文件编码分别对应的数据获取相应的描述信息。
步骤208,在文件调取时间,遵循对应关系,按照项目获取对应的待提取文件。
为了解决数据过于分散、不同项目存在重复数据、提资需求管理工作量大等问题,提取不同类别的文件,实现文件的高效提取,降低文件提取的次数。由此,将离散的文件聚合,并在特定的时间输出,可以降低获取重复文件的次数。
上述文件获取方法中,按照待提取文件类别,确定待提取文件的调度时间,使各项目所需的文件编码数据重组,使分散的数据聚合成具体的类别,降低了获取文件的时间,提高了相关效率;而通过选择模板集合中的模板标识,将各个模板的字段进行组合,得到目标模板,可以增加其兼容性,实现模板的复用,增强本申请的兼容性,降低开发模板的重复过程,提高相关效率,而后,通过填充后的目标模板,同时获取多个项目所需文件的对应关系与调度时间,并在待提取文件类别对应的文件调度时间,通过对应关系,获取项目对应的待提取文件,可以更高效率地获取到分散的文件,降低重复文件的获取次数,实现高效且精细化管理。
在一个实施例中,如图3所示,获取文件编码所属类别,获取文件编码所属类别映射到的文件调度时间包括:
步骤302,获取作业分类映射表,按照作业分类映射表,确定文件编码所属的待提取文件类别。
作业分类映射表,其可以是一种映射表,也可以是任意可以实现映射表同等功能的数据结构,其用于表征键值对之间的对应关系,其中,待提取文件描述信息是键,而待提取文件描述信息所属类别是构建待提取文件描述信息的值。
按照作业分类映射表,确定文件编码所属的待提取文件类别,其可以使用多种方式实现:其可以通过Map进行的映射,也可以是使用其他算法所进行的映射。例如:其可以使用hashmap算法、TreeMap算法、set方法等方式实现,也可以使用队列配合指针等方式实现。
步骤304,获取待提取文件类别对应的周期映射表,基于周期映射表,估算待提取文件类别对应的活动周期。
周期映射表,是各文件类别所对应的时间信息,不同的文件类别对应于不同的文件调度时间,不同文件调度时间可以是不同长度的时间段,也可以是不同的时间点。周期映射表中的数据,可以通过历史数据获取,可以通过模型估算。周期映射表可以是一种映射表,也可以是任意可以实现映射表同等功能的数据结构,其用于表征键值对之间的对应关系。周期映射表中,文件类别是键,而活动周期是文件类别的值。
在一可选地实施例中,活动周期包括第一周期、第二周期与第三周期中的一项或多项;其中,第一周期是完成第一待提取文件的时间,属于不完善的文件,一般不属于上述标准化清单的字段中,即FRE时间;第二周期是完成第一待提取文件的时间,属于较为完善的版本、状态,即FIN时间;第三周期是完成第三待提取文件的时间,属于固化后的版本,即FRZ时间。其中,FIN时间与FRZ时间是标准化清单的不同字段。
步骤306,获取文件编码对应的初始时间,初始时间为接收文件调用请求的时间。
初始时间,为接收文件调用请求的时间,接收文件调用请求的时间可以是一个时间点,可以是个时间段。例如:初始时间可以是接收到文件调用请求的计算机时间,也可以位于计算机时间所在范围之中。
步骤308,基于初始时间与估算出的活动周期进行计算,得到文件调度时间。
基于初始时间与活动周期进行计算,可以是两个时间段进行的计算,也可以是两个时间点进行的计算。例如:活动周期为3个月之前或之内这一时间段,而初始时间就可以为1月这类较大时间段、1月1日这类较小时间段或者1月1日1点钟1分1秒这类时间点;基于同一论述,当活动周期定为3月1日1点钟1分1秒这一时间点时,初始时间也可以是1月这类较大时间段、1月1日这类较小时间段或者1月1日1点钟1分1秒这类时间点。
本实施例中,先通过作业分类映射表,确定其文件编码所属的待提取文件类别,再通过周期映射表确定不同文件类别对应的获取时间。由此,通过两步映射的方式,既降低了单次映射的数据量,更精细地操控数据,又避免了相同数据被多次获取的问题,提高了文件获取效率,即使是大批量的项目获取海量文件,也可以做到精细化管控。
在一个实施例中,如图4所示,按照文件调用请求选取模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板包括:
步骤402,获取文件调用请求中的模板编码,将模板编码与模板集合中的模板标识进行匹配。
模板编码,是文件调用请求携带的数据,用于表示文件调用请求所需要的模板,不同模板包括至少部分不同的字段。模板编码可以是任意数据类型,其可以是整型、长整型或浮点型等数值型,也可以是字符串型或者布尔型。模板编码可以是模板的任意部分,其可以是模板标识,可以是另一模板字段。
将模板编码与模板标识进行匹配,就是在模板集合中搜集模板,判断是否存在与模板编码相对应的模板标识。该步骤存在多种实现方式,其可以直接使用模板编码与模板标识进行比对,判断是否一致,以降低构建数据体系的难度;其可以使用模板编码与各个模板的字段进行比对,判断是否存在相关性,再确定模板编码对应的字段,根据模板编码对应的字段,将该对应的字段所属模板的模板标识,确定为模板编码相对应的模板标识。
步骤404,若匹配成功,则按照匹配到的模板标识,从模板集合中获取匹配到的模板标识对应的模板字段,组合选中的模板字段,得到目标模板。
可按照用户需求,选择构建目标模板的方式,例如:可以按照匹配到的模板标识,获取到匹配到的模板标识对应的待拼接模板,对各个待拼接模板进行拼接,以生成目标模板,以保障模板的完整性,避免数据遗漏或丢失;也可以对待拼接模板的字段进行提取,选择性去除冗余字段,再生成目标模板,以降低数据的总量,降低计算量;还可以将某一模板作为默认模板,选择与默认模板相关的模板进行组合。
可选地,将模板编码与模板标识进行匹配之后,还包括:若匹配不成功,则获取默认模板。该默认模板可以是上述标准化清单。
本实施例中,通过模板编码与模板标识进行匹配,选取一个或多个模板进行组合,生成所需的目标模板,可以实现高灵活性的模板组合,具有较高的兼容性,可以满足多领域、多系统、多项目的需求,并实现模板数据的复用。
在一个实施例中,如图5所示,模板标识包括关联模板标识,按照匹配到的模板标识,从模板集合中获取匹配到的模板标识对应的模板字段,组合选中的模板字段,得到目标模板包括:
步骤502,获取第一文件获取模板,第一文件获取模板包括第一描述信息字段与关联模板标识字段。
第一文件获取模板,是默认模板,其可以是上述的标准化清单,也可以是具有其他字段的模板。第一文件获取模板包括第一描述信息字段,第一描述信息字段是通用字段,通用字段可以是至少两个现有模板的公用字段,也可以是通过其他方式所固化的字段。
在一可选地实施例中,获取第一文件获取模板包括:响应于接收文件调用请求,获取第一文件获取模板。本实施例中,不论模板编码是否匹配到模板标识,均可获取第一文件获取模板,实现基础层次的标准化,降低匹配次数,减少计算量。
在一可选地实施例中,获取第一文件获取模板包括:接收到接收文件调用请求后,检测是否存在与关联模板标识对应的模板编码;若检测到,则获取第一文件获取模板。其中,在模板编码匹配到模板标识之后,才可获取第一文件获取模板,否则可以使用其他模板,丰富模板种类,兼容性更强,且标准化程度更高。
步骤504,将匹配到的关联模板标识填充到关联模板标识字段,得到目标关联标识。
在得到目标关联标识的过程中,构建了第一文件获取模板与第二文件获取模板之间的对应关系。而关联模板标识字段中,可以包括任意数量的关联模板标识,以实现多个模板的组合。
步骤506,获取目标关联标识对应的第二文件获取模板,第二文件获取模板包括第二描述信息字段。
第二文件获取模板,其是第一文件获取模板所关联到的模板,其中的第二描述信息字段与第一描述字段可以不存在通用程度方面的区别,以实现模板的复合调度;第二描述信息字段也可以是任意模板,其可以随意设定,以满足多样化的需求。
步骤508,将第二描述信息字段添加到第一文件获取模板,生成目标模板。
目标模板,包括第一描述信息字段、第二描述信息字段与关联模板标识字段。其中,第一描述信息字段是通用字段,是多个领域、系统、专业或项目中通用的字段;第二描述信息字段是专注于个性化的字段,具有较高的灵活性;关联模板标识字段,用于选择第二文件获取模板来关联到第一文件获取模板,以实现模板的组合与复用。
在将第二描述信息字段添加到第一文件获取模板的步骤中,可以将第一描述信息字段与第二描述信息字段的任意组合,将组合后的描述信息字段作为目标模板的字段;也可以为第一描述信息字段与第二描述信息字段设定获取信息的先后顺序,实现不同优先级的信息获取。
可选地,如果目标关联标识包括多个关联模板标识,则可以将多个第二描述信息字段添加到第一文件获取模板,并可以对多个第一文件获取模板的冗余字段进行消除,以降低获取的总数据量,避免数据的重复获取。
本实施例中,通过将第一描述信息字段设定为预设的目标模板的字段,通过关联模板标识字段,获取待定的第二描述信息字段,以此构建了目标模板,兼顾粗粒度与细粒度进行数据的把控,高精度的控制文件获取的过程。
在一个可选地实施例中,方法还包括生成第一描述信息字段的步骤,步骤包括:
获取历史描述信息字段,从历史描述信息字段获取重复的描述信息字段;
对重复的描述信息字段进行审核,将通过审核的重复的项目信息字段作为第一描述信息字段。
历史描述信息字段,其可以根据数据库中的描述信息设定,也可以根据某些条件、指标或者环境而直接生成。历史描述信息字段,用于充当重复的描述信息字段所属的数据库,用以得到重复的描述信息字段。历史描述信息字段,其可以是数据集合。
在一可选地实施例中,从历史描述信息字段获取重复的描述信息字段的步骤中,可以将完全相同的历史描述信息字段作为重叠的描述信息字段,也可以通过计算历史描述信息字段的相似度来实现。示例性地,可以使用分词的算法。文字识别等内容获取的方式,将不同表述的历史描述信息字段进行分析,得到相同的描述信息字段,将语意相同的描述信息字段作为重复的描述信息字段;也可以选择任一历史描述信息字段为标准字段,通过机器学习模型等方式,计算其他历史描述信息字段与标准字段之间的相似度,若相似度在同一范围,则确定为重复的描述信息字段。
在一可选地实施例中,在对重复的描述信息字段进行审核,将通过审核的重复的项目信息字段作为第一描述信息字段。在对重复的描述信息字段进行审核时,可以选择任意维度,包括文件存储渠道的审核、文件获取渠道的审核及文件获取的总体性审核等。示例性地,在一个可选地实施例中,收资方与提资方之间的确认交互,当需求文件的收资方发出请求,要求生成第一描述信息字段时,需要进行文件提取的提资方进行审核确认,判断该第一描述信息字段是否符合提资方所能提供的;在一个可选地实施例中,需要接口工程师等专业人员于技术方面进行审核确认,判断该第一描述信息字段是否可以实现,是否会影响到其他字段等功能性审核;在一个可选地实施例中,需要总工程师等综合性管理人员审核,判断是否存在重复性工作,是否会影响到项目等总体性审核。
本实施例中,通过对复杂而分散的数据进行聚合,归纳提取,降低了数据复杂度,通过生成第一描述信息字段,降低了所需的模板数量,使第一文件获取模板更适宜多种多样的领域或项目,需要输入的模板标识数量得以降低。而通过审核的项目信息字段,可以更好地满足项目需求,高精细度地控制文件获取过程。
在一个实施例中,如图6所示,应用文件调度时间、项目标识与文件编码填充目标模板,得到文件管理信息包括的步骤,步骤包括:
步骤602,基于目标模板的字段,获取项目标识对应的项目描述信息,获取文件编码对应的待提取文件描述信息。
在一可选地实施例中,为方便各个项目对相应的待提取文件进行调度,目标模板的字段包括:至少两种项目描述信息字段与待提取文件描述信息字段,用于被相应的信息描述或描述信息所填充。信息描述也可以称为信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
在一可选地实施例中,将目标模板的字段与项目标识作为索引,从项目标识对应的项目描述信息中选取目标项目描述信息,得到项目标识对应的项目描述信息;或者,将目标模板的字段与文件编码作为索引,从文件编码对应的文件描述信息中选取目标文件描述信息,得到文件编码对应的文件描述信息。
步骤604,基于文件调度时间与文件编码所属类别的映射关系,确定待提取文件的文件调度时间。
在一可选地实施例中,同属一类的文件编码会拥有相同的文件调度时间,该相同的文件调度时间可以是指具有相同的时间长度,也可以是根据相同的时间点进行调度,如果根据相同的时间点进行调度,可以在某两个时间点之间进行调度或者某两个时间段之间进行调度。
在一可选地实施例中,若待提取文件为多个,则属于同一类别的文件具有类别标识,通过该类别标识进行匹配之后,同步赋予具有相同类别标识的待提取文件的文件调度时间,建立各个待提取文件的文件调度时间。
步骤606,应用项目描述信息、待提取文件描述信息及待提取文件的文件调度时间填充目标模板,构建文件调度时间、项目与待提取文件的对应关系。
在一可选地实施例中,构建文件调度时间、项目与待提取文件的对应关系,可以是非映射关系。例如:当缺少文件调度时间时,项目与待提取文件的对应关系仍是可以建立的,也可以设定默认的文件调度时间,以建立默认时间、项目与待提取文件之间的对应关系。
在一可选地实施例中,构建文件调度时间、项目与待提取文件的对应关系,可以是映射关系,而该映射关系可以是一对一或一对多的。例如:在同一个文件调度时间,可以有多个项目获取多个文件。
本实施例中,建立描述信息之间的对应关系,并配合文件调度时间,形成了具有方便检索的文件管理信息,且文件管理信息包括多种多样的描述信息,便于批量化进行大数据的调度,同时为多个项目提取多个文件。
在一个实施例中,在进行了映射与填充模板之后,可能会存在数据遗漏或者溢出等情况,例如,当某一字段填充后数据量过大,超过了模板规定的阈值,则可能不会将数据填入其中,基于此,还需要修正数据的步骤。如图7所示,应用项目描述信息、待提取文件描述信息及待提取文件的文件调度时间填充目标模板之后,包括:
步骤702,从项目描述信息与文件描述信息中,获取与目标模板的字段对应的原始信息。
在一可选地实施例中,将目标模板的字段作为索引,从项目描述信息与文件描述信息中搜索相关的数据,以形成原始信息,原始信息可以是具体的字段,也可以是具体字段所对应的标识,还可以是具体的数据范围。
在一可选地实施例中,获取目标模板的字段对应的原始信息之后,会形成一个数据集合,需要去除该数据集合中的重复信息,以得到具有映射关系的映射表或者其他不具有重复信息的数据集合。
步骤704,将匹配的原始信息与文件管理信息进行比对,若原始信息多于文件管理信息,则获取原始信息与文件管理信息的差异信息。
在一可选地实施例中,将匹配的原始信息与文件管理信息进行比对,可以是将具有相同标识的信息进行比对,若具有相同标识的信息,则确定为匹配的。在一可选地实施例中,可以比对语意提取后的信息相似度,当信息相似度达到阈值时,确定原始信息与文件管理信息为匹配的。
在一可选地实施例中,原始信息多于文件管理信息,则获取原始信息与文件管理信息的差异信息,包括:判断原始信息总量是否多于文件管理信息;或者,判断原始信息中的具体字段是否多于文件管理信息的具体字段;或者,判断原始信息中的数据长度是否多于文件管理信息的数据长度。
在一可选地实施例中,差异信息对应于具体的描述信息字段,例如,如果原始信息中的项目描述信息多于文件管理信息,则可以得到项目描述差异信息;如果原始信息中的文件描述信息多于文件管理信息,则可以得到文件描述差异信息。
步骤706,将差异信息补充到文件管理信息,得到修正后的文件管理信息,修正后的文件管理信息包括修正后的项目描述信息、修正后的待提取文件,和/或,修正后的对应关系。
在一可选地实施例中,不同的差异信息会补充到不同的目标模板的字段,例如,如果原始信息中的项目描述信息多于文件管理信息,则可以得到项目描述差异信息,项目描述差异信息用于修正项目描述信息。
本实施例中,考虑到填充模板时,会受到模板字段属性中的字段长度等因素制约,可能会导致数据丢失或者数据混乱等问题,因此,通过获取与目标模板的字段对应的原始信息,用以佐证,并纠正文件管理信息中得到错误,进一步实现精细化管理。
在一个实施例中,如图8所示,应用项目描述信息与待提取文件描述信息填充目标模板,得到文件管理信息,还包括:
检测目标模板是否存在修改,若存在修改,则基于修改后的目标模板,获取项目编码和/或文件编码分别对应的描述信息,得到更新后的描述信息,使用更新后的描述信息更新文件管理信息。
在一个可选地实施例中,检测目标模板是否存在修改,可以通过检测目标模板字段中的任意数据来实现,也可以通过检测与目标模板相关的数据来实现。例如:可以检测目标模板的字段或者模板标识是否发生改变,也可以检测目标模板中的模板标识对应的模板是否发生改变或者对应的模板字段是否被改变。
在一个可选地实施例中,基于修改后的目标模板,获取所述项目编码对应的项目描述信息,以及,所述文件编码对应的待提取文件描述信息,得到更新后的描述信息,进行了至少一次数据处理。例如:可以将目标模板进行修改后的字段作为索引,重新获取信息,直接按照项目编码与文件编码获取相应的描述信息,实现数据的实时更新。也可以配合数据清洗的步骤或者其他数据聚合、重组的方法。
本实施例中,通过设定目标模板的修正机制,只需要修正目标模板的字段,即可自动更新相应的文件,实现大批量的数据标准化、精细化把控。
在一具体的应用场景中,将上述技术应用到资料提取的相关背景。在各个领域的设计院中,不同专业、部门之间经常会对生产数据进行利用、交换,该动作俗称提资,比如A专业需要B专业中的某个数据,则B专业需要向A专业提供相关资料及参数,B是提资方、A是收资方,整个提资的过程需要提交建立需求,设定计划完成日期,再由具体负责的设计人员发起提资流程,每个节点都是有时间进度要求的,同时项目办也会对其中延误、未关闭的需求进行跟踪和管控。
提资的全过程都在提资系统中进行实现,采用信息化平台应用手段进行线上处理,一般提资系统都能实现提资需求的建立和维护,需求根据当前环节的进度分为不同状态,设计人员发起具体的提资流程,可能存在多次使用提资单的情况,采用版本区分,每个版本都有签收意见,能对提资全生命周期的过程进行监控和记录,最后再做统计分析及查询。
传统技术中,一般将不同的数据存入不同的数据库,构建不同身份操作不同数据库中的数据,避免提资时的数据误操作和混乱;或者,使用基于专业间的提资类型定义提资数据,根据提资数据建立相应的中间数据库;以中间数据库为桥梁,实现两平台之间多专业提资及收资方法,后续角色读取中间数据库中的提资数据,配合数字化模型对提资数据进行校核、发布、分发、接收处理。然而,对于大数据量大的技术领域而言,传统技术的数据提取方式过于粗糙,难以对整体数据进行把控。
在某一环境中,如果某些项目存在建设周期长、数据量大、复杂程度高等特点,例如:设计院内负责的项目,特别是核电项目建设,需要解决提资系统中个性化需求过多、数据过于分散、不同项目存在重复数据、提资需求管理工作量大的。需要标准化、规范化、批量化、模板化的方式方法来提高数据的规范性,高效性,在复杂的数据中求同存异进行归纳提取,降低数据复杂度,控制个性化需求的数量,降低人工维护和管理的工作量。而使用本申请上述实施例即可实现这一效果。
在上述抽象化环境中的某一技术方案中,可以分为4个部分:“标准化清单新增”、“标准化清单策划”、“标准化清单变更”与“标准化表格模板维护”,各阶段均可以是独立或组合的,且均应当受到保护。
“标准化清单新增”:如果以服务器为实施对象,则可以对应于上述的“接收文件调用请求,获取文件调用请求携带待提取文件的文件编码”以及“按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板”,其标准化提资的基础,提资管理角色可以通过该功能进行手动单条新增标准化清单,或者通过EXCEL批量导入方式新增数据,该清单主要包含设计阶段、子项、系统、提资专业、提资部门、条目号、收资专业、收资部门、关键提资、资料名称、需求描述、提资分类、机组号、作业编码、模板编码;这些字段都属于标准化通用字段,适用于所有项目。
“标准化清单策划”:如果以服务器为实施对象,则可以对应于上述的“获取所述文件编码所属类别映射到的文件调度时间”以及“应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,”,其可以是使用一个目标模板生成多个项目需求的过程。
在一可选地实施方式中,选中需要策划的清单,再选中需要策划的项目,此时会自动形成策划的中间数据,形成中间数据的步骤可以是:
标准化清单中有作业编码,通过作业编码和具体项目能从作业策划系统中获取IED分类,IED分类可以是文件出版计划,文件出版计划包括1类,2类,3类,4类。
形成中间数据之后,这些数据会根据作业代码及映射表匹配每种状态的计划完成日期,其如图8所示,在一可选地实施例中,该步骤包括:
根据IED分类,基于IED分类映射周期表中分别获取FIN活动周期和/或FRZ活动周期;其中,FIN活动周期是第二活动周期,用于获取较完整版本的时间,而FRZ活动周期是第三活动周期,用于获取固化版本的时间。
若策划的时间为初始计划日期,初始计划日期分别减去对应的活动周期,得到每条作业代码的最终FIN、FRZ计划日期,再分别从中选取最近的两个日期作为该项目需求的FIN计划完成日期、FRZ计划完成日期;FIN计划完成日期、FRZ计划完成日期,用于告知专业人员,这份需求需要在这个时间内完成提资流程及固化,包括FIN\FRZ两种状态的时间,同时也方便项目管理人员进行进度把控预警提醒。
在一可选地实施例中,将填充后的目标模板作为选择的项目确认具体的项目需求,系统再自动补充完善其他字段,包括收、提资负责人、PRE\FIN\FRZ三个状态的计划完成日期。如果此时会存在部分数据不完整的情况,例如收、提资负责人过多,计划日期没匹配等问题,这时需要提资管理角色或者某些程序进行修正和填补计划日期,当校验信息通过时,即可导入项目,实现一条完整的需求。
在一可选地实施例中,项目需求是实际生效的提资需求,有明确的项目,及PRE\FIN\FRZ计划日期,通过标准化清单策划后的需求属于标准化需求,即仅填充后的第一文件获取模板生成的项目需求是标准化需求,而配合上述第二文件获取模板生成的项目需求属于普通需求。
“标准化清单变更”:其对应于“形成第一文件获取模板”的步骤,对于已新增的清单数据,后续也会存在维护修改的情况,特别是由下游专业的设计人员的反馈,因为标准化清单影响较大,必须做好管控,所以需要走变更申请流程进行审批,其包括多级审批,具体如图9所示。
“标准化表格模板维护”:对应于“获取目标模板集合”可以新增修改删除表格模板,实体内容是一个标准的word等编辑用模板,在标准化清单新增时可以选择一个模板进行关联,若该清单关联了一个模板,其发起的项目需求在起草提资单时,会自动拷贝一个模板作为提资单流程的附件,且能做到在线编辑,设计人员非常方便填写对应数据,实现了模板的自动关联和应用,无需用户再上传模板,做到了统一标准化。
在这一场景中,提供了一种适用于设计院的提资系统进行标准化管理的实施方案,在生成项目需求方面,集成方面等成本或者效率方面均有较大的优势。
在生成项目需求与成本方面,根据一个目标模板的基础上,策划的不同项目需求,是一对多的关系,属于同一个模板生成的项目需求,可以是标准化的数据,且后续设计人员无需再对这些标准化字段进行填写,系统会自动带出。规范了提资数据的多样性,降低了需求复杂度,而每个项目需求都可以选择性制定PRE\FIN\FRZ三种计划日期,要做到时间进度的设定、监控及预警。通过标准化清单策划的需求,因为有同一套模板的基础数据,所以基础数据一旦修改,所有与其关联的项目需求会自动批量修改,且能作为溯源,查看修改及审批记录,降低了文件的管理维护成本。总之,通过标准化清单批量策划项目的方式实现项目需求的建立,做到了规范性、标准性、统一性,也降低了建立需求的工作量。
对于集成化方面,采用模块化开发,对现有的提资系统不产生影响,且能做到新旧功能、新旧数据的无缝衔接;而且,通过在清单新增时的填写模板编码,在清单填写的编码和模板维护模块中的编码相同时,则产生关联,通过该清单策划的项目需求,后续在应用时就会自动抓取并带上对应维护模板信息。
为了更方便理解本申请的技术方案,从用户操作的角度进行论述,包括标准化提资的建立方法、标准化清单的构建方法、标准化清单的修改方法:其中:
标准化提资的建立方法,包括:
将普通个性化需求的通用属性和要求归纳精简成标准化清单,新建清单后,再选择对应的项目进行批量策划项目需求,系统根据作业代码和时间映射表的关联自动计算出各个状态的完成时间,校验通过后,自动生成具体的提资需求。其中,通用属性和要求具体指标准化清单新增时的字段,后面策划出不同项目时,这些字段都是通用的固定的,属于模板数据。
标准化清单的构建方法,包括:
先建立模板维护的模块,实现增、删、改、查等数据库基础功能,在标准化清单中能对所有的模板进行选择一个关联,建立关系后,与该标准化清单相关的具体需求进行提资单流程时,系统会自动拷贝一个副本作为模板附件,且能实现在线编辑。
标准化清单的修改方法,包括:
对标准化清单的修改进行流程审批及记录,审核通过后再由具体执行人进行修改操作,执行前的节点可进行退回操作。
应该理解的是,虽然图2-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-7中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图10所示,提供了一种文件获取装置,包括:获取时间确定模块、模板获取模块、对应关系确定模块和文件提取模块,其中:
获取时间确定模块,用于接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间;
模板获取模块,用于基于所述文件调用请求获取目标模板集合,按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;
对应关系确定模块,用于应用所述映射到的文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,所述文件管理信息用于指示所述文件调度时间、项目与待提取文件的对应关系;
文件提取模块,用于在所述文件调取时间,遵循所述对应关系,按照所述项目获取对应的待提取文件。
在一个实施例中,时间确定模块包括类别确定单元、周期确定单元、初始时间获取单元及调度时间计算单元,其中:
类别确定单元,用于获取作业分类映射表,按照所述作业分类映射表,确定所述文件编码所属的待提取文件类别。
周期确定单元,用于获取待提取文件类别对应的周期映射表,基于所述周期映射表,估算所述待提取文件类别对应的活动周期。
初始时间获取单元,用于获取所述文件编码对应的初始时间,所述初始时间为接收文件调用请求的时间。
调度时间计算单元,用于基于所述初始时间与所述估算出的活动周期进行计算,得到所述文件调度时间。
在一个实施例中,模板获取模块包括模板选择单元,模板组合单元,其中:
模板选择单元,用于获取所述文件调用请求中的模板编码,将所述模板编码与所述模板集合中的模板标识进行匹配;
模板组合单元,用于在匹配成功时,则按照所述匹配到的模板标识,从所述模板集合中获取匹配到的模板标识对应的模板字段,组合所述选中的模板字段,得到所述目标模板。
在一个实施例中,模板组合单元,包括第一模板子单元,模板关联子单元,第二模板子单元,模板构建子单元,其中:
第一模板子单元,用于获取第一文件获取模板,所述第一文件获取模板包括第一描述信息字段与关联模板标识字段;
模板关联子单元,用于将匹配到的关联模板标识填充到所述关联模板标识字段,得到目标关联标识;
第二模板子单元,用于获取所述目标关联标识对应的第二文件获取模板,所述第二文件获取模板包括第二描述信息字段;
模板构建子单元,用于将所述第二描述信息字段添加到所述第一文件获取模板,生成所述目标模板。
在一个实施例中,对应关系确定模块包括文件信息获取单元,调度时间确定单元,对应关系构建单元,其中:
文件信息获取单元,用于基于所述目标模板的字段,获取所述项目标识对应的项目描述信息,获取所述文件编码对应的待提取文件描述信息;
调度时间确定单元,用于基于所述文件调度时间与所述文件编码所属类别的映射关系,确定待提取文件的文件调度时间;
对应关系构建单元,用于应用所述项目描述信息、所述待提取文件描述信息及所述待提取文件的文件调度时间填充所述目标模板,构建所述文件调度时间、项目与待提取文件的对应关系。
在一个实施例中,对应关系构建单元包括修正信息获取子单元,差异信息获取子单元,管理信息修正子单元,其中:
修正信息获取子单元,用于从所述项目描述信息与文件描述信息中,获取与目标模板的字段对应的原始信息;
差异信息获取子单元,用于将匹配的所述原始信息与所述文件管理信息进行比对,若所述原始信息多于所述文件管理信息,则获取所述原始信息与所述文件管理信息的差异信息;
管理信息修正子单元,用于将所述差异信息补充到所述文件管理信息,得到修正后的文件管理信息,所述修正后的文件管理信息包括修正后的项目描述信息、修正后的待提取文件,和/或,修正后的对应关系。
在一个实施例中,对应关系确定模块,还包括模板信息重构单元,模板信息重构单元,用于检测所述目标模板是否存在修改,若存在修改,则基于修改后的目标模板,获取所述项目编码和/或所述文件编码分别对应的描述信息,得到更新后的描述信息,使用所述更新后的描述信息更新所述文件管理信息。
关于文件获取装置的具体限定可以参见上文中对于文件获取方法的限定,在此不再赘述。上述文件获取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文件获取数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种文件获取方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种文件获取方法,其特征在于,所述方法包括:
接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间;
基于所述文件调用请求获取目标模板集合,按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;
应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,所述文件管理信息用于指示所述文件调度时间、项目标识与待提取文件的对应关系;
在所述文件调取时间,遵循所述对应关系,按照所述项目标识获取对应的待提取文件。
2.根据权利要求1所述的方法,其特征在于,所述获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间包括:
获取作业分类映射表,按照所述作业分类映射表,确定所述文件编码所属的待提取文件类别;
获取待提取文件类别对应的周期映射表,基于所述周期映射表,估算所述待提取文件类别对应的活动周期;
获取所述文件编码对应的初始时间,所述初始时间为接收文件调用请求的时间;
基于所述初始时间与所述估算出的活动周期进行计算,得到所述文件调度时间。
3.根据权利要求1所述的方法,其特征在于,所述按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板包括:
获取所述文件调用请求中的模板编码,将所述模板编码与所述模板集合中的模板标识进行匹配;
若匹配成功,则按照所述匹配到的模板标识,从所述模板集合中获取匹配到的模板标识对应的模板字段,组合所述选中的模板字段,得到所述目标模板。
4.根据权利要求3所述的方法,其特征在于,所述模板标识包括关联模板标识,所述按照所述匹配到的模板标识,从所述模板集合中获取匹配到的模板标识对应的模板字段,组合所述选中的模板字段,得到所述目标模板包括:
获取第一文件获取模板,所述第一文件获取模板包括第一描述信息字段与关联模板标识字段;
将匹配到的关联模板标识填充到所述关联模板标识字段,得到目标关联标识;
获取所述目标关联标识对应的第二文件获取模板,所述第二文件获取模板包括第二描述信息字段;
将所述第二描述信息字段添加到所述第一文件获取模板,生成所述目标模板。
5.根据权利要求1所述的方法,其特征在于,所述应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息包括的步骤,所述步骤包括:
基于所述目标模板的字段,获取所述项目标识对应的项目描述信息,获取所述文件编码对应的待提取文件描述信息;
基于所述文件调度时间与所述文件编码所属类别的映射关系,确定待提取文件的文件调度时间;
应用所述项目描述信息、所述待提取文件描述信息及所述待提取文件的文件调度时间填充所述目标模板,构建所述文件调度时间、项目与待提取文件的对应关系。
6.根据权利要求5所述的方法,其特征在于,所述应用所述项目描述信息、所述待提取文件描述信息及所述待提取文件的文件调度时间填充所述目标模板之后,包括:
从所述项目描述信息与文件描述信息中,获取与目标模板的字段对应的原始信息;
将匹配的所述原始信息与所述文件管理信息进行比对,若所述原始信息多于所述文件管理信息,则获取所述原始信息与所述文件管理信息的差异信息;
将所述差异信息补充到所述文件管理信息,得到修正后的文件管理信息,所述修正后的文件管理信息包括修正后的项目描述信息、修正后的待提取文件,和/或,修正后的对应关系。
7.根据权利要求1~6任意一项所述的方法,其特征在于,所述应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,还包括:
检测所述目标模板是否存在修改,若存在修改,则基于修改后的目标模板,获取所述项目编码和/或所述文件编码分别对应的描述信息,得到更新后的描述信息,使用所述更新后的描述信息更新所述文件管理信息。
8.一种文件获取装置,其特征在于,所述装置包括:
获取时间确定模块,用于接收文件调用请求,获取文件调用请求携带待提取文件的文件编码与项目标识,获取所述文件编码所属类别,获取所述文件编码所属类别映射到的文件调度时间;
模板获取模块,用于基于所述文件调用请求获取目标模板集合,按照所述文件调用请求选取所述模板集合中的模板标识,将选中的模板标识所对应的模板字段进行组合,形成目标模板;
对应关系确定模块,用于应用所述文件调度时间、所述项目标识与所述文件编码填充所述目标模板,得到文件管理信息,所述文件管理信息用于指示所述文件调度时间、项目标识与待提取文件的对应关系;
文件提取模块,用于在所述文件调取时间,遵循所述对应关系,按照所述项目标识获取对应的待提取文件。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202111393958.8A 2021-11-23 2021-11-23 文件获取方法、装置、计算机设备和存储介质 Pending CN114036187A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111393958.8A CN114036187A (zh) 2021-11-23 2021-11-23 文件获取方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111393958.8A CN114036187A (zh) 2021-11-23 2021-11-23 文件获取方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114036187A true CN114036187A (zh) 2022-02-11

Family

ID=80145218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111393958.8A Pending CN114036187A (zh) 2021-11-23 2021-11-23 文件获取方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114036187A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723566A (zh) * 2022-06-10 2022-07-08 高盈国际创新科技(深圳)有限公司 金融交易数据处理方法及系统
CN115665126A (zh) * 2022-10-11 2023-01-31 平安银行股份有限公司 批量执行文件生成方法、装置、介质及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723566A (zh) * 2022-06-10 2022-07-08 高盈国际创新科技(深圳)有限公司 金融交易数据处理方法及系统
CN115665126A (zh) * 2022-10-11 2023-01-31 平安银行股份有限公司 批量执行文件生成方法、装置、介质及设备

Similar Documents

Publication Publication Date Title
WO2022179008A1 (zh) 基于区块链的供应链金融AI DaaS算法仓库平台
US20180007145A1 (en) Graphically managing data classification workflows in a social networking system with directed graphs
CN111712809A (zh) 通过示例来学习etl规则
CN114036187A (zh) 文件获取方法、装置、计算机设备和存储介质
CN113035308B (zh) 电子健康档案的质量评价方法和系统
CN112465011A (zh) 基于项目研发过程的项目风险预测方法和系统
CN111563703B (zh) 项目管理系统、方法、计算机设备和计算机可读存储介质
CN111061679B (zh) 一种基于rete和drools规则的科技创新政策速配的方法和系统
CN114416703A (zh) 数据完整性自动监控方法、装置、设备及介质
CN111833018A (zh) 一种科技项目的专利分析方法及系统
CN111737335B (zh) 产品信息集成处理方法、装置、计算机设备和存储介质
CN116069300A (zh) 工作流控制代码生成方法、装置、电子设备及存储介质
CN101753619A (zh) 用于扩展服务模型的方法和系统
CN114219596A (zh) 一种基于决策树模型的数据处理方法及相关设备
CN114281795A (zh) 一种基于业务数据标准表的数据模型构建方法
CN112465461A (zh) 业务对象信息变更方法、系统、计算机设备和存储介质
Hu Information lifecycle modeling framework for construction project lifecycle management
CN116187675A (zh) 任务分配方法、装置、设备及存储介质
CN115543428A (zh) 一种基于策略模板的模拟数据生成方法和装置
US20210397745A1 (en) Data providing server device and data providing method
CN114004542A (zh) 一种企业任务管理方法、系统、计算机设备及存储介质
CN112559641B (zh) 拉链表的处理方法及装置、可读存储介质、电子设备
JP6336922B2 (ja) 業務バリエーションに基づく業務影響箇所抽出方法および業務影響箇所抽出装置
CN109032578B (zh) 基于数据库sql代码生成方法及系统
CN112966974A (zh) 一种项目配置方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination