CN114201177A - 文件生成方法、装置、电子设备、介质和计算机程序产品 - Google Patents

文件生成方法、装置、电子设备、介质和计算机程序产品 Download PDF

Info

Publication number
CN114201177A
CN114201177A CN202111538388.7A CN202111538388A CN114201177A CN 114201177 A CN114201177 A CN 114201177A CN 202111538388 A CN202111538388 A CN 202111538388A CN 114201177 A CN114201177 A CN 114201177A
Authority
CN
China
Prior art keywords
data
information
processed
splicing
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111538388.7A
Other languages
English (en)
Inventor
陈思扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202111538388.7A priority Critical patent/CN114201177A/zh
Publication of CN114201177A publication Critical patent/CN114201177A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/427Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/52Binary to binary

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开了一种文件生成方法、装置、电子设备、介质和计算机程序产品。该文件生成方法包括:对报送数据对应的脚本文件进行逆向解析,得到所述脚本文件对应的逆向文件;其中,所述逆向文件包括:数据加工流程表和至少一个数据来源表;基于所述逆向文件中的待处理信息的类型,将不同类型的所述待处理信息分别存储至不同的数据来源表中;对所述数据来源表中的待处理信息进行拼接,得到分句信息;将不同语句范围的分句信息进行拼接,生成所述报送数据对应的目标关系表;其中,所述目标关系表用于描述所述报送数据对应的来源。可以实现快速的生成报送项目对应的解释性文件的效果。

Description

文件生成方法、装置、电子设备、介质和计算机程序产品
技术领域
本申请涉及计算机领域,具体涉及一种文件生成方法、装置、电子设备、介质和计算机程序产品。
背景技术
当前金融机构面临着外部监管力度不断升级的趋势,金融监管单位对金融机构报送的数据内容的质量要求不断提高,并基于检查需要,进一步提出了对报送数据的来源加工过程的可解释和可检查性的要求。在这一背景下,金融机构需尽快完善自身数据,尤其是监管报送数据的来源、映射规则和加工方法等数据血缘方面内容的解释性文档。
目前该解释性文档的来源主要依赖于前期项目开发文档的积累,如果前期的数据加工的设计文档留档不完整,或者实际开发过程中数据加工与开发文档已发生变化,又或者报送数据经过长年多次迭代已发生变化,但并没有进行文档记录,则需要完全依赖人工阅读报送数据对应的脚本文件和政策文件等多种方式重建解释性文档,工作繁琐且难度很大。
发明内容
本申请实施例的目的是提供一种文件生成方法、装置、电子设备、介质和计算机程序产品,以实现快速的生成报送项目对应的解释性文件的效果。
本申请的技术方案如下:
第一方面,提供了一种文件生成方法,该方法包括:
对报送数据对应的脚本文件进行逆向解析,得到所述脚本文件对应的逆向文件;其中,所述逆向文件包括:数据加工流程表和至少一个数据来源表;
基于所述逆向文件中的待处理信息的类型,将不同类型的所述待处理信息分别存储至不同的数据来源表中;
对所述数据来源表中的待处理信息进行拼接,得到分句信息;
将不同语句范围的分句信息进行拼接,生成所述报送数据对应的目标关系表;其中,所述目标关系表用于描述所述报送数据对应的来源。
第二方面,提供了一种文件生成装置,该装置包括:
解析模块,用于对报送数据对应的脚本文件进行逆向解析,得到所述脚本文件对应的逆向文件;其中,所述逆向文件包括:数据加工流程表和至少一个数据来源表;
存储模块,用于基于所述逆向文件中的待处理信息的类型,将不同类型的所述待处理信息分别存储至不同的数据来源表中;
第一拼接模块,用于对所述数据来源表中的待处理信息进行拼接,得到分句信息;
第二拼接模块,用于将不同语句范围的分句信息进行拼接,生成所述报送数据对应的目标关系表;其中,所述目标关系表用于描述所述报送数据对应的来源。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现本申请实施例任一所述的文件生成方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现本申请实施例任一所述的文件生成方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本申请实施例任一所述的文件生成方法的步骤。
本申请的实施例提供的技术方案至少带来以下有益效果:
本申请实施例提供的文件生成方法、装置、电子设备、介质和计算机程序产品,通过对报送数据对应的脚本文件进行逆向解析,得到脚本文件对应的逆向文件,该逆向文件包括:数据加工流程表和至少一个数据来源表,基于逆向文件中待处理信息的类型,将待处理信息分别存储至不同的数据来源表中,对数据来源表中的待处理信息进行拼接,得到分句信息,然后将不同语句范围的分句信息进行拼接,生成报送数据对应的目标关系表,由于目标关系表中具有报送数据的来源,如此自动基于报送数据对应的脚本文件生成对应的目标关系表,无需人工进行大量脚本文件夹的阅读,提升了目标关系表的生成效率,节约了人力。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。
图1是本申请第一方面实施例提供的一种文件生成方法的流程示意图;
图2是本申请第一方面实施例提供的另一种文件生成方法的流程示意图;
图3是本申请第二方面实施例提供的一种文件生成装置的结构示意图;
图4是本申请第三方面实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本申请的技术方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的例子。
本申请实施例中对数据的获取、存储、使用和处理等均符合国家法律法规的相关规定。
如背景技术部分所述,现有技术中存在对报送数据进行重建解释性文档时,完全依赖人工阅读报送数据对应的脚本文件和政策文件,导致工作繁琐且难度很大的问题,为了解决上述问题,本申请实施例提供了一种文件生成方法、装置、电子设备、介质和计算机程序产品,通过对报送数据对应的脚本文件进行逆向解析,得到脚本文件对应的逆向文件,该逆向文件包括:数据加工流程表和至少一个数据来源表,基于逆向文件中待处理信息的类型,将待处理信息分别存储至不同的数据来源表中,对数据来源表中的待处理信息进行拼接,得到分句信息,然后将不同语句范围的分句信息进行拼接,生成报送数据对应的目标关系表,由于目标关系表中具有报送数据的来源,如此自动基于报送数据对应的脚本文件生成对应的目标关系表,无需人工进行大量脚本文件夹的阅读,提升了目标关系表的生成效率,节约了人力。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的文件生成方法进行详细地说明。
图1是本申请实施例所提供的一种文件生成方法的流程示意图,该文件生成方法的执行主体可以为服务器。上述执行主体并不对本申请实施例构成限定。
如图1所示,本申请实施例提供的文件生成方法可以包括步骤110-步骤140。
步骤110、对报送数据对应的脚本文件进行逆向解析,得到脚本文件对应的逆向文件。
其中,逆向文件可以包括:数据加工流程表和至少一个数据来源表。
步骤120、基于逆向文件中的待处理信息的类型,将不同类型的待处理信息分别存储至不同的数据来源表中。
步骤130、对数据来源表中的待处理信息进行拼接,得到分句信息。
步骤140、将不同语句范围的分句信息进行拼接,生成报送数据对应的目标关系表。
其中,目标关系表可以用于描述报送数据对应的来源。
在本申请的实施例中,通过对报送数据对应的脚本文件进行逆向解析,得到脚本文件对应的逆向文件,该逆向文件包括:数据加工流程表和至少一个数据来源表,基于逆向文件中待处理信息的类型,将待处理信息分别存储至不同的数据来源表中,对数据来源表中的待处理信息进行拼接,得到分句信息,然后将不同语句范围的分句信息进行拼接,生成报送数据对应的目标关系表,由于目标关系表中具有报送数据的来源,如此自动基于报送数据对应的脚本文件生成对应的目标关系表,无需人工进行大量脚本文件夹的阅读,提升了目标关系表的生成效率,节约了人力。
下面对本申请实施例提供的文件生成方法进行详细介绍。
首先介绍步骤110、对报送数据对应的脚本文件进行逆向解析,得到脚本文件对应的逆向文件。
其中,报送数据可以是进行报送的数据。具体的可以是报送税务等的税务数据。
逆向文件可以是对报送数据对应的脚本文件进行逆向解析后所得到的文件。
在本申请的一些实施例中,逆向文件可以包括:数据加工流程表和至少一个数据来源表。
在本申请的一些实施例中,数据加工流程表(main表)可以是利用表格化的表述方式来表述数据(报送数据,以及报送数据的来源数据)从哪个数据表上经过怎样的处理加工生成的。
在本申请的一些实施例中,数据来源表(mapping表)可以是用于表征具体某一步骤中用了哪些字段、哪些数据,经过了怎样的处理,该字段的上游字段是什么,下游字段是什么等。
在本申请的一些实施例中,数据加工流程表和数据来源表的关系可以这样理解:针对一个数据进行傅里叶变换得到变换后的数据这个示例而言,数据加工流程表仅是描述了一个大概过程,即描述的是数据A经过傅里叶变换得到数据B,也就是说数据加工流程表就大概描述什么数据,经过什么算法,得到什么数据即可。而数据来源表则会详细描述数据A从哪来的,数据A进行傅里叶变换的详细过程,以及得到的数据B具体是什么样的数据,该数据下一步用于干什么,也就是说数据来源表会详细描述某一步骤的具体过程。
在本申请的一些实施例中,数据来源表可以但不限于包括:from部分、join部分、where部分和mapping部分。
在本申请的一些实施例中,from部分可以主要用于描述某一数据的来源,以及该数据的下游数据是什么。
在本申请的一些实施例中,join部分可以主要用于描述各表之间的关系。具体的可以是若某一表中的数据需要调用另一表中的数据,则join部分就是用于描述这两个表之间的关系。
在本申请的一些实施例中,where部分可以主要用于描述两个表连接后如何进行数据选取。
在本申请的一些实施例中,mapping部分可以主要用于描述字段之间的映射关系。
在本申请的一些实施例中,针对不同格式的脚本文件可用对应的解析器对脚本文件进行逆向解析。具体的,若脚本文件是Perl格式,则可以使用Perl格式对应的解析器Perlparser对脚本文件进行逆向解析,得到每个脚本文件对应的逆向文件。
在本申请的一些实施例中,逆向文件可以是excel格式。
在本申请的一些实施例中,步骤110的目的是在于利用与脚本文件对应的解析器将脚本文件中的结构化查询语言(Structured Query Language,SQL)语句解析拆解成最小单元的词汇或符号。即将脚本文件中的完整的描述拆解成数据、符号、词汇和短句等。
然后介绍步骤120、基于逆向文件中的待处理信息的类型,将不同类型的待处理信息分别存储至不同的数据来源表中。
其中,待处理信息可以是步骤110中拆解的最小单元。例如可以但不限于是:数据来源表中数据加工流程对应的数据、数据来源表中数据加工流程对应的符号和数据来源表中数据加工流程对应的短句。
在本申请的一些实施例中,可根据逆向文件中的待处理信息的类型,将不同类型的待处理信息分别存储至对应的中间表(from部分的表、join部分的表、where部分的表和mapping部分的表)中。在各中间表中记录下各脚本文件中各加工流程的解析词汇、符号和短句等数据。
接着介绍步骤130、对数据来源表中的待处理信息进行拼接,得到分句信息。
其中,分句信息可以是将数据来源表中的待处理信息进行拼接后所形成的分句。
在本申请的一些实施例中,为了进一步节省人力,提高效率,步骤130具体可以包括:
对数据来源表中的数据加工流程对应的数据、符号和短句按照预设拼接规则进行拼接,得到分句信息。
其中,预设拼接规则可以是预先设置的拼接规则。在本申请的一些实施例中,对中间表中表示各加工流程的词汇、符号和短句等要素,进行可读性较好的分句的合并,生成完整的字段变换、赋值函数等分句信息。
在本申请的一些实施例中,在对数据来源表中的数据加工流程对应的数据、符号和短句按照预设拼接规则进行拼接,得到分句信息的过程中,还要记录好各中间表数据对应的来源文件、加工流程的标记等,便于后续进行拼接。
在本申请的实施例中,通过对数据来源表中的数据加工流程对应的数据、符号和短句按照预设拼接规则进行拼接,得到分句信息,如此可自动得到可读性较好的分句信息,节省了人力,提高了效率。
在本申请的一些实施例中,为了得到精确的报送数据对应的解释性文档,在步骤130之前,上述所涉及的文件生成方法还可以包括:
对数据来源表中的待处理信息进行清洗,得到清洗后的待处理信息。
在本申请的一些实施例中,可对数据来源表中的待处理信息进行清洗,得到清洗后的待处理信息。
对应的,步骤130具体可以包括:对数据来源表中的清洗后的待处理信息进行拼接,得到分句信息。
在本申请的实施例中,可对数据来源表中的待处理信息进行清洗,得到清洗后的待处理信息,如此可基于清洗过后的待处理信息进行拼接,得到精确的分句信息,进而可得到精确的报送数据对应的解释性文档。
在本申请的一些实施例中,为了进一步得到精确的报送数据对应的解释性文档,所述对数据来源表中的待处理信息进行清洗,得到清洗后的待处理信息,可以具体包括:
对数据来源表中重复的数据进行删除;
对于数据来源表中以预设字符开始的短句,改写为符合目标关系表格式的短句,得到清洗后的待处理信息。
其中,预设字符可以是预先设置的字符。
目标关系表格式可以是目标关系表的格式。
在本申请的一些实施例中,目标关系表可以是报送数据对应的最终的解释性文档,该文档为表格形式。
在本申请的一些实施例中,可以对其他会引起拼接或写入错误的数据进行的预先处理,例如为避免后续拼接时写入目标关系表出错,对一些以'='(即预设字符)开头的短句进行改造处理等。还可以是将数据来源表中重复的数据进行删除等。
在本申请的一些实施例中,上述仅列举了进行数据清洗的两种方式,但是本领域技术人员应该知道对数据进行清洗并不仅限于上述所列举的两种方式,还可以具体其他的方式,任何对数据进行清洗的方式均属于本申请实施例的保护范围之列,在此不再赘述。
在本申请的一些实施例中,本步骤旨在通过预处理提高后续拼接数据的准确性。
在本申请的实施例中,通过对数据来源表中重复的数据进行删除,对于数据来源表中以预设字符开始的短句,改写为符合目标关系表格式的短句,得到清洗后的待处理信息,如此可得到精确的待处理信息,进而得到精确的分句信息,提高了后续拼接的准确性。
最后介绍步骤140、将不同语句范围的分句信息进行拼接,生成报送数据对应的目标关系表。
其中,同一语句范围可以是属于相同语句范围内的语句。
目标关系表可以将同一语句范围的分句信息进行拼接后所生成的报送数据对应的表。该目标关系表可以是为excel表格,该表可以用于描述报送数据对应的来源,即为报送数据对应的解释性文档。
在本申请的一些实施例中,可在上述分句信息的基础上对加工逻辑语句做进一步的拼接。具体的可以是将不同语句范围内的分句信息进行拼接,得到复杂一些的多层嵌套的语句的拼装,拼装后的即可形成包含目标字段(目标关系表中所需的字段)、报送数据对应映射来源和报送数据对应加工逻辑等内容的目标关系表。
在本申请的一些实施例中,为了得到精确的目标关系表,步骤140具体可以包括:
将不同语句范围的分句信息进行拼接,得到报送数据对应的临时关系表;
对临时关系表中为空的字段进行数据补充,以及将临时数据表中的临时数据进行删除,生成报送数据对应的目标关系表。
其中,临时关系表可以是将不同语句范围的分句信息进行拼接后所形成的关系表。在该关系表中存在有些字段下面的数据为空,或者在该表中存在拼接过程中系统自动生成的临时数据。
在本申请的一些实施例中,可以对临时关系表中字段下面的数据为空的数据进行补充,以及将临时数据表中的系统自动生成的临时数据进行删除,生成报送数据对应的目标关系表。
在本申请的一些实施例中,在生成的目标关系表中可以具有:脚本文件、加工流程、符号(AND&OR)、辅助表英文名、辅助表中字段英文名、字段变换、条件取值、源表英文名、源字段英文名、赋值函数、目标关系表英文名、目标关系表字段或字段别名、赋值表达式、From关联、Join条件和Where条件等。
在本申请的一些实施例中,辅助表可以是生成该目标关系表所用到的其他表。
在本申请的一些实施例中,源表可以是报送数据的来源表。
在本申请的一些实施例中,目标关系表可以用于后续人工建设指标库模型提供字段级的数据来源和加工逻辑的支持。
在本申请的实施例中,通过将不同语句范围的分句信息进行拼接,得到报送数据对应的临时关系表,对临时关系表中为空的字段进行数据补充,以及将临时数据表中的临时数据进行删除,生成报送数据对应的目标关系表,如此提高了数据的标准化程度,增强了目标关系表的可读性。
在本申请的一些实施例中,为了精确将同一语句范围的分句信息进行拼接,在步骤140之前,上述所涉及的文件生成方法还可以包括:
检测分句信息对应的语句范围标识;
在确定检测到语句范围标识的情况下,确定分句信息的语句范围。
其中,语句范围标识可以是表征分句信息的语句范围的标识。具体的可以是左括号标识和右括号标识。
在本申请的一些实施例中,检测分句信息中对应的语句范围标识,例如可以是对分句信息的左括号和右括号进行检测,在检测到分句信息的左括号和右括号时,可确定出该分句信息对应的语句范围。
在本申请的实施例中,通过检测分句信息对应的语句范围标识,在确定检测到语句范围标识的情况下,确定分句信息的语句范围,如此可精确确定出分句信息的语句范围,进而可精确进行进一步的拼接,得到目标关系表。
在本申请的一些实施例中,为了更加清楚的了解本申请实施例提供的文件生成方法,本申请实施例还提供了文件生成方法的另一种可实现方式。图2是本申请实施例所提供的另一种文件生成方法的流程示意图,如图2所示,本申请实施例提供的文件生成方法可以包括步骤210-步骤250。
步骤210、获取报送数据对应的各脚本文件。
步骤220、对脚本文件进行逆向解析,得到逆向文件。
在本申请的一些实施例中,步骤220与上述实施例中的步骤110一致,在此不再赘述。
步骤230、数据采集。
在本申请的一些实施例中,步骤230与上述实施例中的步骤120一致,即数据采集即为上述步骤120中的基于逆向文件中的待处理信息的类型,将不同类型的待处理信息分别存储至不同的数据来源表中,在此不再赘述。
步骤240、数据处理。
在本申请的一些实施例中,数据处理包括对数据进行清洗、将数据进行预处理(即对数据来源表中的待处理信息进行拼接,得到分句信息)、将数据拼接(即将不同语句范围的分句信息进行拼接)、自动填充(即对临时关系表中为空的字段进行数据补充)和标准化处理(将临时数据表中的临时数据进行删除)。
步骤250、输出解释性文档。
在本申请的一些实施例中,输出解释性文档即为将数据处理后的文档输出为excel表格形式。
需要说明的是,本申请实施例提供的文件生成方法,执行主体可以为文件生成装置,或者该风险确定装置中的用于执行文件生成方法的控制模块。
基于与上述的文件生成方法相同的发明构思,本申请还提供了一种文件生成装置。下面结合图3对本申请实施例提供的文件生成装置进行详细说明。
图3是根据一示例性实施例示出的一种文件生成装置的结构示意图。
如图3所示,该文件生成装置300可以包括:
解析模块310,用于对报送数据对应的脚本文件进行逆向解析,得到所述脚本文件对应的逆向文件;其中,所述逆向文件包括:数据加工流程表和至少一个数据来源表;
存储模块320,用于基于所述逆向文件中的待处理信息的类型,将不同类型的所述待处理信息分别存储至不同的数据来源表中;
第一拼接模块330,用于对所述数据来源表中的待处理信息进行拼接,得到分句信息;
第二拼接模块340,用于将不同语句范围的分句信息进行拼接,生成所述报送数据对应的目标关系表;其中,所述目标关系表用于描述所述报送数据对应的来源。
在本申请实施例中,通过解析模块对报送数据对应的脚本文件进行逆向解析,得到脚本文件对应的逆向文件,该逆向文件包括:数据加工流程表和至少一个数据来源表,通过存储模块基于逆向文件中待处理信息的类型,将待处理信息分别存储至不同的数据来源表中,通过第一拼接模块对数据来源表中的待处理信息进行拼接,得到分句信息,然后通过第二拼接模块将不同语句范围的分句信息进行拼接,生成报送数据对应的目标关系表,由于目标关系表中具有报送数据的来源,如此自动基于报送数据对应的脚本文件生成对应的目标关系表,无需人工进行大量脚本文件夹的阅读,提升了目标关系表的生成效率,节约了人力。
在本申请的一些实施例中,所述待处理信息至少包括:所述数据来源表中数据加工流程对应的数据、所述数据来源表中数据加工流程对应的符号和所述数据来源表中数据加工流程对应的短句。
在本申请的一些实施例中,为了进一步节省人力,提高效率,第一拼接模块330具体用于:对所述数据来源表中的数据加工流程对应的数据、符号和短句按照预设拼接规则进行拼接,得到分句信息。
在本申请的一些实施例中,为了得到精确的报送数据对应的解释性文档,上述所涉及的文件生成装置还可以包括:清洗模块,用于对所述数据来源表中的待处理信息进行清洗,得到清洗后的待处理信息;
对应的,第一拼接模块具体可以用于:对所述数据来源表中的清洗后的待处理信息进行拼接,得到分句信息。
在本申请的一些实施例中,为了进一步得到精确的报送数据对应的解释性文档,所述清洗模块具体可以用于:
对所述数据来源表中重复的数据进行删除;对于所述数据来源表中以预设字符开始的短句,改写为符合所述目标关系表格式的短句,得到清洗后的待处理信息。
在本申请的一些实施例中,为了精确将同一语句范围的分句信息进行拼接,上述所涉及的文件生成装置还可以包括:
检测模块,用于检测所述分句信息对应的语句范围标识;
确定模块,用于在确定检测到所述语句范围标识的情况下,确定所述分句信息的语句范围。
在本申请的一些实施例中,为了得到精确的目标关系表,第二拼接模块340具体可以用于:
将不同语句范围的分句信息进行拼接,得到所述报送数据对应的临时关系表;
对所述临时关系表中为空的字段进行数据补充,以及将所述临时数据表中的临时数据进行删除,生成所述报送数据对应的目标关系表。
本申请实施例提供的文件生成装置,可以用于执行上述各方法实施例提供的文件生成方法,其实现原理和技术效果类似,为简介起见,在此不再赘述。
基于同一发明构思,本申请实施例还提供了一种电子设备。
图4是本申请实施例提供的一种电子设备的结构示意图。如图4所示,电子设备可以包括处理器401以及存储有计算机程序或指令的存储器402。
具体地,上述处理器401可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在综合网关容灾设备的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。存储器可包括只读存储器(Read Only Memory image,ROM)、随机存取存储器(Random-Access Memory,RAM)、磁盘存储介质设备、光存储介质设备、闪存设备、电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行上述实施例提供的文件生成方法所描述的操作。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现上述实施例中的任意一种文件生成方法。
在一个示例中,电子设备还可包括通信接口403和总线410。其中,如图4所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本发明实施例中各模块、设备、单元和/或设备之间的通信。
总线410包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该电子设备可以执行本发明实施例中的文件生成方法,从而实现图1-图2任一描述的文件生成方法。
另外,结合上述实施例中的文件生成方法,本发明实施例可提供一种可读存储介质来实现。该可读存储介质上存储有程序指令;该程序指令被处理器执行时实现上述实施例中的任意一种文件生成方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种文件生成方法,其特征在于,所述方法包括:
对报送数据对应的脚本文件进行逆向解析,得到所述脚本文件对应的逆向文件;其中,所述逆向文件包括:数据加工流程表和至少一个数据来源表;
基于所述逆向文件中的待处理信息的类型,将不同类型的所述待处理信息分别存储至不同的数据来源表中;
对所述数据来源表中的待处理信息进行拼接,得到分句信息;
将不同语句范围的分句信息进行拼接,生成所述报送数据对应的目标关系表;其中,所述目标关系表用于描述所述报送数据对应的来源。
2.根据权利要求1所述的方法,其特征在于,所述待处理信息至少包括:所述数据来源表中数据加工流程对应的数据、所述数据来源表中数据加工流程对应的符号和所述数据来源表中数据加工流程对应的短句;
所述对所述数据来源表中的待处理信息进行拼接,得到分句信息,包括:
对所述数据来源表中的数据加工流程对应的数据、符号和短句按照预设拼接规则进行拼接,得到分句信息。
3.根据权利要求2所述的方法,其特征在于,在所述对所述数据来源表中的待处理信息进行拼接,得到分句信息之前,所述方法还包括:
对所述数据来源表中的待处理信息进行清洗,得到清洗后的待处理信息;
所述对所述数据来源表中的待处理信息进行拼接,得到分句信息,包括:
对所述数据来源表中的清洗后的待处理信息进行拼接,得到分句信息。
4.根据权利要求3所述的方法,其特征在于,所述对所述数据来源中的数据进行清洗,得到清洗后的待处理信息,包括:
对所述数据来源表中重复的数据进行删除;
对于所述数据来源表中以预设字符开始的短句,改写为符合所述目标关系表格式的短句,得到清洗后的待处理信息。
5.根据权利要求1-4任一所述的方法,其特征在于,在所述将不同语句范围的分句信息进行拼接,生成所述报送数据对应的目标关系表之前,所述方法还包括:
检测所述分句信息对应的语句范围标识;
在确定检测到所述语句范围标识的情况下,确定所述分句信息的语句范围。
6.根据权利要求1-4任一所述的方法,其特征在于,所述将不同语句范围的分句信息进行拼接,生成所述报送数据对应的目标关系表,包括:
将不同语句范围的分句信息进行拼接,得到所述报送数据对应的临时关系表;
对所述临时关系表中为空的字段进行数据补充,以及将所述临时数据表中的临时数据进行删除,生成所述报送数据对应的目标关系表。
7.一种文件生成装置,其特征在于,所述装置包括:
解析模块,用于对报送数据对应的脚本文件进行逆向解析,得到所述脚本文件对应的逆向文件;其中,所述逆向文件包括:数据加工流程表和至少一个数据来源表;
存储模块,用于基于所述逆向文件中的待处理信息的类型,将不同类型的所述待处理信息分别存储至不同的数据来源表中;
第一拼接模块,用于对所述数据来源表中的待处理信息进行拼接,得到分句信息;
第二拼接模块,用于将不同语句范围的分句信息进行拼接,生成所述报送数据对应的目标关系表;其中,所述目标关系表用于描述所述报送数据对应的来源。
8.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7任一所述的文件生成方法的步骤。
9.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-6任一所述的文件生成方法的步骤。
10.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-6任意一项所述的文件生成方法。
CN202111538388.7A 2021-12-15 2021-12-15 文件生成方法、装置、电子设备、介质和计算机程序产品 Pending CN114201177A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111538388.7A CN114201177A (zh) 2021-12-15 2021-12-15 文件生成方法、装置、电子设备、介质和计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111538388.7A CN114201177A (zh) 2021-12-15 2021-12-15 文件生成方法、装置、电子设备、介质和计算机程序产品

Publications (1)

Publication Number Publication Date
CN114201177A true CN114201177A (zh) 2022-03-18

Family

ID=80654239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111538388.7A Pending CN114201177A (zh) 2021-12-15 2021-12-15 文件生成方法、装置、电子设备、介质和计算机程序产品

Country Status (1)

Country Link
CN (1) CN114201177A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114840178A (zh) * 2022-07-01 2022-08-02 浙江西图盟数字科技有限公司 基于数字化仿真平台的工艺文件生成方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114840178A (zh) * 2022-07-01 2022-08-02 浙江西图盟数字科技有限公司 基于数字化仿真平台的工艺文件生成方法、装置及设备
CN114840178B (zh) * 2022-07-01 2022-12-02 浙江西图盟数字科技有限公司 基于数字化仿真平台的工艺文件生成方法、装置及设备

Similar Documents

Publication Publication Date Title
CN109522552B (zh) 一种医疗信息的归一化方法、装置、介质及电子设备
US9122540B2 (en) Transformation of computer programs and eliminating errors
CN111144210B (zh) 图像的结构化处理方法及装置、存储介质及电子设备
US11327722B1 (en) Programming language corpus generation
CN111090641A (zh) 数据处理方法及装置、电子设备、存储介质
CN108170468A (zh) 一种自动检测注释和代码一致性的方法及其系统
CN113627168B (zh) 一种元器件封装冲突的检查方法、装置、介质及设备
CN109189372B (zh) 保险产品的开发脚本生成方法及终端设备
CN115952760A (zh) 一种数模电路仿真方法、装置、设备及计算机存储介质
CN114201177A (zh) 文件生成方法、装置、电子设备、介质和计算机程序产品
CN110688823B (zh) Xml文件验证方法及装置
CN117873905B (zh) 一种代码同源检测的方法、装置、设备及介质
CN109359055B (zh) 一种数据测试的方法和设备
CN116360794A (zh) 数据库语言解析方法、装置、计算机设备及存储介质
CN115547508A (zh) 数据校正方法、装置、电子设备及存储介质
CN114090014A (zh) 程序拆分方法、装置、设备及计算机存储介质
CN110633204B (zh) 一种程序缺陷检测方法及装置
CN109710305B (zh) 一种开发信息的获取方法、装置、存储介质及终端设备
CN113672512A (zh) 代码检查规则生成方法、代码检查方法、装置、介质
CN112395865A (zh) 报关单校验方法及装置
CN117707987B (zh) 一种测试用例的检测方法、装置、电子设备及存储介质
CN114895987B (zh) 消息处理方法、装置、设备及计算机存储介质
JP2002342129A (ja) コーディングチェック方式
CN113821210B (zh) 一种文件解析方法、装置及存储介质
CN113485715B (zh) 一种基于数据中台的代码提示方法、系统及数据计算平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination