CN114035805B - 用于预编译器的代码转换方法、装置、介质及设备 - Google Patents

用于预编译器的代码转换方法、装置、介质及设备 Download PDF

Info

Publication number
CN114035805B
CN114035805B CN202111356826.8A CN202111356826A CN114035805B CN 114035805 B CN114035805 B CN 114035805B CN 202111356826 A CN202111356826 A CN 202111356826A CN 114035805 B CN114035805 B CN 114035805B
Authority
CN
China
Prior art keywords
information
code
dependency
dependency information
abstract syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111356826.8A
Other languages
English (en)
Other versions
CN114035805A (zh
Inventor
马贤迪
树柏涵
吴世伟
韦保山
宝腾飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202111356826.8A priority Critical patent/CN114035805B/zh
Publication of CN114035805A publication Critical patent/CN114035805A/zh
Application granted granted Critical
Publication of CN114035805B publication Critical patent/CN114035805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/51Source to source
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/423Preprocessors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/427Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本公开涉及一种用于预编译器的代码转换方法、装置、介质及设备,所述方法包括:获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;根据所述中间表示生成第二代码语言下对应的第二代码。由此可以在一定程度上保证代码转换的统一性和一致性,避免人工编写代码的差异,降低技术人员的工作量。

Description

用于预编译器的代码转换方法、装置、介质及设备
技术领域
本公开涉及计算机技术领域,具体地,涉及一种用于预编译器的代码转换方法、装置、介质及设备。
背景技术
随着深度学习的广泛应用,在搜索引擎、推荐系统、机器视觉等业务系统中,越来越多的深度学习模型部署到线上服务。机器学习模型在离线训练时,一般要将输入的数据做特征工程预处理,再输入模型以对模型进行训练。在对模型离线训练完成后,对该模型上线部署。在该过程中,在训练过程中对输入数据的处理和模型上线部署的代码语言不同,例如,训练过程中采用Python实现特征工程逻辑代码,上线部署中需要用C++重新实现该逻辑代码。
相关技术中,通常是需要人工编写两套代码,以分别适用于模型的训练和部署过程,而在上述技术方案中,不仅增加了技术人员的开发工作量,同时难以保证两套代码的一致性,影响模型在线上的效果,并且难以适用于需求的变更。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种用于预编译器的代码转换方法,所述方法包括:
获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;
对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
根据所述中间表示生成第二代码语言下对应的第二代码。
第二方面,本公开提供一种用于预编译器的代码转换装置,所述装置包括:
获取模块,用于获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;
第一确定模块,用于对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
转换模块,用于根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
生成模块,用于根据所述中间表示生成第二代码语言下对应的第二代码。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面所述方法的步骤。
在上述技术方案中,对获取到的源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树,转换成包含所述抽象语法树中各节点的类型信息的中间表示,之后根据所述中间表示生成第二代码语言下对应的第二代码。由此通过上述技术方案可以通过对源代码文件的解析,基于变量信息和依赖信息获得与源代码文件的抽象语法树等价且包含其节点类型信息的中间表示,通过生成该统一结构的中间表示以实现代码转换,可以降低代码转换的过程中第一代码语言和第二代码语言之间的关联,能够基于对第一代码的一次分析实现多种第二代码语言下的代码转换,提高该代码转换方法的使用范围,并且可以在一定程度上保证代码转换的统一性和一致性,有效避免人工编写代码时的个人习惯性差异,便于后续的代码维护和漏洞检查,在降低技术人员工作量的同时,提高生成的第二代码的质量,并且可以在需求变更的同时快速且准确的实现代码转换适配,为基于第二代码的模型的使用提供可靠的技术支持,进一步提升用户使用体验。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
图1为根据本公开的一种实施方式提供的一种用于预编译器的代码转换方法的流程图;
图2为基于本公开的实施例提供的静态编译器的架构流程示意图;
图3为根据本公开的一种实施方式提供的一种用于预编译器的代码转换装置的框图;
图4示出了适于用来实现本公开实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1所示,为根据本公开的一种实施方式提供的一种用于预编译器的代码转换方法的流程图,如图1所示,所述方法可以包括:
在步骤11中,获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码。
其中,进行代码转换的源代码文件可以是一个或多个,在该源代码文件为多个时,则可以根据默认指定或用户指定确定其中的一个文件作为初始的源代码文件进行后续流程。示例地,该第一代码语言可以是Python,如背景技术中所述,该源代码文件可以是模型训练时编写的代码。
在步骤12中,对源代码文件进行解析,确定源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类。
示例地,在进行代码开发时,在该文件中可以定义变量以对属性进行描述,该变量信息可以包含该变量的名称、数据类型以及作用域等,依赖信息用于表征该源代码文件中的类之间的依赖关系以及函数之间的依赖关系。
在步骤13中,根据变量信息和依赖信息,将依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息。
其中,中间表示(Intermediate Representation,IR)为第一代码进行语法分析后到生成目标代码之间的源程序表现形式,抽象语法树(Abstract Syntax Tree,AST)是源代码的抽象语法结构的树状表示,该抽象语法树中的每个节点都表示源代码中的一种结构。抽象语法树可以通过词法分析器和语法分析器对第一代码进行分析获得,其处理方式为本领域中的常用方式,如可以通过Parser工具进行分析获得,在此不再赘述。其中,图2所示为基于本公开的实施例提供的静态编译器的架构流程示意图,则可以根据上述语法分析流程AST Parser对第一代码进行分析,获得上述抽象语法树。示例地,该抽象语法树、变量信息等可以存储至上下文文件ScriptContext中,以便于后续应用过程中对相关信息的快速读取。
在本公开实施例中,根据变量信息和依赖信息,可以针对每一解析对象及其依赖的对象进行代码转换,同时结合变量信息可以进一步确定该抽象语法树中每个节点的类型信息,获得该解析对象对应的统一结构表示,便于后续到第二代码语言的统一转换。
在步骤14中,根据中间表示生成第二代码语言下对应的第二代码。
其中,在该实施例中可以将获得的中间表示作为代码转换的元数据,同时可以定义代码转换规则的模板文件,其中,该模板文件中可以定义转换至第二代码语言的语法结构。示例地,可以基于代码生成工具实现该中间表示至第二代码的转换,如可以基于生成流程CodeGen生成第二代码,其可以读取该中间表示并从代码转换规则的模板文件中读取转换规则,将该读取到的转换规则与中间表示进行合并以进行代码生成,以输出第二代码。
在上述技术方案中,对获取到的源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树,转换成包含所述抽象语法树中各节点的类型信息的中间表示,之后根据所述中间表示生成第二代码语言下对应的第二代码。由此通过上述技术方案可以通过对源代码文件的解析,基于变量信息和依赖信息获得与源代码文件的抽象语法树等价且包含其节点类型信息的中间表示,通过生成该统一结构的中间表示以实现代码转换,可以降低代码转换的过程中第一代码语言和第二代码语言之间的关联,能够基于对第一代码的一次分析实现多种第二代码语言下的代码转换,提高该代码转换方法的使用范围,并且可以在一定程度上保证代码转换的统一性和一致性,有效避免人工编写代码时的个人习惯性差异,便于后续的代码维护和漏洞检查,在降低技术人员工作量的同时,提高生成的第二代码的质量,并且可以在需求变更的同时快速且准确的实现代码转换适配,为基于第二代码的模型的使用提供可靠的技术支持,进一步提升用户使用体验。
在一种可能的实施例中,所述对源代码文件进行解析,确定源代码文件对应的变量信息和依赖信息的示例性实现方式如下,该步骤可以包括:
对所述源代码文件中的变量进行解析,获得所述源代码文件中的全局变量和局部变量,以获得所述变量信息。
其中,可以通过提取源代码文件中的变量定义语句,确定该源代码文件中定义的各个变量,局部变量为定义在函数内部的变量,其的作用域范围为函数内,全局变量为定义在函数外的变量,其作用域范围为全局,由此,可以根据变量定义的位置确定该变量的作用域,以确定其为局部变量还是全局变量。同时针对第一代码语言中的语法,也可以基于变量定义的关键字确定,如在Python中,global定义的变量可以确定其为全局变量。同时在进行变量解析时,可以进一步获得定义该变量的变量类型和变量名称,以获得变量信息。作为示例,可以将获得的各个变量信息进行统一存储,以便于后续代码转换过程中的直接应用。其中,如图2所示,可以通过模块分析流程ModuleAnalysis确定该变量信息。
针对所述源代码文件中的每一解析对象,根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息。
如上文所述,该解析对象可以是函数Function,也可以是类Class,以解析对象为类为例进行说明。示例地,若A类的变化引起了B类的变化,则说明B类依赖于A类,通常情况下依赖关系体现在某个类的函数使用另一个类的对象作为参数。在该实施例中,可以通过对每一类的函数进行分类,以确定是否存在依赖,从而确定该类的依赖信息。
由此,通过上述技术方案,可以对源代码文件中的变量信息和依赖信息进行分析,为确定该源代码文件的结构化表示提供数据支持,同时确定源代码文件的依赖关系也可以为后续生成第二代码提供支持,保证转换所得的第二代码与第一代码的逻辑一致性和可用性。
在一种可能的实施例中,根据解析对象对应的抽象语法树,确定所述解析对象的依赖信息,包括:
根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象,其中,所述目标对象初始为所述解析对象。
以下以函数F1为例进行说明,初始时,将该函数F1作为目标对象,则可以根据该函数F1对应的抽象语法树,确定其中的节点中是否有引用其他函数的节点(即依赖对象),若有引用其他函数的节点则确定该函数F1存在依赖对象,例如,该依赖对象为函数F2和函数F3。
若存在所述依赖对象,针对所述依赖对象,在获取到的所述依赖对象所属的目标代码文件不是所述源代码文件的情况下,对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息,并将所述依赖对象作为新的目标对象,重新执行所述根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象的步骤,直至不存在目标对象对应的依赖对象。
示例地,若依赖对象为多个,则可以按照确定顺序依次对每一依赖对象进行上述分析。例如首先获取函数F2所属的目标代码文件,该目标代码文件不是该源代码文件,则对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息。其中,获取变量信息的方式已在上文进行详述,在此不再赘述。分析完变量信息之后,则可以该函数F2确定为新的目标对象,即对函数F2进一步执行上述流程,以对函数F2进行分析,示例地,进一步分析所得该函数F2存在依赖对象为函数F4,函数F4不存在依赖对象。
针对函数F3,获取函数F3所属的目标代码文件,该目标代码文件是该源代码文件,由于此时已经对该源代码文件进行了变量信息分析,此时无需重新解析,可以直接将该函数F3作为新的目标对象,即对函数F3进一步执行上述流程,以对函数F3进行分析,示例地,进一步分析所得函数F3不存在依赖对象。由此,分析完成。
根据所述解析对象确定出的各个目标对象以及该目标对象的依赖对象,确定所述解析对象的依赖信息。
通过上述分析过程确定函数F1依赖函数F2和函数F3,函数F2依赖函数F4,则可以根据该确定出的各个依赖关系生成函数F1的依赖关系,以表征该多个函数之间的依赖,如图2所示,可以通过该DAG分析流程生成该依赖信息,该依赖信息可以通过DAG(有向无环图,Directed acyclic graph)表示。其中在确定依赖关系之后可以基于本领域常用的方式生成有向无环图,本公开在此不再赘述。
由此,通过上述技术方案,可以对源代码文件中的各个函数和类之间的依赖关系进行分析,保证代码转换前后逻辑关系的一致性,为快速进行代码转换提供数据支持,同时也可以有效保证生成的第二代码的有效性和可用性,便于模型的快速部署和服务。
在一种可能的实施例中,根据变量信息和依赖信息,将依赖信息中各个解析对象对应的抽象语法树转换成中间表示的示例性实现方式如下,该步骤可以包括:
基于所述依赖信息,依次获取所述依赖信息中的每一解析对象;
针对获取到的每一解析对象,根据所述解析对象对应的抽象语法树、所述解析对象中的变量以及所述解析对象所属文件对应的变量信息,以递归下降方式生成与该抽象语法树对应的中间表示。
接上文所述示例,在将解析对象函数F1对应的抽象语法树转换成中间表示时,其对应的依赖关系如下:函数F1依赖函数F2和函数F3,函数F2依赖函数F4,即对函数F1进行转换需要依赖函数F2和函数F3的中间表示,对函数F2进行转换需要依赖函数F4的中间表示。
相应地,在该实施例中,可以依次获取函数F1、函数F2、函数F3和函数F4,在该转换过程中,函数F1和函数F2的转换需要等待。在获取到函数F3时,可以根据函数F3对应的抽象语法树、函数F3中的变量以及函数F3所属文件对应的变量信息,确定函数F3对应的中间表示。示例地,可以基于函数F3中的变量从函数F3所属文件对应的变量信息中、确定函数F3的变量对应变量信息,从而基于函数F3的变量对应变量信息和函数F3对应的抽象语法树确定该抽象语法树中的各节点的类型,获得对应的中间表示,其中,该中间表示可以预先设置定义的结构体模板,从而基于该结构体模板和该添加节点类型后的抽象语法树形成对应的中间表示。
同样地,可以确定函数F4对应的中间表示,进一步地可以基于递归下降的方式确定函数F2对应的中间表示,在函数F2和函数F3分别对应的中间表示确定出后,进一步基于递归下降的方式确定函数F1对应的中间表示。
由此,可以结合依赖信息和变量信息,依次有序地对解析对象对应的抽象语法树进行快速且准确地转换,提高中间表示中包含的代码特征的全面性,同时可以提高中间表示的转换效率,从而提高代码转换的效率和准确性。
在一种可能的实施例中,在所述根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示的步骤之前,所述方法还可以包括:
根据所述第二代码语言对应的语法,确定所述变量信息与所述第二代码语言对应的关键字是否存在冲突;
若确定存在冲突,则根据预设命名规则所述变量信息进行重命名,获得更新变量信息。
其中,在不同的代码语言下可能存在不同的关键字定义,例如在Python中,可以定义名称为int的变量,而C++中,int为表示数据类型为整型的关键字,其并不能作为变量名称。因此,在该实施例中,在进行中间表示转换之后,可以根据第二代码语言下的关键字定义确定是否与源代码文件中的变量信息存在冲突。
若不存在冲突,则可以直接基于该变量信息进行中间表示的转换,若存在冲突则需要对变量信息进行重命名,例如对变量信息中存在冲突的变量名称进行重命名,其中预设命名规则可以根据实际应用场景进行设置,能够避免关键字冲突即可,本公开对此不进行限定,例如可以采用添加下划线后缀等方式进行重命名,可以存储该原始名称与更新变量信息至上下文文件中,以便后续转换过程中的查询读取。
对所述依赖信息中的各个解析对象的签名进行解析,获得所述解析对象的类型信息和参数信息,并将所述类型信息和所述参数信息与所述依赖信息关联,获得更新依赖信息。
示例地,针对函数的依赖信息则可以其中的每一函数进行解析,获得该函数的名称和类型信息,并对参数进行解析,获得参数名称和参数类型等参数信息,从而将其与依赖信息关联,示例地,可以将该解析对象的类型信息和参数信息存储在上下文文件中并进行关联,以进一步提高更新依赖信息关联特征的全面性,同时对解析对象的签名进行预先解析,也可以在一定程度上的提高代码转换方法的效率。
相应地,所述根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示则可以包括:
根据所述变量信息对应的更新变量信息和所述依赖信息对应的更新依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示。
示例地,可以基于图2中的分析流程Analysis进行上述关键字冲突检测和签名解析等流程,之后基于流程后所得的更新后的相关信息进行中间表示的转换,如图2中的中间表示转换流程Parser,并将转换所得的中间表示存储在中间表示模块IR Module中。由此,通过上述技术方案,可以预先对代码转换过程中的不同代码语言之间的差异性进行检测,避免代码转换的冲突,同时对解析对象的签名解析之后进行中间表示的转换,也可以进一步提高该中间表示的准确性,从而保证基于将该中间表示转换所得的第二代码的准确性。
如背景技术中所述需要对该模型对应的代码进行上线部署,进而提供相应的服务。基于此,本公开还提供以下实施例。
在一种可能的实施例中,所述方法还可以包括:
调用所述第二代码语言对应的编译器对所述第二代码进行编译,获得所述第二代码对应的动态库;
对所述动态库和所述第二代码对应的函数表进行封装,获得运行时模块,其中,所述运行时模块基于所述运行时模块对应的入口函数被调用。
示例地,该第二代码语言为C++,则在该实施例中,可以进一步调用C++编译器对该第二代码进行编译,从而可以将该第二代码编译成动态库DSO的形式,如图2中可以通过C++编译器Compiler进行编译,获得动态库DSO。该过程中需要调用其他代码语言下的编译工具,可以通过编译工具链Toolchain实现。其中,该第二代码对应的函数表可以通过对第一代码进行解析的过程获得,其中,针对于类中的成员函数,其可以结合类和函数名称添加至该函数表中,例如,MyClass.F5函数,表示类MyClass中的成员函数F5。若在第一代码分析的过程中对其函数名称进行重命名,则该函数表中为重命名之后的名称。
作为示例,在调用C++编译器进行编译之后,则该预编译器AOT可以加载该动态库DSO,并通过封装流程RTModule将该动态库和函数表进行封装,获得运行时模块RuntimeModule。其中,所述运行时模块基于所述运行时模块对应的入口函数被调用。示例地,可以调用GetFunction接口获取该运行时模块的入口函数的函数信息,从而基于该入口函数调用该运行时模块,以接入上层服务,如图2中流程所示。
由此,通过上述技术方案,在对第一代码进行转换获得第二代码之后,可以进一步地调用第二代码语言对应的编译器对该第二代码进行编译,从而获得动态库,实现第二代码语言下的运行时以降低动态分配和调度,进一步提高该预编译器的流程自动化处理水平,降低技术人员的人工工作量,提升用户使用体验。
在一种可能的实施例中,所述方法还包括:基于第三方库和预编译器中预设的签名表示,确定所述第三方库对应的包装库的库名称和库链接地址,其中,所述包装库中包含所述第三方库的链接地址。其中,该第三方库可以包括该动态库。预设的签名表示可以是预定义的、对库的抽象表示,通过生成包装库可以将各个第三方库的签名表示为统一格式,便于第三方库的注册以及预编译器对第三方库的识别。
根据所述库名称和所述库链接地址,生成映射关系并存储所述映射关系至映射表中;根据所述第三方库的所述库名称和所述映射表,生成所述第三方库在所述第一代码语言下对应的接口代码,并将所述接口代码添加至接口文件。其中,针对于新注册的第三方库,若要在第一代码语言下进行调用,则可以将该第三方库包装成第一代码语言下的一个的接口,基于该接口实现该第三方库的调用。在该实施例中,针对每一第三方库,都可以在第一代码语言下生成其对应的接口代码,例如,可以基于wrapper生成该第三方库对应的接口代码,以用于调用第三方库。该实施例中可以将第三方库对应的接口代码添加至接口文件中,从而使得预编译器在进行代码转换时可以通过导入该接口文件实现在第一代码语言下对新注册的第三方库的调用。
相应地,根据所述中间表示生成第二代码语言下对应的第二代码,可以是根据所述第二代码语言和所述接口文件对所述中间表示进行转换,以获得所述第二代码。
由此,可以在预编译器中基于包装库和映射表的方式注册第三方库,通过生成接口文件以使得预编译器对调用第三方库的第一代码进行准确识别和代码转换,支持开发者在预编译器中扩展第三方库,提高第三方库的集成效率,同时提高该代码转换方法的使用范围和转换准确度。
在一种可能的实施例中,所述方法还包括:
在所述第一代码语言下,基于所述库名称和所述接口文件中的所述映射表确定所述库链接地址;
根据所述库链接地址路由至所述包装库,并根据所述包装库中的所述第三方库的链接地址路由至所述第三方库,根据第一代码语言下的调用参数调用所述第三方库。
其中,注册到预编译器中的第三方库也可以在第一代码语言下被调用编译。在该情况下可以基于调用的库名称从该接口文件中的映射表中查询该库名称对应的库链接地址。示例地,可以以库名称MyClass作为key从映射表中进行查询,从而查询到该key对应的value,即该库名称MyClass对应的库链接地址,记为A1。
在该实施例中,可以基于返回的地址A1进行库调用,从而实现对包装库MyClass的调用。在调用该包装库时基于其中的第三方库的链接地址A2进一步调用第三方库,实现第一代码语言下对该第三方库的调用。其中,调用过程中不同代码语言下的参数类型的转换可以可以基于预编译器中运行时层的FFI(Foreign Function Interface,语言交互接口)实现,在此不再赘述由此,通过上述技术方案,可以基于包装库和映射表在第一代码语言下将对包装库的调用分发路由至对应的第三方库的实际链接地址,从而实现对第三方库的调用,实现第一代码语言下对不同代码语言的第三方库的直接使用,进一步拓展预编译器的使用范围,贴合实际应用场景。
在一种可能的实施例中,所述方法还包括:
对所述运行时模块和所述运行时模块的元信息进行封装,获得即时生成处理器(JitOp,Just In Time Operator)。
将所述即时生成处理器集成到处理流程,以在所述处理流程中基于所述即时生成处理器的接口使用所述即时生成处理器。
在该实施例中,在将第一代码进行转换获得第二代码后,可以其他的判断逻辑等进行集成,为便于处理流程pipeline中的调用方进行使用,其可以对该运行时模块进行进一步地封装,其中,元信息是关于信息的信息,用于描述信息的结构、语义、用途和用法等。在该实施例中元信息的结构可以预先设置,从而可以根据该结构和该运行时模块确定该运行时模块的元信息,从而进行封装,具体的封装方式可以采用本领域中的常用方式,在此不再赘述。因此,通过上述技术方案,调用方可以基于封装即时生成处理器后的接口对该第二代码直接进行调用,使得对该第二代码中逻辑的调用与普通函数调用方式一致,为其他调用方提供更简便的调用方式,简化使用流程和调用方式,进一步提高第二代码应用的自动化水平,从而可以有效简化模型的部署的复杂化,提升用户使用体验。
在一种可能的实施例中,如图2所示,上述各个步骤中的出现的错误信息可以通过报错程序Error Reporter追溯源代码以获得错误提示信息,以便于用户基于该错误提示信息快速定位报错位置,从而进行相应地修改和维护。
在一种可能的实施例中,可以通过trace机制,记录代码转换后的第二代码的运行过程,并对其进行序列化保存,从而保存的序列化数据支持脱离第一代码语言的运行环境,而可以直接被第二代言语言的运行环境所使用,进一步提高第二代码语言下对第二代码的应用的自动化,拓宽该代码转换方法的适用范围。
基于同样的发明构思,本公开还提供一种用于预编译器的代码转换装置,如图3所示,所述装置10包括:
获取模块100,用于获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;
第一确定模块200,用于对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
转换模块300,用于根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
生成模块400,用于根据所述中间表示生成第二代码语言下对应的第二代码。
可选地,所述装置还包括:
编译模块,用于调用所述第二代码语言对应的编译器对所述第二代码进行编译,获得所述第二代码对应的动态库;
第一封装模块,用于对所述动态库和所述第二代码对应的函数表进行封装,获得运行时模块,其中,所述运行时模块基于所述运行时模块对应的入口函数被调用。
可选地,所述装置还包括:
第二封装模块,用于对所述运行时模块和所述运行时模块的元信息进行封装,获得即时生成处理器;
集成模块,用于将所述即时生成处理器集成到处理流程,以在所述处理流程中基于所述即时生成处理器的接口使用所述即时生成处理器。
可选地,所述第一确定模块包括:
第一解析子模块,用于对所述源代码文件中的变量进行解析,获得所述源代码文件中的全局变量和局部变量,以获得所述变量信息;
第一确定子模块,用于针对所述源代码文件中的每一解析对象,根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息。
可选地,所述第一确定子模块包括:
第二确定子模块,用于根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象,其中,所述目标对象初始为所述解析对象;
第二解析子模块,用于若存在所述依赖对象,针对所述依赖对象,在获取到的所述依赖对象所属的目标代码文件不是所述源代码文件的情况下,对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息,并将所述依赖对象作为新的目标对象,重新触发所述第二确定子模块根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象,直至不存在目标对象对应的依赖对象;
第三确定子模块,用于根据所述解析对象确定出的各个目标对象以及该目标对象的依赖对象,确定所述解析对象的依赖信息。
可选地,所述转换模块包括:
获取子模块,用于基于所述依赖信息,依次获取所述依赖信息中的每一解析对象;
生成子模块,用于针对获取到的每一解析对象,根据所述解析对象对应的抽象语法树、所述解析对象中的变量以及所述解析对象所属文件对应的变量信息,以递归下降方式生成与该抽象语法树对应的中间表示。
可选地,所述装置还包括:
第二确定模块,用于在所述转换模块根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示之前,根据所述第二代码语言对应的语法,确定所述变量信息与所述第二代码语言对应的关键字是否存在冲突;
第一更新模块,用于若确定存在冲突,则根据预设命名规则所述变量信息进行重命名,获得更新变量信息;
第二更新模块,用于对所述依赖信息中的各个解析对象的签名进行解析,获得所述解析对象的类型信息和参数信息,并将所述类型信息和所述参数信息与所述依赖信息关联,获得更新依赖信息;
所述转换模块用于:
根据所述变量信息对应的更新变量信息和所述依赖信息对应的更新依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;根据所述中间表示生成第二代码语言下对应的第二代码。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取进行代码转换的源代码文件的模块”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,示例1提供了一种用于预编译器的代码转换方法,其中,所述方法包括:
获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;
对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
根据所述中间表示生成第二代码语言下对应的第二代码。
根据本公开的一个或多个实施例,示例2提供了示例1的方法,其中,所述方法还包括:
调用所述第二代码语言对应的编译器对所述第二代码进行编译,获得所述第二代码对应的动态库;
对所述动态库和所述第二代码对应的函数表进行封装,获得运行时模块,其中,所述运行时模块基于所述运行时模块对应的入口函数被调用。
根据本公开的一个或多个实施例,示例3提供了示例2的方法,其中,所述方法还包括:
对所述运行时模块和所述运行时模块的元信息进行封装,获得即时生成处理器;
将所述即时生成处理器集成到处理流程,以在所述处理流程中基于所述即时生成处理器的接口使用所述即时生成处理器。
根据本公开的一个或多个实施例,示例4提供了示例1的方法,其中,所述对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,包括:
对所述源代码文件中的变量进行解析,获得所述源代码文件中的全局变量和局部变量,以获得所述变量信息;
针对所述源代码文件中的每一解析对象,根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息。
根据本公开的一个或多个实施例,示例5提供了示例4的方法,其中,所述根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息,包括:
根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象,其中,所述目标对象初始为所述解析对象;
若存在所述依赖对象,针对所述依赖对象,在获取到的所述依赖对象所属的目标代码文件不是所述源代码文件的情况下,对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息,并将所述依赖对象作为新的目标对象,重新执行所述根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象的步骤,直至不存在目标对象对应的依赖对象;
根据所述解析对象确定出的各个目标对象以及该目标对象的依赖对象,确定所述解析对象的依赖信息。
根据本公开的一个或多个实施例,示例6提供了示例1的方法,其中,所述根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,包括:
基于所述依赖信息,依次获取所述依赖信息中的每一解析对象;
针对获取到的每一解析对象,根据所述解析对象对应的抽象语法树、所述解析对象中的变量以及所述解析对象所属文件对应的变量信息,以递归下降方式生成与该抽象语法树对应的中间表示。
根据本公开的一个或多个实施例,示例7提供了示例1-6中任一示例的方法,其中,在所述根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示的步骤之前,所述方法还包括:
根据所述第二代码语言对应的语法,确定所述变量信息与所述第二代码语言对应的关键字是否存在冲突;
若确定存在冲突,则根据预设命名规则所述变量信息进行重命名,获得更新变量信息;
对所述依赖信息中的各个解析对象的签名进行解析,获得所述解析对象的类型信息和参数信息,并将所述类型信息和所述参数信息与所述依赖信息关联,获得更新依赖信息;
所述根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,包括:
根据所述变量信息对应的更新变量信息和所述依赖信息对应的更新依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示。
根据本公开的一个或多个实施例,示例8提供了一种用于预编译器的代码转换装置,其中,所述装置包括:
获取模块,用于获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;
第一确定模块,用于对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
转换模块,用于根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
生成模块,用于根据所述中间表示生成第二代码语言下对应的第二代码。
根据本公开的一个或多个实施例,示例9提供了一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理装置执行时实现示例1-7中任一示例所述方法的步骤。
根据本公开的一个或多个实施例,示例10提供了一种电子设备,其中,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现示例1-7中任一示例所述方法的步骤。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

Claims (9)

1.一种用于预编译器的代码转换方法,其特征在于,所述方法包括:
获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;
对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
根据所述中间表示生成第二代码语言下对应的第二代码;
其中,所述根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,包括:
基于所述依赖信息,依次获取所述依赖信息中的每一解析对象;
针对获取到的每一解析对象,根据所述解析对象对应的抽象语法树、所述解析对象中的变量以及所述解析对象所属文件对应的变量信息,以递归下降方式生成与该抽象语法树对应的中间表示。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
调用所述第二代码语言对应的编译器对所述第二代码进行编译,获得所述第二代码对应的动态库;
对所述动态库和所述第二代码对应的函数表进行封装,获得运行时模块,其中,所述运行时模块基于所述运行时模块对应的入口函数被调用。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对所述运行时模块和所述运行时模块的元信息进行封装,获得即时生成处理器;
将所述即时生成处理器集成到处理流程,以在所述处理流程中基于所述即时生成处理器的接口使用所述即时生成处理器。
4.根据权利要求1所述的方法,其特征在于,所述对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,包括:
对所述源代码文件中的变量进行解析,获得所述源代码文件中的全局变量和局部变量,以获得所述变量信息;
针对所述源代码文件中的每一解析对象,根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息,包括:
根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象,其中,所述目标对象初始为所述解析对象;
若存在所述依赖对象,针对所述依赖对象,在获取到的所述依赖对象所属的目标代码文件不是所述源代码文件的情况下,对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息,并将所述依赖对象作为新的目标对象,重新执行所述根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象的步骤,直至不存在目标对象对应的依赖对象;
根据所述解析对象确定出的各个目标对象以及该目标对象的依赖对象,确定所述解析对象的依赖信息。
6.根据权利要求1-5中任一项所述的方法,其特征在于,在所述根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示的步骤之前,所述方法还包括:
根据所述第二代码语言对应的语法,确定所述变量信息与所述第二代码语言对应的关键字是否存在冲突;
若确定存在冲突,则根据预设命名规则所述变量信息进行重命名,获得更新变量信息;
对所述依赖信息中的各个解析对象的签名进行解析,获得所述解析对象的类型信息和参数信息,并将所述类型信息和所述参数信息与所述依赖信息关联,获得更新依赖信息;
所述根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,包括:
根据所述变量信息对应的更新变量信息和所述依赖信息对应的更新依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示。
7.一种用于预编译器的代码转换装置,其特征在于,所述装置包括:
获取模块,用于获取进行代码转换的源代码文件,其中,所述源代码文件中包含第一代码语言下的第一代码;
第一确定模块,用于对所述源代码文件进行解析,确定所述源代码文件对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
转换模块,用于根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
生成模块,用于根据所述中间表示生成第二代码语言下对应的第二代码;
其中,所述转换模块包括:
获取子模块,用于基于所述依赖信息,依次获取所述依赖信息中的每一解析对象;
生成子模块,用于针对获取到的每一解析对象,根据所述解析对象对应的抽象语法树、所述解析对象中的变量以及所述解析对象所属文件对应的变量信息,以递归下降方式生成与该抽象语法树对应的中间表示。
8.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-6中任一项所述方法的步骤。
9.一种电子设备,其特征在于,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现权利要求1-6中任一项所述方法的步骤。
CN202111356826.8A 2021-11-16 2021-11-16 用于预编译器的代码转换方法、装置、介质及设备 Active CN114035805B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111356826.8A CN114035805B (zh) 2021-11-16 2021-11-16 用于预编译器的代码转换方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111356826.8A CN114035805B (zh) 2021-11-16 2021-11-16 用于预编译器的代码转换方法、装置、介质及设备

Publications (2)

Publication Number Publication Date
CN114035805A CN114035805A (zh) 2022-02-11
CN114035805B true CN114035805B (zh) 2024-07-26

Family

ID=80144590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111356826.8A Active CN114035805B (zh) 2021-11-16 2021-11-16 用于预编译器的代码转换方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN114035805B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023207103A1 (zh) * 2022-04-28 2023-11-02 华为云计算技术有限公司 代码转换方法和装置
CN115167909B (zh) * 2022-09-08 2022-11-08 云账户技术(天津)有限公司 一种变更文件的管理方法及装置
CN115904480B (zh) * 2023-01-09 2023-07-14 成方金融科技有限公司 代码重构方法、装置、电子设备及存储介质
CN116126347B (zh) * 2023-04-17 2023-07-07 函子科技(杭州)有限公司 一种低代码应用程序的文件编译系统和方法
CN117492753A (zh) * 2023-10-24 2024-02-02 深圳微米云服信息科技有限公司 一种实现数据可视化的前端开发方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111240684A (zh) * 2020-01-03 2020-06-05 北京字节跳动网络技术有限公司 一种js代码的裁剪方法、装置、介质和电子设备
CN111240982A (zh) * 2020-01-09 2020-06-05 华东师范大学 源代码静态分析方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6986101B2 (en) * 1999-05-06 2006-01-10 International Business Machines Corporation Method and apparatus for converting programs and source code files written in a programming language to equivalent markup language files
CN102521008B (zh) * 2011-12-28 2014-12-10 用友软件股份有限公司 程序编译装置和程序编译方法
US20140282373A1 (en) * 2013-03-15 2014-09-18 Trinity Millennium Group, Inc. Automated business rule harvesting with abstract syntax tree transformation
CN107678748B (zh) * 2017-09-21 2020-05-12 杭州迪普科技股份有限公司 一种源代码文件编译方法及装置
US10416972B1 (en) * 2018-03-16 2019-09-17 Capital One Services, Llc Generating closures from abstract representation of source code
CN110489124B (zh) * 2019-07-12 2023-06-13 浙江口碑网络技术有限公司 源代码执行方法、装置、存储介质及计算机设备
CN112799677B (zh) * 2021-02-05 2023-09-12 北京字节跳动网络技术有限公司 一种编译期的hook方法、装置、设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111240684A (zh) * 2020-01-03 2020-06-05 北京字节跳动网络技术有限公司 一种js代码的裁剪方法、装置、介质和电子设备
CN111240982A (zh) * 2020-01-09 2020-06-05 华东师范大学 源代码静态分析方法

Also Published As

Publication number Publication date
CN114035805A (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
CN114035805B (zh) 用于预编译器的代码转换方法、装置、介质及设备
CN110007920B (zh) 一种获取代码依赖关系的方法、装置及电子设备
CN110764748B (zh) 代码调用方法、装置、终端及存储介质
CN111324342B (zh) 一种生成接口层代码的方法、装置、介质和电子设备
CN111240684A (zh) 一种js代码的裁剪方法、装置、介质和电子设备
CN111309304B (zh) 一种生成idl文件的方法、装置、介质和电子设备
CN111796865B (zh) 一种字节码文件修改方法、装置、终端设备及介质
CN111338944B (zh) 远程过程调用rpc接口测试方法、装置、介质及设备
CN112527386B (zh) 应用程序发布方法及装置
CN110543297A (zh) 用于生成源码的方法和装置
US8910137B2 (en) Code profiling of executable library for pipeline parallelization
CN113761588A (zh) 一种数据校验方法、装置、终端设备及存储介质
CN113419740A (zh) 程序数据流的分析方法、装置、电子设备及可读存储介质
CN114780107A (zh) 一种规则运行文件的语法分析方法、装置和决策引擎
CN111124541A (zh) 一种配置文件的生成方法、装置、设备及介质
CN112527302B (zh) 错误检测的方法及装置、终端和存储介质
CN114047923A (zh) 错误代码定位方法、装置、存储介质以及电子设备
CN111539200B (zh) 一种生成富文本的方法、装置、介质和电子设备
CN111797009A (zh) 用于检测代码兼容性的方法、装置和电子设备
CN114047922B (zh) 用于预编译器的代码转换方法、装置、介质及设备
CN110471667A (zh) 一种审核源程序的方法、装置、介质和电子设备
CN114116517B (zh) 前端项目分析方法、装置、介质及电子设备
CN116954618A (zh) 函数编译方法、装置、介质以及电子设备
CN113918164B (zh) 应用程序包的生成方法、装置、可读介质和电子设备
CN114428615B (zh) Css编译方法、样式更新方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant