CN113138767B - 代码语言转换方法、装置、电子设备及存储介质 - Google Patents

代码语言转换方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113138767B
CN113138767B CN202110451006.0A CN202110451006A CN113138767B CN 113138767 B CN113138767 B CN 113138767B CN 202110451006 A CN202110451006 A CN 202110451006A CN 113138767 B CN113138767 B CN 113138767B
Authority
CN
China
Prior art keywords
language
code
objects
serialization
serialized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110451006.0A
Other languages
English (en)
Other versions
CN113138767A (zh
Inventor
何子南
王凯
邢培康
李炯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110451006.0A priority Critical patent/CN113138767B/zh
Publication of CN113138767A publication Critical patent/CN113138767A/zh
Application granted granted Critical
Publication of CN113138767B publication Critical patent/CN113138767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/427Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/51Source to source

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

本公开提供了一种代码语言转换方法,包括:获取第一代码语言的第一源代码文本,并确定第一源代码文本包含的至少一种类型的语言对象,再将每种语言对象解析成对应的序列化对象。基于第二代码语言的语法规则,将所有序列化对象编译为第二代码语言。本公开还提供一种代码语言转换装置、电子设备以及计算机可读存储介质。

Description

代码语言转换方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种代码语言转换方法、装置、电子设备及计算机可读存储介质。
背景技术
随着网络通信技术的快速更新换代,各领域使用的互联网系统框架和技术也在不断更新。由于不同系统框架所运用的编程语言不同,开发人员对现有的系统框架更新时,不可避免地需要转换原系统框架的代码语言。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:若采用人工转换的方法,则要求技术人员熟练掌握两种新旧语言的逻辑规则,且人工转换法需要耗费大量人力,且转换过程极易出错。若采用抽象语法树转换的方法,则需要建立完整的抽象语法树,而对于语法规则复杂的编程语言而言,构建完整抽象语法树的过程就变得极为困难。
发明内容
有鉴于此,本公开提供了一种代码语言转换方法和装置。
本公开的一个方面提供了一种代码语言转换方法,包括:获取第一代码语言的第一源代码文本;确定所述第一源代码文本包含的至少一种类型的语言对象;将每种所述语言对象解析成对应的序列化对象;基于第二代码语言的语法规则,将所有所述序列化对象编译为第二代码语言。
根据本公开的实施例,所述将每种所述语言对象解析成对应的序列化对象,包括:解析每种所述语言对象,得到每种所述语言对象包含的数据结构;将所有所述数据结构分别转化为对应的序列化对象。
根据本公开的实施例,所述确定所述第一源代码文本包含的至少一种类型的语言对象,包括:依次确定所述第一源代码文本中每条代码语言的语言类型;统计同一语言类型的代码语言,得到至少一种类型的语言对象。
根据本公开的实施例,所述确定所述第一源代码文本包含的至少一种类型的语言对象,还包括:当无法确定所述第一源代码文本中代码语言的语言类型时,将所述代码语言标记为特定语言类型;统计所述特定语言类型的代码语言,得到特定语言对象。
根据本公开的实施例,所述语言对象为SQL对象,所述基于第二代码语言的语法规则,将所有所述序列化对象编译为第二代码语言,包括:判断所述SQL对象对应的序列化对象是否包含游标;若所述SQL对象对应的序列化对象不包含游标,则按照所述第二代码语言的SQL规则,将所述序列化对象编译为第二代码语言;若所述SQL对象对应的序列化对象包含游标,则使用List对象将所述序列化对象编译为第二代码语言,所述List对象用于模拟游标动作。
根据本公开的实施例,所述语言对象为Record对象,所述将每种所述语言对象解析成对应的序列化对象,包括:通过Record解析器和Dataitem解析器解析所述Record对象,得到Record序列化对象,所述Record序列化对象包含数据结构和字段信息。
根据本公开的实施例,所述语言对象为Program对象,所述将每种所述语言对象解析成对应的序列化对象,包括:通过Program解析器解析所述Program对象,得到Program序列化对象,所述Program序列化对象包含程序属性、入口函数定义和数据结构。
根据本公开的实施例,所述语言对象为Function对象,所述将每种所述语言对象解析成对应的序列化对象,包括:通过Function解析器解析所述Function对象,得到Function序列化对象,所述Function序列化对象包含的语法树结构。
本公开的另一个方面提供了一种代码语言转换装置,包括:获取模块,用于获取第一代码语言的第一源代码文本;确定模块,用于确定所述第一源代码文本包含的至少一种类型的语言对象;解析模块,用于将每种所述语言对象解析成对应的序列化对象;以及编译模块,用于基于第二代码语言的语法规则,将所有所述序列化对象编译为第二代码语言。
根据本公开的实施例,所述解析模块包括:第一解析单元,用于解析每种所述语言对象,得到每种所述语言对象包含的数据结构;转化单元,用于将所有所述数据结构分别转化为序列化对象。
根据本公开的实施例,所述确定模块包括:确定单元,用于依次确定所述第一源代码文本中每条代码语言的语言类型;第一统计单元,用于统计同一语言类型的代码语言,得到至少一种类型的语言对象。
根据本公开的实施例,所述确定模块还包括:标记单元,用于当无法确定所述第一源代码文本中代码语言的语言类型时,将所述代码语言标记为特定语言类型;第二统计单元,用于统计特定语言类型的代码语言,得到特定语言对象。
根据本公开的实施例,所述语言对象为SQL对象,所述编译模块包括:判断单元,用于判断所述SQL对象对应的序列化对象是否包含游标;第一编译单元,用于若所述SQL对象对应的序列化对象不包含游标,则按照所述第二代码语言的SQL规则,将所述序列化对象编译为第二代码语言;第二编译单元,用于若所述SQL对象对应的序列化对象包含游标,则使用List对象将所述序列化对象编译为第二代码语言,所述List对象用于模拟游标动作。
根据本公开的实施例,所述语言对象为Record对象,所述解析模块包括:第二解析单元,用于通过Record解析器和Dataitem解析器解析所述Record对象,得到Record序列化对象,所述Record序列化对象包含数据结构和字段信息。
根据本公开的实施例,所述语言对象为Program对象,所述解析模块包括:第三解析单元用于,通过Program解析器解析所述Program对象,得到Program序列化对象,所述Program序列化对象包含程序属性、入口函数定义和数据结构。
根据本公开的实施例,所述语言对象为Function对象,所述解析模块包括:第四解析单元,用于通过Function解析器解析所述Function对象,得到Function序列化对象,所述Function序列化对象包含的语法树结构。
本公开的另一方面提供了一种电子设备,所述电子设备包括一个或多个处理器;以及存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求上述任一项所述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,因为采用了将原始的源代码解析成包含数据结构的序列化对象的技术手段,所以至少部分地克服了现有技术中不同编程语言之间转换成本高、强依赖于抽象语法树的技术问题,进而达到了减少人工操作,降低错误率的技术效果。同时,在解析过程中会收集目前尚不支持的语法信息,所以本方法可以不断增加转换代码种类,实现对更多类型语法的支持,而无需一次性的构建完整的语法树。因此,本技术方案可以极大地降低软件系统跨编程语言系统迁移的人力成本。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了可以应用本公开的用于代码语言转换方法和装置的示例性系统架构;
图2示意性示出了根据本公开实施例的代码语言转换方法的流程图;
图3A示意性示出了根据本公开实施例的代码语言转换的结构示意图;
图3B示意性示出了根据本公开另一实施例的代码语言转换的结构示意图;
图4A示意性示出了根据本公开另一实施例的代码语言转换方法的流程图;
图4B示意性示出了根据本公开另一实施例的代码语言转换方法的流程图;
图4C示意性示出了根据本公开另一实施例的代码语言转换方法的流程图;
图5示意性示出了根据本公开实施例的代码语言转换装置的框图;
图6A示意性示出了根据本公开另一实施例的代码语言转换装置的框图;
图6B示意性示出了根据本公开另一实施例的代码语言转换装置的框图;
图6C示意性示出了根据本公开另一实施例的代码语言转换装置的框图;以及
图7示意性示出了根据本公开实施例的适于实现代码语言转换装置的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种用于代码语言转换方法以及能够应用该方法的转换装置。该方法包括解析语法对象过程和编译过程。解析语法对象包括先获取第一代码语言的第一源代码文本,确定第一源代码文本包含的至少一种类型的语言对象。再将每种语言对象解析成对应的序列化对象。最后在编译过程中,基于第二代码语言的语法规则,将所有序列化对象编译为第二代码语言。
图1示意性示出了根据本公开实施例的可以应用代码语言转换方法的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的代码语言转换方法一般可以由服务器105执行。相应地,本公开实施例所提供的代码语言转换装置一般可以设置于服务器105中。本公开实施例所提供的代码语言转换方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的代码语言转换装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所提供的代码语言转换装置也可以由终端设备101、102或103执行,或者也可以由不同于终端设备101、102或103的其他终端设备执行。相应地,本公开实施例所提供的代码语言转换装置也可以设置于终端设备101、102或103中,或设置于不同于终端设备101、102或103的其他终端设备中。
例如,源代码语言文本可以原本存储在终端设备101、102或103中的任意一个(例如,终端设备101,但不限于此)之中,或者存储在外部存储设备上并可以导入到终端设备101中。然后,终端设备101可以在本地执行本公开实施例所提供的代码语言转换方法,或者将源代码语言文本发送到其他终端设备、服务器或服务器集群,并由接收该待处理图像的其他终端设备、服务器或服务器集群来执行本公开实施例所提供的代码语言转换方法。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的代码语言转换方法的流程图。
如图2所示,该方法包括操作S201~S204。
在操作S201,获取第一代码语言的第一源代码文本。
在操作S202,确定第一源代码文本包含的至少一种类型的语言对象。
在本操作中,语言对象可理解为同一类型的代码集合。源代码包含多个类型的代码语言,例如,数据库代码、函数代码、数据结构代码等。开发人员根据实际情况,定义至少一个类型的语言对象,并将源代码划分为属于不同的语言对象。语言对象的定义由本领域的技术人员根据实际情况而定,本公开并不限定定义的语言对象的类型和数量。例如,可将源代码的类型定义为Program对象、Record对象、Fnction对象和SQL对象四种类型。其中,Program对象为程序类的语言对象、Record对象为数据结构类的语言对象、Function对象为方法类的语言对象,以及SQL对象为数据库类的语言对象。
在操作S203,将每种语言对象解析成对应的序列化对象。
在本操作中,序列化对象可理解为一种可以存储或传输的数据。例如,将源代码数据结构或字段信息转换为可以存储或传输的数据形式,即序列化对象。例如,在序列化期间,将语言对象解析为序列化对象,并将该序列化对象的当前状态写入到临时或持久性存储区,一个语言对象可以被表示为一个字节序列,该字节序列包括该语言对象的数据、语言对象的类型信息和存储在语言对象中数据的类型。同时,通过从存储区中读取或反序列化该语言对象的状态,可以重新创建该语言对象,即该语言对象的类型信息、语言对象的数据,还有语言对象中的数据类型可以用来在内存中新建新的语言对象。
一般而言,保存的序列化对象实际保存的是对象的状态,即它的成员变量。由此可知,对象序列化不会关注类中的静态变量。将源代码解析成序列化对象后,使一些语言代码,例如,不序列化便无法访问的对象实例数据,可以被查看或修改。将语言对象解析为序列化对象后,可增加该语言对象的生命周期。
在操作S204,基于第二代码语言的语法规则,将所有序列化对象编译为第二代码语言。
在本公开始实施例中,第一语言代码可理解为系统框架的原始开发代码,第二语言代码可理解为新系统框架的开发语言代码,即需要转换成的目标语言代码。
将源代码的数据信息先划分为不同类型的语言对象,在将不同类型的语言对象解析为相应的序列化对象,增加语言对象的生命周期。在后续的代码语言转换过程中,对序列化对象进行反序列化操作,可将序列化对象包含的数据信息转换成新的第二语言代码的语言对象。
通过本公开实施例,从语言代码的基础数据信息的角度出发,通过序列化对象实现对语言代码的转换。所以在不同编程语言之间的转换过程中避免出现转换成本高和强依赖于抽象语法树的技术问题,进而达到了减少人工操作,降低错误率的技术效果。
结合图3A和3B所示的具体实施例对图2所示的方法进一步解释。图3A和图3B示意性示出了根据本公开实施例的代码语言转换的结构示意图。如图3A和3B所示,例如,第一语言代码为EGL语言,第二语言代码为Java语言。
在图3A中,通过解析策略链301解析EGL语言的源代码,得到EGL语言的源代码包含的数据信息302。按照定义的语言对象,将数据信息302划分不同的语言对象,通过序列化接口并将不同类型的语言对象的数据信息解析为对应的序列化对象303。
在图3B中,获得不同类型的语言对象对应的序列化对象304包含的数据信息305,再根据Java的语法规则,通过编译器306将数据信息305编译为Java语言代码。
其中,定义的语言对象类型可以包括Program对象、Record对象、Fnction对象和SQL对象。解析链301包含至少一个解析器,例如,在图3A中解析器包含Program-define解析器、Record-define解析器、DataItem-define解析器、Function-define解析器、Evaluation解析器、Expression解析器、Flow-control解析器、Function-call解析器、Egl-call解析器和SQL解析器等等。通过上述解析器,解析EGL语言代码,获得的数据信息302至少包含Program信息、Record信息、DataItem信息、Function信息、Evaluation信息、Expression信息、Flow-control信息、Function-call信息、Egl-call信息和SQL信息等等。其中,Program对象对应的序列化对象包含Program信息;Record对象对应的序列化对象包含Record信息和DataItem信息;Function对象对应的序列化对象包含Function信息、Evaluation信息、Expression信息、Flow-control信息、Function-call信息和Egl-call信息等等;SQL对象对应的序列化对象包含SQL信息。
相应地,获取Program对象、Record对象、Fnction对象和SQL对象对应的序列化对象包含的数据信息,将获取的数据信息分别编译为Java语言代码。其中,编译器306包含Class-define编译器、Function编译器、Java-Bean编译器、Evaluation编译器、Expression编译器、Flow-control编译器、Method invoke编译器、class invoke编译器和SQL编译器等等。
本公开提供一种示例性的EGL语言代码的源代码文本。
例如,EGL的程序定义如下,属于Program对象:
例如,EGL的数据结构定义如下,属于Record对象:
例如,EGL的方法定义如下,属于Function对象:
本公开一种示例性的EGL语言代码的源代码文本解析的序列化对象。
例如,Program对象对应的序列化对象:
EglProgram-packageName:acib_FOVA.onlinel name:AAHXXXX
type:basicProgram
commRaw:(AWC_LANG_COMM AWC_LANG_COMM,NWC_APP_STAT NWC_APP_STAT,AWC_AUTH_COMM AWC_AUTH_COMM,AWC_INFO_COMM AWC_INFO_COMM)
propertyRaw{includeReferencedFunctions=yes,
allowUnqualifiedItemReferences=yes,localSQLScope=yes,throwNrfEofExceptions=yes,handleHardIOErrors=no,V60ExceptionCompatibility=yes,TextLiteralDefaultIsString=no}recordRaw:ATHPACON ATHPACON;ATHPCDDMATHPCDDM;ATHPCMGM ATHPCMGM;alComm:<awc_lang_comm,awc_lang_comm>,<nwc_app_stat,nwc_app_stat>,alRecord:<athpacon,ATHPACON>,<athpcddm,ATHPCDDM>,<athpcmgm,ATHPCMGM>,<athpctdm,ATHPCTDM>,<athrsabr,ATHRSABR>,<athrsrep,ATHRSREP>
例如,Record对象对应的序列化对象:
EglRecord-name:awa_16197_msg type:basicRecord
propertyRaw:{TextLiteralDefaultIsString=NO}
alKeyItems:
CodeRecordItem-class:egl.EglRecordItem@34b5be06 level:10
id:msgchar idOrigin:MSGCHAR type:String customType:length:392
offset:0 array:1 isArray:false
alRatio:
masterRecord:null
subRecord:egl.EglRecordItem@1c83f4d4 egl.EglRecordItem@5154eec5
CodeRecordItem-class:egl.EglRecordItem@71a6649e level:15
id:msgchar_lang_lang_num idOrigin:LANG_NUM type:int customType:
length:5 offset:90 array:1 isArray:false
alRatio:
masterRecord:egl.EglRecordItem@64f616a3
subRecord:null
CodeEnd-level:0
例如,Function对象对应的序列化对象:
EglFunction-name:asp_chk_med_65028 parameter:returns:
CodeSetEmpty-code:set AWC_MMNG_COMM empty var:AWC_MMNG_COMM
CodeEvaluation-value:AWC_CTIN_ICOM.SYSFLAG3 type:0 alAssignment:1,
al0perator:
CodeElse
CodeEvaluation-value:AWG_LI11001_ICOM.CARD_SYSPART_CHAR type:0
alAssignment:AWA_65028_WORK.MED_SYSPART,alOperator:
CodeEnd-level:2
CodeCall-code:call″L111001″(NWC_APP_STAT,AWC_LANG_COMM,AWC_AUTH_COMM,AWC_CTIN_ICOM,AWC_MMNG_COMM,AWC_VMINFO_ICOM,AWG_LI11001_ICOM,AWC_CHAR_COMM,AWC_MSJNL_COMM)-target:LI11001
para:NWC_APP_STAT,AWC_LANG_COMM,AWC_AUTH_COMM,AWC_CTIN_ICOM,AWC_MMNG_COMM,AWC_VMINFO_ICOM,AWG_LI11001_ICOM,AWC_CHAR_COMM,AWC_MSJNL-COMM,
CodeEnd-level:2
CodeElse
CodeIf-code:if(xxxxxxx)
alVariable:ATHPACON.VARVALUE,0,
alOperator:==,
CodeEvaluation-value:AWG_AI65028_RST.LFTCVV2NUM type:0
alAssignment:″″,alOperator:
以上内容为Program对象、Record对象和Function对象分别对应的序列化对象的内容节选,只是示例性的说明序列化对象的具体内容。
下面参考图4A~图4C,结合具体实施例对图2所示的方法做进一步说明。
图4A示意性示出了根据本公开另一实施例的代码语言转换方法的流程图。
如图4A所示,确定第一源代码文本包含的至少一种类型的语言对象,包括操作S401~S402。
在操作S401,依次确定第一源代码文本中每条代码语言的语言类型。
在操作S402,统计同一语言类型的代码语言,得到至少一种类型的语言对象。
在本公开实施例中,结合图3A,通过解析链中的解析器对第一源代码文包含的代码语言依次解析。例如,解析链包含至少一个解析节点,每个解析节点对应一个解析器。将每条代码语言依次输入至解析链中,通过解析节点对代码语言进行解析。其中,本领域的技术人员对解析链中各解析节点的解析顺序可根据实际的解析情况自行定义,本申请对解析链中的解析节点的解析顺序不作限定。
本公开实施例提供一种示意性的解析过程。例如,将第一源代码文本输入至解析链中,首先由Program解析器所在的解析节点获取该第一源代码文本,并对该第一源代码文本包含的语言代码进行解析,其中该第一源代码文本包含多段代码。通过Program-define解析器分别对多段代码进行解析,若Program解析器只能解析第一段代码,则第一段代码为program对象。其余代码流转期第二个解析器Record-define解析器,能被Record-define解析器成功解析的代码属于Record对象,未能成功解析的代码流转至下一个解析器,直至解析完全部代码。
可理解地,每一类型的语言对象对应至少一个解析器。例如,Program对象对应的解析器至少包含Program-define解析器;Record对象对应的解析器至少包含Record-define解析器和DataItem-define解析器;Function对象对应的解析器至少包含Function-define解析器、Evaluation解析器、Expression解析器、Flow-control解析器、Function-call解析器和Egl-call解析器等等;SQL对象对应的解析器至少包含SQL解析器。
图4B示意性示出了根据本公开另一实施例的代码语言转换方法的流程图。
如图4B所示,确定第一源代码文本包含的至少一种类型的语言对象,包括操作S403~S404。
在操作S403,当无法确定第一源代码文本中代码语言的语言类型时,将代码语言标记为特定语言类型。
在操作S404,统计特定语言类型的代码语言,得到特定语言对象。
在本公开实施例中,第一源代码文本包含的代码可能无法被成功确定出属于的语言类型,即解析链不包含可解析该段代码的解析器。若解析链上所有解析器均无法解析该段代码,则将该代码标记为特定语言类型,统计得到特定语言类型,使用一特定类存储相关代码信息。
同时,基于上述情况,还可以在解析链中添加新的类型的解析器,以提升解析链的解析能力。或者,当语法规则更新后,某一解析器不再需要被使用后,可删除或修改该解析器,以提升解析链的解析效率。
图4C示意性示出了根据本公开另一实施例的代码语言转换方法的流程图。
如图4C所示,确定第一源代码文本包含的至少一种类型的语言对象,包括操作S405~S406。
在操作S403,解析每种语言对象,得到每种语言对象包含的数据结构。
在操作S404,将所有数据结构分别转化为对应的序列化对象。
在本公实施例中,当语言对象为Program对象时,通过Program解析器解析Program对象,得到Program序列化对象,Program序列化对象包含程序属性、入口函数定义和数据结构。
当语言对象为Record对象时,通过Record解析器解析Record对象,得到数据结构的类型和属性;通过Dataitem解析器解析Record对象,得到字段信息的名称、类型、长度、偏移。Record序列化对象包含数据结构的类型和属性以及字段信息的名称、类型、长度、偏移。
当语言对象为Function对象时,通过Function解析器解析Function对象,得到Function序列化对象,Function序列化对象包含的语法树结构。
作为一种可选实施例,当语言对象为SQL对象时,基于第二代码语言的语法规则,将所有序列化对象编译为第二代码语言,包括判断SQL对象对应的序列化对象是否包含游标;若SQL对象对应的序列化对象不包含游标,则按照第二代码语言的SQL规则,将序列化对象编译为第二代码语言;若SQL对象对应的序列化对象包含游标,则使用List对象将序列化对象编译为第二代码语言,List对象用于模拟游标动作。
在本公开实施例中,由于不同的编程语言的数据库语句的语法规则不同,则需要根据不同的数据库语句的语法规则设计不同的编译规则。例如,将EGL语言的数据库语句转换为Java语言时,需要判断该语句中是否包含游标。对于不包含游标的SQL语句,则按照Java的标准SQL语法规则进行将SQL的序列化对象编译为Java语言。对于包含游标的SQL语句,则在创建的Java类中,使用List对象模拟游标动作,实现对数据的存储或使用。
作为一种可选实施例,当语言对象为Program对象时,基于Java的语法规则,将Program对象对应的序列化对象包含的程序属性,入口函数定义以及使用的数据结构名称等信息编译为Java类。当语言对象为Record对象时,基于Java的语法规则,将Record对象对应的序列化对象包含的数据结构的类型、属性以及字段信息的名称、类型、长度、偏移等信息编译为Java Bean,用于存储数据。当语言对象为Function对象时,基于Java的语法规则,将Function对象对应的序列化对象编译为Java语言,包括循环语句、判断语句和条件语句等等。
图5示意性示出了根据本公开的实施例的代码语言转换装置的框图。
如图5所示,代码语言转换装置500包括获取模块510、确定模块520、解析模块530和编译模块540。
获取模块510,用于获取第一代码语言的第一源代码文本。
确定模块520,用于确定第一源代码文本包含的至少一种类型的语言对象。
解析模块530,用于将每种语言对象解析成对应的序列化对象。
编译模块540,用于基于第二代码语言的语法规则,将所有序列化对象编译为第二代码语言。
通过本公开的实施例,因为采用了将原始的源代码解析成包含数据结构的序列化对象的技术手段,所以至少部分地克服了现有技术中不同编程语言之间转换成本高、强依赖于抽象语法树的技术问题,进而达到了减少人工操作,降低错误率的技术效果。同时,在解析过程中会收集目前尚不支持的语法信息,所以本方法可以不断增加转换代码种类,实现对更多类型语法的支持,而无需一次性的构建完整的语法树。因此,极大地降低软件系统跨编程语言系统迁移的人力成本。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块510、确定模块520、解析模块530和编译模块540中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,获取模块510、确定模块520、解析模块530和编译模块540中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块510、确定模块520、解析模块530和编译模块540中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
下面参考图6A~图6C,结合具体实施例对图5所示的装置做进一步说明。
图6A示意性示出了根据本公开另一实施例的代码语言转换装置的框图。
如图6A所示,确定模块520包括:
确定单元5201,用于依次确定第一源代码文本中每条代码语言的语言类型。
第一统计单元5202,用于统计同一语言类型的代码语言,得到至少一种类型的语言对象。
图6B示意性示出了根据本公开另一实施例的代码语言转换装置的框图。
如图6B所示,确定模块520还包括:
标记单元5203,用于当无法确定第一源代码文本中代码语言的语言类型时,将代码语言标记为特定语言类型。
第二统计单元5204,用于统计特定语言类型的代码语言,得到特定语言对象。
图6C示意性示出了根据本公开另一实施例的代码语言转换装置的框图。
如图6C所示,解析模块530还包括:
第一解析单元5301,用于解析每种语言对象,得到每种语言对象包含的数据结构。
转化单元5302,用于将所有数据结构分别转化为对应的序列化对象。
在本公开实施例中,当语言对象为Record对象时,解析模块530包括:第二解析单元,用于通过Record解析器和Dataitem解析器解析Record对象,得到Record序列化对象,Record序列化对象包含数据结构和字段信息。
当语言对象为Program对象时,解析模块530包括:第三解析单元用于,通过Program解析器解析Program对象,得到Program序列化对象,Program序列化对象包含程序属性、入口函数定义和数据结构。
当语言对象为Function对象时,解析模块530包括:第四解析单元,用于通过Function解析器解析Function对象,得到Function序列化对象,Function序列化对象包含的语法树结构。
作为一种可选实施例,当语言对象为SQL对象时,编译模块540包括:判断单元,用于判断SQL对象对应的序列化对象是否包含游标;第一编译单元,用于若SQL对象对应的序列化对象不包含游标,则按照第二代码语言的SQL规则,将序列化对象编译为第二代码语言;第二编译单元,用于若SQL对象对应的序列化对象包含游标,则使用List对象将序列化对象编译为第二代码语言,List对象用于模拟游标动作。
需要说明的是,本公开的实施例中代码语言转换装置部分与本公开的实施例中代码语言转换方法部分是相对应的,代码语言转换装置部分的描述具体参考代码语言转换方法部分,在此不再赘述。
图7示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,根据本公开实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有系统600操作所需的各种程序和数据。处理器601、ROM 602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,系统600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。系统600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框,以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (16)

1.一种代码语言转换方法,包括:
获取第一代码语言的第一源代码文本;
确定所述第一源代码文本包含的至少一种类型的语言对象;
将每种所述语言对象解析成对应的序列化对象;
基于第二代码语言的语法规则,将所有所述序列化对象编译为第二代码语言;
其中,所述语言对象为SQL对象,所述基于第二代码语言的语法规则,将所有所述序列化对象编译为第二代码语言,包括:
判断所述SQL对象对应的序列化对象是否包含游标;
若所述SQL对象对应的序列化对象不包含游标,则按照所述第二代码语言的SQL规则,将所述序列化对象编译为第二代码语言;
若所述SQL对象对应的序列化对象包含游标,则使用List对象将所述序列化对象编译为第二代码语言,所述List对象用于模拟游标动作。
2.根据权利要求1所述的方法,其中,所述将每种所述语言对象解析成对应的序列化对象,包括:
解析每种所述语言对象,得到每种所述语言对象包含的数据结构;
将所有所述数据结构分别转化为对应的序列化对象。
3.根据权利要求1所述的方法,其中,所述确定所述第一源代码文本包含的至少一种类型的语言对象,包括:
依次确定所述第一源代码文本中每条代码语言的语言类型;
统计同一语言类型的代码语言,得到至少一种类型的语言对象。
4.根据权利要求3所述的方法,其中,所述确定所述第一源代码文本包含的至少一种类型的语言对象,还包括:
当无法确定所述第一源代码文本中代码语言的语言类型时,将所述代码语言标记为特定语言类型;
统计所述特定语言类型的代码语言,得到特定语言对象。
5.根据权利要求1或2所述的方法,其中,所述语言对象为Record对象,所述将每种所述语言对象解析成对应的序列化对象,包括:
通过Record解析器和Dataitem解析器解析所述Record对象,得到Record序列化对象,所述Record序列化对象包含数据结构和字段信息。
6.根据权利要求1或2所述的方法,其中,所述语言对象为Program对象,所述将每种所述语言对象解析成对应的序列化对象,包括:
通过Program解析器解析所述Program对象,得到Program序列化对象,所述Program序列化对象包含程序属性、入口函数定义和数据结构。
7.根据权利要求1或2所述的方法,其中,所述语言对象为Function对象,所述将每种所述语言对象解析成对应的序列化对象,包括:
通过Function解析器解析所述Function对象,得到Function序列化对象,所述Function序列化对象包含语法树结构。
8.一种代码语言转换装置,包括:
获取模块,用于获取第一代码语言的第一源代码文本;
确定模块,用于确定所述第一源代码文本包含的至少一种类型的语言对象;
解析模块,用于将每种所述语言对象解析成对应的序列化对象;以及
编译模块,用于基于第二代码语言的语法规则,将所有所述序列化对象编译为第二代码语言;
其中,所述语言对象为SQL对象,所述编译模块包括:
判断单元,用于判断所述SQL对象对应的序列化对象是否包含游标;
第一编译单元,用于若所述SQL对象对应的序列化对象不包含游标,则按照所述第二代码语言的SQL规则,将所述序列化对象编译为第二代码语言;
第二编译单元,用于若所述SQL对象对应的序列化对象包含游标,则使用List对象将所述序列化对象编译为第二代码语言,所述List对象用于模拟游标动作。
9.根据权利要求8所述的装置,其中,所述解析模块包括:
第一解析单元,用于解析每种所述语言对象,得到每种所述语言对象包含的数据结构;
转化单元,用于将所有所述数据结构分别转化为对应的序列化对象。
10.根据权利要求8所述的装置,其中,所述确定模块包括:
确定单元,用于依次确定所述第一源代码文本中每条代码语言的语言类型;
第一统计单元,用于统计同一语言类型的代码语言,得到至少一种类型的语言对象。
11.根据权利要求10所述的装置,其中,所述确定模块还包括:
标记单元,用于当无法确定所述第一源代码文本中代码语言的语言类型时,将所述代码语言标记为特定语言类型;
第二统计单元,用于统计所述特定语言类型的代码语言,得到特定语言对象。
12.根据权利要求8或9所述的装置,其中,所述语言对象为Record对象,所述解析模块包括:
第二解析单元,用于通过Record解析器和Dataitem解析器解析所述Record对象,得到Record序列化对象,所述Record序列化对象包含数据结构和字段信息。
13.根据权利要求8或9所述的装置,其中,所述语言对象为Program对象,所述解析模块包括:
第三解析单元用于,通过Program解析器解析所述Program对象,得到Program序列化对象,所述Program序列化对象包含程序属性、入口函数定义和数据结构。
14.根据权利要求8或9所述的装置,其中,所述语言对象为Function对象,所述解析模块包括:
第四解析单元,用于通过Function解析器解析所述Function对象,得到Function序列化对象,所述Function序列化对象包含语法树结构。
15.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至7中任一项所述的方法。
CN202110451006.0A 2021-04-25 2021-04-25 代码语言转换方法、装置、电子设备及存储介质 Active CN113138767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110451006.0A CN113138767B (zh) 2021-04-25 2021-04-25 代码语言转换方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110451006.0A CN113138767B (zh) 2021-04-25 2021-04-25 代码语言转换方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113138767A CN113138767A (zh) 2021-07-20
CN113138767B true CN113138767B (zh) 2024-04-30

Family

ID=76812053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110451006.0A Active CN113138767B (zh) 2021-04-25 2021-04-25 代码语言转换方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113138767B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113608746B (zh) * 2021-08-16 2023-10-27 北京字节跳动网络技术有限公司 一种代码转换处理方法、装置、计算机设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111708539A (zh) * 2020-06-17 2020-09-25 腾讯科技(深圳)有限公司 一种应用程序代码转换方法、装置、电子设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10515029B2 (en) * 2016-11-18 2019-12-24 Vmware, Inc. Conversion tool for moving from block-based persistence to byte-based persistence

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111708539A (zh) * 2020-06-17 2020-09-25 腾讯科技(深圳)有限公司 一种应用程序代码转换方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN113138767A (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
US9852015B2 (en) Automatic discovery of a JavaScript API
US8601438B2 (en) Data transformation based on a technical design document
CN110543297B (zh) 用于生成源码的方法和装置
CN111125064B (zh) 一种生成数据库模式定义语句的方法和装置
CN114116065B (zh) 获取拓扑图数据对象的方法、装置、及电子设备
CN107391528B (zh) 前端组件依赖信息搜索方法及设备
CN113138767B (zh) 代码语言转换方法、装置、电子设备及存储介质
CN113419740A (zh) 程序数据流的分析方法、装置、电子设备及可读存储介质
CN113962597A (zh) 一种数据分析方法、装置、电子设备及存储介质
CN113238739A (zh) 一种插件开发和数据获取方法、装置、电子设备及介质
US20160292067A1 (en) System and method for keyword based testing of custom components
CN111222323A (zh) 一种词槽抽取方法、词槽抽取装置及电子设备
CN111367791B (zh) 一种生成测试用例的方法、装置、介质和电子设备
CN113392311A (zh) 字段搜索方法、字段搜索装置、电子设备及存储介质
CN111539200B (zh) 一种生成富文本的方法、装置、介质和电子设备
CN113032256A (zh) 自动化测试方法、装置、计算机系统和可读存储介质
CN112527880B (zh) 大数据集群元数据信息的采集方法、装置、设备及介质
CN116382703B (zh) 软件包生成方法、代码开发方法及装置、电子设备和介质
CN113110947B (zh) 一种程序调用链生成方法、系统、电子设备及介质
CN116755684B (zh) OAS Schema的生成方法、装置、设备及介质
CN112965747B (zh) 挖掘代码漏洞的方法、装置、设备和计算机可读介质
CN111241538B (zh) 一种保护节点对象变量的方法、装置、介质和电子设备
CN116661857A (zh) 数据提取方法、装置、设备及存储介质
CN113392112A (zh) 数据解析方法、数据解析装置、电子设备和存储介质
CN113760702A (zh) 一种小程序的单元测试方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant