CN113467828B - 一种异构众核处理器中编程语言转换方法和系统 - Google Patents
一种异构众核处理器中编程语言转换方法和系统 Download PDFInfo
- Publication number
- CN113467828B CN113467828B CN202110698088.9A CN202110698088A CN113467828B CN 113467828 B CN113467828 B CN 113467828B CN 202110698088 A CN202110698088 A CN 202110698088A CN 113467828 B CN113467828 B CN 113467828B
- Authority
- CN
- China
- Prior art keywords
- grammar
- language
- rule
- container
- statement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013507 mapping Methods 0.000 claims abstract description 85
- 238000006243 chemical reaction Methods 0.000 claims abstract description 41
- 238000004458 analytical method Methods 0.000 claims abstract description 37
- 238000005516 engineering process Methods 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims description 108
- 238000010276 construction Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 13
- 238000013461 design Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/76—Adapting program code to run in a different environment; Porting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/42—Syntactic analysis
- G06F8/427—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/44—Encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45504—Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
- G06F9/45529—Embedded in an application, e.g. JavaScript in a Web browser
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Stored Programmes (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
本发明提出一种异构众核处理器中编程语言转换方法和系统,其方法技术方案包括构建异构众核处理器主核中C++语言转换至C语言的语法识别规则和语法映射规则,并通过ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成抽象语法树;对所述抽象语法树进行遍历,根据所述语法识别规则自动识别所述STL容器的声明语句,并将所述声明语句的声明信息保存到Utility类数据结构中;对所述抽象语法树再次进行遍历,根据所述语法映射规则将所述STL容器映射到基于所述C语言的libcstl上;根据所述libcstl的语法规则,对所述C++语言STL容器源代码进行重构,将所述C++语言STL容器转换为所述C语言的libcstl。本发明解决了现有STL容器数据重构复杂耗时,手工编写方式效率低、成本高的问题。
Description
技术领域
本发明属于ANTLR语法解析领域,尤其涉及一种异构众核处理器中编程语言转换方法和系统。
背景技术
“神威*太湖之光”超级计算机使用国产SW26010异构众核处理器,如图2所示,该处理器采用主-从核架构,一个处理器包含4个核组(CGs),每个核组包含1个主核(MPE)、1个8*8从核阵列(CPE)和1个内存控制器(MC),单处理器峰值计算能力为3TFlops,访存带宽为130GB/s。其中主核编译器支持C,C++和Fortran 3种编程语言,而从核上的编译器只支持C和Fortran两种编程语言。编译器的不兼容问题,使得C++编写的科学计算程序无法在从核上直接运行,从而无法有效利用SW26010处理器强大的计算能力。
异构众核处理器内集成了大量不同类型的处理器核心,且从核编译器不支持C++,其在提供更多计算资源的同时,增加了程序设计与代码移植的难度。当前,在大数据、人工智能等领域存有大量的C++遗产代码程序,其数据结构复杂,STL标准库使用频率高,对于遗产代码在异构众核处理器上的移植,程序员一般使用手工方式编写MPI主核并行程序,并将C++热点代码段手动转换成C代码段,使用从核进行C代码段的加速优化,但STL容器数据重构复杂耗时,手工编写方式效率低、成本高。
发明内容
本申请实施例提供了一种异构众核处理器中编程语言转换方法和系统,以至少解决现有STL容器数据重构复杂耗时,手工编写方式效率低、成本高的问题。
第一方面,本申请实施例提供了一种异构众核处理器中编程语言转换方法,包括:ANTLR解析步骤,构建异构众核处理器主核中C++语言转换至C语言的语法识别规则和语法映射规则,并通过ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成抽象语法树;第一语法树遍历步骤,对所述抽象语法树进行遍历,根据所述语法识别规则自动识别所述STL容器的声明语句,并将所述声明语句的声明信息保存到Utility类数据结构中;第二语法树遍历步骤,对所述抽象语法树再次进行遍历,根据所述语法映射规则将所述STL容器映射到基于所述C语言的libcstl上;源码重构转换步骤,根据所述libcstl的语法规则,对所述C++语言STL容器源代码进行重构,将所述C++语言STL容器转换为所述C语言的libcstl。
优选的,所述ANTLR解析步骤进一步包括:声明规则构建步骤,构建所述C++语言STL容器的所述语法识别规则,并构建所述C++语言STL容器到所述C语言的libcstl的所述语法映射规则;声明语法解析步骤,基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树。
优选的,所述第二语法树遍历步骤进一步包括:声明语句定位步骤,根据已保存的所述Utility类数据结构,快速定位到所述声明语句;声明信息映射步骤,根据所述语法映射规则将所述STL容器声明映射到基于所述C语言的libcstl上。
优选的,所述ANTLR解析步骤进一步包括:函数调用规则构建步骤,构建所述C++语言STL容器函数调用的所述语法识别规则,并构建所述C++语言STL容器函数调用到所述C语言的libcstl的所述语法映射规则;函数调用语法解析步骤,基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树。
优选的,所述第二语法树遍历步骤进一步包括:函数调用识别步骤,根据已保存的所述Utility类数据结构,识别出所述STL容器的函数调用语句,定义为目标语句,并识别所述目标语句中的函数信息;函数调用映射步骤,根据所述语法映射规则将所述STL容器的所述函数调用映射到基于所述C语言的libcstl上。
第二方面,本申请实施例提供了一种异构众核处理器中编程语言转换系统,适用于上述一种异构众核处理器中编程语言转换方法,包括:ANTLR解析模块,构建异构众核处理器主核中C++语言转换至C语言的语法识别规则和语法映射规则,并通过ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成抽象语法树;第一语法树遍历模块,对所述抽象语法树进行遍历,根据所述语法识别规则自动识别所述STL容器的声明语句,并将所述声明语句的声明信息保存到Utility类数据结构中;第二语法树遍历模块,对所述抽象语法树再次进行遍历,根据所述语法映射规则将所述STL容器映射到基于所述C语言的libcstl上;源码重构转换模块,根据所述libcstl的语法规则,对所述C++语言STL容器源代码进行重构,将所述C++语言STL容器转换为所述C语言的libcstl。
在其中一些实施例中,所述ANTLR解析模块进一步包括:声明规则构建单元,构建所述C++语言STL容器的所述语法识别规则,并构建所述C++语言STL容器到所述C语言的libcstl的所述语法映射规则;声明语法解析单元,基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树。
在其中一些实施例中,所述第二语法树遍历模块进一步包括:声明语句定位单元,根据已保存的所述Utility类数据结构,快速定位到所述声明语句;声明信息映射单元,根据所述语法映射规则将所述STL容器声明映射到基于所述C语言的libcstl上。
在其中一些实施例中,所述ANTLR解析模块进一步包括:函数调用规则构建单元,构建所述C++语言STL容器函数调用的所述语法识别规则,并构建所述C++语言STL容器函数调用到所述C语言的libcstl的所述语法映射规则;函数调用语法解析单元,基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树。
在其中一些实施例中,所述第二语法树遍历模块进一步包括:函数调用识别单元,根据已保存的所述Utility类数据结构,识别出所述STL容器的函数调用语句,定义为目标语句,并识别所述目标语句中的函数信息;函数调用映射单元,根据所述语法映射规则将所述STL容器的所述函数调用映射到基于所述C语言的libcstl上。
相比于相关技术,本申请实施例提供的一种异构众核处理器中编程语言转换方法基于开源的ANTLR4语法解析工具,将C++源代码解析为抽象语法树,抽象语法树是源代码结构的一种抽象表示,它以树的形状表示语言的语法结构。实现ANTLR4的listener接口,可以遍历整个抽象语法树,并根据目标语言的语法规则进行源代码的重构,实现STL容器源代码的语法自动识别和目标语言转换。本申请能够自动识别与转换C++STL容器为C语言,协助程序开发人员快速构建数据结构,节省了人力成本;提升了移植效率,加快了科学代码在异构众核处理器上的移植速度。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明的异构众核处理器中编程语言转换方法流程图;
图2为图1中步骤S1和步骤S3的第一分步骤流程图;
图3为图1中步骤S1和步骤S3的第二分步骤流程图;
图4为本发明的异构众核处理器中编程语言转换系统的框架图;
图5为本发明实施例提供的的一电子设备的框架图;
图6为ANTLR语法解析过程示意图;
图7为SW26010异构众核处理器架构图;
图8为vector容器声明和调用的转换实例;
图9为STL容器识别规则架构设计图;
图10为STL容器映射规则架构设计图;
以上图中:
1、ANTLR解析模块;2、第一语法树遍历模块;3、第二语法树遍历模块;4、源码重构转换模块;11、声明规则构建单元;12、声明语法解析单元;13、函数调用规则构建单元;14、函数调用语法解析单元;31、声明语句定位单元;32、声明信息映射单元;33、函数调用识别单元;34、函数调用映射单元;60、总线;61、处理器;62、存储器;63、通信接口。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
ANTLR(Another Tool for Language Recognition)是一个强大的跨语言语法解析器,可以用来读取、处理、执行和翻译结构化文本或二进制文件,被广泛用来构建语言,工具和框架。在ANTLR中,首先需要根据待解析语言的语法规则定义解析规则,形成ANTLR语法文件(.g4);其次通过调用ANTLR内置方法,生成对应的词法分析器和语法分析器。词法分析器根据词法规则将输入的字符流转换为由短语组成的标记流,得到具体语言的词法分析结果;语法分析器是将这些短语标记流进行组合,生成抽象语法树,所有的词法信息都是存储在抽象语法树的叶子结点上,可以根据具体的需求来进行相应的处理,获取最终的执行结果。其解析过程如图6所示。
C++标准模板库(Standard Template Library)是采用模板技术、实现泛型编程思想的通用软件组件库,比传统的函数库与类库具有更好的代码重用性。STL主要包括容器(Container)、迭代器(Iterator)、算法(Algorithm)等。容器是一种数据结构,算法通过迭代器对容器中的数据进行访问,形成数据结构+算法的程序结构。
libcstl是使用标准C语言编写的通用数据结构和常用算法库,其模仿了STL的接口形式,包括容器、迭代器、算法等,为C编程中的数据管理提供了方便易用的程序库。
本申请可应用于“神威*太湖之光”超级计算机使用的国产SW26010异构众核处理器,图7为SW26010异构众核处理器架构图,如图7所示,该处理器采用主-从核架构,一个处理器包含4个核组(CGs),每个核组包含1个主核(MPE)、1个8*8从核阵列(CPE)和1个内存控制器(MC),单处理器峰值计算能力为3TFlops,访存带宽为130GB/s。
本发明的技术方案是在ANTLR4语法解析的基础上,构建了一套C++STL容器自动识别并转换为C语言libcstl的框架。通过ANTLR4语法解析技术,将C++源代码解析为抽象语法树,并编程实现listener接口,遍历抽象语法树,根据C++STL容器特征识别出STL容器的声明、函数调用等,然后通过匹配预先建立的C++STL到C语言libcstl的映射规则,自动构建基于C语言libcstl的容器声明、函数调用等,实现C++STL容器源代码的语法自动识别和C语言的自动转换。本发明的技术方案包括C++STL容器声明的自动识别转换和C++STL容器函数调用的自动识别转换。
以下,结合附图详细介绍本发明的实施例:
图1为本发明的异构众核处理器中编程语言转换方法流程图,请参见图1,本发明异构众核处理器中编程语言转换方法包括如下步骤:
S1:构建异构众核处理器主核中C++语言转换至C语言的语法识别规则和语法映射规则,并通过ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成抽象语法树。
图9为STL容器识别规则架构设计图,请参见图9,在具体实施中,STL容器识别规则是对于容器的特征描述,将特征描述总结为一条一条的规则,基于此规则,在抽象语法树的遍历过程中可以识别出STL容器具体的声明方式或函数调用等。STL容器识别规则包含了对15种容器的声明和函数调用识别。其中每一种容器又分为声明识别规则和函数识别规则,这两种规则包含首要规则和次要规则。首要规则是必选规则,即必须具备的规则或条件,其作用为确定是否为某个容器的声明语句或函数调用语句;次要规则是可选规则,即可选择其中某一条或某几条规则,不用满足所有规则,其作用是确定是哪一种声明语句或哪个函数调用语句。基于首要规则和次要规则,结合抽象语法树的语法解析,可以自动识别出STL容器的声明或函数调用。
图10为STL容器映射规则架构设计图,请参见图10,在具体实施中,STL容器映射规则是根据识别出的容器声明或函数调用语句进行分解,将语句分解为若干条件要素,根据条件要素的满足情况,查询libcstl数据库,匹配libcstl种对应的声明语句或函数定义,按照匹配到的声明语句或函数重构源代码。STL容器映射规则包含了对15种容器的声明和函数调用的映射。其中每一种容器又分为声明映射规则和函数映射规则。以声明映射规则为例,已识别出的容器声明语句,可分解为多个要素,包括容器类型,数据类型,变量名称,元素个数,元素值等。根据要素的分解情况,查询libcstl,可匹配到对应的C语言容器声明语句,并进行语句的重构。
可选的,本申请实施例包括C++STL容器声明的自动识别转换,图2为图1中步骤S1和步骤S3的第一分步骤流程图,请参见图2:
S11:构建所述C++语言STL容器的所述语法识别规则,并构建所述C++语言STL容器到所述C语言的libcstl的所述语法映射规则;
S12:基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树。
在具体实施中,构建C++STL容器的语法识别规则,构建C++STL容器到C语言libcstl的语法映射规则,基于cpp14.g4语法规则文件,使用ANTLR技术对C++STL容器源代码进行语法解析,形成抽象语法树。
可选的,本申请实施例还包括C++STL容器函数调用的自动识别转换,图3为图1中步骤S1和步骤S3的第二分步骤流程图,请参见图3:
S13:构建所述C++语言STL容器函数调用的所述语法识别规则,并构建所述C++语言STL容器函数调用到所述C语言的libcstl的所述语法映射规则;
S14:基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树。
在具体实施中,构建C++STL容器调用的语法识别规则,构建C++STL容器函数调用到C语言libcstl的语法映射规则,基于cpp14.g4语法规则文件,使用ANTLR技术对C++STL容器源代码进行语法解析,形成抽象语法树。
请继续参见图1:
S2:对所述抽象语法树进行遍历,根据所述语法识别规则自动识别所述STL容器的声明语句,并将所述声明语句的声明信息保存到Utility类数据结构中。
在具体实施中,编程实现listener接口,遍历抽象语法树;第一次抽象语法树遍历,根据C++STL容器的语法识别规则,自动识别STL容器的声明语句,将容器声明的变量名称,所属类、函数等信息保存到Utility类数据结构中。
S3:对所述抽象语法树再次进行遍历,根据所述语法映射规则将所述STL容器映射到基于所述C语言的libcstl上。
可选的,本申请实施例包括C++STL容器声明的自动识别转换,图2为图1中步骤S1和步骤S3的第一分步骤流程图,请参见图2:
S31:根据已保存的所述Utility类数据结构,快速定位到所述声明语句;
S32:根据所述语法映射规则将所述STL容器声明映射到基于所述C语言的libcstl上。
在具体实施中,第二次抽象语法树解析时,根据已保存的Utility数据结构,快速定位到容器声明语句;根据C++STL容器到C语言libcstl的语法映射规则,将源代码的容器声明映射到基于C语言的libcstl上。
可选的,本申请实施例还包括C++STL容器函数调用的自动识别转换,图3为图1中步骤S1和步骤S3的第二分步骤流程图,请参见图3:
S33:根据已保存的所述Utility类数据结构,识别出所述STL容器的函数调用语句,定义为目标语句,并识别所述目标语句中的函数信息;
S34:根据所述语法映射规则将所述STL容器的所述函数调用映射到基于所述C语言的libcstl上。
在具体实施中,第二次抽象语法树解析时,根据已保存的Utility数据结构,识别出容器函数调用语句,并定义为目标语句;结合STL容器函数调用规则,识别目标语句中的成员函数名称,参数等信息;根据C++STL容器函数调用到C语言libcstl的语法映射规则,将源代码的容器函数调用映射到基于C语言的libcstl上。
请继续参见图1:
S4:根据所述libcstl的语法规则,对所述C++语言STL容器源代码进行重构,将所述C++语言STL容器转换为所述C语言的libcstl。
在具体实施中,根据libcstl的语法规则,对源代码进行重构,从而达到C++语言STL容器声明以及C++语言STL函数调用转换为C语言libcstl的目的。
本申请提供一具体实施例对上述技术方案作进一步说明:
本申请提供C++STL 15种容器声明和调用的自动识别与转换,如下表所示:
序列容器 | 关联容器 | 无序关联容器 | 容器适配器 |
vector | map | unordered_map | stack |
deque | set | unordered_set | queue |
list | multimap | unordered_multimap | priority_queue |
pair | multiset | unordered_multiset |
并且,图8为vector容器声明和调用的转换实例,请参见图8,以vector容器为例,本申请,提供了转换前的C++vector声明和函数调用的代码,以及转换后的基于libcstl的C语言代码。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例提供了一种异构众核处理器中编程语言转换系统,适用于上述的一种异构众核处理器中编程语言转换方法。如以下所使用的,术语“单元”、“模块”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件、或者软件和硬件的组合的实现也是可能并被构想的。
图4为根据本发明的异构众核处理器中编程语言转换系统的框架图,请参见图4,包括:
ANTLR解析模块1:构建异构众核处理器主核中C++语言转换至C语言的语法识别规则和语法映射规则,并通过ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成抽象语法树。
图9为STL容器识别规则架构设计图,请参见图9,在具体实施中,STL容器识别规则是对于容器的特征描述,将特征描述总结为一条一条的规则,基于此规则,在抽象语法树的遍历过程中可以识别出STL容器具体的声明方式或函数调用等。STL容器识别规则包含了对15种容器的声明和函数调用识别。其中每一种容器又分为声明识别规则和函数识别规则,这两种规则包含首要规则和次要规则。首要规则是必选规则,即必须具备的规则或条件,其作用为确定是否为某个容器的声明语句或函数调用语句;次要规则是可选规则,即可选择其中某一条或某几条规则,不用满足所有规则,其作用是确定是哪一种声明语句或哪个函数调用语句。基于首要规则和次要规则,结合抽象语法树的语法解析,可以自动识别出STL容器的声明或函数调用。
图10为STL容器映射规则架构设计图,请参见图10,在具体实施中,STL容器映射规则是根据识别出的容器声明或函数调用语句进行分解,将语句分解为若干条件要素,根据条件要素的满足情况,查询libcstl数据库,匹配libcstl种对应的声明语句或函数定义,按照匹配到的声明语句或函数重构源代码。STL容器映射规则包含了对15种容器的声明和函数调用的映射。其中每一种容器又分为声明映射规则和函数映射规则。以声明映射规则为例,已识别出的容器声明语句,可分解为多个要素,包括容器类型,数据类型,变量名称,元素个数,元素值等。根据要素的分解情况,查询libcstl,可匹配到对应的C语言容器声明语句,并进行语句的重构。
可选的,本申请实施例包括C++STL容器声明的自动识别转换以及C++STL容器函数调用的自动识别转换,ANTLR解析模块1还包括:
声明规则构建单元11:构建所述C++语言STL容器的所述语法识别规则,并构建所述C++语言STL容器到所述C语言的libcstl的所述语法映射规则;
声明语法解析单元12:基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树。
在具体实施中,构建C++STL容器的语法识别规则,构建C++STL容器到C语言libcstl的语法映射规则,基于cpp14.g4语法规则文件,使用ANTLR技术对C++STL容器源代码进行语法解析,形成抽象语法树。
函数调用规则构建单元13:构建所述C++语言STL容器函数调用的所述语法识别规则,并构建所述C++语言STL容器函数调用到所述C语言的libcstl的所述语法映射规则;
函数调用语法解析单元14:基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树。
在具体实施中,构建C++STL容器调用的语法识别规则,构建C++STL容器函数调用到C语言libcstl的语法映射规则,基于cpp14.g4语法规则文件,使用ANTLR技术对C++STL容器源代码进行语法解析,形成抽象语法树。
第一语法树遍历模块2:对所述抽象语法树进行遍历,根据所述语法识别规则自动识别所述STL容器的声明语句,并将所述声明语句的声明信息保存到Utility类数据结构中。
在具体实施中,编程实现listener接口,遍历抽象语法树;第一次抽象语法树遍历,根据C++STL容器的语法识别规则,自动识别STL容器的声明语句,将容器声明的变量名称,所属类、函数等信息保存到Utility类数据结构中。
第二语法树遍历模块3:对所述抽象语法树再次进行遍历,根据所述语法映射规则将所述STL容器映射到基于所述C语言的libcstl上。
可选的,第二语法树遍历模块3还包括:
声明语句定位单元31:根据已保存的所述Utility类数据结构,快速定位到所述声明语句;
声明信息映射单元32:根据所述语法映射规则将所述STL容器声明映射到基于所述C语言的libcstl上。
在具体实施中,第二次抽象语法树解析时,根据已保存的Utility数据结构,快速定位到容器声明语句;根据C++STL容器到C语言libcstl的语法映射规则,将源代码的容器声明映射到基于C语言的libcstl上。
函数调用识别单元33:根据已保存的所述Utility类数据结构,识别出所述STL容器的函数调用语句,定义为目标语句,并识别所述目标语句中的函数信息;
函数调用映射单元34:根据所述语法映射规则将所述STL容器的所述函数调用映射到基于所述C语言的libcstl上。
在具体实施中,第二次抽象语法树解析时,根据已保存的Utility数据结构,识别出容器函数调用语句,并定义为目标语句;结合STL容器函数调用规则,识别目标语句中的成员函数名称,参数等信息;根据C++STL容器函数调用到C语言libcstl的语法映射规则,将源代码的容器函数调用映射到基于C语言的libcstl上。
源码重构转换模块4:根据所述libcstl的语法规则,对所述C++语言STL容器源代码进行重构,将所述C++语言STL容器转换为所述C语言的libcstl。
在具体实施中,根据libcstl的语法规则,对源代码进行重构,从而达到C++语言STL容器声明以及C++语言STL函数调用转换为C语言libcstl的目的。
本申请提供一具体实施例对上述技术方案作进一步说明:
本申请提供C++STL 15种容器声明和调用的自动识别与转换,如下表所示:
序列容器 | 关联容器 | 无序关联容器 | 容器适配器 |
vector | map | unordered_map | stack |
deque | set | unordered_set | queue |
list | multimap | unordered_multimap | priority_queue |
pair | multiset | unordered_multiset |
并且,图8为vector容器声明和调用的转换实例,请参见图8,以vector容器为例,本申请,提供了转换前的C++vector声明和函数调用的代码,以及转换后的基于libcstl的C语言代码。
另外,结合图1、图2描述的一种异构众核处理器中编程语言转换方法可以由电子设备来实现。图5为本发明实施例提供的的一电子设备的框架图。
电子设备可以包括处理器61以及存储有计算机程序指令的存储器62。
具体地,上述处理器61可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器62可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器62可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器62可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器62可在数据处理装置的内部或外部。在特定实施例中,存储器62是非易失性(Non-Volatile)存储器。在特定实施例中,存储器62包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器62可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器61所执行的可能的计算机程序指令。
处理器61通过读取并执行存储器62中存储的计算机程序指令,以实现上述实施例中的任意一种异构众核处理器中编程语言转换方法。
在其中一些实施例中,电子设备还可包括通信接口63和总线60。其中,如图5所示,处理器61、存储器62、通信接口63通过总线60连接并完成相互间的通信。
通信端口63可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线60包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。总线60包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(ControlBus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线60可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(FrontSide Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线60可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以执行本申请实施例中的一种异构众核处理器中编程语言转换方法。
另外,结合上述实施例中的一种异构众核处理器中编程语言转换方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种异构众核处理器中编程语言转换方法。
而前述的存储介质包括:U盘、移动硬盘、只读存储器(ReadOnly Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (2)
1.一种异构众核处理器中编程语言转换方法,其特征在于,包括:
ANTLR解析步骤,构建异构众核处理器主核中C++语言转换至C语言的语法识别规则和语法映射规则,并通过ANTLR技术对C++语言STL容器源代码进行语法解析,形成抽象语法树;
所述ANTLR解析步骤进一步包括:声明规则构建步骤,构建所述C++语言STL容器的所述语法识别规则,并构建所述C++语言STL容器到所述C语言的libcstl的所述语法映射规则;声明语法解析步骤,基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树;函数调用规则构建步骤,构建所述C++语言STL容器函数调用的所述语法识别规则,并构建所述C++语言STL容器函数调用到所述C语言的libcstl的所述语法映射规则;函数调用语法解析步骤,基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树;
第一语法树遍历步骤,对所述抽象语法树进行遍历,根据所述语法识别规则自动识别所述C++语言STL容器的声明语句,并将所述声明语句的声明信息保存到Utility类数据结构中;
第二语法树遍历步骤,对所述抽象语法树再次进行遍历,根据所述语法映射规则将所述C++语言STL容器映射到基于所述C语言的libcstl上;
所述第二语法树遍历步骤进一步包括:声明语句定位步骤,根据已保存的所述Utility类数据结构,快速定位到所述声明语句;声明信息映射步骤,根据所述语法映射规则将所述C++语言STL容器声明映射到基于所述C语言的libcstl上;函数调用识别步骤,根据已保存的所述Utility类数据结构,识别出所述C++语言STL容器的函数调用语句,定义为目标语句,并识别所述目标语句中的函数信息;函数调用映射步骤,根据所述语法映射规则将所述C++语言STL容器的所述函数调用映射到基于所述C语言的libcstl上;
源码重构转换步骤,根据所述libcstl的语法规则,对所述C++语言STL容器源代码进行重构,将所述C++语言STL容器转换为所述C语言的libcstl。
2.一种异构众核处理器中编程语言转换系统,其特征在于,包括:
ANTLR解析模块,构建异构众核处理器主核中C++语言转换至C语言的语法识别规则和语法映射规则,并通过ANTLR技术对C++语言STL容器源代码进行语法解析,形成抽象语法树;
第一语法树遍历模块,对所述抽象语法树进行遍历,根据所述语法识别规则自动识别所述C++语言STL容器的声明语句,并将所述声明语句的声明信息保存到Utility类数据结构中;
所述ANTLR解析模块进一步包括:声明规则构建单元,构建所述C++语言STL容器的所述语法识别规则,并构建所述C++语言STL容器到所述C语言的libcstl的所述语法映射规则;声明语法解析单元,基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树;函数调用规则构建单元,构建所述C++语言STL容器函数调用的所述语法识别规则,并构建所述C++语言STL容器函数调用到所述C语言的libcstl的所述语法映射规则;函数调用语法解析单元,基于cpp14.g4语法规则文件,通过所述ANTLR技术对所述C++语言STL容器源代码进行语法解析,形成所述抽象语法树;
第二语法树遍历模块,对所述抽象语法树再次进行遍历,根据所述语法映射规则将所述C++语言STL容器映射到基于所述C语言的libcstl上;
所述第二语法树遍历模块进一步包括:声明语句定位单元,根据已保存的所述Utility类数据结构,快速定位到所述声明语句;声明信息映射单元,根据所述语法映射规则将所述C++语言STL容器声明映射到基于所述C语言的libcstl上;函数调用识别单元,根据已保存的所述Utility类数据结构,识别出所述C++语言STL容器的函数调用语句,定义为目标语句,并识别所述目标语句中的函数信息;函数调用映射单元,根据所述语法映射规则将所述C++语言STL容器的所述函数调用映射到基于所述C语言的libcstl上;
源码重构转换模块,根据所述libcstl的语法规则,对所述C++语言STL容器源代码进行重构,将所述C++语言STL容器转换为所述C语言的libcstl。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110698088.9A CN113467828B (zh) | 2021-06-23 | 2021-06-23 | 一种异构众核处理器中编程语言转换方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110698088.9A CN113467828B (zh) | 2021-06-23 | 2021-06-23 | 一种异构众核处理器中编程语言转换方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113467828A CN113467828A (zh) | 2021-10-01 |
CN113467828B true CN113467828B (zh) | 2024-01-12 |
Family
ID=77872470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110698088.9A Active CN113467828B (zh) | 2021-06-23 | 2021-06-23 | 一种异构众核处理器中编程语言转换方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113467828B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115390852A (zh) * | 2022-08-26 | 2022-11-25 | 支付宝(杭州)信息技术有限公司 | 一种生成统一抽象语法树与程序分析的方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880452A (zh) * | 2012-02-01 | 2013-01-16 | 日照市国软软件有限公司 | 一种可跨语言重用的编程语言 |
US9996328B1 (en) * | 2017-06-22 | 2018-06-12 | Archeo Futurus, Inc. | Compiling and optimizing a computer code by minimizing a number of states in a finite machine corresponding to the computer code |
CN108629035A (zh) * | 2018-05-10 | 2018-10-09 | 福建星瑞格软件有限公司 | 一种基于jdbc代理的异构数据库应用迁移方法 |
CN110865814A (zh) * | 2019-10-30 | 2020-03-06 | 南京天数智芯科技有限公司 | 一种支持异构计算核架构的编译器实现方法和系统 |
CN111488154A (zh) * | 2020-04-23 | 2020-08-04 | 北京东土科技股份有限公司 | St语言源代码编译方法、装置、计算机设备及介质 |
CN111984233A (zh) * | 2020-08-03 | 2020-11-24 | 南京航空航天大学 | 一种AltaRica模型中类的平展化方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7954059B2 (en) * | 2006-07-24 | 2011-05-31 | National Instruments Corporation | Automatic conversion of text-based code having function overloading and dynamic types into a graphical program for compiled execution |
US9239710B2 (en) * | 2013-03-15 | 2016-01-19 | ArtinSoft Corporation | Programming language transformations with abstract syntax tree extensions |
-
2021
- 2021-06-23 CN CN202110698088.9A patent/CN113467828B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880452A (zh) * | 2012-02-01 | 2013-01-16 | 日照市国软软件有限公司 | 一种可跨语言重用的编程语言 |
US9996328B1 (en) * | 2017-06-22 | 2018-06-12 | Archeo Futurus, Inc. | Compiling and optimizing a computer code by minimizing a number of states in a finite machine corresponding to the computer code |
CN108629035A (zh) * | 2018-05-10 | 2018-10-09 | 福建星瑞格软件有限公司 | 一种基于jdbc代理的异构数据库应用迁移方法 |
CN110865814A (zh) * | 2019-10-30 | 2020-03-06 | 南京天数智芯科技有限公司 | 一种支持异构计算核架构的编译器实现方法和系统 |
CN111488154A (zh) * | 2020-04-23 | 2020-08-04 | 北京东土科技股份有限公司 | St语言源代码编译方法、装置、计算机设备及介质 |
CN111984233A (zh) * | 2020-08-03 | 2020-11-24 | 南京航空航天大学 | 一种AltaRica模型中类的平展化方法 |
Non-Patent Citations (1)
Title |
---|
海洋多源异构数据转换系统的设计与实现;马伟霞 等;《计算机工程与设计》;第35卷(第08期);第2917-2922页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113467828A (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kuchaiev et al. | Nemo: a toolkit for building ai applications using neural modules | |
US11900079B2 (en) | Acceleration techniques for graph analysis programs | |
CN108628635B (zh) | 获取参数名和局部变量名的方法、装置、设备及存储介质 | |
US8522221B1 (en) | Techniques for automatic generation of instruction-set documentation | |
CN112988163B (zh) | 编程语言智能适配方法、装置、电子设备和介质 | |
CN113504900B (zh) | 一种编程语言转换方法和装置 | |
KR950006609B1 (ko) | 다중 패스코드 발생에 있어서 템플리트를 이용한 다중 언어 최적화 컴파일러 | |
CN108595334B (zh) | 一种计算Java程序动态切片的方法、装置及可读存储介质 | |
CN109828759B (zh) | 代码编译方法、装置、计算机装置及存储介质 | |
WO2021259290A1 (zh) | 存储过程转换方法、装置、设备和存储介质 | |
US11650901B2 (en) | Automated generation of software patches | |
US11604774B2 (en) | Method and apparatus of converting schema in deep learning framework, and computer storage medium | |
US12039305B2 (en) | Method for compilation, electronic device and storage medium | |
Ahmad et al. | Leveraging parallel data processing frameworks with verified lifting | |
CN113467828B (zh) | 一种异构众核处理器中编程语言转换方法和系统 | |
CN114780100B (zh) | 编译方法、电子设备及存储介质 | |
CN114327477A (zh) | 智能合约执行方法、装置、电子装置和存储介质 | |
US7493481B1 (en) | Direct hardware processing of internal data structure fields | |
CN112632924B (zh) | 规则化执行序列标注的方法、系统、电子设备及存储介质 | |
EP4113284A1 (en) | Cross-platform code conversion method and device | |
Trojahner et al. | Dependently typed array programs don’t go wrong | |
CN113467778B (zh) | 一种异构众核处理器中算法转换方法和系统 | |
US11762762B1 (en) | Static and automatic inference of inter-basic block burst transfers for high-level synthesis | |
CN114115900B (zh) | 一种脚本编译方法、装置及电子设备 | |
CN112860233B (zh) | 目标语法树的生成方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 266100 Shandong Province, Qingdao city Laoshan District Songling Road No. 238 Applicant after: OCEAN University OF CHINA Applicant after: Qingdao Marine Science and Technology Center Address before: 266100 Shandong Province, Qingdao city Laoshan District Songling Road No. 238 Applicant before: OCEAN University OF CHINA Applicant before: QINGDAO NATIONAL LABORATORY FOR MARINE SCIENCE AND TECHNOLOGY DEVELOPMENT CENTER |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |