CN111249736B - 代码处理方法及装置 - Google Patents

代码处理方法及装置 Download PDF

Info

Publication number
CN111249736B
CN111249736B CN202010047489.3A CN202010047489A CN111249736B CN 111249736 B CN111249736 B CN 111249736B CN 202010047489 A CN202010047489 A CN 202010047489A CN 111249736 B CN111249736 B CN 111249736B
Authority
CN
China
Prior art keywords
node
type
syntax tree
abstract syntax
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010047489.3A
Other languages
English (en)
Other versions
CN111249736A (zh
Inventor
陈伟杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202010047489.3A priority Critical patent/CN111249736B/zh
Publication of CN111249736A publication Critical patent/CN111249736A/zh
Application granted granted Critical
Publication of CN111249736B publication Critical patent/CN111249736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/60Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/44Encoding
    • G06F8/447Target code generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种代码处理方法及装置。其中,该方法包括:将初始源代码转换为源抽象语法树对象;将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。本发明解决了现有技术中存在游戏项目的表格数据较多导致占用内存资源,影响游戏进程的技术问题。

Description

代码处理方法及装置
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种代码处理方法及装置。
背景技术
目前市面上有非常多的游戏项目采用python语言作为主要开发语言,这些项目通常会将游戏策划的表格数据导出为python模块文件。游戏进程会读取这些模块文件到内存里并执行相应的游戏逻辑。当表格数据变得越多的时候,表格数据占用的内存也会变多,甚至成为游戏进程的内存瓶颈。
为解决表格数据占用的问题,表格数据会被导出为python模块,模块里面包含不同类型的对象,包括字典,元组,lambda表达式,整形,长整形,浮点,字符串。对于表格数据而言,里面有很相同字面值的对象构建运算,由于这些构建运算会得到相同的对象,所以这种方式虽然在一定程度上降低了表格模块的内存占用。
但是,由于字典,元组,lambda表达式等类型是可变数据类型,python模块没有对这些类型对象使用字面值运算的优化手段。并且游戏内对于表格数据的使用是只读的,所以对于表格数据而言,字典,元组,lambda表达式等类型也是不可变数据类型,并且表格数据通常会包含多个相同值的上述类型的不同对象,这些不同对象对于表格数据来说是冗余的,会占用内存资源。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种代码处理方法及装置,以至少解决现有技术中存在游戏项目的表格数据较多导致占用内存资源,影响游戏进程的技术问题。
根据本发明实施例的一个方面,提供了一种代码处理方法,包括:将初始源代码转换为源抽象语法树对象;将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
根据本发明实施例的另一方面,还提供了一种代码处理装置,包括:转换模块,用于将初始源代码转换为源抽象语法树对象;第一处理模块,用于将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;第二处理模块,用于将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
根据本发明实施例的另一方面,还提供了一种存储介质,上述存储介质包括存储的程序,其中,在上述程序运行时控制上述存储介质所在设备执行任意一项上述的代码处理方法。
根据本发明实施例的另一方面,还提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行任意一项上述的代码处理方法。
在本发明实施例中,采用修改表格模块源代码的方式,通过将初始源代码转换为源抽象语法树对象;将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码,达到了修改源代码以改变对象运算方式,减少表格数据的内存占用的目的,从而实现了加快游戏进程的技术效果,进而解决了现有技术中存在游戏项目的表格数据较多导致占用内存资源,影响游戏进程的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种代码处理方法的流程图;
图2是根据本发明实施例的一种可选的代码处理方法的流程图;
图3是根据本发明实施例的一种可选的代码处理方法的流程图;
图4是根据本发明实施例的一种代码处理装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,为方便理解本发明实施例,下面将对本发明中所涉及的部分术语或名词进行解释说明:
ast模块:是指python提供的一个模块,用于帮助python程序处理python语法的抽象语法树。
tree_node:表格模块文件通过ast模块转化得到的抽象语法树对象的名称。
ast.Name:ast模块提供的节点类型之一,代表名字表达式节点类型。
ast.Dict:ast模块提供的节点类型之一,代表字典节点类型。
ast.Tuple:ast模块提供的节点类型之一,代表元组节点类型。
ast.Lambda:ast模块提供的节点类型之一,代表lambda表达式节点类型。
ast.Assign:ast模块提供的节点类型之一,代表赋值表达式节点类型。
ast.Delete:ast模块提供的节点类型之一,代表删除表达式节点类型。
Const:自定义的节点类型,用于替换可变对象节点。
codegen:python的第三方库,用于将抽象语法树对象逆转换为代码字符串。
const_dict:有序的以Const类型节点对象的name属性为键,值为包含被替换节点的信息的数据结构的表格。
node:属于某一抽象语法树的节点对象,作为输入变量。
ast.Num:ast模块提供的节点类型之一,代表数字节点类型。
ast.Expression:st模块提供的节点类型之一,代表表达式类型。
None,True,False:python内置的不可变对象。
repr:python内置的函数,可以将对象序列化为字符串。
source:由表格模块文件读入内存后的字符串对象。
ast.parse:ast模块提供的函数,将代码字符串对象转换为抽象语法树对象。
tree_node:转换后的抽象语法树对象的名称。
ConstTransformer:用于修改抽象语法树的遍历类。
visitor:ConstTransformer类对象。
new_body:存储算法计算得到的新的节点列表。
const_name,const_info:中间过程名称。
实施例1
根据本发明实施例,提供了一种代码处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种代码处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,将初始源代码转换为源抽象语法树对象;
步骤S104,将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;
步骤S106,将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
在本发明实施例中,采用修改表格模块源代码的方式,通过将初始源代码转换为源抽象语法树对象;将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码,达到了修改源代码以改变对象运算方式,减少表格数据的内存占用的目的,从而实现了加快游戏进程的技术效果,进而解决了现有技术中存在游戏项目的表格数据较多导致占用内存资源,影响游戏进程的技术问题。
在一种可选的实施例中,上述多个可变数据类型对象包括:字典类型对象、元组类型对象、预设表达式类型对象。
可选的,在本申请实施例中,上述预设表达式类型对象具体可以为lambda表达式类型对象。
在一种可选的实施例中,上述初始源代码在读入内存后从初始的表格数据形式转化为字符串对象。
可选的,在上述实施例中,上述初始源代码的初始形式为表格数据形式,在读入内存后从初始的表格数据形式转化为字符串对象。
作为一种可选的实施例,可以通过采用python内置的ast模块,将字符串对象转化为源抽象语法树对象tree_node;可选的,上述ast模块帮助python程序处理python语法的抽象语法树,ast提供节点类的定义和工具函数和类,包括遍历语法树类和修改语法树等功能,开发者可以使用该ast模块来分析和处理python源代码。
可选的,上述多个可变数据类型对象包括:ast.Dict,ast.Tuple,ast.Lambda类型节点;上述自定义类型对象为Const类型节点。
作为另一种可选的实施例,本申请实施例通过新增自定义类型对象Const类型节点,继承于ast.Name节点类,并提供将ast.Dict,ast.Tuple,ast.Lambda等节点类型转化为字面值的方法,实现将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,具体的,可以通过深度遍历抽象语法树对象,将抽象语法树对象里面的ast.Dict,ast.Tuple,ast.Lambda类型节点替换为Const类型节点,其中,字面值相同的节点其对应Const类型节点的name属性相同。
可选的,上述赋值表达式类型对象为ast.Assign节点,上述删除表达式类型对象为ast.Delete节点。
可选的,自定义节点类Const(即上述Const类型节点)可以但不限于为以下代码形式:
class Const(ast.Name):
def__init__(self,name,origin_node,*args,**kwargs):
super(Const,self).__init__(id=name,*args,**kwargs)
self.name=name
具体的,上述Const类型节点继承于ast.Name类型,其name属性和其id属性一致,name属性同时是一个标识,当不同的Const类型节点的name属性值相等,则表明这些节点指向同一个对象;Const类型节点被用于替换可变数据类型对象的节点。
在本申请实施例中,在将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象之后,上述赋值表达式类型对象ast.Assign节点和上述删除表达式类型对象ast.Delete节点到至新创建的对象列表,得到目标抽象语法树对象;借助第三方模块codegen,将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
可选的,上述第三方模块codegen可以将目标抽象语法树对象逆向转换为目标源代码(python源代码),相当于ast模块的一个逆向操作。
通过本申请实施例提供的代码处理方法,通过将源抽象语法树对象中的字典类型对象、元组类型对象、预设表达式类型对象等多个可变数据类型对象,替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;再将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
也即,通过借助ast模块和codegen模块,增加节点类Const,通过替换源抽象语法树的ast.Dict,ast.Tuple,ast.Lambda节点为Const类型节点,增加ast.Assign节点和ast.Delete节点,并将修改后的抽象语法树转换为目标源代码的方式,使得表格模块里面,字面值相同的字典,元组,lambda表达式等可变类型的构建运算转化为对同一个对象的引用运算,消除了冗余的对象,减低了表格数据对内存资源的占用。
需要说明的是,本申请实施中,减少占用的内存资源的多少与表格数据重复度正相关。
在一种可选的实施例中,将上述初始源代码转换为上述源抽象语法树对象包括:
步骤S202,通过预设脚本语言中配置的解析函数将上述字符串对象转换为上述源抽象语法树对象。
作为一种可选的实施例,上述预设脚本语言可以为python语言,上述解析函数可以为ast模块,也即可以通过采用python内置的ast模块,将字符串对象转化为源抽象语法树对象tree_node。
在一种可选的实施例中,将上述源抽象语法树对象中的上述多个可变数据类型对象替换为上述自定义类型对象,并添加上述赋值表达式类型对象和上述删除表达式类型对象,得到上述目标抽象语法树对象包括:
步骤S302,将上述多个可变数据类型对象替换为上述自定义类型对象,构建采用键值对表示的数据结构;
步骤S304,基于上述数据结构,在新创建的对象列表中添加上述赋值表达式类型对象和上述删除表达式类型对象,得到上述目标抽象语法树对象。
可选的,上述键值对以上述自定义类型对象的名称属性为键,以被替换对象的信息为值。
在本申请一种可选的实施例中,在遍历过程中构建有序的以Const类型节点对象的name属性为键,值为包含被替换节点的信息的数据结构const_dict。根据上述数据结构const_dict,按序添加上述赋值表达式类型对象ast.Assign节点和上述删除表达式类型对象ast.Delete节点到至新创建的对象列表。
作为一种可选的实施例,本申请实施例还以通过以下程序代码实现将上述多个可变数据类型对象替换为上述自定义类型对象,构建采用键值对表示的数据结构,也即,将ast.Dict,ast.Tuple,ast.Lambda等节点类型转化为字面值:
Figure BDA0002369948130000071
Figure BDA0002369948130000081
基于上述程序代码可知,本申请实施例通过node_to_key函数将多个可变数据类型对象替换为上述自定义类型对象(例如,字符串对象或不可变类型对象),如将一个节点转化为字面值,该字面值是一个字符串对象或不可变类型对象,例如,如None,True或False。literal_eval函数将一个节点对象转化为一个非节点类的自定义类型对象,literal_eval里面的子函数_convert是实际执行转化逻辑的函数。
在一种可选的实施例中,图2是根据本发明实施例的一种可选的代码处理方法的流程图,如图2所示,基于上述数据结构,在上述新创建的对象列表中添加上述赋值表达式类型对象包括:
步骤S402,构建上述赋值表达式类型对象;
步骤S404,将上述赋值表达式类型对象添加至上述新创建的对象列表中。
可选的,上述赋值表达式类型对象的目标元素是以上述自定义类型对象的名称属性为标识构建的名字表达式类型对象,上述目标元素的值属性是与上述自定义类型对象的名称属性对应的字面值。
可选的,通过构建上述赋值表达式类型对象;并将上述赋值表达式类型对象添加至上述新创建的对象列表中,基于上述数据结构,在上述新创建的对象列表中添加上述赋值表达式类型对象。
在本申请实施例中,通过以ConstTransformer.add_const_node完成添加常量节点的逻辑,其接受一个源节点node作为参数,完成如下流程得到Const类型节点:调用node_to_key得到node的字面值key,判断key是否存在于const_key_dict里面,如果不存在,以__CONST__为前缀,index为后缀创建字符串const_name,以const_name为参数创建ConstInfo对象const_info,以const_name为键添加到const_dict字典里面,以key为键添加到const_key_dict里面,最后index属性自增1;否则,以__CONST__为前缀,index为后缀创建字符串const_name,以const_name为参数创建ConstInfo对象const_info,以const_name为键添加到const_dict字典里面,以key为键添加到const_key_dict里面,最后index属性自增1。
通过key从const_key_dict得到const_info,以const_info.name,node作为参数构建Const类型节点const_node,往const_info的node_list列表加入源节点node,往const_info.const_node_list列表加入const_node,返回const_node;const_key_dict字典保证了相同字面值的节点构建出来的ConstNode对象的name属性会相同,并会被加入到同一个ConstInfo对象。
作为一种可选的实施例,替换ast.Dict节点的实现代码如下所示:
Figure BDA0002369948130000091
Figure BDA0002369948130000101
可选的,可以以ConstTransformer.visit_Dict完成ast.Dict节点替换的逻辑,采取深度遍历的方法,先将keys属性内的所有节点完成Const类型节点的替换,再将values属性内的所有节点完成Const类型节点的替换,最后完成自身节点的Const替换。
作为一种可选的实施例,替换ast.Tuple节点的实现代码如下所示:
Figure BDA0002369948130000102
也即,通过ConstTransformer.visit_Tuple完成ast.Tuple节点替换的逻辑,同样是深度遍历的方法,先将elts属性内的所有节点完成Const的替换,最后再完成自身Const类型节点的替换。
作为一种可选的实施例,替换ast.Lambda节点的实现代码如下所示:
def visit_Lambda(self,node):
return self.add_const_node(node)
也即,通过ConstTransformer.visit_Lambda完成ast.Lambda节点的替换逻辑,由于该类型节点没有子对象,完成自身Const类型节点替换即可。
在一种可选的实施例中,图3是根据本发明实施例的一种可选的代码处理方法的流程图,如图3所示,基于上述数据结构,在上述新创建的对象列表中添加上述删除表达式类型对象包括:
步骤S502,构建上述删除表达式类型对象;
步骤S504,将上述删除表达式类型对象添加至上述新创建的对象列表中。
可选的,上述赋值表达式类型对象的目标元素是以上述自定义类型对象的名称属性为标识构建的名字表达式类型对象。
可选的,可以通过构建上述删除表达式类型对象;并将上述删除表达式类型对象添加至上述新创建的对象列表中。
作为一种可选的实施例中,可以通过遍历for const_name,const_info innode.const_dict.iteritems();构建ast.Delete节点delete_node,其targets属性只有一个元素为以const_name为id构建的ast.Name节点;将delete_node往后添加到new_body;将new_body替换tree_node.body属性,即使用新的节点列表替换旧的节点列表。
作为一种可选的实施例,本申请实施例所提供的代码处理方法的整体算法流程可以但不限于如下步骤1-9所示:
1.输入表格模块的初始源代码source;
2.以source为参数,调用ast.parse函数,得到源抽象语法树对象tree_node;
3.创建ConstTransfromer对象visitor,以tree_node为参数调用visitor.vistor方法,完成ast.Dict,ast.Tuple,ast.Lambda的替换,并且vistor.const_dict会存储被创建的ConstInfo对象;
4.创建新的节点列表new_body
5.遍历for const_name,const_info in visitor.const_dict.iteritems()
5.1构建ast.Assign节点assign_node,其targets只有一个元素为以const_name为id构建的ast.Name节点,value属性为const_info.node_list[0],由于const_info.node_list里面每一个节点的字面值都一样,因此使用其中一个节点作为value即可;
5.2将assign_node往后添加到new_body;
6.将tree_node的子节点按序往后添加到new_body里面;
7.遍历for const_name,const_info in node.const_dict.iteritems();
7.1构建ast.Delete节点delete_node,其targets属性只有一个元素为以const_name为id构建的ast.Name节点;
7.2将delete_node往后添加到new_body;
8.将new_body替换tree_node.body属性,即使用新的节点列表替换旧的节点列表;
9.使用codegen模块将修改后的tree_node得到目标源代码并返回。
作为一种可选的实施例,以下提供一个使用本申请实施例所提供的代码处理方法的一个实施方式:
处理前的初始源代码:
Figure BDA0002369948130000121
处理前的目标源代码:
Figure BDA0002369948130000122
Figure BDA0002369948130000131
作为一种可选的实施例,_convert函数可以通过执行以下流程得到自定义类型对象:
首先,输入可变数据类型对象node,并判断node的类型,如果node类型为ast.Str类型,那么返回node.s属性,如果node类型为ast.Num类型,以__ast_const_num_%s(%s)为格式化字符串,node.n的类型和node.n数值为格式化参数,得到一个字符串并返回;如果node类型为ast.Tuple类型,借助python元组构造语法,遍历node的子节点,将每一个子节点作为参数调用_convert函数得到返回值,并将返回值地结果放到构造元组对象里,并返回构造的元组对象;如果node类型为ast.Dict类型,借助python字典构造语法,遍历字典的每一个键和值,以键和值作为参数调用得到_convert函数得到键返回值和值返回值,并将键返回值和值返回值作为构造字典对象的键和值,最后返回构造的字典对象;如果node类型为ast.Name并且node的id属性值等于”None”,“True”,“False”其中一个,那么返回对应的值None,True,False;如果node类型为Const,返回node的name属性;如果node类型为ast.Lambda,以__ast_lambda_%s作为格式字符串,借助codegen模块将node转换为python代码字符串作为格式化参数得到的字符串并返回;则抛出ValueError异常。
作为一种可选的实施例,literal_eval函数可以通过执行以下流程得到自定义类型对象:
首先,输入可变数据类型对象node,并判断node的类型,如果node的类型为ast.Expression,将node的body属性作为参数调用_convert函数得到返回值并返回;否则,以node为参数调用_convert函数得到返回值并返回;node_to_key函数执行以下流程得到字面值;输入节点对象node,并以node为参数调用literal_eval函数得到自定义类型对象,判断自定义类型对象的类型,如果自定义类型对象的类型为字典类型,以__ast_const_dict_%s为格式化字符串,按键的值有序地构建一个以键值对二元元组作为元素的元组对象,并且对其调用repr函数合成一个字符串对象,并以该字符串对象作为格式化参数得到一个新的字符串并返回,如果自定义类型对象的类型为元组类型,以__ast_const_tuple_%s为格式化字符串,对中间对象调用repr函数得到的返回值作为格式化参数,得到一个新的字符串并返回自定义类型对象。
本申请一种可选的实施例中提供遍历节点类,定义ConstInfo的代码可以如下所示:
class ConstInfo(object):
def__init__(self,name):
self.name=name
self.node_list=[]
self.const_node_list=[]
其中,上述ConstInfo是存储了Const类型节点和被Const类型节点替换的原节点的数据结构,const_node_list存储了相同name属性的Const类型节点列表,node_list存储了被const_node_list里的Const类型节点替换的节点列表,name属性和const_node_list里面任一节点的name属性相同,也即相同字面值的ast.Dict,ast.Tuple,ast.Lambda节点归属于同一个ConstInfo对象。
本申请一种可选的实施例中定义遍历节点类的实现代码可以如下所示:
class ConstTransformer(ast.NodeTransformer):
def__init__(self):
self.const_dict=OrderedDict()
self.const_key_dict=OrderedDict()
self.index=0
具体的,上述ast模块提供工具类ast.NodeTransformer,这个类用于遍历抽象语法树,开发者可以继承该类来实现自定义节点逻辑。ConstTransformer继承于ast.NodeTransformer,其包含3个属性,const_dict是以ConstInfo.name为键,ConstInfo对象为值的有序字典,const_key_dict以ConstInfo.node_list里面任意一个节点的字面值作为键,值为ConstInfo对象的有序字典。index属性为生成Const类型节点name属性的自增下标,目的是确保name属性的唯一性。
本申请一种可选的实施例中通过源节点得到一个常量节点的实现代码可以如下所示:
def add_const_node(self,node):
try:
key=node_to_key(node)
except(ValueError,TypeError):
return node
if key not in self.const_key_dict:
const_name='__CONST__%s'%self.index
const_info=self.const_dict[const_name]=ConstInfo(const_name)
self.const_key_dict[key]=const_info
self.index+=1
else:
const_info=self.const_key_dict[key]
const_node=Const(const_info.name,node)
const_info.node_list.append(node)
const_info.const_node_list.append(const_node)
ast.copy_location(const_node,node)
return const_node
在一种可选的实施例中,上述ConstTransformer.add_const_node完成添加常量节点的逻辑,其接受一个源节点node作为参数,完成如下流程得到Const类型节点:调用node_to_key得到node的字面值key,判断key是否存在于const_key_dict里面,如果不存在,以__CONST__为前缀,index为后缀创建字符串const_name,以const_name为参数创建ConstInfo对象const_info,以const_name为键添加到const_dict字典里面,以key为键添加到const_key_dict里面,最后index属性自增1,否则,通过key从const_key_dict得到const_info;以const_info.name,node作为参数构建Const类型节点const_node,往const_info的node_list列表加入源节点node,往const_info.const_node_list列表加入const_node,返回const_node;其中,const_key_dict字典保证了相同字面值的节点构建出来的ConstNode对象的name属性会相同,并会被加入到同一个ConstInfo对象;
本申请一种可选的实施例中,替换ast.Dict节点的实现代码可以如下所示:
def visit_Dict(self,node):
keys=tuple(node.keys)
for index,key in enumerate(keys):
ret=self.visit(key)
if ret:
node.keys[index]=ret
ret=self.visit(node.values[index])
if ret:
node.values[index]=ret
return self.add_const_node(node)
具体的,上述ConstTransformer.visit_Dict完成ast.Dict节点替换的逻辑,可以采用深度遍历的方法,例如,先将keys属性内的所有节点完成Const类型节点的替换,再将values属性内的所有节点完成Const类型节点的替换,最后完成自身节点的Const替换。
本申请一种可选的实施例中,替换ast.Tuple节点的实现代码可以如下所示:
def visit_Tuple(self,node):
if not node.elts:
return node
for index,child_node in enumerate(tuple(node.elts)):
ret=self.visit(child_node)
if ret:
node.elts[index]=ret
return self.add_const_node(node)
具体的,上述ConstTransformer.visit_Tuple完成ast.Tuple节点替换的逻辑,同样是深度遍历的方法,先将elts属性内的所有节点完成Const的替换,最后再完成自身Const类型节点的替换。
本申请一种可选的实施例中,替换ast.Lambda节点的实现代码可以如下所示:
def visit_Lambda(self,node):
return self.add_const_node(node)
具体的,上述ConstTransformer.visit_Lambda完成ast.Lambda节点的替换逻辑,由于该类型节点没有子对象,完成自身Const类型节点替换即可。
作为一种可选的实施例,上述实现方案的整体算法流程,可以但不限于如下所示:
首先,输入表格模块初始源代码source,并以source为参数,调用ast.parse函数,得到抽象语法树对象tree_node,创建ConstTransfromer对象visitor,以tree_node为参数调用visitor.vistor方法,此步骤会完成ast.Dict,ast.Tuple,ast.Lambda的替换,并且vistor.const_dict会存储着被创建的ConstInfo对象,创建新的节点列表new_body,遍历for const_name,const_info in visitor.const_dict.iteritems(),构建ast.Assign节点assign_node,其targets只有一个元素为以const_name为id构建的ast.Name节点,value属性为const_info.node_list[0],由于const_info.node_list里面每一个节点的字面值都一样,所以使用其中一个节点作为value即可;通过将assign_node往后添加到new_body,将tree_node的子节点按序往后添加到new_body里,遍历for const_name,const_infoinnode.const_dict.iteritems(),构建ast.Delete节点delete_node,其targets属性只有一个元素为以const_name为id构建的ast.Name节点,将delete_node往后添加到new_body;将new_body替换tree_node.body属性,即是使用新的节点列表替换旧的节点列表;使用codegen模块将修改后的tree_node得到源代码并返回。
实施例2
根据本发明实施例,还提供了一种用于实施上述代码处理方法的装置实施例,图4是根据本发明实施例的一种代码处理装置的结构示意图,如图4所示,上述代码处理装置,包括:转换模块40、第一处理模块42和第二处理模块44,其中:
转换模块40,用于将初始源代码转换为源抽象语法树对象;第一处理模块42,用于将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;第二处理模块44,用于将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;或者,上述各个模块以任意组合的方式位于不同的处理器中。
此处需要说明的是,上述转换模块40、第一处理模块42和第二处理模块44对应于实施例1中的步骤S102至步骤S106,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在计算机终端中。
需要说明的是,本实施例的可选或优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
上述的代码处理装置还可以包括处理器和存储器,上述转换模块40、第一处理模块42和第二处理模块44等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元,上述内核可以设置一个或以上。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
根据本申请实施例,还提供了一种存储介质实施例。可选地,在本实施例中,上述存储介质包括存储的程序,其中,在上述程序运行时控制上述存储介质所在设备执行上述任意一种代码处理方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中,上述存储介质包括存储的程序。
可选地,在程序运行时控制存储介质所在设备执行以下功能:将初始源代码转换为源抽象语法树对象;将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
根据本申请实施例,还提供了一种处理器实施例。可选地,在本实施例中,上述处理器用于运行程序,其中,上述程序运行时执行上述任意一种代码处理方法。
本申请实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:将初始源代码转换为源抽象语法树对象;将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:将初始源代码转换为源抽象语法树对象;将上述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;将上述目标抽象语法树对象逆向转换为目标源代码,并输出上述目标源代码。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种代码处理方法,其特征在于,包括:
将初始源代码转换为源抽象语法树对象;
将所述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;
将所述目标抽象语法树对象逆向转换为目标源代码,并输出所述目标源代码;
其中,将所述源抽象语法树对象中的所述多个可变数据类型对象替换为所述自定义类型对象,并添加所述赋值表达式类型对象和所述删除表达式类型对象,得到所述目标抽象语法树对象包括:将所述多个可变数据类型对象替换为所述自定义类型对象,构建采用键值对表示的数据结构,其中,所述键值对以所述自定义类型对象的名称属性为键,以被替换对象的信息为值;基于所述数据结构,在新创建的对象列表中添加所述赋值表达式类型对象和所述删除表达式类型对象,得到所述目标抽象语法树对象。
2.根据权利要求1所述的方法,其特征在于,所述初始源代码在读入内存后从初始的表格数据形式转化为字符串对象。
3.根据权利要求2所述的方法,其特征在于,将所述初始源代码转换为所述源抽象语法树对象包括:
通过预设脚本语言中配置的解析函数将所述字符串对象转换为所述源抽象语法树对象。
4.根据权利要求1所述的方法,其特征在于,所述多个可变数据类型对象包括:
字典类型对象、元组类型对象、预设表达式类型对象。
5.根据权利要求1所述的方法,其特征在于,基于所述数据结构,在所述新创建的对象列表中添加所述赋值表达式类型对象包括:
构建所述赋值表达式类型对象,其中,所述赋值表达式类型对象的目标元素是以所述自定义类型对象的名称属性为标识构建的名字表达式类型对象,所述目标元素的值属性是与所述自定义类型对象的名称属性对应的字面值;
将所述赋值表达式类型对象添加至所述新创建的对象列表中。
6.根据权利要求1所述的方法,其特征在于,基于所述数据结构,在所述新创建的对象列表中添加所述删除表达式类型对象包括:
构建所述删除表达式类型对象,其中,所述删除表达式类型对象的目标元素是以所述自定义类型对象的名称属性为标识构建的名字表达式类型对象;
将所述删除表达式类型对象添加至所述新创建的对象列表中。
7.一种代码处理装置,其特征在于,包括:
转换模块,用于将初始源代码转换为源抽象语法树对象;
第一处理模块,用于将所述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象;
第二处理模块,用于将所述目标抽象语法树对象逆向转换为目标源代码,并输出所述目标源代码;
其中,所述第一处理模块用于通过以下步骤来将所述源抽象语法树对象中的多个可变数据类型对象替换为自定义类型对象,并添加赋值表达式类型对象和删除表达式类型对象,得到目标抽象语法树对象:将所述多个可变数据类型对象替换为所述自定义类型对象,构建采用键值对表示的数据结构,其中,所述键值对以所述自定义类型对象的名称属性为键,以被替换对象的信息为值;基于所述数据结构,在新创建的对象列表中添加所述赋值表达式类型对象和所述删除表达式类型对象,得到所述目标抽象语法树对象。
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任意一项所述的代码处理方法。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的代码处理方法。
CN202010047489.3A 2020-01-16 2020-01-16 代码处理方法及装置 Active CN111249736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010047489.3A CN111249736B (zh) 2020-01-16 2020-01-16 代码处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010047489.3A CN111249736B (zh) 2020-01-16 2020-01-16 代码处理方法及装置

Publications (2)

Publication Number Publication Date
CN111249736A CN111249736A (zh) 2020-06-09
CN111249736B true CN111249736B (zh) 2023-03-21

Family

ID=70952155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010047489.3A Active CN111249736B (zh) 2020-01-16 2020-01-16 代码处理方法及装置

Country Status (1)

Country Link
CN (1) CN111249736B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111857811B (zh) * 2020-07-29 2023-09-22 湖南泛联新安信息科技有限公司 一种资源流图的构建方法
CN112104709B (zh) * 2020-08-28 2022-06-07 腾讯科技(深圳)有限公司 智能合约的处理方法、装置、介质及电子设备
CN112346722B (zh) 2020-11-11 2022-04-19 苏州大学 一种实现编译型嵌入式Python的方法
CN112905153B (zh) * 2020-12-07 2023-10-27 中国科学院软件研究所 一种面向软件定义卫星的软件并行构建方法以及装置
CN114661341A (zh) * 2022-03-28 2022-06-24 北京白海科技有限公司 一种代码辅助信息的获取方法及装置
CN115185526B (zh) * 2022-05-27 2023-10-10 韩济澎 一种能够逆向推理的编程语言的编译系统及方法
CN114756183A (zh) * 2022-06-16 2022-07-15 深圳市信润富联数字科技有限公司 数据打印方法、装置、设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657140B (zh) * 2015-02-10 2018-01-09 广州华多网络科技有限公司 代码生成方法及装置
CN109992935B (zh) * 2019-03-15 2021-05-25 同盾控股有限公司 一种源代码保护方法及装置
CN110471666A (zh) * 2019-07-18 2019-11-19 五八有限公司 代码自动转换方法和装置、代码转换器及介质

Also Published As

Publication number Publication date
CN111249736A (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
CN111249736B (zh) 代码处理方法及装置
CN110162296B (zh) 应用程序编程接口文档的生成方法、装置及终端设备
CN110609693B (zh) 基于数据标准化的代码更新方法、装置及终端设备
CN109117209B (zh) 序列化和反序列化方法及装置
WO2021179809A1 (zh) 缓存和执行智能合约的方法和装置
CN109145235B (zh) 用于解析网页的方法、装置及电子设备
CN107330014B (zh) 一种数据表的创建方法与设备
CN109460220A (zh) 报文预定义代码生成方法、装置、电子设备和存储介质
CN116089663A (zh) 一种规则表达式匹配方法、装置及计算机可读存储介质
CN115934161A (zh) 一种代码变更的影响分析方法、装置以及设备
CN113849781A (zh) Go语言源代码混淆方法、系统、终端及存储介质
CN117520309A (zh) 一种跨数据库类型的数据迁移方法、装置
CN117149631A (zh) 一种参数校验方法、装置、设备及介质
CN113821211B (zh) 命令解析方法、装置、存储介质和计算机设备
CN107451050B (zh) 函数获取方法和装置、服务器
CN114662119A (zh) 一种智能合约漏洞检测方法及装置
CN110516122B (zh) 嵌套型数据的合并方法、装置及电子设备
CN109840080B (zh) 字符属性比较方法、装置、存储介质及电子设备
CN112883044A (zh) 用于数据库的数据处理方法、装置及计算机可读介质
CN115004169A (zh) 用户选取方法、装置、服务器及存储介质
CN113971028B (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
CN110334098A (zh) 一种基于脚本的数据库合并方法及系统
CN114090928B (zh) 嵌套html实体解码方法、装置、计算机设备和存储介质
CN116451795B (zh) 一种量子线路图处理方法、装置及电子设备和存储介质
CN116700840B (zh) 文件执行方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant