CN110795089A - 一种代码生成方法、装置、设备和存储介质 - Google Patents

一种代码生成方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN110795089A
CN110795089A CN201911037981.6A CN201911037981A CN110795089A CN 110795089 A CN110795089 A CN 110795089A CN 201911037981 A CN201911037981 A CN 201911037981A CN 110795089 A CN110795089 A CN 110795089A
Authority
CN
China
Prior art keywords
code
parameters
training
parameter
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911037981.6A
Other languages
English (en)
Inventor
谢立东
沈丽忠
李婉华
郑健
陈铭新
李晓敦
赵世辉
唐景峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN201911037981.6A priority Critical patent/CN110795089A/zh
Publication of CN110795089A publication Critical patent/CN110795089A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/35Creation or generation of source code model driven
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/76Adapting program code to run in a different environment; Porting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种代码生成方法、装置、设备和存储介质。其中,该方法包括:获取初始模型文件中各训练参数;根据各所述训练参数及预先配置代码模板生成代码段;确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码。本发明实施例的技术方案,通过自动解析初始模型文件生成目标训练代码,实现了机器学习模型训练代码的快速生成,提高了机器学习模型训练代码的灵活性。

Description

一种代码生成方法、装置、设备和存储介质
技术领域
本发明实施例涉及计算机应用技术领域,尤其涉及一种代码生成方法、装置、设备和存储介质。
背景技术
机器学习产品中常遇到跨平台的问题,例如使用Python语言的训练了一个机器学习模型,跨平台部署到其他生成环境时,为了使用机器学习模型需要修改生产环境,显然通过修改生产环境而使用机器学习模型的得不偿失,为此人们约定了预测模型标记语言(Predictive Model Markup Language,PMML)实现跨平台的机器学习模型部署。
然而,机器学习模型与训练数据是强相关的,不同的数据会训练出不同的模型,使用PMML语言将机器学习模型部署到其他平台时,如果数据发生变化和调整,机器学习模型生产的预测结果不准确,需要对机器学习模型进行微调以适应数据的变化,然而PMML语言仅描述由机器学习模型,无法获取到机器学习模型的训练代码,只能在原平台对机器学习模型进行重新训练,灵活程度较差。
发明内容
本发明提供一种代码生成方法、装置、设备和存储介质,以实现跨平台下机器学习模型训练代码的灵活生成,可增强机器学习模块预测结果的准确性。
第一方面,本发明实施例提供了一种代码生成方法,该方法包括:
获取初始模型文件中各训练参数;
根据各所述训练参数及预先配置代码模板生成代码段;
确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码。
第二方面,本发明实施例还提供了一种代码生成装置,其特征在于,该装置包括:
文件分析模块,用于获取初始模型文件中各训练参数;
代码段模块,用于根据各所述训练参数及预先配置代码模板生成代码段;
代码生成模块,用于确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的代码生成方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的代码生成方法。
本发明实施例的技术方案,通过获取初始模型代码文件中的训练参数,根据训练参数及预先配置的代码模板生成代码段,根据代码段之间的关联参数连接代码段生成目标训练代码,实现了模型训练代码的快速生成,提高了机器学习模型训练代码的灵活性,可适应训练数据集的变化,可提高机器学习模型预存的准确性。
附图说明
图1是本发明实施例一提供的一种代码生成方法的步骤流程图;
图2是本发明实施例二提供的一种代码生成方法的步骤流程图;
图3是本发明实施例三提供的一种代码生成装置的结构示意图;
图4是本发明实施例四提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构,此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
图1是本发明实施例一提供的一种代码生成方法的步骤流程图,本实施例可适用于根据机器学习模型逆生成训练代码的情况,该方法可以由代码生成装置来执行,该装置可以采用硬件和/或软件的方式来实现,参见图1,本发明实施例的方法具体包括如下步骤:
步骤101、获取初始模型文件中各训练参数。
其中,初始模型文件可以是存储有机器学习模型的文件,具体可以是语言模型标记语言(Predictive Model Markup Language,PMML)文件,可以是由统一的XML格式描述生成的机器学习模型,初始模型文件中可以对机器学习模型的数据字典、挖掘架构、数据转换、模型定义、输出、目标、模型解释和模型验证等进行了描述和定义,初始模型文件可以用于数据预测;训练参数可以是在初始模型文件中定义的用于描述机器学习模型的参数,例如,训练过程使用的训练模型等,训练参数可以反应训练机器学习模型所需要的参数信息。
具体的,可以对初始模型文件进行分析,获取到初始模型文件中的训练参数,示例性的,可以根据初始模型文件中的标签对初始模型文件进行分析,获取到各标签内的参数,可以将获取到的参数作为训练参数,一个PMML文件中部分内容如下所示:
Figure BDA0002252071210000041
可以分析初始模型代码文件中的DataField name标签和Value标签,可以获取到标签中的内容,标签列y和输入特征列x1、x2、x3和x4,并且标签列的值为(0、1、2),可以将获取到标签列y、输入特征列x1、x2、x3和x4以及标签列值为(0、1、2)作为训练参数。
步骤102、根据各所述训练参数及预先配置代码模板生成代码段。
其中,代码模板可以是在各平台处预先存储的代码模板,可以用于进行机器学习模型的训练,代码模板可以与各平台的语言相同,例如平台为R语言平台,相应的,可以存储有R语言的代码模板,代码模板可以按照功能进行划分,不同的功能可以对应不同的代码模板,例如,数据挖掘可以对应代码模板A、数据转换可以对应代码模板B;代码段可以是根据训练参数及代码模板生成的代码,代码段可以具体为机器学习模型训练代码实现不同功能的代码。
在本发明实施例中,可以根据训练参数的类型获取到对应的代码模板,可以将训练参数填充到代码模板中生成代码段,例如,训练参数为标签列和特征列,可以获取到训练模型的代码模板,将标签列和特征列的数量填充到代码模板的对应位置中,填充训练参数后的代码模板可以作为代码段,不同的训练参数可以对应相同的代码段。
步骤103、确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码。
其中,关联参数可以是连接各代码段的中间参数,可以用于将代码段连接为目标训练代码,例如,代码段A输出参数α,代码段B输入参数α,参数α可以是代码段A和代码段B的关联参数,代码段A输出的输出参数可以作为代码段B输入的输入参数。目标训练代码可以是根据初始模型文件生成的机器学习模型训练代码,目标训练代码经过运行后可以训练生成初始模型文件中的机器学习模型,目标训练代码的编码语言可以为多种,如,python、scikit-learn、R、SparkML、XGBoost、LightGBM或Tensorflow等。
具体的,可以通过对初始模型文件进行分析获取到各代码段之间的关系,从而确定出代码段之间作为连接作为的关联参数,获取到待码段之间的关联参数,并基于关联参数将代码段进行连接,使得代码段组成目标训练代码,可以理解的是,代码段可以具体为机器学习模型训练代码实现不同功能的代码,将各代码段连接后可以完成机器学习模型的完整训练过程。
本发明实施例的技术方案,通过分析初始模型文件获取到训练参数,根据训练参数及代码模板生成代码段,根据代码段之间的关联参数将代码段连接成目标训练代码,实现了根据机器学习模型文件逆向获取到模型训练代码,提高了跨语言平台下的训练代码生成,以代码段为代码模板,降低了代码冗余,减少了代码模板的存储空间,各代码模板根据需要自由搭配,可提高机器学习模型训练代码生成的灵活性。
实施例二
图2是本发明实施例二提供的一种代码生成方法的步骤流程图,本发明实施例是以上述实施例为基础进行的具体化,参见图2,本发明实施例的提供的代码生成方法包括:
步骤201、获取初始模型文件中的文本标签。
其中,文本标签可以是初始模型文件中描述机器学习模型的标签,文本标签可以包括标签名和标签内容。
具体的,初始模型文件具体可以为PMML标记语言文件,初始模型文件中包括多种文本标签,例如,<DataDictionary>、<MiningSchema>和<LocalTransformations>等,不同的文本标签可以描述不同的机器学习模型内容,可以对初始模型文件中的文本标签进行正则匹配,在初始模型文件中配到内容时,可以认为获取到对应的文本标签。
步骤202、若文本标签为预设标签,则获取初始模型文件中文本标签对应的训练参数;其中,所述训练参数包括训练输入参数、训练输出参数、训练模型参数、数据转换参数和/或数据挖掘参数。
其中,预设标签可以是用于获取训练参数的匹配标签,可以用于对初始模型文件中的文本标签进行匹配,预设标签可以根据需要预先存储,通过对PMML标准进行分析,发现PMML标记语言文件中可以包括数据词典、挖掘架构、数据转换、模型定义、输出、目标、模型解释和模型验证等几类文本标签,而其中与训练机器学习模型相关的文本标签可以包括数据字典、挖掘架构、数据转换、模型定义和模型解释等几类标签,可以将与机器学习模型训练相关的数据字典、挖掘架构、数据转换、模型定义和模型解释等文本标签预设为预设标签。
具体的,可以将获取到的文本标签与预设标签进行对比,如果文本标签为预设标签中的标签,可以确定该文本标签与机器学习模型训练相关,可以获取初始模型文件中该文本标签对应的训练参数,例如,当文本标签与预设标签匹配时,可以获取初始模型文件中该文本标签中的标签内容,可以将获取到的标签内容作为训练参数,训练参数可以按照文本标签的不同划分为训练输入参数、训练输出参数、训练模型参数、数据转换参数和数据挖掘参数等,训练参数可以用于填充到代码模板中以生成训练机器学习模型的代码。
可选的,预设标签包括数据字典标签、挖掘架构标签、数据转换标签、模型定义标签和/或模型解释标签。
在本发明实施例中,预先标签可以根据训练参数对应的文本标签不同划分为数据字典标签、挖掘架构标签、数据转换标签、模型定义标签和模型解释标签,预设标签可以预先存储,可以为数据字典标签、挖掘架构标签、数据转换标签、模型定义标签和模型解释标签中的一种或者多种。数据字典标签对应的训练参数,可以识别和定义那些输入数据字段对于解决眼前问题是最有用的,包含数值、序列和类别字段等,挖掘架构标签对应的训练参数,可以为处理缺失值和离群点的策略,数据转换标签对应的训练参数,可以是将原始输入数据预处理后到衍生字段所需的计算。衍生字段对输入数据进行合并或者修改,以求得更有价值的字段。模型定义标签对应的训练参数可以是定义了模型的结构和参数,如关联规则模型、贝叶斯网络模型、聚类模型、基线模型、高斯处理模型、朴素贝叶斯模型、最近邻模型、神经网络模型、回归模型、规则集模型、序列模型、评分卡模型、支持向量机模型、文本模型、时间序列模型和树模型等。模型解释标签对应的训练参数可以是定义了将测试数据传递模型进行预测时计算得到的模型度量标准,例如可以包含混淆矩阵、变动率纸币(PriceRate of Change,ROC)和准确率等。
步骤203、根据训练参数获取预先配置的代码模板。
其中,代码模板可以用于生成训练机器学习模型的代码,代码模板可以按照训练机器学习模型的功能划分,不同功能可以对应不同的代码模板,例如,代码模板A用于数据挖掘,代码模板B用于数据转换,代码模板的编码语言可以对应运行机器学习模型平台的编码语言。
在本发明实施例中,可以获取训练参数获取到对应的代码模板,若训练参数为数据挖掘参数,可以获取到具有数据挖掘功能的代码模板,若训练参数为数据转换参数,可以获取到具有数据转换功能的代码模板,可以理解的是,代码模板可以预先存储在机器学习模型运行平台中。示例性的,训练参数为logit,可以获取逻辑回归的训练模型,在PMML中训练模型可以包括关联规则模型、贝叶斯网络模型、聚类模型、基线模型、高斯处理模型、朴素贝叶斯模型、最近邻模型、神经网络模型、回归模型、规则集模型、序列模型、评分卡模型、支持向量机模型、文本模型、时间序列模型和树模型等,可以根据不同的训练参数内容获取到不同的训练模型的代码模板。
步骤204、将训练参数填充到代码模板的对应待填充位置以生成代码段。
其中,待填充位置可以是代码模板中预留的用于填充训练参数的位置。
具体的,可以获取代码模板的待填充位置,可以将训练参数根据训练参数的类型填充到待填充位置,可以待填充位置已被训练参数填充的代码模板作为代码段。
步骤205、将训练参数在初始模型文件中的出现顺序确定为各代码段的连接顺序关系。
其中,出现顺序可以是训练参数的在初始模型文件中的先后顺序,初始模型文件中机器学习模型的描述的训练参数可以按照机器学习模型训练的先后顺序出现,在初始模型文件中先出现的训练参数,在机器学习模型训练时需要先用到,训练参数对应的代码段可以先于其他代码段在训练机器学习模型的代码中出现。
具体的,可以按照从初始模型文件头部到尾部的顺序确定训练参数在初始模型文件的出现顺序,可以根据出现顺序将训练参数作为对应的代码段的连接顺序关系,例如,训练参数中数据词典参数先于挖掘架构参数出现,相应的,在训练机器学习模型的代码中用于数据分析的数据字典对应的代码段可以先于数据挖掘的挖掘架构的代码段出现。
步骤206、根据各代码段的传入参数、传出参数和连接顺序关系生成关联参数。
其中,传入参数可以是代码段为实现对应机器学习模型训练功能需要的输入数据,传出参数可以是代码段为实现对应机器学习模型训练功能需要的输出数据。
具体的,可以对代码段进行分析获取到传入参数和传出参数,代码段的传入参数和传出参数可以为多个,根据代码段之间的连接顺序关系,若前一个代码段的传出参数与后一个代码段的传入参数相同,可以将该参数作为连接前一代码段和后一代码段的关联参数。
步骤207、通过关联参数连接各所述代码段生成目标训练代码。
具体的,在确定代码段之间的关联参数后,可以生成关联参数在代码段之间进行数据传递,可以将存在关联参数的各代码段作为目标训练代码。
步骤208、根据用户的调整参数对目标训练代码进行调整。
其中,调整参数可以是对目标训练代码进行调整的参数,调整参数可以根据机器学习模型的数据集的变化生成。
在本发明实施例中,当用于机器学习模型训练的数据集发生变化时,可以生成调整参数对目标训练代码进行调整,例如,调整参数可以包括调整标签列的数量和增加特征列的维度等,通过对目标训练代码的调整,增强了对数据集的适应性,通过目标训练代码生成的机器学习模型预测更准确。
本发明实施例的技术方案,通过获取初始模型文件中的文本标签,若文本标签为预设标签,则获取初始模型文件中对应的训练参数,根据训练参数获取代码模板,将训练参数填充后的代码模板作为代码段,确定代码段之间的关联参数,由关联参数将代码段连接以生成目标训练代码,根据用户的调整参数调整目标训练代码,实现了根据机器学习模型文件逆向获取到模型训练代码,提高了跨语言平台下的训练代码生成,对训练代码进行调整,便于机器学习模型的重新训练,可提高预测的准确性。
进一步的,在上述发明实施例的基础上,根据各代码段的传入参数、传出参数和连接顺序关系生成关联参数,包括:根据连接顺序关系获取代码段中与第一代码段连接的第二代码段,其中,第一代码段位于连接顺序关系的开始位置;若第一代码段的第一传出参数与第二代码段的第二传入参数相同,则将第一传出参数确定为关联参数;将第二代码段确定为新的第一代码段,返回根据连接顺序关系获取代码段中第一代码段连接的第二代码段。
在本发明实施例中,可以按照连接顺序关系获取代码段,将获取到前一个代码段作为第一代码段,可以将该代码段后面的代码段作为第二代码段,若第一代码段的传出参数与第二代码段的传入参数相同,可以将第一代码段的传出参数作为第一代码段与第二代码段的关联参数,可以按照上述步骤根据连接顺序关系确定出各代码段间的关联参数。
实施例三
图3是本发明实施例三提供的一种代码生成装置的结构示意图,本发明实施例提供的代码生成装置可执行本发明任意实施例所提供的代码生成方法,具备执行方法相应的功能模块和有益效果。该装置可以由软件和/或硬件实现,具体包括:文件分析模块301、代码段模块302和代码生成模块303。
其中,文件分析模块301,用于获取初始模型文件中各训练参数。
代码段模块302,用于根据各所述训练参数及预先配置代码模板生成代码段。
代码生成模块303,用于确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码。
本发明实施例的技术方案,通过文件分析模块获取初始模型代码文件中的训练参数,代码段模块根据训练参数及预先配置的代码模板生成代码段,代码生成模块根据代码段之间的关联参数连接代码段生成目标训练代码,实现了模型训练代码的快速生成,提高了机器学习模型训练代码的灵活性,可适应训练数据集的变化,可提高机器学习模型预存的准确性。
进一步的,在上述发明实施例的基础上,文件分析模块包括:
标签获取单元,用于获取初始模型文件中的文本标签。
参数获取单元,用于若文本标签为预设标签,则获取初始模型文件中文本标签对应的训练参数;其中,所述训练参数包括训练输入参数、训练输出参数、训练模型参数、数据转换参数和/或数据挖掘参数。
进一步的,在上述发明实施例的基础上,参数获取单元中的预设标签包括数据字典标签、挖掘架构标签、数据转换标签、模型定义标签和/或模型解释标签。
进一步的,在上述发明实施例的基础上,代码段模块包括:
模板获取单元,用于根据训练参数获取预先配置的代码模板。
模板填充单元,用于将训练参数填充到代码模板的对应待填充位置以生成代码段。
进一步的,在上述发明实施例的基础上,代码生成模块包括:
顺序确定单元,用于将训练参数在初始模型文件中的出现顺序确定为各代码段的连接顺序关系。
关联参数生成单元,用于根据各代码段的传入参数、传出参数和连接顺序关系生成关联参数。
代码段连接单元,用于通过关联参数连接各所述代码段生成目标训练代码。
进一步的,在上述发明实施例的基础上,关联参数生成单元具体用于:根据连接顺序关系获取代码段中与第一代码段连接的第二代码段,其中,第一代码段位于连接顺序关系的开始位置;若第一代码段的第一传出参数与第二代码段的第二传入参数相同,则将第一传出参数确定为关联参数;将第二代码段确定为新的第一代码段,返回根据连接顺序关系获取代码段中第一代码段连接的第二代码段。
进一步的,在上述发明实施例的基础上,还包括:
代码调整模块,用于根据用户的调整参数对目标训练代码进行调整。
实施例四
图4是本发明实施例四提供的一种设备的结构示意图,如图4所示,该设备包括处理器40、存储器41、输入装置42和输出装置43;设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种代码生成方法对应的程序模块(例如,一种代码生成装置中的文件分析模块301、代码段模块302和代码生成模块303)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的一种代码生成方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
实施例五
本发明实施例D还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种代码生成方法,该方法包括:
获取初始模型文件中各训练参数;
根据各所述训练参数及预先配置代码模板生成代码段;
确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的一种代码生成方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述代码生成装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种代码生成方法,其特征在于,包括:
获取初始模型文件中各训练参数;
根据各所述训练参数及预先配置代码模板生成代码段;
确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码。
2.根据权利要求1所述的方法,其特征在于,所述获取初始模型文件中各训练参数,包括:
获取初始模型文件中的文本标签;
若文本标签为预设标签,则获取初始模型文件中文本标签对应的训练参数;
其中,所述训练参数包括训练输入参数、训练输出参数、训练模型参数、数据转换参数和/或数据挖掘参数。
3.根据权利要求2所述的方法,其特征在于,所述预设标签包括数据字典标签、挖掘架构标签、数据转换标签、模型定义标签和/或模型解释标签。
4.根据权利要求1所述的方法,其特征在于,所述根据各所述训练参数及预先配置代码模板生成代码段,包括:
根据训练参数获取预先配置的代码模板;
将训练参数填充到代码模板的对应待填充位置以生成代码段。
5.根据权利要求1所述的方法,其特征在于,所述确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码,包括:
将训练参数在初始模型文件中的出现顺序确定为各代码段的连接顺序关系;
根据各代码段的传入参数、传出参数和连接顺序关系生成关联参数;
通过关联参数连接各所述代码段生成目标训练代码。
6.根据权利要求5所述的方法,其特征在于,所述根据各代码段的传入参数、传出参数和连接顺序关系生成关联参数,包括:
根据连接顺序关系获取代码段中与第一代码段连接的第二代码段,其中,第一代码段位于连接顺序关系的开始位置;
若第一代码段的第一传出参数与第二代码段的第二传入参数相同,则将第一传出参数确定为关联参数;
将第二代码段确定为新的第一代码段,返回根据连接顺序关系获取代码段中第一代码段连接的第二代码段。
7.根据权利要求1所述的方法,其特征在于,还包括:
根据用户的调整参数对目标训练代码进行调整。
8.一种代码生成装置,其特征在于,包括:
文件分析模块,用于获取初始模型文件中各训练参数;
代码段模块,用于根据各所述训练参数及预先配置代码模板生成代码段;
代码生成模块,用于确定各代码段之间的关联参数,并基于所述关联参数连接各代码段以生成目标训练代码。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的代码生成方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的代码生成方法。
CN201911037981.6A 2019-10-29 2019-10-29 一种代码生成方法、装置、设备和存储介质 Pending CN110795089A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911037981.6A CN110795089A (zh) 2019-10-29 2019-10-29 一种代码生成方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911037981.6A CN110795089A (zh) 2019-10-29 2019-10-29 一种代码生成方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN110795089A true CN110795089A (zh) 2020-02-14

Family

ID=69441797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911037981.6A Pending CN110795089A (zh) 2019-10-29 2019-10-29 一种代码生成方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN110795089A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651191A (zh) * 2020-05-12 2020-09-11 北京仁科互动网络技术有限公司 应用于微服务构架的单应用打包方法及系统
CN111694574A (zh) * 2020-06-12 2020-09-22 北京百度网讯科技有限公司 指令代码处理的方法、装置、设备以及存储介质
CN111858348A (zh) * 2020-07-23 2020-10-30 深圳慕智科技有限公司 一种基于神经网络输出向量的测试数据度量方法
CN112579149A (zh) * 2020-12-24 2021-03-30 第四范式(北京)技术有限公司 模型训练程序镜像的生成方法、装置、设备及存储介质
CN112686300A (zh) * 2020-12-29 2021-04-20 杭州海康威视数字技术股份有限公司 一种数据处理方法、装置及设备
CN114153447A (zh) * 2021-11-22 2022-03-08 厦门深度赋智科技有限公司 一种自动化生成ai训练代码的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150100542A1 (en) * 2013-10-03 2015-04-09 International Business Machines Corporation Automatic generation of an extract, transform, load (etl) job
CN106201643A (zh) * 2016-07-14 2016-12-07 北京邮电大学 数据解析方法及装置
CN108762764A (zh) * 2018-06-05 2018-11-06 中国平安人寿保险股份有限公司 代码自动生成方法、装置、计算机设备及存储介质
CN109871229A (zh) * 2019-01-16 2019-06-11 平安普惠企业管理有限公司 代码文本的管理方法、装置、存储介质及终端设备
CN110083351A (zh) * 2019-04-22 2019-08-02 北京百度网讯科技有限公司 用于生成代码的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150100542A1 (en) * 2013-10-03 2015-04-09 International Business Machines Corporation Automatic generation of an extract, transform, load (etl) job
CN106201643A (zh) * 2016-07-14 2016-12-07 北京邮电大学 数据解析方法及装置
CN108762764A (zh) * 2018-06-05 2018-11-06 中国平安人寿保险股份有限公司 代码自动生成方法、装置、计算机设备及存储介质
CN109871229A (zh) * 2019-01-16 2019-06-11 平安普惠企业管理有限公司 代码文本的管理方法、装置、存储介质及终端设备
CN110083351A (zh) * 2019-04-22 2019-08-02 北京百度网讯科技有限公司 用于生成代码的方法和装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651191A (zh) * 2020-05-12 2020-09-11 北京仁科互动网络技术有限公司 应用于微服务构架的单应用打包方法及系统
CN111651191B (zh) * 2020-05-12 2023-03-17 北京仁科互动网络技术有限公司 应用于微服务构架的单应用打包方法及系统
CN111694574A (zh) * 2020-06-12 2020-09-22 北京百度网讯科技有限公司 指令代码处理的方法、装置、设备以及存储介质
CN111694574B (zh) * 2020-06-12 2023-11-14 北京百度网讯科技有限公司 指令代码处理的方法、装置、设备以及存储介质
CN111858348A (zh) * 2020-07-23 2020-10-30 深圳慕智科技有限公司 一种基于神经网络输出向量的测试数据度量方法
CN112579149A (zh) * 2020-12-24 2021-03-30 第四范式(北京)技术有限公司 模型训练程序镜像的生成方法、装置、设备及存储介质
CN112579149B (zh) * 2020-12-24 2024-01-30 第四范式(北京)技术有限公司 模型训练程序镜像的生成方法、装置、设备及存储介质
CN112686300A (zh) * 2020-12-29 2021-04-20 杭州海康威视数字技术股份有限公司 一种数据处理方法、装置及设备
CN112686300B (zh) * 2020-12-29 2023-09-26 杭州海康威视数字技术股份有限公司 一种数据处理方法、装置及设备
CN114153447A (zh) * 2021-11-22 2022-03-08 厦门深度赋智科技有限公司 一种自动化生成ai训练代码的方法
CN114153447B (zh) * 2021-11-22 2024-04-30 厦门深度赋智科技有限公司 一种自动化生成ai训练代码的方法

Similar Documents

Publication Publication Date Title
CN110795089A (zh) 一种代码生成方法、装置、设备和存储介质
CN110457431B (zh) 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN111985213B (zh) 一种语音客服文本纠错的方法和装置
CN110334179B (zh) 问答处理方法、装置、计算机设备和存储介质
KR101801153B1 (ko) 기계학습 기반의 문자 인식 시스템
KR20170090345A (ko) 디지털 이미지의 시맨틱 태그의 획득 방법 및 장치
CN104679826B (zh) 基于分类模型的上下文识别的方法和系统
KR101851675B1 (ko) 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템
CN111198939B (zh) 语句相似度的分析方法、装置及计算机设备
US11537787B2 (en) Template-based redesign of a document based on document content
CN116543404A (zh) 基于单元格坐标优化的表格语义信息抽取方法、系统、设备及介质
CN112287095A (zh) 确定问题答案的方法、装置、计算机设备及存储介质
CN111461301A (zh) 序列化数据处理方法和装置、文本处理方法和装置
CN112860919A (zh) 基于生成模型的数据标注方法、装置、设备及存储介质
CN114021570A (zh) 实体消歧方法、装置、设备及存储介质
CN115587583A (zh) 噪声的检测方法、装置及电子设备
CN109063155B (zh) 语言模型参数确定方法、装置和计算机设备
CN110717333A (zh) 文章摘要自动生成方法、装置及计算机可读存储介质
CN110413749B (zh) 确定标准问题的方法及装置
CN112395880A (zh) 结构化三元组的纠错方法、装置、计算机设备及存储介质
CN111814496A (zh) 文本处理方法、装置、设备及存储介质
US20210383057A1 (en) Selection device and selection method
CN114822726A (zh) 构建方法、分析方法、装置、存储介质和计算机设备
CN110427330B (zh) 一种代码分析的方法以及相关装置
CN111694945A (zh) 基于神经网络的法条关联推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220922

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.