CN114254598A - 用于使机器学习自动化的设备和使机器学习自动化的方法 - Google Patents

用于使机器学习自动化的设备和使机器学习自动化的方法 Download PDF

Info

Publication number
CN114254598A
CN114254598A CN202111115245.5A CN202111115245A CN114254598A CN 114254598 A CN114254598 A CN 114254598A CN 202111115245 A CN202111115245 A CN 202111115245A CN 114254598 A CN114254598 A CN 114254598A
Authority
CN
China
Prior art keywords
representation
machine learning
elements
determining
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111115245.5A
Other languages
English (en)
Inventor
周柏帆
E·卡尔拉莫夫
T·皮钦斯基
Y·斯福塔朔娃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of CN114254598A publication Critical patent/CN114254598A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

一种设备(100)和计算机实现的方法,包括:提供具有参数的机器学习流水线(M)的表示;提供多个元素及其关系的多个元素的表示(O);提供多个元素的表示(O)中的第一元素;根据第一元素来确定多个元素的表示(O)中的第二元素,其中,第一元素和第二元素具有满足第一条件的关系,特别地,第二元素是根据在多个元素的表示(O)中编码的语义从多个元素的表示(O)中的第一元素在语义上可得的;以及根据第二元素来确定参数。

Description

用于使机器学习自动化的设备和使机器学习自动化的方法
技术领域
本发明涉及机器学习的自动化,尤其涉及流水线构造和流水线配置的自动化。
背景技术
机器学习流水线可以将原始数据变成结论和功能机器学习模型。
机器学习流水线的开发是复杂的过程,其需要对数据的深入理解以及对领域和要解决的问题的必要理解。这需要在信息处理和数据分析中特别是在机器学习中进行专门的训练。
发明内容
用于使机器学习自动化的设备和使机器学习自动化的计算机实现的方法提供了使得较不熟练的或未受训练的用户能够创建功能机器学习模型的工具。
该设备和方法可被应用在其中存在针对用于数据分析的机器学习流水线的开发的任何以下要求的任何情况下。
机器学习流水线构造应该是自动化的,以节省大量的开发工作和时间。机器学习流水线应当是可由非专家配置的。机器学习流水线应当针对多个不同的数据集可修改,以解决若干任务。机器学习流水线也应当针对未来的场景可修改。
计算机实现的方法包括:提供具有参数的机器学习流水线的表示;提供多个元素及其关系的表示;提供多个元素的表示中的第一元素;根据第一元素来确定多个元素的表示中的第二元素,其中,第一元素和第二元素具有满足第一条件的关系,特别地,第二元素是根据在多个元素的表示中编码的语义从多个元素的表示中的第一元素在语义上可得的;以及根据第二元素来确定参数。
有利地,该方法包括:根据第二元素来确定多个元素的表示中的第三元素,其中,第二元素和第三元素具有满足第二条件的关系,特别地,第三元素是从多个元素的表示中的第二元素在语义上可得的;以及如果满足第二条件,则根据第二元素和第三元素来确定参数,否则,不根据第二元素和第三元素来确定参数。这允许更复杂的处理,以提供用于对应依赖性的三维映射。
有利地,多个元素的表示包括本体或表示本体的图形。本体或图形以适合于自动处理的格式对关于机器学习的知识进行编码。
有利地,该方法包括:提供输入数据;以及提供输入数据的特征的注释,特别是输入数据中的变量名,其中,提供第一元素包括根据第一本体针对注释来确定多个元素的表示的元素,其表示多个元素的表示中的输入数据的特征,特别是输入数据的变量名,其中,提供第二元素包括根据第一本体针对第一元素来确定多个元素的表示的元素,其表示多个元素的表示中的特征名,特别是域中的变量名,并且其中,该方法还包括确定包括输入数据、第一元素和第二元素的第一数据集。这对于非专家用户来说是有用的界面。
有利地,确定第三元素包括特别是根据第二本体针对第二元素来确定多个元素的表示的元素,其表示满足第三条件的多个元素的表示中的特征群组。第二本体表示关于特征群组的专家知识,使其对于非专家用户是可用的。
有利地,该方法包括确定第四元素,其中,确定第四元素包括特别是根据第三本体针对第三元素来确定多个元素的表示的元素,其表示满足第三条件的处理算法,特别地,第四元素是从多个元素的表示中的第三元素在语义上可得的。这样,处理算法被自动选择。
在一个方面,该方法包括确定包括第一数据集、第二元素、第三元素和第四元素的第二数据集。
在一个方面,该方法包括通过利用由第四元素表示的处理算法来处理第二数据集而确定特征集;以及确定第五元素,其中,确定第五元素包括针对第三元素来确定多个元素的表示的元素,其表示满足第四条件的特征集,特别地,第五元素是从多个元素的表示中的第三元素在语义上可得的,并且第五元素是从多个元素的表示中的第四元素在语义上可得的,并且其中,该方法还包括确定包括特征集、第三元素和第五元素的第三数据集。
有利地,该方法包括确定第六元素,其中,确定第六元素包括针对第五元素来确定多个元素的表示的元素,其表示满足第五条件的机器学习建模算法,特别地,第六元素是从多个元素的表示中的第五元素在语义上可得的,并且其中,该方法还包括确定第四数据集,所述第四数据集包括从特征集中选择的特征、第五元素和第六元素。这样,可以自动确定机器学习算法或多个机器学习算法。
有利地,该方法包括查找用于处理数据的指令和/或根据第六元素针对第四数据集定义的数据。因此,自动创建机器学习模型。
有利地,提供机器学习流水线的表示包括从机器学习流水线的多个表示中选择机器学习流水线的表示。这允许使用由专家创建的模板。
有利地,提供机器学习流水线的表示包括检测对机器学习流水线的多个表示之一进行标识的用户输入;以及选择在用户输入中标识的机器学习流水线的表示。这使得非专家用户能够创建机器学习流水线和模型。
可以根据机器学习流水线的表示来确定机器学习模型。
该方法可以包括提供包括图像的原始数据;确定用于图像分类器模型的机器学习流水线的参数;根据参数来确定机器学习模型;利用原始数据的至少一个图像来训练机器学习模型。如此训练的机器学习模型是图像分类器模型或包括它。
该方法可以包括提供图像;利用机器学习模型对图像进行分类。
一种用于确定机器学习模型的设备适于执行该方法。
附图说明
从以下描述和附图中可获得进一步有利的实施例。在附图中:
图1示意性地描绘用于确定机器学习模型的设备;
图2示意性地描绘用于确定机器学习模型的方法中的步骤。
具体实施方式
图1描绘了用于确定机器学习模型102的设备100。
设备100包括用户界面层104、语义层106、数据和映射层108以及机器学习层110。设备100适于执行将在下面描述的计算机实现的方法。
用户界面层104向用户提供用于使用语义层106的语义组件并因此使用整个系统的界面。
用户界面层104包括第一功能112,其适于动态地可视化关于数据注释114和关于机器学习模型116的信息。
用户界面层104可以包括图形用户界面功能,其用于显示关于当前数据注释114和关于机器学习模型116的信息。
第一功能112适于从用户检索关于数据注释114和/或机器学习模型116的信息。
在示例中,机器学习流水线的表示可由用户通过从图形用户界面上显示的多个机器学习流水线118中选择它来选择。
关于机器学习模型116的信息包括可视化120。
可视化120包括特征群组122。在示例中,特征群组122包括用于第一特征群组122-1、第二特征群组122-2和第三特征群组122-3的图标。示例中的第一特征群组122-1是用于单个特征的群组。示例中的第二特征群组122-2是用于时间序列的群组。示例中的第三特征群组122-3是用于质量指标的群组。
可视化120包括处理算法124的图形表示。处理算法124的图形表示包括用于第一算法124-1的图标、用于第二算法124-2的图标、和图表124-3。示例中的第一算法124-1是用于第一特征群组122-1(例如用于单个特征的群组)的算法。示例中的第二算法124-2是用于第二群组122-2(例如,用于时间序列的群组)的算法。图表124-3在示例中显示了从笛卡尔坐标系的原点开始的电阻随时间的进程,其具有长度并具有峰值(最大值)以及从峰值到端值的下降。
可视化120包括机器学习算法126的图形表示。示例中的机器学习算法126的图形表示包括描绘机器学习算法126的方面的图标126-1。
关于当前数据注释114的信息包括特征群组128。在示例中,特征群组128包括用于第一特征群组128-1、第二特征群组128-2和第三特征群组128-3的图标。
关于当前数据注释114的信息包括域特征名130。在示例中,域特征名130包括用于第一域特征名130-1、第二域特征名130-2、第三域特征名130-3、第四域特征名130-4和第五域特征名130-5的图标。
在示例中,第一域特征名130-1表示数据的状态。在示例中,第二域特征名130-2表示数据的特性。在示例中,第三域特征名130-3表示数据的类型。在示例中,第四域特征名130-4表示数据的另一类型。在示例中,第五域特征名130-5表示数据的质量。
在示例中,第一域特征名130-1和第二域特征名130-2被映射到第一特征群组128-1。在示例中,第三域特征名130-3和第四域特征名130-4被映射到第二特征群组128-2。在示例中,第五域特征名130-5被映射到第三特征群组128-3。
关于当前数据注释114的信息包括原始特征名132。在示例中,原始特征名132包括用于第一原始特征名132-1、第二原始特征名132-2、第三原始特征名132-3、第四原始特征名132-4和第五原始特征名132-5的图标。
在示例中,第一原始特征名132-1表示数据的状态代码。在示例中,第二原始特征名132-2表示数据的特性。在示例中,第三原始特征名132-3表示数据的类型。在示例中,第四原始特征名132-4表示数据的另一类型。在示例中,第五原始特征名132-5表示数据的质量。
在示例中,第一原始特征名132-1被映射到第一域特征名130-1。在示例中,第二原始特征名132-2被映射到第二域特征名130-2。在示例中,第三原始特征名132-3被映射到第三域特征名130-3。在示例中,第四原始特征名132-4被映射到第四域特征名130-4。在示例中,第五原始特征名132-5被映射到第五域特征名130-5。
语义层106包括多个元素及其关系的表示O。更具体地,表示O包括第一本体134、第二本体136和第三本体138。
示例中的第一本体134是用形式表示对域知识进行编码的域本体,包括域的类别和属性以及它们的关系。
示例中的第二本体136是特征群组本体,其存储域本体术语与机器学习流水线的预先设计的目录中的特征群组之间的链接。
示例中的第三本体138是机器学习本体,其利用形式表示对机器学习知识进行编码,包括允许的和默认的特征群组、用于特征群组的合适的特征处理算法、对应的特征处理群组、用于每个特征处理群组及其关系的合适的机器学习建模算法。示例中的第三本体138对目录进行编码。目录以形式表示存储了由机器学习专家预先设计的一些成功的且相当通用的机器学习流水线。机器学习流水线是从特征群组到其用于特征群组的特征处理算法、到其对应的特征处理群组、以及其指定的用于特征处理群组的机器学习建模算法的预先设计的映射。
语义层106包括第二功能SR。在示例中,第二功能SR包括第一推理器(reasoner)140、第二推理器142和第三推理器144。第二功能SR也可以包括注释器146。
注释器146允许用户用来自第一本体134(在示例中为域本体)的术语来注释原始数据。
第一功能112可以适于从用户输入确定数据的注释A。第二功能SR可以适于接收注释A。第一功能112可以适于从用户输入确定机器学习流水线的表示M。第二功能SR可以适于接收机器学习流水线的表示M。
在示例中,注释器146适于处理注释A和来自第一本体134的元素,以确定第一数据集148,其包括来自原始数据库152的原始数据150、以及根据第一本体134的从原始数据150到域特征名的原始特征名的第一映射154。
在示例中,第一推理器140适于处理第一映射154,以根据第二本体136确定域特征名到特征群组的第二映射156。第一推理器140可以适于基于第二本体136和用户的配置来自动生成和用户配置第二映射156。
在示例中,第二推理器142适于处理第二映射156,以根据第二本体136和第三本体138确定特征群组到处理算法到特征处理群组的第三映射158。第二推理器142可以适于基于第二本体136、目录(例如基于第三本体138)、第二映射156和用户选择的机器学习流水线的表示M,自动生成第三映射158。
在示例中,第二推理器142适于根据第二映射156和第三映射158确定域名到特征群组到处理算法的第四映射160。
在示例中,第二推理器142适于根据第三映射158确定特征群组到特征处理群组的第五映射162。
在示例中,第三推理器144适于根据第三映射158确定特征处理群组到机器学习算法的第六映射164。第三推理器144可以适于基于目录(例如基于第三本体138)和用户选择的机器学习流水线的表示M,自动生成第六映射。
机器学习层110包括适于从原始数据库152确定原始数据150的第一数据整合器166。机器学习层110包括适于根据第一数据集148确定整合数据170的第二数据整合器168。存储在原始数据库152中的原始数据由第二数据整合168转换成适于机器学习的整合数据170。整合数据170被提供用于第二数据集172,其包括整合数据170和第四映射160。
机器学习层110包括第一处理器174,其适于根据第二数据集172确定用于第三数据集178的特征176。第三数据集178包括特征176和第五映射162。
机器学习层110包括第二处理器180,其适于根据第三数据集178确定用于第四数据集184的所选特征182。第四数据集184包括所选特征182和第六映射164。
机器学习层110包括第三处理器186,其适于根据第四数据集184确定机器学习模型102。
数据和映射层108包括原始数据库152、第一数据集148、第二数据集172、第三数据集178、第四数据集184和机器学习模型102。
在图1中,双线箭头指示数据的信息流,实箭头指示语义的信息流,并且虚线指示表示O中的元素类别的连接。
下面描述自动机器学习流水线构造和机器学习流水线配置的示例性方法。自动化方法使用了语义,其允许可配置机器学习流水线的自动化构造。
根据方法,用户仅需要用域本体术语来注释数据并从目录中选择预先设计的机器学习流水线。其他一切都是自动的。这是通过在预先设计的机器学习流水线的目录中利用语义技术对域知识和机器学习知识的形式表示进行编码来实现的。
在一个方面,机器学习流水线的表示M具有参数。表示O可以包括对域和机器学习知识进行编码的语义。语义包括表示域知识或机器学习知识的多个元素及其关系。
在一个方面,当提供注释A时,根据注释A确定表示O中的第一元素。然后可以根据第一元素确定表示O中的第二元素。在示例中,第二元素被确定成使得第一元素和第二元素具有满足第一条件的关系。第一条件可以是第二元素根据表示O中编码的语义从表示O中的第一元素在语义上可得的。当第一元素和第二元素满足第一条件时,根据第二元素来确定参数。否则,不根据第二元素来确定参数。
在另一方面,可以根据第二元素来确定表示O中的第三元素。在示例中,第二元素和第三元素具有满足第二条件的关系。第二条件可以是第三元素从表示O中的第二元素在语义上可得的。在这个方面,如果满足第二条件,则可以根据第二元素和第三元素来确定参数。否则,可以不根据第二元素和第三元素来确定参数。
例如,元素S1可以用在表示O中出现的特征群组来实例化第一参数P1。
例如,元素S2可以用从元素S1的特征群组在语义上可得的在表示O中出现的一个或多个处理算法来实例化第二参数P2。
例如,元素S3可以用从元素S2的一个或多个处理算法在语义上可得的在表示O中出现的一个或多个处理特征群组来实例化第三参数P3。
例如,元素S4可以用从元素S3的一个或多个处理特征群组在语义上可得的在表示O中出现的处理特征来实例化第四参数P4。
例如,元素S5可以用从元素S4的一个或多个处理特征在语义上可得的在表示O中出现的一个或多个机器学习算法来实例化第五参数P5。
由于本体不是图形,所以语义上可得性的概念可以变化并且取决于用例和应用。
在一个方面,语义上可得可以基于将前述本体中的一个或多个投影到图形结构上并计算图形可得性来确定。该图形结构还可以计及本体元素之间的路径的内聚性。其可以计及O的元素之间的显式和隐式关系。
下面参考图2描述该方法。作为示例,该方法用于具有参数P1、…、Pk的机器学习流水线。机器学习流水线可具有由表示O中的元素所表示的参数集。
该方法包括步骤200,其提供具有参数P1、…、Pk的机器学习流水线的表示M。
提供表示M可包括检测对机器学习流水线的多个表示118之一进行标识的用户输入,以及选择在用户输入中标识的机器学习流水线的表示M。
该方法包括步骤202,其提供表示O。表示O包括多个元素及其关系。
示例中的表示O包括第一本体134、第二本体136和第三本体138。可以类似地使用表示这些的图形。
该方法包括步骤204,其提供输入数据。
该方法包括步骤206,其提供输入数据的特征的注释A,特别是输入数据中的变量名。
该方法包括步骤208,其提供表示O的第一元素和第二元素。在示例中,提供第一元素包括针对注释A确定表示O的元素,其表示了表示O中的输入数据的特征。在示例中,确定了根据第一本体的输入数据的变量名。
在示例中,提供第二元素包括针对第一元素来确定表示O的元素,其表示了表示O中的特征名。在示例中,确定了根据第一本体的域中的变量名。
可以根据第一元素在表示O中确定第二元素,使得第一元素和第二元素具有满足第一条件的关系。在示例中,这意味着第二元素是根据表示O中编码的语义从表示O中的第一元素在语义上可得的。可以确定满足第一条件的多个第二元素。该方法被描述用于这些第二元素中的一个,并且同样适用于这些第二元素的任何数量。
该方法还包括步骤210,其确定包括输入数据150、第一元素和第二元素的第一数据集148。
该方法还包括步骤212,其确定表示O中的表示特征群组的第三元素。第一参数P1可根据第三元素来确定。
示例中的步骤212包括针对第二元素特别是根据第二本体136来确定表示O的元素,其表示了表示O中的满足第二条件的特征群组。该方法被描述用于这些第三元素中的一个,并且同样适用于这些第三元素的任何数量。
可以根据第二元素在表示O中确定第三元素,使得第三元素是从表示O中的第二元素在语义上可得的。
第三元素可以根据第二本体136来确定。
该方法还包括步骤214,其确定表示O中的第四元素。在示例中确定第四元素包括针对第三元素来确定表示O的元素,其表示满足第三条件的处理算法。可以根据第三元素在表示O中确定第四元素,使得第四元素是从第三元素在语义上可得的。第四元素表示由第三元素所表示的特征群组的处理算法。第二参数P2可根据第四元素来确定。该方法被描述用于这些第四元素中的一个,并且同样适用于这些第四元素的任何数量。
第四元素可以根据第三本体138来确定。
该方法还包括步骤216,其确定包括第二数据集、第二元素、第三元素和第四元素的第二数据集172。
该方法还包括步骤218,其通过用由第四元素表示的处理算法来处理第二数据集172而确定特征集176。
该方法还包括步骤220,其确定第五元素。在示例中确定第五元素包括针对第三元素来确定表示O的元素,其表示满足第四条件的特征集172。在示例中,第五元素被确定成使得第五元素是从表示O中的第三元素在语义上可得的,并且第五元素是从表示O中的第四元素在语义上可得的。在示例中,第五元素表示一个或多个处理特征群组。第三参数P3可根据第五元素来确定。第四参数P4可以用处理特征(即用特征集176)来实例化。
该方法还包括步骤222,其确定包括特征集176、第三元素和第五元素的第三数据集178。
该方法还包括步骤224,其确定第六元素。确定第六元素包括针对第五元素来确定表示O的元素,其表示满足第五条件的机器学习建模算法。在示例中,第六元素被确定成使得第六元素是从表示O中的第五元素在语义上可得的。第五参数P5可以根据由第六元素表示的一个或多个机器学习算法来确定。
该方法还包括步骤226,其确定第四数据集184,该第四数据集184包括从特征集176中选择的特征、第五元素和第六元素。
该方法还包括步骤228,其查找用于处理数据的指令和/或根据第六元素针对第四数据集184定义的数据。
这样,机器学习流水线将原始输入数据变成结论和功能机器学习模型。
机器学习流水线可被应用,例如以提供图像分类器模型。图像分类器模型可以用于基于在过程期间取得的图像的监视和过程控制。该过程可以是电阻焊接。图像可以描绘被焊接的部分和/或焊缝。
为了训练图像分类器模型的目的,可由用户注释来自过程或其模拟的训练图像。表示O可以包括将被用于图像分类的域特征名和用于处理或分类图像的特定处理算法。可以针对图像分类器模型自动地确定机器学习建模算法。机器学习建模算法可以根据机器学习流水线的表示M利用参数来执行,以从训练图像自动地形成经训练的机器学习模型。
为了训练,原始数据150包括图像。在训练中,确定了机器学习流水线M的至少一个参数,其是图像分类器模型的参数。用于图像分类器模型的参数可以是超参数或图像分类器模型中的人工神经网络的权重。机器学习模型根据参数来确定,并且利用原始数据150的至少一个图像来训练。
在训练之后,可以利用如此训练的机器学习模型对图像进行分类。

Claims (17)

1.一种计算机实现的方法,其特征在于,提供(200)具有参数的机器学习流水线(M)的表示;提供(202)多个元素及其关系的表示(O);提供(208)所述多个元素的所述表示(O)中的第一元素;根据所述第一元素来确定所述多个元素的所述表示(O)中的第二元素,其中,所述第一元素和所述第二元素具有满足第一条件的关系,特别地,所述第二元素是根据在所述表示(O)中编码的语义从所述多个元素的所述表示(O)中的所述第一元素在语义上可得的;以及根据所述第二元素来确定所述参数。
2.根据权利要求1所述的方法,其特征在于,根据所述第二元素来确定(212)所述多个元素的所述表示(O)中的第三元素,其中,所述第二元素和所述第三元素具有满足第二条件的关系,特别地,所述第三元素是从所述多个元素的所述表示(O)中的所述第二元素在语义上可得的;以及如果满足所述第二条件,则根据所述第二元素和所述第三元素来确定所述参数,否则,不根据所述第二元素和所述第三元素来确定所述参数。
3.根据权利要求1或2所述的方法,其特征在于,所述多个元素的所述表示(O)包括本体或表示本体的图形。
4.根据前述权利要求中任一项所述的方法,其特征在于,提供(204)输入数据;以及提供(206)所述输入数据的特征的注释(A),特别是所述输入数据中的变量名,其中,提供(208)所述第一元素包括根据第一本体针对所述注释(A)确定所述多个元素的所述表示(O)的元素,其表示所述多个元素的所述表示(O)中的所述输入数据的所述特征,特别是所述输入数据的变量名,其中,提供(208)所述第二元素包括根据所述第一本体针对所述第一元素来确定所述多个元素的所述表示(O)的元素,其表示所述多个元素的所述表示(O)中的特征名,特别是域中的变量名,并且其中,所述方法还包括确定(210)包括所述输入数据、所述第一元素和所述第二元素的第一数据集。
5.根据权利要求4所述的方法,其特征在于,确定(212)所述第三元素包括特别是根据第二本体针对所述第二元素来确定所述多个元素的所述表示(O)的元素,其表示满足所述第三条件的所述多个元素的所述表示(O)中的特征群组。
6.根据权利要求5所述的方法,其特征在于,确定(214)第四元素,其中,确定所述第四元素包括特别是根据第三本体针对所述第三元素来确定所述多个元素的所述表示(O)的元素,其表示满足第三条件的处理算法,特别地,所述第四元素是从所述多个元素的所述表示(O)中的所述第三元素在语义上可得的。
7.根据权利要求6所述的方法,其特征在于,确定(216)包括所述第一数据集、所述第二元素、所述第三元素和所述第四元素的第二数据集。
8.根据权利要求7所述的方法,其特征在于,通过利用由所述第四元素表示的所述处理算法来处理所述第二数据集而确定(218)特征集;以及确定(220)第五元素,其中,确定(220)所述第五元素包括针对所述第三元素来确定所述多个元素的所述表示(O)的元素,其表示满足第四条件的所述特征集,特别地,所述第五元素是从所述多个元素的所述表示(O)中的所述第三元素在语义上可得的,并且所述第五元素是从所述多个元素的所述表示(O)中的所述第四元素在语义上可得的,并且其中,所述方法还包括确定(222)包括所述特征集、所述第三元素和所述第五元素的第三数据集。
9.根据权利要求8所述的方法,其特征在于,确定(224)第六元素,其中,确定(224)所述第六元素包括针对所述第五元素来确定所述多个元素的所述表示(O)的元素,其表示满足第五条件的机器学习建模算法,特别地,所述第六元素是从所述多个元素的所述表示(O)中的所述第五元素在语义上可得的,并且其中,所述方法还包括确定(226)第四数据集,所述第四数据集包括从所述特征集中选择的特征、所述第五元素和所述第六元素。
10.根据权利要求9所述的方法,其特征在于,查找(228)用于处理数据的指令和/或根据所述第六元素针对所述第四数据集定义的数据。
11.根据前述权利要求中任一项所述的方法,其特征在于,提供(200)所述机器学习流水线的所述表示包括从机器学习流水线的多个表示中选择所述机器学习流水线的所述表示。
12.根据前述权利要求中任一项所述的方法,其特征在于,提供(200)所述机器学习流水线的所述表示包括检测对机器学习流水线的所述多个表示之一进行标识的用户输入;以及选择在所述用户输入中标识的所述机器学习流水线的所述表示。
13.根据前述权利要求中任一项所述的方法,其特征在于,根据所述机器学习流水线(M)的所述表示来确定(228)机器学习模型。
14.根据权利要求13所述的方法,其特征在于,提供包括图像的原始数据(150);确定用于图像分类器模型的所述机器学习流水线(M)的所述参数;根据所述参数来确定所述机器学习模型;利用所述原始数据(150)的至少一个图像来训练所述机器学习模型。
15.根据权利要求14所述的方法,其特征在于,提供图像;利用所述机器学习模型对所述图像进行分类。
16.一种用于确定机器学习模型(102)的设备(100),其特征在于,所述设备(100)适于执行根据前述权利要求中任一项所述的方法。
17.一种计算机程序,其特征在于,所述计算机程序包括计算机可读指令,所述计算机可读指令当在计算机上执行时,使所述计算机执行根据权利要求1至15中任一项所述的方法中的步骤。
CN202111115245.5A 2020-09-24 2021-09-23 用于使机器学习自动化的设备和使机器学习自动化的方法 Pending CN114254598A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102020211996.1 2020-09-24
DE102020211996.1A DE102020211996A1 (de) 2020-09-24 2020-09-24 Vorrichtung und Verfahren zum Automatisieren des maschinellen Lernens

Publications (1)

Publication Number Publication Date
CN114254598A true CN114254598A (zh) 2022-03-29

Family

ID=80473758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111115245.5A Pending CN114254598A (zh) 2020-09-24 2021-09-23 用于使机器学习自动化的设备和使机器学习自动化的方法

Country Status (2)

Country Link
CN (1) CN114254598A (zh)
DE (1) DE102020211996A1 (zh)

Also Published As

Publication number Publication date
DE102020211996A1 (de) 2022-03-24

Similar Documents

Publication Publication Date Title
Furian et al. A conceptual modeling framework for discrete event simulation using hierarchical control structures
US7188091B2 (en) Rule processing system
US8732107B2 (en) Method and system for capturing business rules for automated decision procession
US6965887B2 (en) Rule processing methods for automating a decision and assessing satisfiability of rule-based decision diagrams
Cellier Discrete event modeling and simulation technologies: a tapestry of systems and AI-based theories and methodologies
CA2649449A1 (en) Method, apparatus and computer-readabele medium to provide customized classification of documents in a file management system
CN115170048B (zh) 基于模型和规则的工作流实现方法、系统和介质
CN109543085A (zh) 数据提取方法、装置及计算机可读存储介质
CN114330738A (zh) 用于使机器学习自动化的设备和使机器学习自动化的方法
CN114462582A (zh) 基于卷积神经网络模型的数据处理方法及装置、设备
CN114254598A (zh) 用于使机器学习自动化的设备和使机器学习自动化的方法
JP7033913B2 (ja) 3dデータに対するデジタル仕上げマテリアルのための高度自動化アプリケーション
Yang et al. A situation-centric approach to identifying new user intentions using the mtl method
WO2016130048A1 (ru) Автоматизированное построение маршрута логического вывода в миварной базе знаний
US11741430B1 (en) Integrated priorities and activities alignment, coordination and visualization systems and methods
Houze et al. A hybrid artificial intelligence approach in well test interpretation
AU2003220382A1 (en) Rule processing system and method
Al-Fedaghi Modeling the realization and execution of functions and functional requirements
JP7131827B2 (ja) データ処理方法、データ処理システム、データ処理プログラム及びデータ構造
EP4312152A1 (en) Material selection for designing a manufacturing product
Bagheri et al. An exploratory classification of applications in the realm of collaborative modeling and design
US20200285678A1 (en) Method and system for machine-assisted cross-platform design synchronisation
Ellmauthaler et al. Stream packing for asynchronous multi-context systems using ASP
CN114594884A (zh) 图形化交易策略生成方法、装置、电子设备及存储介质
WO2024148441A1 (en) System and method for designing and generating class architectures of neural network using a graphical programming language

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination