CN114330738A - 用于使机器学习自动化的设备和使机器学习自动化的方法 - Google Patents
用于使机器学习自动化的设备和使机器学习自动化的方法 Download PDFInfo
- Publication number
- CN114330738A CN114330738A CN202111183034.5A CN202111183034A CN114330738A CN 114330738 A CN114330738 A CN 114330738A CN 202111183034 A CN202111183034 A CN 202111183034A CN 114330738 A CN114330738 A CN 114330738A
- Authority
- CN
- China
- Prior art keywords
- machine learning
- determining
- elements
- representation
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 164
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000006870 function Effects 0.000 claims description 38
- 230000004044 response Effects 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims 1
- 230000003993 interaction Effects 0.000 description 60
- 238000012545 processing Methods 0.000 description 36
- 238000004422 calculation algorithm Methods 0.000 description 35
- 238000013507 mapping Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 7
- 238000012800 visualization Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 241001468265 Candidatus Phytoplasma Species 0.000 description 1
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003466 welding Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种设备和计算机实现的方法,包括:在元素之间的关系的表示(O)中确定表示机器学习流水线(M)的第一特性的元素;在所述表示(O)中根据表示所述第一特性的元素来确定表示所述机器学习流水线(M)的第二特性的元素;输出针对表示所述第二特性的元素的输出;检测输入,特别是用户的输入;如果所述输入满足要求则根据表示所述第二特性的元素来确定所述机器学习流水线(M)的参数,或者,否则,不根据表示所述第二特性的元素来确定所述机器学习流水线(M)的所述参数。
Description
技术领域
本发明涉及机器学习的自动化,尤其涉及流水线构造和流水线配置的自动化。
背景技术
机器学习流水线可以将原始数据变成结论和功能机器学习模型。
机器学习流水线的开发是复杂的过程,其需要对数据的深入理解以及对领域和要解决的问题的必要理解。这需要在信息处理和数据分析中特别是在机器学习中进行专门的训练。
发明内容
用于使机器学习自动化的设备和使机器学习自动化的计算机实现的方法提供了一种由语义技术支持的半自动化的机器学习开发的白盒方式,其允许甚至由非机器学习专家进行的机器学习流水线的方便的场景适应性构造和配置。
该设备和方法实现了可解释、可扩展和可配置的机器学习流水线开发,其也可以由具有最少机器学习训练的非机器学习专家来使用。这是通过在机器学习流水线中利用语义技术对域知识和机器学习知识的形式表示进行编码来实现的。
可以针对多个不同的数据集来开发机器学习流水线以解决具有相似性的若干任务。机器学习流水线对于未来场景是可高效维护和可扩展的。
该计算机实现的方法包括:在元素之间的关系的表示中确定表示机器学习流水线的第一特性的元素;在所述表示中根据表示所述第一特性的元素来确定表示所述机器学习流水线的第二特性的元素;输出针对表示所述第二特性的元素的输出;检测输入,特别是用户的输入;如果所述输入满足要求则根据表示所述第二特性的元素来确定所述机器学习流水线的参数,或者,否则,不根据表示所述第二特性的元素来确定所述机器学习流水线的所述参数。
所述参数配置了所述机器学习流水线。表示所述第二特性的元素使所述机器学习流水线对于非机器学习专家用户可解释。非机器学习专家用户可以经由所述输入来配置所述机器学习流水线。不需要关于表示所述机器学习流水线的所述第一特性的元素的知识。
在一个方面中,该方法包括了确定表示所述第一特性的元素和表示所述第二特性的元素是否具有满足条件的关系,特别地,所述条件是表示所述第二特性的元素是根据所述表示中编码的语义从所述表示中的表示所述第一特性的元素在语义上可得的。
输出所述输出包括提示用户做出响应,特别是喜欢或不喜欢第二元素或者选择表示所述第二特性的元素。
该方法优选地包括了利用用于评估语义可得性的功能来确定所述关系;检测所述响应;并且根据所述响应来修改所述功能的至少一个参数。这样,基于所述输入来更新可得性功能。
该方法可以包括根据所述响应来确定两个元素之间的链接;表示所述关系的语义可得图通过将与所述两个元素和它们之间的所述链接相对应的机器学习模板存储在所述语义可得图中来构造。
该方法可以包括确定从表示所述第一特性的元素在所述表示中在语义上可得的多个元素;根据所述输入从所述多个元素中确定表示所述第二特性的元素。用户可以例如从列表中选择被用于确定参数的表示第二特性的元素。
该方法可以包括当所述输入未能满足所述要求时,确定从表示所述第一特性的元素在所述表示中在语义上可得的表示所述第二特性的另一元素。例如,如果用户不喜欢第二元素,则可以重复被用于参数的元素的计算。
在一个方面,该方法包括根据所述输入来确定所述条件。因此,语义可得性的概念根据用户偏好而被更新。
在一个方面,该方法包括了确定用于所述机器学习流水线的部分的所述参数;并且根据所述机器学习流水线中的所述部分的功能来确定所述条件。
该方法可以包括根据所述输入来确定元素群组;并且根据所述元素群组来确定用于所述机器学习流水线的表示的多个参数。这样,可以确定与表示机器学习流水线的特性的第一元素有关的多个参数。
该方法可以包括根据所述机器学习流水线的表示来确定机器学习模型。
该方法可以包括提供包括图像的原始数据;确定用于图像分类器模型的所述机器学习流水线的所述参数;根据所述参数来确定所述机器学习模型;利用所述原始数据的至少一个图像来训练所述图像分类器模型。如此训练的机器学习模型是图像分类器模型或包括它。
该方法可以包括提供图像;利用所述机器学习模型对所述图像进行分类。
一种用于确定机器学习模型的设备适于执行该方法。
附图说明
从以下描述和附图中可获得进一步有利的实施例。在附图中:
图1示意性地描绘用于确定机器学习模型的设备;
图2示意性地描绘用于确定机器学习模型的方法中的步骤;
图3示意性地描绘用户交互的各方面。
具体实施方式
图1描绘了用于确定机器学习模型102的设备100。
设备100包括用户界面层104、语义层106、数据和映射层108以及机器学习层110。设备100适于执行将在下面描述的计算机实现的方法。
用户界面层104向用户提供用于使用语义层106的语义组件并因此使用整个系统的界面。
用户界面层104包括第一功能112,其适于动态地可视化关于数据注释114和关于机器学习模型116的信息。
用户界面层104可以包括图形用户界面功能,其用于显示关于当前数据注释114和关于机器学习模型116的信息。
第一功能112适于从用户检索关于数据注释114和/或机器学习模型116和/或机器学习本体模板T之间的链接L的信息。
在示例中,机器学习流水线的表示可由用户通过从图形用户界面上显示的多个机器学习流水线118中选择它来选择。
在示例中,机器学习本体模板T之间的链接L可由用户通过从图形用户界面上显示的多个机器学习模板中选择要链接的机器学习本体模板T来选择。
关于机器学习模型116的信息包括可视化120。
可视化120包括特征群组122。在示例中,特征群组122包括用于第一特征群组122-1、第二特征群组122-2和第三特征群组122-3的图标。示例中的第一特征群组122-1是用于单个特征的群组。示例中的第二特征群组122-2是用于时间序列的群组。示例中的第三特征群组122-3是用于质量指标的群组。
可视化120包括处理算法124的图形表示。处理算法124的图形表示包括用于第一算法124-1的图标、用于第二算法124-2的图标、和图表124-3。示例中的第一算法124-1是用于第一特征群组122-1(例如用于单个特征的群组)的算法。示例中的第二算法124-2是用于第二群组122-2(例如,用于时间序列的群组)的算法。图表124-3在示例中显示了从笛卡尔坐标系的原点开始的电阻随时间的进程,其具有长度并具有峰值(最大值)以及从峰值到端值的下降。
可视化120包括机器学习算法126的图形表示。示例中的机器学习算法126的图形表示包括描绘机器学习算法126的方面的图标126-1。
关于当前数据注释114的信息包括特征群组128。在示例中,特征群组128包括用于第一特征群组128-1、第二特征群组128-2和第三特征群组128-3的图标。
关于当前数据注释114的信息包括域特征名130。在示例中,域特征名130包括用于第一域特征名130-1、第二域特征名130-2、第三域特征名130-3、第四域特征名130-4和第五域特征名130-5的图标。
在示例中,第一域特征名130-1表示数据的状态。在示例中,第二域特征名130-2表示数据的特性。在示例中,第三域特征名130-3表示数据的类型。在示例中,第四域特征名130-4表示数据的另一类型。在示例中,第五域特征名130-5表示数据的质量。
在示例中,第一域特征名130-1和第二域特征名130-2被映射到第一特征群组128-1。在示例中,第三域特征名130-3和第四域特征名130-4被映射到第二特征群组128-2。在示例中,第五域特征名130-5被映射到第三特征群组128-3。
关于当前数据注释114的信息包括原始特征名132。在示例中,原始特征名132包括用于第一原始特征名132-1、第二原始特征名132-2、第三原始特征名132-3、第四原始特征名132-4和第五原始特征名132-5的图标。
在示例中,第一原始特征名132-1表示数据的状态代码。在示例中,第二原始特征名132-2表示数据的特性。在示例中,第三原始特征名132-3表示数据的类型。在示例中,第四原始特征名132-4表示数据的另一类型。在示例中,第五原始特征名132-5表示数据的质量。
在示例中,第一原始特征名132-1被映射到第一域特征名130-1。在示例中,第二原始特征名132-2被映射到第二域特征名130-2。在示例中,第三原始特征名132-3被映射到第三域特征名130-3。在示例中,第四原始特征名132-4被映射到第四域特征名130-4。在示例中,第五原始特征名132-5被映射到第五域特征名130-5。
可视化120包括可链接的多个机器学习本体模板T的显示T'。机器学习本体模板T可以指特征群组之一、机器学习算法之一、域特征名之一或原始特征名之一,并且由图标之一表示。
图1中连接这些项的箭头表示了这些元素之间的用户提供的链接L。
语义层106包括用于多个元素的关系的表示O。更具体地,表示O包括第一本体134、第二本体136和第三本体138。
示例中的第一本体134是用形式表示对域知识进行编码的域本体,包括域的类别和属性以及它们的关系。
示例中的第二本体136是特征群组本体,其存储域本体术语与机器学习流水线的预先设计的目录中的特征群组之间的链接。
示例中的第三本体138是机器学习流水线本体,其利用形式表示对机器学习知识进行编码,包括允许的和默认的特征群组、用于特征群组的合适的特征处理算法、对应的特征处理群组、用于每个特征处理群组及其关系的合适的机器学习建模算法。示例中的第三本体138对目录进行编码。目录以形式表示存储了由机器学习专家预先设计的一些成功的且相当通用的机器学习流水线。机器学习流水线是从特征群组到其用于特征群组的特征处理算法、到其对应的特征处理群组、以及其指定的用于特征处理群组的机器学习建模算法的预先设计的映射。
语义层106包括机器学习本体MLO和机器学习本体模板T。
机器学习本体MLO用形式表示对机器学习知识进行编码。机器学习本体MLO例如对什么特征群组或其组合被允许或不被允许用于处理输入数据和/或用于处理输入数据的默认特征群组进行编码。机器学习本体MLO例如对什么特征处理算法适合于哪个特征群组进行编码。机器学习本体MLO例如对与特征处理算法对应的特征处理群组、对于特征处理群组适合的机器学习建模算法和/或它们的关系进行编码。
机器学习本体MLO在一个方面定义了语义可得图的允许搜索空间。
机器学习本体模板T在一个方面是具有用于实例化第三本体138的变量的本体片段,即机器学习流水线本体。
语义层106包括动态扩展器,例如动态智能推理器DSR,其将机器学习流水线本体MLO和机器学习模板T以及用户提供的链接L作为输入,并且动态扩展、配置和构造第三本体138,即机器学习流水线本体。
第三本体138(即,使用机器学习本体MLO和模板T来构造的机器学习流水线本体)针对元素集来对语义可得图G进行编码,所述元素集比如是特征群组、特征处理算法、特征处理群组、以及其指定的用于每个特征处理群组的机器学习建模算法。
在一个示例中,语义可得图G是通过使用链接L来链接机器学习模板T而构造的。
在示例中,动态智能推理器DSR具有两层功能。
首先,动态智能推理器DSR被配置为将链接L作为输入,并且链接机器学习模板T以动态地配置、扩展和构造语义可得图G。
在示例中,基于机器学习流水线本体MLO来定义语义可得图G的允许搜索空间。
其次,动态智能推理器DSR被配置为将例如输入数据集D的注释A作为输入,并计算表示O中的元素S1、…、Sn的若干集合,这些元素是从链接L在语义上可得的,并且可能彼此之间具有语义可得性关系。与另一元素Sj具有语义可得性关系的元素Si是从该另一元素Sj在语义上可得的。
动态智能推理器DSR被配置为在语义可得图G中动态地更新语义可得性关系。
语义层106包括第二功能SR。在示例中,第二功能SR包括第一推理器(reasoner)140、第二推理器142和第三推理器144。第二功能SR也可以包括注释器146。
注释器146允许用户用来自第一本体134(在示例中为域本体)的术语来注释原始数据。
第一功能112可以适于从用户输入确定数据的注释A。第二功能SR可以适于接收注释A。第一功能112可以适于从用户输入确定机器学习流水线的表示M。第二功能SR可以适于接收机器学习流水线的表示M。
第一功能112可以适于用户交互。更具体地,第一功能112适于确定和输出提示用户做出响应的输出。在一个方面,第一功能112适于输出提示,所述提示显示用户交互针对其而发起的表示O的元素。第一功能112可以适于请求用户喜欢或不喜欢该元素。第一功能112可以适于请求用户从元素列表中选择元素中的一个或多个。第一功能112可以适于响应于输出而检测由用户的输入。第一功能112可以适于根据输入来确定用户交互的结果。第一功能112可以适于确定指示用户交互针对其而发起的元素是否将被用于确定机器学习流水线的结果。第一功能112可以适于确定指示已经由用户根据输入而选择的列表的元素或若干元素的结果。第一功能112可以适于确定包括用户交互针对其而发起的元素的元素群组,作为结果。
在一个方面中,第一功能112适于确定用于评估表示O中的元素的语义可得性的至少一个条件。
在示例中,注释器146适于处理注释A和来自第一本体134的元素,以确定第一数据集148,其包括来自原始数据库152的原始数据150、以及根据第一本体134的从原始数据150到域特征名的原始特征名的第一映射154。
在示例中,第一推理器140适于处理第一映射154,以根据第二本体136确定域特征名到特征群组的第二映射156。第一推理器140可以适于基于第二本体136和用户的配置以及用户交互的结果(例如来自用户的输入),自动生成和用户配置第二映射156。
在示例中,第二推理器142适于处理第二映射156,以根据第二本体136和第三本体138确定特征群组到处理算法到特征处理群组的第三映射158。第二推理器142可以适于基于第二本体136、目录(例如基于第三本体138)、第二映射156、用户选择的机器学习流水线的表示M以及用户交互的结果(例如来自用户的输入),自动生成第三映射158。
在示例中,第二推理器142适于根据第二映射156和第三映射158以及用户交互的结果(例如来自用户的输入),确定域名到特征群组到处理算法的第四映射160。
在示例中,第二推理器142适于根据第三映射158以及用户交互的结果(例如来自用户的输入),确定特征群组到特征处理群组的第五映射162。
在示例中,第三推理器144适于根据第三映射158确定特征处理群组到机器学习算法的第六映射164。第三推理器144可以适于基于目录(例如基于第三本体138)、用户选择的机器学习流水线的表示M以及用户交互的结果(例如来自用户的输入),自动生成第六映射。
机器学习层110包括适于从原始数据库152确定原始数据150的第一数据整合器166。机器学习层110包括适于根据第一数据集148确定整合数据170的第二数据整合器168。存储在原始数据库152中的原始数据由第二数据整合168转换成适于机器学习的整合数据170。整合数据170被提供用于第二数据集172,其包括整合数据170和第四映射160。
机器学习层110包括第一处理器174,其适于根据第二数据集172确定用于第三数据集178的特征176。第三数据集178包括特征176和第五映射162。
机器学习层110包括第二处理器180,其适于根据第三数据集178确定用于第四数据集184的所选特征182。第四数据集184包括所选特征182和第六映射164。
机器学习层110包括第三处理器186,其适于根据第四数据集184确定机器学习模型102。
数据和映射层108包括原始数据库152、第一数据集148、第二数据集172、第三数据集178、第四数据集184和机器学习模型102。
在图1中,双线箭头指示数据的信息流,实箭头指示语义的信息流,并且虚线指示表示O中的元素类别的连接。
下面描述自动机器学习流水线构造和机器学习流水线配置的示例性方法。自动化方法使用了语义,其允许在机器学习流水线的自动化构造期间的用户交互。
根据该方法,用户需要用域本体术语来注释数据并从目录中选择预先设计的机器学习流水线。用户可以在用于构造机器学习流水线的表示M的一系列步骤的中间步骤处进行交互。其他一切都是自动的。这是通过在预先设计的机器学习流水线的目录中利用语义技术对域知识和机器学习知识的形式表示进行编码来实现的。
在一个方面,机器学习流水线的表示M具有参数。表示O可以包括对域和机器学习知识进行编码的语义。语义包括表示域知识或机器学习知识的多个元素及其关系。
在一个方面,当提供注释A时,根据注释A确定表示O中的第一元素。然后可以根据第一元素确定表示O中的第二元素。在示例中,第二元素被确定成使得第一元素和第二元素具有满足第一条件的关系。第一条件可以是第二元素根据表示O中编码的语义从表示O中的第一元素在语义上可得的。当第一元素和第二元素满足第一条件时,根据第二元素来确定参数。否则,不根据第二元素来确定参数。
在另一方面,可以根据第二元素来确定表示O中的第三元素。在示例中,第二元素和第三元素具有满足第二条件的关系。第二条件可以是第三元素从表示O中的第二元素在语义上可得的。在这个方面,如果满足第二条件,则可以根据第二元素和第三元素来确定参数。否则,可以不根据第二元素和第三元素来确定参数。
例如,元素S1可以用在表示O中出现的特征群组来实例化第一参数P1。
例如,元素S2可以用从元素S1的特征群组在语义上可得的在表示O中出现的一个或多个处理算法来实例化第二参数P2。
例如,元素S3可以用从元素S2的一个或多个处理算法在语义上可得的在表示O中出现的一个或多个处理特征群组来实例化第三参数P3。
例如,元素S4可以用从元素S3的一个或多个处理特征群组在语义上可得的在表示O中出现的处理特征来实例化第四参数P4。
例如,元素S5可以用从元素S4的一个或多个处理特征在语义上可得的在表示O中出现的一个或多个机器学习算法来实例化第五参数P5。
由于本体不是图形,所以语义可得性的概念可以变化并且取决于用例和应用。
在一个方面,语义上可得可以基于将前述本体中的一个或多个投影到图形结构上并计算图形可得性来确定。该图形结构还可以计及本体元素之间的路径的内聚性。其可以计及表示O的元素之间的显式和隐式关系。
下面参考图2描述该方法。作为示例,该方法用于具有参数P1、…、Pk的机器学习流水线。机器学习流水线可具有由表示O中的元素所表示的参数集。
该方法包括步骤200,其提供具有参数P1、…、Pk的机器学习流水线的表示M。
提供表示M可包括检测对机器学习流水线的多个表示118之一进行标识的用户输入,以及选择在用户输入中标识的机器学习流水线的表示M。
该方法包括步骤202,其提供表示O。表示O包括多个元素及其关系。
示例中的表示O包括第一本体134、第二本体136和第三本体138。可以类似地使用表示这些的图形。
该方法包括步骤204,其提供输入数据。
该方法包括步骤206,其提供输入数据的特征的注释A,特别是输入数据中的变量名。
该方法包括步骤208,其提供表示O的第一元素和第二元素。在示例中,提供第一元素包括针对注释A确定表示O的元素,其表示了表示O中的输入数据的特征。在示例中,确定了根据第一本体的输入数据的变量名。
在示例中,提供第二元素包括针对第一元素来确定表示O的元素,其表示了表示O中的特征名。在示例中,确定了根据第一本体的域中的变量名。
可以根据第一元素在表示O中确定第二元素,使得第一元素和第二元素具有满足第一条件的关系。在示例中,这意味着第二元素是根据表示O中编码的语义从表示O中的第一元素在语义上可得的。可以确定满足第一条件的多个第二元素。该方法被描述用于这些第二元素中的一个,并且同样适用于这些第二元素的任何数量。
该方法还包括步骤210,其确定包括输入数据150、第一元素和第二元素的第一数据集148。
该方法还包括步骤212,其确定表示O中的表示特征群组的第三元素。第一参数P1可根据第三元素来确定。
示例中的步骤212包括针对第二元素特别是根据第二本体136来确定表示O的元素,其表示了表示O中的满足第二条件的特征群组。该方法被描述用于这些第三元素中的一个,并且同样适用于这些第三元素的任何数量。
可以根据第二元素在表示O中确定第三元素,使得第三元素是从表示O中的第二元素在语义上可得的。
第三元素可以根据第二本体136来确定。。
该方法可以包括确定在元素之间的关系的表示O中从第二元素在语义上可得的多个第三元素。
该方法可选地包括用于第三元素或多个第三元素的用户交互的步骤213。
下面将参考图3来描述用户交互。第一参数P1可以根据第三元素或者不根据针对第三元素的用户交互的结果来确定。
当用户交互的结果指示了第三元素满足第一要求时,执行步骤214。否则,执行步骤212。如果第三元素被用户喜欢或选择,则可以满足第一要求。否则,可能不满足第一要求。
第二条件可根据用户交互的结果来更新、改变或确定,以用于通过语义可得性的更新概念来执行步骤212。
第二条件可以根据第一参数P1被用于的机器学习流水线中的部分的功能来更新、改变或确定。
用户交互的结果可以指示包括第三元素的元素群组,该第三元素根据在用户交互中接收到的输入来确定,如下所述。该方法可包括根据元素群组来确定用于机器学习流水线的表示M的多个参数,其包括用于第三元素的参数。
该方法还包括步骤214,其确定表示O中的第四元素。在示例中确定第四元素包括针对第三元素来确定表示O的元素,其表示满足第三条件的处理算法。可以根据第三元素在表示O中确定第四元素,使得第四元素是从第三元素在语义上可得的。第四元素表示由第三元素所表示的特征群组的处理算法。第二参数P2可根据第四元素来确定。该方法被描述用于这些第四元素中的一个,并且同样适用于这些第四元素的任何数量。
第四元素可以根据第三本体138来确定。
该方法可以包括确定从第三元素在元素之间的关系的表示O中在语义上可得的多个第四元素。
该方法可选地包括用于第四元素或多个第四元素的用户交互的步骤215。
下面将参考图3描述用户交互。
第二参数P2可根据第四元素或者不根据用于第四元素的用户交互的结果来确定。
当用户交互的结果指示了第四元素满足第二要求时,执行步骤216。否则,执行步骤214。
如果第四元素被用户喜欢或选择,则可以满足第二要求。否则,可能不满足第二要求。
第三条件可根据用户交互的结果来更新、改变或确定,以用于通过语义可得性的更新概念来执行步骤214。
第三条件可以根据第二参数P2被用于的机器学习流水线中的部分的功能来更新、改变或确定。
用户交互的结果可以指示包括第四元素的元素群组,该第四元素是根据在用户交互中接收到的输入来确定的,如下所述。该方法可以包括根据元素群组来确定用于机器学习流水线的表示M的多个参数,所述多个参数包括用于第四元素的参数。
该方法还包括步骤216,其确定包括第二数据集、第二元素、第三元素和第四元素的第二数据集172。
该方法还包括步骤218,其通过用由第四元素表示的处理算法来处理第二数据集172而确定特征集176。
该方法还包括步骤220,其确定第五元素。在示例中确定第五元素包括针对第三元素来确定表示O的元素,其表示满足第四条件的特征集172。在示例中,第五元素被确定成使得第五元素是从表示O中的第三元素在语义上可得的,并且第五元素是从表示O中的第四元素在语义上可得的。在示例中,第五元素表示一个或多个处理特征群组。
该方法可以包括确定从第三元素和第四元素在元素之间的关系的表示O中在语义上可得的多个第五元素。
该方法可选地包括用于第五元素或多个第四元素的用户交互的步骤221。
下面将参考图3描述用户交互。
第三参数P3可根据第五元素或者不根据用于第五元素的用户交互的结果来确定。第四参数P4可以用处理特征即用特征集176来实例化,或者不根据用于第五元素的用户交互的结果来实例化。
当用户交互的结果指示了第五元素满足第三要求时,则执行步骤222。否则,执行步骤220。
如果第五元素被用户喜欢或选择,则可以满足第三要求。否则,可能不满足第三要求。
第四条件可根据用户交互的结果来更新、改变或确定,以用于通过语义可得性的更新概念来执行步骤220。
第四条件可以根据第三参数P3被用于的机器学习流水线中的部分的功能来更新、改变或确定。
第四条件可以根据第四参数P4被用于的机器学习流水线中的部分的功能来更新、改变或确定。
用户交互的结果可以指示包括第五元素的元素群组,该第五元素根据在用户交互中接收到的输入来确定,如下所述。该方法可以包括根据元素群组来确定用于机器学习流水线的表示M的多个参数,所述多个参数包括用于第五元素的参数。
该方法还包括步骤222,其确定包括特征集176、第三元素和第五元素的第三数据集178。
该方法还包括步骤224,其确定第六元素。确定第六元素包括针对第五元素来确定表示O的元素,其表示满足第五条件的机器学习建模算法。在示例中,第六元素被确定成使得第六元素是从表示O中的第五元素在语义上可得的。
该方法可以包括确定从第五元素在元素之间的关系的表示O中在语义上可得的多个第六元素。
该方法可选地包括用于第六元素或多个第六元素的用户交互的步骤225。
下面将参考图3描述用户交互。
第五参数P5可根据由第六元素表示的一个或多个机器学习算法或者不根据用于第六元素的用户交互的结果来确定。
当用户交互的结果指示了使用第六元素时,执行步骤226。否则,执行步骤224。
第五条件可根据用户交互的结果来更新、改变或确定,以用于通过语义可得性的更新概念来执行步骤224。
第五条件可以根据第五参数P5被用于的机器学习流水线中的部分的功能来更新、改变或确定。
用户交互的结果可以指示包括第六元素的元素群组,该第六元素是根据在用户交互中接收到的输入来确定的,如下所述。该方法可以包括根据元素群组来确定用于机器学习流水线的表示M的多个参数,所述多个参数包括用于第六元素的参数。
该方法还包括步骤226,其确定第四数据集184,该第四数据集184包括从特征集176中选择的特征、第五元素和第六元素。
该方法还包括步骤228,其查找用于处理数据的指令和/或根据第六元素针对第四数据集184定义的数据。
这样,机器学习流水线将原始输入数据变成结论和功能机器学习模型。
机器学习流水线可被应用,例如以提供图像分类器模型。图像分类器模型可以用于基于在过程期间取得的图像的监视和过程控制。该过程可以是电阻焊接。图像可以描绘被焊接的部分和/或焊缝。
为了训练图像分类器模型,用户可以注释来自过程或其模拟的训练图像。在用户交互中,用户可以从域特征名中选择将用于图像分类的特征。在用户交互中,用户可以选择用于处理或分类图像的特定处理算法。机器学习建模算法可以根据用户选择而自动地确定。机器学习建模算法可以根据机器学习流水线的表示M利用参数来执行,以从训练图像自动地形成经训练的机器学习模型。
为了训练,原始数据150包括图像。在训练中,确定机器学习流水线M的至少一个参数,其是用于图像分类器模型的参数。用于图像分类器模型的参数可以是超参数或人工神经网络的权重。机器学习模型根据参数来确定,并且利用原始数据150的至少一个图像来训练。
在训练之后,可以利用如此训练的机器学习模型对图像进行分类。
在上述方法中,用户在中间步骤处交互,以构造机器学习流水线的表示M。用于步骤的一个或多个参数对应于机器学习流水线的部分并且是半自动确定的。在该上下文中,半自动意味着在迭代中重复系列的步骤,直到用户交互的结果指示了用户已经选择或喜欢机器学习流水线的对应部分的一个或多个元素。
在用户交互中,在元素之间的关系的表示O中确定表示机器学习流水线M的第一特性的元素。根据系列的哪个步骤被处理,该元素可以是第二元素、第三元素、第四元素或第五元素。
在用户交互中,根据表示第一特性的元素在表示O中确定表示机器学习流水线M的第二特性的元素。确定哪个元素取决于被处理的系列的步骤。在对应的用户交互中,根据第二元素来确定第三元素,根据第二和第三元素来确定第四元素,根据第四元素来确定第五元素,或者根据第五元素来确定第六元素。
表示第一特性的元素和表示第二特性的元素具有满足条件的关系,其用于评估适用于系列步骤的语义可得性。
当图形被用于评估语义可得性时,图形的节点可以表示这些元素。可以根据表示第一特性的元素的图形中的第一节点的属性来确定条件。可以根据表示第二特性的元素的图形中的第二节点的属性来确定是否满足该条件。在示例中,条件由第一节点的属性定义,并且如果第二节点的属性满足该条件,则第二节点是从第一节点在语义上可得的。例如,条件的改变被存储在图形中,作为第一节点或第二节点的更新的或新的属性。
图3描述了用于迭代的用户交互中的步骤。
在步骤300中,用户交互包括了确定提示用户做出响应的输出。
输出例如是对用户交互针对其而发起的元素进行显示的提示。该提示可以请求用户喜欢或不喜欢该元素。该提示可以请求用户选择该元素。
当针对元素群组发起用户交互时,提示可以包括群组中的元素的列表以及选择元素中的一个或多个的请求。
用户交互包括对该输出进行输出的步骤302。在示例中,向用户显示该提示。
用户交互包括对输入进行检测的步骤304。输入可以是显示给用户的针对元素的喜欢或不喜欢属性、或者是从多个元素(例如显示给用户的元素列表)中对元素的选择。
输入可以被用于在元素被选择的情况下根据该元素来确定机器学习流水线M的参数,或者在其他情况下不根据该元素来确定机器学习流水线M的参数。
用户交互可以包括通过用于评估语义可得性的功能来确定关系。在示例中,该功能是用户交互针对其而执行的参数被用于的机器学习流水线中的部分的功能。在这种情况下,用户交互可以包括检测响应并且根据响应而修改功能的至少一个参数。
在示例中,功能如以下那样实现:
动态智能推理器DSR将链接L作为输入,并且链接机器学习模板T以动态地配置、扩展和/或构造语义可得图G。
在示例中,基于机器学习流水线本体MLO来定义语义可得图G的允许搜索空间。
动态智能推理器DSR将注释A作为输入,并计算表示O中的若干元素集S1、…、Sn,它们由于链接L而在语义上可得,并且可能彼此之间具有语义可得性关系。
在示例中,动态智能推理器DSR动态地更新第三本体138,即机器学习流水线本体。
功能可以确定是否满足条件。例如,如果条件满足,则功能可指示表示第二特性的元素是根据表示中编码的语义从表示中的表示第一特性的元素在语义上可得的,否则,则不指示这一点。
用户交互包括根据输入来确定用户交互的结果的步骤306。
结果可以指示用户交互针对其而发起的元素是否将被用于确定机器学习流水线。
结果可以指示多个元素中的一个元素或若干元素,特别是由用户根据输入所选择的元素。
结果可以指示包括用户交互针对其而发起的元素的另一元素群组。
Claims (15)
1.一种计算机实现的方法,其特征在于,在元素之间的关系的表示(O)中确定(212、214、220)表示机器学习流水线(M)的第一特性的元素;在所述表示(O)中根据表示所述第一特性的元素来确定(214、220、224)表示所述机器学习流水线(M)的第二特性的元素;输出(302)针对表示所述第二特性的元素的输出;检测(304)输入,特别是用户的输入;如果所述输入满足要求则根据表示所述第二特性的元素来确定(214、220、224)所述机器学习流水线(M)的参数,或者,否则,不根据表示所述第二特性的元素来确定所述机器学习流水线(M)的所述参数。
2.根据权利要求1所述的方法,其特征在于,确定(214、220、224)表示所述第一特性的元素和表示所述第二特性的元素是否具有满足条件的关系,特别地,所述条件是表示所述第二特性的元素是根据所述表示(O)中编码的语义从所述表示(O)中的表示所述第一特性的元素在语义上可得的。
3.根据前述权利要求中任一项所述的方法,其特征在于,输出(302)所述输出包括提示用户做出响应,特别是喜欢或不喜欢表示所述第二特性的元素或者选择表示所述第二特性的元素。
4.根据权利要求2或3中任一项所述的方法,其特征在于,利用用于评估语义可得性的功能来确定所述关系;检测所述响应;并且根据所述响应来修改所述功能的至少一个参数。
5.根据权利要求4所述的方法,其特征在于,根据所述响应来确定两个元素之间的链接(L);表示所述关系的语义可得图通过将与所述两个元素和它们之间的所述链接(L)相对应的机器学习模板(T)存储在所述语义可得图中来构造。
6.根据前述权利要求中任一项所述的方法,其特征在于,确定(214、220、224)从表示所述第一特性的元素在所述表示(O)中在语义上可得的多个元素;根据所述输入从所述多个元素中确定表示所述第二特性的元素(306)。
7.根据前述权利要求中任一项所述的方法,其特征在于,当所述输入未能满足所述要求时,确定(214、220、224)从表示所述第一特性的元素在所述表示(O)中在语义上可得的表示所述第二特性的另一元素。
8.根据前述权利要求中任一项所述的方法,其特征在于,根据所述输入来确定(215、221、225)所述条件。
9.根据前述权利要求中任一项所述的方法,其特征在于,确定用于所述机器学习流水线的部分的所述参数;并且根据所述机器学习流水线中的所述部分的功能来确定(215、221、225)所述条件。
10.根据前述权利要求中任一项所述的方法,其特征在于,根据所述输入来确定(306)元素群组;并且根据所述元素群组来确定(216、222、226)用于所述机器学习流水线(M)的表示的多个参数。
11.根据前述权利要求中任一项所述的方法,其特征在于,根据所述机器学习流水线(M)的表示来确定(228)机器学习模型。
12.根据权利要求11所述的方法,其特征在于,提供包括图像的原始数据(150);确定用于图像分类器模型的所述机器学习流水线(M)的所述参数;根据所述参数来确定所述机器学习模型;利用所述原始数据(150)的至少一个图像来训练所述图像分类器模型。
13.根据权利要求12所述的方法,其特征在于,提供图像;利用所述机器学习模型对所述图像进行分类。
14.一种用于确定机器学习模型(102)的设备(100),其特征在于,所述设备(100)适于执行根据前述权利要求中任一项所述的方法。
15.一种计算机程序,其特征在于,所述计算机程序包括计算机可读指令,所述计算机可读指令当在计算机上执行时,使所述计算机执行根据权利要求1至13中任一项所述的方法中的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20201313.2A EP3982302A1 (en) | 2020-10-12 | 2020-10-12 | Device for and method of automating machine learning |
EP20201313.2 | 2020-10-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114330738A true CN114330738A (zh) | 2022-04-12 |
Family
ID=72840368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111183034.5A Pending CN114330738A (zh) | 2020-10-12 | 2021-10-11 | 用于使机器学习自动化的设备和使机器学习自动化的方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220114486A1 (zh) |
EP (1) | EP3982302A1 (zh) |
JP (1) | JP2022063864A (zh) |
CN (1) | CN114330738A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11587007B2 (en) * | 2020-12-15 | 2023-02-21 | Atlantic Technical Organization | System and method for automatic learning and selecting of a candidate workflow representative of machine learning flow set |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10417577B2 (en) * | 2015-06-05 | 2019-09-17 | Facebook, Inc. | Machine learning system interface |
US11687795B2 (en) * | 2019-02-19 | 2023-06-27 | International Business Machines Corporation | Machine learning engineering through hybrid knowledge representation |
-
2020
- 2020-10-12 EP EP20201313.2A patent/EP3982302A1/en not_active Withdrawn
-
2021
- 2021-09-22 US US17/448,487 patent/US20220114486A1/en active Pending
- 2021-10-11 JP JP2021166890A patent/JP2022063864A/ja active Pending
- 2021-10-11 CN CN202111183034.5A patent/CN114330738A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220114486A1 (en) | 2022-04-14 |
EP3982302A1 (en) | 2022-04-13 |
JP2022063864A (ja) | 2022-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190205792A1 (en) | Automated generation of workflows | |
US7809669B2 (en) | Rule processing system for determining a result response | |
US8732107B2 (en) | Method and system for capturing business rules for automated decision procession | |
Kang et al. | Multiple classification ripple down rules: evaluation and possibilities | |
Brownlee | Machine learning mastery with Weka | |
CN112036153A (zh) | 工单纠错方法、装置、计算机可读存储介质和计算机设备 | |
CN114330267A (zh) | 一种基于语义学关联的结构化报告模板的设计方法 | |
CN115170048B (zh) | 基于模型和规则的工作流实现方法、系统和介质 | |
CN114330738A (zh) | 用于使机器学习自动化的设备和使机器学习自动化的方法 | |
EP2059893A2 (en) | Methods and apparatus for assisting with construction of data for use in an expert system | |
CN114925212A (zh) | 一种自动判断并融合知识图谱的关系抽取方法及系统 | |
CN113761388A (zh) | 一种推荐方法、装置、电子设备及存储介质 | |
Yang et al. | A situation-centric approach to identifying new user intentions using the mtl method | |
US20230186117A1 (en) | Automated cloud data and technology solution delivery using dynamic minibot squad engine machine learning and artificial intelligence modeling | |
CN114254598A (zh) | 用于使机器学习自动化的设备和使机器学习自动化的方法 | |
CN109684466B (zh) | 一种智能教育顾问系统 | |
JP3805993B2 (ja) | 原因推定方法、原因推定装置、原因推定プログラム及び記録媒体 | |
CN104137107A (zh) | 用于为化学计量分析形成预测模型的方法、软件和图形用户界面 | |
EP4312152A1 (en) | Material selection for designing a manufacturing product | |
JP2020046956A (ja) | 機械学習システム | |
EP1512085A1 (en) | Rule processing system and method | |
CN111681082B (zh) | 交互式产品配置方法及系统、计算机可读存储介质、终端 | |
US20230111928A1 (en) | 3d printing planning | |
Luong | Knowledge management for bridge design process using building block concept | |
Yang | A situation-centric, knowledge-driven requirements elicitation approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |