CN115511043A - 用于训练机器学习算法的方法 - Google Patents
用于训练机器学习算法的方法 Download PDFInfo
- Publication number
- CN115511043A CN115511043A CN202210703318.0A CN202210703318A CN115511043A CN 115511043 A CN115511043 A CN 115511043A CN 202210703318 A CN202210703318 A CN 202210703318A CN 115511043 A CN115511043 A CN 115511043A
- Authority
- CN
- China
- Prior art keywords
- data
- machine learning
- learning algorithm
- control device
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 137
- 238000012549 training Methods 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000000875 corresponding effect Effects 0.000 claims abstract description 76
- 230000000694 effects Effects 0.000 claims abstract description 19
- 230000005540 biological transmission Effects 0.000 claims description 34
- 230000001276 controlling effect Effects 0.000 claims description 29
- 230000002123 temporal effect Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 21
- 230000001934 delay Effects 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000013531 bayesian neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及一种用于训练具有不确定性的机器学习算法的方法,其中所述方法(1)具有如下步骤:针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据对当前包含在所述初始模型中的不确定性的影响(4);针对所述多个时间点中的每个时间点,基于所规定的数据级别以及相对应的所检测到的数据对当前包含在所述初始模型中的不确定性的相应影响,确定相对应的所检测到的数据的分辨率(5);针对所述多个时间点中的每个时间点,将所检测到的数据基于相对应的所确定的分辨率来传输给所述控制设备(6);而且通过所述控制设备基于被传输给所述控制设备的数据来对所述初始模型进行再训练(7)。
Description
技术领域
本发明涉及一种用于训练机器学习算法来控制至少一个可控系统的方法,其中该至少一个可控系统基于具有不确定性的机器学习算法来被训练,其中该机器学习算法可以在该至少一个可控系统的运行期间被再训练,而且其中训练数据到用于对机器学习算法进行再训练的控制设备的传输被优化。
背景技术
数字控制设备在大量应用中被用于控制和调节技术系统,这些技术系统在下文通常称为可控系统。在此,这些控制设备根据指定的控制算法来处理传感器信号或者其它输入值,使得确定用于功能的一个或多个输出值,例如用于操控执行器的操纵参量。
在此,该控制算法例如可以是机器学习算法。在此,各个可控系统分别收集关于它们的使用的数据,其中这些数据然后被用于对机器学习算法相对应地进行训练。在此,此类机器学习算法通常基于:使用统计方法,以便对数据处理系统进行训练,使得该数据处理系统可以在该数据处理系统最初未曾明确为了特定任务而被编程的情况下执行该特定任务。在此,机器学习的目的在于构建可以从数据中学习并做出预测的算法。这些算法创建数学模型,利用这些数学模型例如可以对数据进行分类。
在此,公知如下方法,其中算法首先有关最初收集的数据来被预训练,以便获得具有不确定性的初始模型。这具有如下优点:机器学习算法在此已经可以相对快速地被用于控制至少一个可控系统,而所有可能的分配、尤其是还有很少出现的分配不必首先复杂地被准确训练。接着,在至少一个可控系统的运行期间,机器学习算法或初始模型可以基于相对应的在该至少一个可控系统的运行期间所检测到的数据来被再训练,以便消除不确定性。
然而,在这种情况下,被证明是有问题的是:可控系统越来越多地具有大量要控制的功能或相对应的执行器。然而,如果现在在可控系统的运行期间会检测关于所有这些要控制的功能的数据并且因此大量数据或大数据量会被传输给相对应的控制设备以对机器学习算法进行再训练,则这些数据可能导致数据传输方面的问题,例如导致时延或者像干扰那样的交互效应。
从出版文献DE 10 2016 216 945 A1公知一种用于以基于数据的功能模型的模型值为基础来执行功能的方法,其中在查询点确定基于数据的功能模型的模型值,确定模型精度指示或模型有效性指示,并且根据该模型精度指示或模型有效性指示来执行该功能,该模型精度指示或模型有效性指示说明了在查询点的基于数据的功能模型的模型值的精度或有效性。
因此,本发明所基于的任务在于:说明一种经优化的用于训练机器学习算法的方法以及尤其是一种经优化的用于对具有不确定性的机器学习算法进行再训练的方法。
该任务利用一种按照专利权利要求1的特征的用于训练机器学习算法的方法来被解决。
该任务还利用一种具有专利权利要求7的特征的控制设备来被解决。
此外,该任务也通过一种按照专利权利要求12的用于训练机器学习算法的系统来被解决。
有利的实施方式和扩展方案从从属权利要求中以及从参考附图的描述中得到。
发明内容
按照本发明的一个实施方式,该任务通过一种用于训练机器学习算法的方法来被解决,其中该机器学习算法是用于控制至少一个可控系统的算法,其中该机器学习算法给输入值分配可能的输出值,其中该机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中该不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好。在此,该方法具有:通过用于训练机器学习算法的控制设备基于最初收集到的数据来对机器学习算法进行预训练,以便获得初始模型。此外,在该至少一个可控系统的运行期间,在多个时间点检测表征该至少一个可控系统的当前状态的数据;针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的影响;并且针对所述多个时间点中的每个时间点,基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的相应影响,确定在相对应的时间点所检测到的数据的分辨率,其中针对所述多个时间点中的每个时间点,在相对应的时间点所检测到的数据基于相对应的所确定的分辨率或者以相对应的所确定的分辨率来被传输给控制设备,并且初始模型基于被传输给控制设备的数据通过该控制设备来被再训练。
在这种情况下,不确定性被理解成值或变量,该值或该变量说明了输入值与相对应的输出值之间的分配的质量,也就是说该分配基于多少信息内容或者到目前为止在该分配的附近记录了多少训练数据。
此外,最初收集的数据被理解成如下数据或训练数据,这些数据或训练数据最初被提供用于训练机器学习算法,其中尤其涉及描述频繁或定期出现的情况的数据。在此,有关这些最初收集的数据来被训练的机器学习算法称为初始模型。
此外,在特定时间点所检测到的数据对当前包含在初始模型中的不确定性的影响被理解成相对应的数据的信息内容,其中该信息内容说明了这些数据对于初始模型的再训练的重要程度,也就是说通过基于这些数据对初始模型的再训练是否或者在多大程度上可以减小在初始模型中的不确定性。在此,在特定时间点包含在可能已经被再训练的初始模型中的不确定性称为当前所包含的不确定性。
此外,分辨率被理解成所检测到的数据被传输并且呈现或映射给控制设备的精度。例如,该分辨率可以说明所检测到的图像数据以何种质量被传输或者所检测到的图像数据的多少个像素被传输。此外,在动态测量的情况下,该分辨率例如可以说明在哪些时间点检测到的数据被传输给控制设备。在此,该分辨率进而也影响相对应的数据的存储大小。
此外,所规定的数据级别表示在被传输给控制设备的数据中的所定义的信息级别,例如所要传输的最大数据量或者在所传输的数据中的信息内容总体上至少应该有多少。在此,所规定的数据级别例如可以由模型制造商或该至少一个可控系统的制造商或者控制设备或相对应的数据中心的运营商来被指定。
总的来说,因此可以使所检测到的数据的分辨率并且借此存储大小适配,使得所检测到的数据不是以其全分辨率或存储大小来被传输。经此,可以防止在数据传输方面的问题,例如时延或者像干扰那样的交互效应。此外,数据传输可以被设计为使得考虑相对应的数据传输系统的现实条件,例如CAN总线的容量或者无线数据传输的供支配的带宽。此外,该方法确保了算法的动态细化或主动学习,其中基于所传输的数据同样也具有所希望的信息内容,也可以训练在实践中非常罕见的情况。经此,可以进一步提高在通过机器学习算法将输入值分配给输出值时的精度。因此,总的来说,说明了一种经优化的用于训练机器学习算法的方法以及尤其是一种经优化的用于对具有不确定性的机器学习算法进行再训练的方法。
在此,至少可控系统例如可以是自主驾驶车辆的驾驶员辅助功能,这些驾驶员辅助功能具有涉及自主驾驶机动车的运行的功能,例如挡位选择、速度选择或者温度设定。此外,但是该至少一个可控系统例如也可以是任何其它基于机器学习算法的可控系统,例如厨房用具或洗衣机。
此外,各个时间点例如可以随着时间等距分布。此外,然而其它分布也是可能的。
此外,输入值例如可以是传感器信号。此外,但是输入值例如也可以由用户来指定。输出值表征用于控制该至少一个可控系统的相对应的操控信号或者该至少一个可控系统被设定到的值。
在一个实施方式中,该初始模型在此是高斯过程。
在此,高斯过程被理解成随机过程,其中随机变量的每个有限子集都呈多维正态分布(高斯分布)。一般来说,高斯过程表示时间、空间或任意其它函数,这些函数的函数值由于信息不完整而只能以一定的不确定性和概率来被建模。
因此,此类高斯过程适合于快速并且简单地获得或训练初始模型。
此外,但是初始模型也可以是任何其它具有不确定性的机器学习算法,例如是贝叶斯神经网络(Baysian neural network)。
在此,所规定的数据级别可以说明:被传输给控制设备的数据对当前包含在初始模型中的不确定性的影响至少应该有多大,即在所传输的数据中的对于初始模型的再训练来说所希望的信息内容至少应该有多大。所规定的数据级别尤其可以被规定为使得在机器学习算法中或在初始模型中的不确定性尽可能快地被减小,由此可以减少在对初始模型进行细化或再训练时的计算时间和相对应的所需的资源。
在此,针对所述多个时间点中的每个时间点基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的相应影响来确定在相对应的时间点所检测到的数据的分辨率的步骤可以分别具有:确定该分辨率,使得要传输给控制设备的数据的存储大小被最小化并且同时被传输给控制设备的数据的信息内容至少与被传输给控制设备的数据对当前包含在初始模型中的不确定性的至少应该有的影响一样大。因此,可以使用约束优化方法来确定相对应的分辨率。
此外,数据的分辨率可以是数据的空间分辨率、二维分辨率或者时间分辨率。
在此,空间分辨率被理解成对三维平面的呈现或传输的精度。
此外,二维分辨率被理解成对二维平面的呈现或传输的精度。在此,例如可设想的是其中二维平面的左下边缘比右上边缘具有更高的分辨率的情况。
此外,时间分辨率被理解成:在动态测量时在哪些时间点检测到的数据被传输给控制设备。
利用本发明的另一实施方式,也说明了一种用于控制至少一个可控系统的方法,其中该方法具有:通过上文描述的方法来训练用于控制该至少一个可控系统的机器学习算法;并且基于经训练的机器学习算法来控制该至少一个可控系统。
因此,总的来说,说明了一种经优化的用于控制至少一个可控系统的方法,其中该至少一个可控系统基于机器学习算法来被控制,该机器学习算法是基于经优化的方法来被训练的。这样,通过首先训练初始模型,机器学习算法已经可以相对快速地被用于控制至少一个可控系统,而所有可能的分配、尤其是还有很少出现的分配不必首先复杂地被准确训练。经此,可以在训练机器学习算法时进一步节省计算时间以及相对应的计算机能力,使得该方法例如也可以通过在该至少一个可控系统本身中设计的控制设备来被执行,该控制设备通常具有比同类的、在后台中设计的控制设备更少的容量。此外,机器学习算法或初始模型可以在该至少一个可控系统的运行期间被再训练,以便减小初始模型中的不确定性,其中所要传输的数据的分辨率并且借此存储大小被适配为使得所要传输的数据不是以其全分辨率或存储大小来被传输。经此,可以防止在数据传输方面的问题,例如时延或者像干扰那样的交互效应。此外,数据传输可以被设计为使得考虑相对应的数据传输系统的现实条件,例如CAN总线的容量或者无线数据传输的供支配的带宽。此外,该方法确保了算法的动态细化或主动学习,其中基于所选择的被传输的数据也可以训练在实践中非常罕见的情况。经此,可以在通过机器学习算法来控制该至少一个可控系统的情况下进一步提高在将输入值分配给输出值时的精度。
此外,利用本发明的另一实施方式,也说明了一种用于选择训练数据来训练机器学习算法的控制设备,其中该机器学习算法是用于控制至少一个可控系统的算法,其中该机器学习算法给输入值分配可能的输出值,其中该机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中该不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好,而且其中该机器学习算法是基于最初收集到的数据来被预训练的,以便获得初始模型,而且其中该控制设备具有:检测单元,该检测单元被设计为在该至少一个可控系统的运行期间,在多个时间点分别检测表征该至少一个可控系统的当前状态的数据;第一确定单元,该第一确定单元被设计为针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的影响;第二确定单元,该第二确定单元被设计为基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的相应影响,确定在相对应的时间点所检测到的数据的分辨率;和传输单元,该传输单元被设计为针对所述多个时间点中的每个时间点,将在相对应的时间点所检测到的数据基于相对应的所确定的分辨率或者以相对应的所确定的分辨率来传输给用于训练机器学习算法的控制设备。
因此,总的来说,说明了一种用于传输或选择训练数据来训练机器学习算法的控制设备,该控制设备被设计为使得所检测到的数据的分辨率并且借此存储大小被适配为使得所检测到的数据不是以其全分辨率或存储大小来被传输。经此,可以防止在数据传输方面的问题,例如时延或者像干扰那样的交互效应。此外,数据传输可以被设计为使得考虑相对应的数据传输系统的现实条件,例如CAN总线的容量或者无线数据传输的供支配的带宽。
在一个实施方式中,该初始模型在此进而是高斯过程。此类高斯过程适合于快速并且简单地获得或训练初始模型。此外,但是初始模型也可以是任何其它具有不确定性的机器学习算法,例如是贝叶斯神经网络(Baysian neural network)。
在此,所规定的数据级别进而可以说明:被传输的数据对当前包含在初始模型中的不确定性的影响至少应该有多大,即在所传输的数据中的对于初始模型的再训练来说所希望的信息内容至少应该有多大。所规定的数据级别尤其可以被规定为使得在机器学习算法中或在初始模型中的不确定性尽可能快地被减小,由此可以减少在对初始模型进行细化或再训练时的计算时间和相对应的所需的资源。
在此,第二确定单元可以被设计为:针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据的分辨率,使得被传输给控制设备的数据的存储大小被最小化并且同时这些被传输给控制设备的数据的信息内容至少与被传输给控制设备的数据对当前包含在初始模型中的不确定性的至少应该有的影响一样大。因此,第二确定单元可以被设计为:相应地使用约束优化方法来确定相对应的分辨率。
此外,数据的分辨率进而可以是数据的空间分辨率、二维分辨率或者时间分辨率。此外,然而也可以使用其它类型的分辨率,例如辐射分辨率。
此外,利用本发明的另一实施方式,也说明一种用于训练机器学习算法的系统,其中该机器学习算法是用于控制至少一个可控系统的算法,其中该机器学习算法给输入值分配可能的输出值,其中该机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中该不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好,而且其中该系统具有上文描述的用于选择训练数据来训练机器学习算法的控制设备和用于训练机器学习算法的控制设备,其中用于训练机器学习算法的控制设备被设计为:基于最初收集到的数据来对机器学习算法进行预训练,以便获得初始模型;并且基于从用于选择训练数据来训练机器学习算法的控制设备为了控制可控系统而获得的数据来对初始模型进行再训练。
因此,总的来说,说明了一种经优化的用于训练机器学习算法的系统以及尤其是一种经优化的用于对具有不确定性的机器学习算法进行再训练的系统。在此,该系统被设计为使得所检测到的数据的分辨率并且借此存储大小被适配,使得所检测到的数据不是以其全分辨率或存储大小来被传输。经此,可以防止在数据传输方面的问题,例如时延或者像干扰那样的交互效应。此外,数据传输可以被设计为使得考虑相对应的数据传输系统的现实条件,例如CAN总线的容量或者无线数据传输的供支配的带宽。此外,该系统确保了算法的动态细化或主动学习,其中基于所选择的被传输的数据也可以训练在实践中非常罕见的情况。经此,可以进一步提高在通过机器学习算法将输入值分配给输出值时的精度。
此外,利用本发明的另一实施方式,还说明了一种用于控制可控系统的系统,其中该系统具有至少一个可控系统和用于基于通过上文描述的用于训练机器学习算法的系统来被训练的机器学习算法来控制该至少一个可控系统的控制设备。
因此,总的来说,说明了一种经优化的用于控制至少一个可控系统的系统,其中该至少一个可控系统基于机器学习算法来被控制,该机器学习算法是基于经优化的方法来被训练的。这样,通过首先训练初始模型,机器学习算法已经可以相对快速地被用于控制至少一个可控系统,而所有可能的分配、尤其是还有很少出现的分配不必首先复杂地被准确训练。经此,可以在训练机器学习算法时进一步节省计算时间以及相对应的计算机能力。此外,机器学习算法或初始模型可以在该至少一个可控系统的运行期间被再训练,以便减小初始模型中的不确定性,其中所检测到的数据的分辨率并且借此存储大小被适配为使得所检测到的数据不是以其全分辨率或存储大小来被传输。经此,可以防止在数据传输方面的问题,例如时延或者像干扰那样的交互效应。此外,数据传输可以被设计为使得考虑相对应的数据传输系统的现实条件,例如CAN总线的容量或者无线数据传输的供支配的带宽。此外,该系统确保了算法的动态细化或主动学习,其中基于所选择的被传输的数据也可以训练在实践中非常罕见的情况。经此,可以在通过机器学习算法来控制该至少一个可控系统的情况下进一步提高在将输入值分配给输出值时的精度。
在此,该至少一个可控系统可以是自主驾驶机动车,也就是说其中在运行期间可以同时并且彼此独立地控制多个可控功能或可控执行器、例如用于速度设定、挡位选择或温度调节的可控功能或可控执行器的系统。此外,但是该至少一个可控系统例如也可以是任何其它基于机器学习算法的可控系统,例如厨房用具或洗衣机。
因此,总的来说能发现:利用本发明,说明了一种经优化的用于训练机器学习算法的方法以及尤其是一种经优化的用于对具有不确定性的机器学习算法进行再训练的方法。
所描述的设计方案和扩展方案可以彼此任意组合。
本发明的其它可能的设计方案、扩展方案和实现方案也包括本发明的之前或者在下文关于实施例所描述的特征的没有明确提到的组合。
附图说明
随附的附图旨在提供对本发明的实施方式的进一步理解。这些附图阐明了实施方式并且与描述相结合地用于阐述本发明的原理和设计。
其它实施方式和所提到的优点中的多个优点参考这些附图得出。这些附图的所呈现的要素不一定彼此按正确比例地被示出。
其中:
图1示出了按照本发明的实施方式的用于训练机器学习算法的方法的流程图;
图2示出了按照本发明的实施方式的用于训练机器学习算法的系统的示意性框图。
在这些附图的图中,只要不另作说明,相同的附图标记就表示相同或功能相同的要素、构件或组件。
具体实施方式
图1示出了按照本发明的实施方式的用于训练机器学习算法的方法1的流程图。
数字控制设备在大量应用中被用于控制和调节技术系统,这些技术系统在下文通常称为可控系统。在此,这些控制设备根据指定的控制算法来处理传感器信号或者其它输入值,使得确定用于功能的一个或多个输出值,例如用于操控执行器的操纵参量。
在此,该控制算法例如可以是机器学习算法。在此,各个可控系统分别收集关于它们的使用的数据,其中这些数据然后被用于对机器学习算法相对应地进行训练。在此,此类机器学习算法通常基于:使用统计方法,以便对数据处理系统进行训练,使得该数据处理系统可以在该数据处理系统最初未曾明确为了特定任务而被编程的情况下执行该特定任务。在此,机器学习的目的在于构建可以从数据中学习并做出预测的算法。这些算法创建数学模型,利用这些数学模型例如可以对数据进行分类。
在此,公知如下方法,其中算法首先有关最初收集的数据来被预训练,以便获得具有不确定性的初始模型。这具有如下优点:机器学习算法在此已经可以相对快速地被用于控制至少一个可控系统,而所有可能的分配、尤其是还有很少出现的分配不必首先复杂地被准确训练。经此,可以在训练机器学习算法时进一步节省计算时间以及相对应的计算机能力。接着,在至少一个可控系统的运行期间,机器学习算法或初始模型可以基于相对应的在该至少一个可控系统的运行期间所检测到的数据来被再训练,以便消除不确定性。
然而,在这种情况下,被证明是有问题的是:可控系统越来越多地具有大量要控制的功能或相对应的执行器。然而,如果现在在可控系统的运行期间会检测关于所有这些要控制的功能的数据并且因此大量数据或大数据量会被传输给相对应的控制设备以对机器学习算法进行再训练,则这些数据可能导致数据传输方面的问题,例如导致时延或者像干扰那样的交互效应。
在此,按照图1的实施方式,说明了一种用于训练机器学习算法的方法1,其中该机器学习算法是用于控制至少一个可控系统的算法,其中该机器学习算法给输入值分配可能的输出值,其中该机器学习算法针对输入值到输出值的每个分配都具有不确定性,而且其中该不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好。在此,该方法1具有步骤2:通过用于训练机器学习算法的控制设备基于最初收集到的数据来对机器学习算法进行预训练,以便获得初始模型。此外,在下一步骤3中,在该至少一个可控系统的运行期间,在多个时间点分别检测表征该至少一个可控系统的当前状态的数据;在步骤4中,针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的影响;并且在步骤5中,针对所述多个时间点中的每个时间点,基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的相应影响,分别确定在相对应的时间点所检测到的数据的分辨率,其中在下一步骤6中,针对所述多个时间点中的每个时间点,将在相对应的时间点所检测到的数据基于相对应的所确定的分辨率来传输给控制设备,并且然后在步骤7中基于被传输给控制设备的数据通过该控制设备来对初始模型进行再训练。
在这种情况下,不确定性被理解成值或变量,该值或该变量说明了输入值与相对应的输出值之间的分配的质量,也就是说该分配基于多少信息内容或者到目前为止在该分配的附近记录了多少训练数据。
此外,最初收集的数据被理解成如下数据或训练数据,这些数据或训练数据最初被提供用于训练机器学习算法,其中尤其涉及描述频繁或定期出现的情况的数据。在此,有关这些最初收集的数据来被训练的机器学习算法称为初始模型。
此外,在特定时间点所检测到的数据对当前包含在初始模型中的不确定性的影响被理解成相对应的数据的信息内容,其中该信息内容说明了这些数据对于初始模型的再训练的重要程度,也就是说通过基于这些数据对初始模型的再训练是否或者在多大程度上可以减小在初始模型中的不确定性。在此,在特定时间点包含在可能已经被再训练的初始模型中的不确定性称为当前所包含的不确定性。
此外,分辨率被理解成所检测到的数据被传输并且呈现或映射给控制设备的精度。例如,该分辨率可以说明所检测到的图像数据以多高的质量被传输或者所检测到的图像数据的多少个像素被传输。此外,在动态测量的情况下,该分辨率例如可以说明在哪些时间点检测到的数据被传输给控制设备。在此,该分辨率进而也影响相对应的数据的存储大小。
此外,所规定的数据级别表示在被传输给控制设备的数据中的所定义的信息级别,例如所要传输的最大数据量或者在所传输的数据中的信息内容总体上至少应该有多少。在此,所规定的数据级别例如可以由模型制造商或该至少一个可控系统的制造商或者控制设备或相对应的数据中心的运营商来被指定。
总的来说,因此使所检测到的数据的分辨率并且借此存储大小适配,使得所检测到的数据不是以其全分辨率或存储大小来被传输。经此,可以防止在数据传输方面的问题,例如时延或者像干扰那样的交互效应。此外,数据传输可以被设计为使得考虑相对应的数据传输系统的现实条件,例如CAN总线的容量或者无线数据传输的供支配的带宽。此外,该方法1确保了算法的动态细化或主动学习,其中基于所传输的数据同样也具有所希望的信息内容,也可以训练在实践中非常罕见的情况。经此,可以进一步提高在通过机器学习算法将输入值分配给输出值时的精度。因此,总的来说,说明了一种经优化的用于训练机器学习算法的方法1以及尤其是一种经优化的用于对具有不确定性的机器学习算法进行再训练的方法1。
在此,该方法1可以被重复执行,例如每隔一定时间间隔,比如每隔10分钟。此外,但是在该方法1的各个重复之间的时间间隔也可以自适应地被适配。在这种情况下,进而可以使用预测模型,该预测模型说明了在某些时间点预期哪些数据,其中基于该预测模型以及必要时该预测模型的不确定性可以决定在哪个时间点重新执行该方法1或在哪个时间段之后重新执行该方法。
此外,所述多个时间点中的时间点可以随着时间等距分布。示例可以是相对应的时间点每秒、每10秒或者每30秒出现。此外,然而其它分布也是可能的。
此外,如果该至少一个可控系统具有多个数据通道,例如该至少一个可控系统的不同可控功能的数据的通道,则可以为每个通道确定相同的分辨率,要不然也可以为这些通道中的至少一部分分别确定不同的或单独的分辨率。
因此,总的来说,基于该方法1可以实现对要传输怎样分辨率的数据的信息最优的选择。
在此,按照图1的实施方式,初始模型是高斯过程。在此,高斯过程表示在函数上具有相关的多元正态分布。高斯过程可用作机器学习中的方法,原因在于具有控制其特征的给定协方差函数的高斯过程也可以被理解成关于未知函数的特性的先验猜测。该先验猜测可以依据数据被高效调节,由此形成可用于预测未知数据点的后验分布。借此,高斯过程为函数推理提供了完整的贝叶斯框架。
因此,通常也称为容差的不确定性或质量指示在此可以被确定为方差、尤其是高斯过程的预测方差。
此外,所规定的数据级别说明:被传输的数据对当前包含在初始模型中的不确定性的影响至少应该有多大,即在所传输的数据中的对于初始模型的再训练来说所希望的信息内容至少应该有多大。
在此,该分辨率可以分别基于约束优化问题来被确定。按照图1的实施方式,针对所述多个时间点中的每个时间点基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的相应影响来确定在相对应的时间点所检测到的数据的分辨率的步骤5分别具有:确定该分辨率,使得要传输给控制设备的数据的存储大小被最小化并且同时被传输给控制设备的数据的信息内容至少与被传输给控制设备的数据对当前包含在初始模型中的不确定性的至少应该有的影响一样大。
此外,为了减少计算时间,一旦存储大小在此低于针对该存储大小的阈值,在此就也可以中断对该分辨率的确定。
此外,该分辨率是数据的空间分辨率、二维分辨率和/或时间分辨率。
图2示出了按照本发明的实施方式的用于训练机器学习算法的系统10的示意性框图。
在此,该机器学习算法进而是用于控制至少一个可控系统的算法,其中该机器学习算法给输入值分配可能的输出值,其中该机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中该不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好。
如图2所示,该系统10在此具有用于选择训练数据来训练机器学习算法的控制设备11和用于训练机器学习算法的控制设备12,其中用于训练机器学习算法的控制设备12被设计为:基于最初收集到的数据来对机器学习算法进行预训练,以便获得初始模型;并且基于从用于选择训练数据来训练机器学习算法的控制设备11为了控制可控系统而获得的数据来对初始模型进行再训练。
在此,用于选择训练数据来训练机器学习算法的控制设备11尤其可以被设计在至少一个可控系统本身中或者集成到该至少一个可控系统中。
此外,用于训练机器学习算法的控制设备12同样可以被设计在该至少一个可控系统本身中要不然也可以被设计在后台中,其中如果该控制设备12被设计在后台中,则使用关于应预期在不久的将来的数据内容和/或将来以怎样的分辨率来传输数据的预测模型,其中该预测模型进而可以是在该至少一个可控系统的运行期间被教导的机器学习算法,而且其中该预测模型可以是固定的或自适应的。如果该预测模型在此是自适应的,则还需要概率预测模型,借助于该概率预测模型可以评估相对应的不确定性,例如在哪个时间点应在数据中预期有相对应的信息内容。在此,该控制设备12例如可以基于该预测模型来预测在不久的将来可以获得哪些数据,并且可以向控制设备11相对应地通知:基于这些在不久的将来所预期的数据中的哪些数据可以减小当前包含在初始模型中的不确定性。
此外,按照图2的实施方式,该至少一个可控系统在此是自主驾驶机动车或者涉及自主驾驶机动车的运行的功能,尤其是速度设定、挡位选择或温度调节。
在此,如图2进一步所示,用于选择训练数据来训练机器学习算法的控制设备11具有:检测单元13,该检测单元被设计为在该至少一个可控系统的运行期间,在多个时间点分别检测表征该至少一个可控系统的当前状态的数据;第一确定单元14,该第一确定单元被设计为针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的影响;第二确定单元15,该第二确定单元被设计为针对所述多个时间点中的每个时间点,基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在初始模型中的不确定性的相应影响,确定在相对应的时间点所检测到的数据的分辨率;和传输单元16,该传输单元被设计为针对所述多个时间点中的每个时间点,将在相对应的时间点所检测到的数据基于相对应的所确定的分辨率来传输给用于训练机器学习算法的控制设备12。
在此,该检测单元和该传输单元例如可以两者都集成到收发器中。此外,该第一确定单元和该第二确定单元可以两者分别例如基于寄存在存储器中并且可通过处理器来执行的代码来被实现。
此外,用于训练机器学习算法的控制设备12同样具有检测单元17,该检测单元被设计为检测或接收通过传输单元16来传输的数据。
在此,各个数据例如可以通过相对应的被设计在该至少一个可控系统中或者被设计在自主驾驶机动车中的传感器或相对应的控制设备来被检测。
按照图2的实施方式,初始模型进而是高斯过程。
此外,所规定的数据级别进而说明:被传输给控制设备的数据对当前包含在初始模型中的不确定性的影响至少应该有多大。
按照图2的实施方式,第二确定单元15还被设计为:针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据的分辨率,使得要传输给控制设备的数据的存储大小被最小化并且同时被传输给用于训练机器学习算法的控制设备12的数据的信息内容至少与被传输给该控制设备12的数据对当前包含在初始模型中的不确定性的至少应该有的影响一样大。因此,第二确定单元15进而被设计为分别基于约束优化问题来确定分辨率。
Claims (14)
1.一种用于训练机器学习算法的方法,其中所述机器学习算法是用于控制至少一个可控系统的算法,其中所述机器学习算法给输入值分配可能的输出值,其中所述机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中所述不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好,其中所述方法(1)具有如下步骤:
- 通过用于训练所述机器学习算法的控制设备基于最初收集到的数据来对所述机器学习算法进行预训练,以便获得初始模型(2);
- 在所述至少一个可控系统的运行期间,在多个时间点分别检测表征所述至少一个可控系统的当前状态的数据(3);
- 针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据对当前包含在所述初始模型中的不确定性的影响(4);
- 针对所述多个时间点中的每个时间点,基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在所述初始模型中的不确定性的相应影响,确定在相对应的时间点所检测到的数据的分辨率(5);
- 针对所述多个时间点中的每个时间点,将在相对应的时间点所检测到的数据基于相对应的所确定的分辨率来传输给所述控制设备(6);而且
- 通过所述控制设备基于被传输给所述控制设备的数据来对所述初始模型进行再训练(7)。
2.根据权利要求1所述的方法,其中所述初始模型是高斯过程。
3.根据权利要求1或2所述的方法,其中所规定的数据级别说明:被传输给所述控制设备的数据对当前包含在所述初始模型中的不确定性的影响至少应该有多大。
4.根据权利要求3所述的方法,其中针对所述多个时间点中的每个时间点基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在所述初始模型中的不确定性的相应影响来确定在相对应的时间点所检测到的数据的分辨率(5)的步骤还具有如下步骤:
- 确定相对应的分辨率,使得要传输给所述控制设备的数据的存储大小被最小化并且同时被传输给所述控制设备的数据的信息内容至少与被传输给所述控制设备的数据对当前包含在所述初始模型中的不确定性的至少应该有的影响一样大。
5.根据权利要求1至4中任一项所述的方法,其中所述数据的分辨率是所述数据的空间分辨率、二维分辨率或者时间分辨率。
6.一种用于控制至少一个可控系统的方法,其中所述方法具有如下步骤:
- 通过根据权利要求1至5中任一项所述的方法(1)来训练用于控制所述至少一个可控系统的机器学习算法;而且
- 基于经训练的机器学习算法来控制所述至少一个可控系统。
7.一种用于选择训练数据来训练机器学习算法的控制设备,其中所述机器学习算法是用于控制至少一个可控系统的算法,其中所述机器学习算法给输入值分配可能的输出值,其中所述机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中所述不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好,而且其中所述机器学习算法是基于最初收集到的数据来被预训练的,以便获得初始模型,而且其中所述控制设备(11)具有:检测单元(13),所述检测单元被设计为在所述至少一个可控系统的运行期间,在多个时间点分别检测表征所述至少一个可控系统的当前状态的数据;第一确定单元(14),所述第一确定单元被设计为针对所述多个时间点中的每个时间点,分别确定在相对应的时间点所检测到的数据对当前包含在所述初始模型中的不确定性的影响;第二确定单元(15),所述第二确定单元被设计为针对所述多个时间点中的每个时间点,基于所规定的数据级别以及在相对应的时间点所检测到的数据对当前包含在所述初始模型中的不确定性的相应影响,确定在相对应的时间点所检测到的数据的分辨率;和传输单元(16),所述传输单元被设计为针对所述多个时间点中的每个时间点,将在相对应的时间点所检测到的数据基于相对应的所确定的分辨率来传输给用于训练所述机器学习算法的控制设备。
8.根据权利要求7所述的控制设备,其中所述初始模型是高斯过程。
9.根据权利要求7或8所述的控制设备,其中所规定的数据级别说明:被传输给所述控制设备的数据对当前包含在所述初始模型中的不确定性的影响至少应该有多大。
10.根据权利要求8所述的控制设备,其中所述第二确定单元(15)被设计为:针对所述多个时间点中的每个时间点,确定相对应的分辨率,使得被传输给用于训练所述机器学习算法的控制设备的数据的存储大小被最小化并且同时被传输给用于训练所述机器学习算法的控制设备的数据的信息内容至少与被传输给用于训练所述机器学习算法的控制设备的数据对当前包含在所述初始模型中的不确定性的至少应该有的影响一样大。
11.根据权利要求7至10中任一项所述的控制设备,其中所述数据的分辨率是所述数据的空间分辨率、二维分辨率或者时间分辨率。
12.一种用于训练机器学习算法的系统,其中所述机器学习算法是用于控制至少一个可控系统的算法,其中所述机器学习算法给输入值分配可能的输出值,其中所述机器学习算法针对输入值到输出值的每个分配都具有不确定性,其中所述不确定性分别说明了输入值到可能的输出值的分配到目前为止被训练得有多好,而且其中所述系统(10)具有根据权利要求7至11中任一项所述的用于选择训练数据来训练所述机器学习算法的控制设备(11)和用于训练所述机器学习算法的控制设备(12),其中用于训练所述机器学习算法的控制设备(12)被设计为:基于最初收集到的数据来对所述机器学习算法进行预训练,以便获得初始模型;并且基于从用于选择训练数据来训练所述机器学习算法的控制设备(11)获得的数据来对所述初始模型进行再训练。
13.一种用于控制可控系统的系统,其中所述系统具有至少一个可控系统和用于基于通过根据权利要求12所述的用于训练机器学习算法的系统来被训练的机器学习算法来控制所述至少一个可控系统的控制设备。
14.根据权利要求13所述的系统,其中所述至少一个可控系统是自主驾驶机动车。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102021206375.6 | 2021-06-22 | ||
DE102021206375.6A DE102021206375A1 (de) | 2021-06-22 | 2021-06-22 | Verfahren zum Trainieren eines Algorithmus des maschinellen Lernens |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115511043A true CN115511043A (zh) | 2022-12-23 |
Family
ID=84283880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210703318.0A Pending CN115511043A (zh) | 2021-06-22 | 2022-06-21 | 用于训练机器学习算法的方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220404780A1 (zh) |
JP (1) | JP2023002489A (zh) |
KR (1) | KR20220170364A (zh) |
CN (1) | CN115511043A (zh) |
DE (1) | DE102021206375A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102021208523A1 (de) | 2021-08-05 | 2023-02-09 | Robert Bosch Gesellschaft mit beschränkter Haftung | Einrichtung und Verfahren zum Auswählen eines digitalen Bildes |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102016216945A1 (de) | 2016-09-07 | 2018-03-08 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Ausführen einer Funktion basierend auf einem Modellwert eines datenbasierten Funktionsmodells basierend auf einer Modellgültigkeitsangabe |
-
2021
- 2021-06-22 DE DE102021206375.6A patent/DE102021206375A1/de active Pending
-
2022
- 2022-06-16 US US17/841,816 patent/US20220404780A1/en active Pending
- 2022-06-17 KR KR1020220074023A patent/KR20220170364A/ko unknown
- 2022-06-21 CN CN202210703318.0A patent/CN115511043A/zh active Pending
- 2022-06-21 JP JP2022099749A patent/JP2023002489A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2023002489A (ja) | 2023-01-10 |
US20220404780A1 (en) | 2022-12-22 |
DE102021206375A1 (de) | 2022-12-22 |
KR20220170364A (ko) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107783528B (zh) | 机器学习系统及其用于学习用户控制模式的方法 | |
CN114126944B (zh) | 滚动时域状态估计器 | |
WO2021227536A1 (en) | Methods and systems for support policy learning | |
CN112488104A (zh) | 深度及置信度估计系统 | |
CN113366509B (zh) | 运算装置 | |
US11093863B2 (en) | Method for ascertaining a time characteristic of a measured variable, prediction system, actuator control system, method for training the actuator control system, training system, computer program, and machine-readable storage medium | |
CN112904852B (zh) | 一种自动驾驶控制方法、装置及电子设备 | |
CN115511043A (zh) | 用于训练机器学习算法的方法 | |
US8190536B2 (en) | Method of performing parallel search optimization | |
US20220404781A1 (en) | Method for training a machine learning algorithm | |
WO2020023483A1 (en) | Continuous parametrizations of neural network layer weights | |
EP4068137B1 (en) | Apparatus and method for optimizing control parameter of solder printing apparatus | |
JP2024521717A (ja) | コンピュータ制御されるシステムの安全な制御/監視 | |
JP6659260B2 (ja) | Plcプログラムの最適化機能を備えた制御装置及び機械学習器 | |
KR20210138498A (ko) | 테스트 벤치를 작동하기 위한 장치 및 방법 | |
CN111077769A (zh) | 用于控制或调节技术系统的方法 | |
US20210034923A1 (en) | System, method, and non-transitory storage medium | |
US20230406304A1 (en) | Method for training a deep-learning-based machine learning algorithm | |
US20240078437A1 (en) | Method for training a generative adversarial network | |
US12061904B2 (en) | Information processing method, information processing apparatus and server apparatus | |
CN116128067A (zh) | 用来生成用于训练机器学习算法的训练数据的方法 | |
CN117763308B (zh) | 基于无人机的运动指标分析方法、电子设备、存储介质 | |
US20220327390A1 (en) | Method for training a neural network | |
US20230234610A1 (en) | Method and Control Device for Training an Object Detector | |
US20230128941A1 (en) | Method for controlling an agent |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |