CN117396744A - 估计装置、估计方法、程序以及学习模型生成装置 - Google Patents
估计装置、估计方法、程序以及学习模型生成装置 Download PDFInfo
- Publication number
- CN117396744A CN117396744A CN202280033593.4A CN202280033593A CN117396744A CN 117396744 A CN117396744 A CN 117396744A CN 202280033593 A CN202280033593 A CN 202280033593A CN 117396744 A CN117396744 A CN 117396744A
- Authority
- CN
- China
- Prior art keywords
- representing
- physical quantity
- performance
- learning
- deformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 56
- 230000008859 change Effects 0.000 claims abstract description 26
- 239000012530 fluid Substances 0.000 claims description 32
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 230000008602 contraction Effects 0.000 claims description 17
- 230000000306 recurrent effect Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 7
- 229920001971 elastomer Polymers 0.000 description 168
- 239000005060 rubber Substances 0.000 description 164
- 238000012545 processing Methods 0.000 description 44
- 230000008569 process Effects 0.000 description 37
- 238000005259 measurement Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 230000001186 cumulative effect Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000806 elastomer Substances 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003014 reinforcing effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000004760 aramid Substances 0.000 description 1
- 229920003235 aromatic polyamide Polymers 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 239000007779 soft material Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M99/00—Subject matter not provided for in other groups of this subclass
- G01M99/007—Subject matter not provided for in other groups of this subclass by applying a load, e.g. for resistance or wear testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Actuator (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
估计装置对将表示与线性或非线性地变形的构件中的变形相应地按时间序列发生变化且种类不同的多个构件特性的物理量以及表示与构件的变形有关的性能状态的物理量的多组数据用作学习用数据、并以输入表示多个构件特性的物理量且输出表示与构件的变形有关的性能状态的物理量的方式进行了学习的学习模型,输入表示估计对象构件中的多个构件特性的物理量,来估计表示与估计对象构件的变形有关的性能状态的物理量。
Description
技术领域
本公开涉及一种估计装置、估计方法、程序以及学习模型生成装置。
背景技术
以往,包括弹簧构件和橡胶构件等弹性体的构件能够根据被施加的力而进行变形,在将包括弹性体的构件利用于装置的情况下,当包括该弹性体的构件发生不良状况时,装置会产生问题。因此,更换包括发生了不良状况的弹性体的构件来消除装置的问题。作为用于确定包括弹性体的构件中的不良状况的技术,已知有对产生于橡胶构件等弹性体的不良状况进行分析的技术(例如参照https://ieeexplore.ieee.org/document/8511330)。在该技术中,聚焦于在气动人工肌肉(PAM)的非线性模型中使用的未知的参数,来分析PAM的不良状况。在该分析中,针对PAM的一部分穿孔了的故障状态和正常状态,测定与收缩运动的增加对应的稳态响应等动态的变化,并与非线性模型的参数的变化相关联地分类为故障状态和正常状态。
发明内容
本公开的一个方式是一种估计装置,包括估计部,所述估计部对将表示与线性或非线性地变形的构件中的所述变形相应地按时间序列发生变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据用作学习用数据、并以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型,输入表示估计对象构件中的多个构件特性的物理量,来估计表示与所述估计对象构件的变形有关的性能状态的物理量。
附图说明
图1是示出第一实施方式所涉及的弹性体的性能估计装置的功能结构的一例的框图。
图2是第一实施方式所涉及的构件的说明图。
图3是示出第一实施方式所涉及的构件的结构的一例的图。
图4是使第一实施方式所涉及的学习模型进行学习的学习处理的说明图。
图5是示出第一实施方式所涉及的测定装置的一例的框图。
图6是示出第一实施方式所涉及的构件特性的一例的图。
图7是示出第一实施方式所涉及的理想环境下的电气特性的图。
图8是示出第一实施方式所涉及的学习数据收集处理的一例的流程图。
图9A是示出通过第一实施方式所涉及的测定装置收集到的电气特性的一例的图。
图9B是示出通过第一实施方式所涉及的测定装置收集到的压力特性的一例的图。
图10是示出第一实施方式所涉及的性能指标的工作循环中的电气特性的一例的图。
图11是第一实施方式所涉及的学习处理部中的学习处理的说明图。
图12是示出第一实施方式所涉及的学习处理的流程的一例的流程图。
图13是示出实现第一实施方式所涉及的弹性体的性能估计装置的各种功能的装置的一例的框图。
图14是示出第一实施方式所涉及的估计处理的流程的一例的流程图。
图15是示出验证橡胶致动器(rubber actuator)的性能状态而得到的验证结果的图。
图16是示出变形例的弹性体的性能估计装置的功能结构的框图。
图17是第二实施方式所涉及的学习处理部中的学习处理的说明图。
图18是示出第二实施方式所涉及的学习处理的流程的一例的流程图。
图19是第三实施方式所涉及的学习处理部中的学习处理的说明图。
图20是示出第三实施方式所涉及的学习处理的流程的一例的流程图。
具体实施方式
包括弹性体的构件的与变形有关的性能根据使用状况和经年变化等因素而逐渐地或急剧地降低。因此,即使能够对故障状态进行分类,也难以确定包括弹性体的构件中的故障等不良状况会对与变形有关的性能造成什么样的影响。例如,在进行使用了包括弹性体的构件的装置的控制的情况下,以包括弹性体的构件的与变形有关的性能为前提来形成装置。包括弹性体的构件的与变形有关的性能根据使用状况和经年变化等因素而逐渐地或急剧地降低。因此,要求确定包括弹性体的构件的与变形有关的性能。可是,如果在包括弹性体的构件发生不良状况后通过构件的更换等进行了应对,则会在运行过程中招致装置的停止,存在改善的余地。
本公开能够在构件产生问题之前估计构件的与变形有关的性能。
本公开的技术的第一方式是一种估计装置,
包括估计部,所述估计部对将表示与线性或非线性地变形的构件中的所述变形相应地按时间序列发生变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据用作学习用数据、并以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型,输入表示估计对象构件中的多个构件特性的物理量,来估计表示与所述估计对象构件的变形有关的性能状态的物理量。
第二方式是,在第一方式的估计装置中,
所述构件的电气特性与所述变形相应地变化,
表示所述多个构件特性的物理量包括表示使所述构件变形的压力特性的第一物理量以及表示与所述构件的变形相应地变化的电气特性的第二物理量,
表示与所述构件的变形有关的性能状态的物理量包括表示使所述构件进行过变形的频度的第三物理量,
所述学习模型以将所述第一物理量和所述第二物理量作为输入且输出所述第三物理量的方式进行学习。
第三方式是,在第二方式的估计装置中,
所述构件的内部被形成为空心,并且所述构件包括因向空心的所述内部供给加压流体而沿规定方向产生收缩力的弹性体,
所述第一物理量是表示供给所述加压流体和所述加压流体的供给解除的情况下的按时间序列的多个压力值的压力特性,
所述第二物理量是表示所述弹性体的与所述第一物理量相应地变化的按时间序列的多个电阻值的电气特性,
所述第三物理量是表示与将规定频度以多个阶段进行分割而得到的多个频度组中的各个频度组对应的性能状态的性能指标,所述规定频度被预先决定为表示能够维持规定性能并且能够进行变形的所述构件的性能状态的物理量。
第四方式是,在第二方式的估计装置中,
所述构件的内部被形成为空心,并且所述构件包括因向空心的所述内部供给加压流体而沿规定方向产生收缩力的弹性体,
所述第一物理量是表示供给所述加压流体和所述加压流体的供给解除的情况下的按时间序列的多个压力值的压力特性,
所述第二物理量是表示所述弹性体的与所述第一物理量相应地变化的按时间序列的多个电阻值的电气特性,
所述第三物理量是表示从使所述构件进行过变形的频度下的性能状态至达到被预先决定为能够维持规定性能并且能够进行变形的所述构件的性能状态的规定频度的性能状态的部件寿命指标。
第五方式是,在第一方式至第四方式中的任一方式的估计装置中,
所述学习模型是使用递归型神经网络进行学习而生成的模型。
第六方式是,在第一方式至第五方式中的任一方式的估计装置中,
所述学习模型是使用基于储备池计算的网络进行学习而生成的模型。
第七方式是,在第一方式至第五方式中的任一方式的估计装置中,
所述学习模型是使用基于物理储备池计算的网络进行学习而生成的模型,所述物理储备池计算使用了积累有表示所述构件的工作状态的物理量、表示与所述变形相应地变化的构件特性的物理量以及表示所述构件的性能的物理量的多组数据的储备池。
第八方式是一种估计方法,在所述估计方法中计算机进行以下处理:
对将表示与线性或非线性地变形的构件中的所述变形相应地按时间序列变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据用作学习用数据、并以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型,输入表示估计对象构件中的多个构件特性的物理量,来估计表示与所述估计对象构件的变形有关的性能状态的物理量。
第九方式是一种程序,用于使计算机作为估计部而发挥功能,
所述估计部对将表示与线性或非线性地变形的构件中的所述变形相应地按时间序列变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据用作学习用数据、并以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型,输入表示估计对象构件中的多个构件特性的物理量,来估计表示与所述估计对象构件的变形有关的性能状态的物理量。
第十方式是一种学习模型生成装置,包括:
获取部,其获取表示与线性或非线性地变形的构件中的所述变形相应地按时间序列变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据;以及
学习模型生成部,其基于所述获取部的获取结果,来生成以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型。
根据本公开,能够在构件产生故障和问题之前估计构件的与变形有关的性能。
下面,参照附图来详细地说明实现本公开的技术的实施方式。
此外,在全部附图中,对作用、功能起到相同效果的构成要素和处理标注相同的附图标记,有时适当地省略重复的说明。另外,本公开不受下面的实施方式的任何限定,能够在本公开的目的的范围内适当地施加变更并进行实施。另外,在本公开中,主要说明对非线性地变形的构件进行的物理量的估计,但是当然也能够应用于对线性地变形的构件进行的物理量的估计。
在本公开中,“构件”是包括非线性地发生变形且电气特性与变形相应地变化的材料的概念。“弹性体”是构件的一例,是包括橡胶、发泡材料以及树脂材料等柔软的材料的概念。另外,“弹性收缩体”是弹性体的一例,是包括根据被赋予的物理量而沿规定方向产生收缩力的构件的概念。产生收缩力的规定方向既可以是二维地表现的表示伸缩的直线方向,也可以是三维地表现的表示挠曲的曲线方向。另外,弹性收缩体包括构件,该构件的内部被形成为空心,并且因向该空心的内部供给加压流体而沿规定方向产生收缩力。
橡胶构件等柔软的弹性体对于被施加的力而呈现非线性的行为。例如,当从形状变化的观点来看二维的形状变化时,与所施加的力(即,物理量或能量)相应地在某方向(例如直线方向)上伸缩的距离非线性地发生变化(参照图2)。例如,长度与所施加的压力的大小相应地变化的弹性体根据压力的增减方向而长度的变化特性不同(例如,在压力P1和P2下为相同的长度L1。)。
另外,包括橡胶构件等柔软的弹性体的构件存在由于重复膨胀收缩(在二维的形状变化中为伸缩)等变形而性能从制造当初的性能(例如,表示膨胀收缩力的性能)降低的情况。因此,本公开的估计装置使用预先进行了学习的学习模型,针对非线性地变形的构件,在构件产生故障和问题之前估计表示构件的与变形有关的性能状态的物理量。
具体地说,本公开的估计装置包括学习模型。学习模型使用将表示多个构件特性的物理量与表示构件的性能状态的物理量进行对应所得到的多个学习用数据来进行学习。表示多个构件特性的物理量是表示与变形相应地按时间序列变化且种类不同的多个构件特性的物理量。在该学习中,以将表示多个构件特性的物理量作为输入且输出表示构件的性能状态的物理量的方式进行学习。使用进行了学习的该学习模型,输入表示估计对象构件的多个构件特性的物理量,将其输出估计为表示所述估计对象构件的性能状态的物理量。
(第一实施方式)
在图1中示出作为本公开的估计装置的、弹性体的性能估计装置1的结构的一例。
此外,在本实施方式中,为了掌握弹性体中的物理量,作为一例,说明对如下的弹性收缩体应用了本公开的技术的情况,该弹性收缩体包括非线性地变形的弹性体中的橡胶构件等柔软的弹性体,并且该弹性收缩体根据被赋予的物理量而在规定方向上产生收缩力。即,在本实施方式中,对在估计弹性收缩体的性能状态的估计处理中应用本公开的技术的情况进行说明。
下面,对作为弹性收缩体的一例应用公知技术的气囊型的弹性收缩体的情况进行说明(例如,参照日本特公昭52-40378号)。
气囊型的弹性收缩体的一例(下面称为橡胶致动器2。)具有通过有机或无机高张力纤维、例如芳香族聚酰胺纤维的编织增强结构覆盖由橡胶构件等柔软的弹性体构成的管状体的外周所得到的主体21,并且通过闭塞构件23将两端开口22密封。橡胶致动器2因经由设置于该闭塞构件23的连接口24向内部空洞供给加压流体而膨胀变形,沿着轴线方向产生收缩力。由于该橡胶致动器2发生膨胀变形,橡胶致动器2的长度发生变化。其中,将橡胶致动器2作为应用对象仅是一例,本公开的估计装置也能够应用于除橡胶致动器2以外的弹性收缩体或包括弹性体的构件。
另外,如图3所示,橡胶致动器2具有主体21,该主体21的由具有内部空洞211的橡胶构件等构成的管状体212的外周被加强结构214覆盖。因向内部空洞211供给加压流体而发生膨胀变形,沿轴线方向产生收缩力。另外,当加压流体的供给被解除(或者排出加压流体)时,形状恢复。收缩力根据由加压流体的供给和供给的解除构成的工作循环、即主体21的膨胀收缩而变化。橡胶致动器2的长度与该收缩力相应地非线性地变化(图2)。该橡胶致动器2存在根据主体21重复膨胀收缩的变形或经年变化等使用状况而导致主体21产生问题的情况。例如,存在管状体212的一部分产生龟裂等问题部位216的情况。由于产生问题部位216,橡胶致动器2的性能从制造当初的性能状态(例如收缩力)下降。即,橡胶致动器2的性能状态发生变化。
对于由这样的橡胶致动器2的性能状态的变化引起的在橡胶致动器2的内部产生的问题部位,难以通过对结构的测量来确定。此外,虽然能够使用能够进行计算机断层摄像(CT扫描)的大规模装置检查橡胶致动器2的内部来确定问题部位,但是并不现实。因此,在本实施方式中,使用针对橡胶致动器2的性能状态预先进行了学习的学习模型来估计橡胶致动器2的与变形有关的性能状态。更具体地说,在产生因管状体212所产生的问题而引起的故障的状况和由于问题而变得难以使用的状况之前,不使用大规模装置而估计橡胶致动器2的性能状态。
在本实施方式中,说明对于表示种类不同的多个构件特性的物理量应用了表示压力特性的物理量和表示电气特性的物理量的一例。在以后的说明中,将表示构件特性的物理量称为构件特性。另外,将表示压力特性的物理量称为压力特性,将表示电气特性的物理量称为电气特性。对于压力特性,作为使橡胶致动器2变形的第一物理量,应用表示按时间序列的多个压力值的压力特性。具体地说,应用表示按时间序列变化的压力值、即用于通过压力施加和解除(工作循环)来使橡胶致动器2变形的向橡胶致动器2施加的按时间序列的多个压力值的压力特性。另外,对于电气特性,应用电阻值的电气特性来作为与橡胶致动器的变形相应地变化的第二物理量。具体地说,应用按时间序列变化的电阻值、即根据工作循环而按时间序列变化的多个电阻值的电气特性。
对于表示构件的与变形有关的性能状态的物理量,应用橡胶致动器2的性能指标来作为表示使橡胶致动器2进行过变形的频度的第三物理量。具体地说,应用表示与将橡胶致动器2能够维持规定性能并且能够进行变形的预先决定的规定频度(例如,工作不良状态、产生了问题的状态的频度)以多个阶段进行分割而得到的多个频度组中的各个频度组对应的性能状态的性能指标,该规定性能是橡胶致动器2能够沿规定方向进行收缩以及通过收缩的解除而能够恢复的性能状态。此外,详情后述,在本实施方式中,性能指标表示初期状态、中期状态以及后期状态中的某一个状态。该性能指标能够理解为构件能够维持性能的期间等的寿命。在该情况下,能够应用表示橡胶致动器2的寿命、即从某一频度下的性能状态至达到规定频度的性能状态的部件寿命指标,该规定频度被预先决定为能够维持规定性能并且能够进行变形的橡胶致动器2的性能状态。
在弹性体的性能估计装置1的估计处理中使用学习完毕的学习模型,该学习完毕的学习模型是针对橡胶致动器2将以性能数据为标签的压力数据和橡胶致动器2的电阻数据作为学习数据进行了机器学习的模型。性能数据是表示上述的橡胶致动器2的性能状态的物理量(性能指标)(参照图7)。压力数据是表示基于上述的工作循环的按时间序列的压力值的压力特性(参照图6)。电阻数据是表示基于工作循环的按时间序列的多个电阻值的电气特性(参照图6)。使用该学习完毕的学习模型,来估计与未知的橡胶致动器2的压力数据及电阻数据对应的橡胶致动器2的性能数据。即,弹性体的性能估计装置1估计根据橡胶致动器2的工作循环而非线性地变化的橡胶致动器2的性能状态。由此,即使是内部不可见且非线性地变形的橡胶致动器2,也能够不使用大规模装置而估计性能状态。
如图1所示,弹性体的性能估计装置1具备估计部5。对估计部5输入表示给予橡胶致动器2的压力的大小(基于工作循环的压力特性)的第一输入数据3来作为压力数据。另外,输入表示橡胶致动器2中的电气特性的大小(基于工作循环的电气特性)的第二输入数据4来作为电阻数据。另外,估计部5输出作为估计结果的表示橡胶致动器2的性能状态(性能指标)的输出数据6来作为性能数据。估计部5包括学习完毕的学习模型51。
学习模型51是完成了根据与变形相伴的按时间序列的橡胶致动器2的压力特性(第一输入数据3)和橡胶致动器2的电气特性(第二输入数据4)导出橡胶致动器2的性能状态(输出数据6)的学习的模型。学习模型51例如是规定学习完毕的神经网络的模型,表现为构成神经网络的节点(神经元)相互之间的连接的权重(强度)的信息的集合。
学习模型51是通过学习处理部52(图4)的学习处理而生成的。学习处理部52使用已测定的物理量作为橡胶致动器2中的按时间序列的物理量来进行学习处理。即,将按时间序列测定橡胶致动器2中的构件特性所得到的大量的数据作为学习数据。学习数据包括输入数据与同该输入数据对应的性能状态(输出数据6)的大量的组合,该输入数据包括压力特性(第一输入数据3)和电气特性(第二输入数据4)。此外,按时间序列的物理量例如也可以通过对压力值及电阻值赋予表示测定时刻的信息来将时间序列信息与压力值及电阻值进行对应。另外,也可以对上述的组合赋予表示测定时刻的信息来将时间序列信息与所述组合进行对应。
接着,对学习处理部52进行的学习处理进行说明。
首先,对学习处理中使用的学习数据进行说明。
在图5中示出对橡胶致动器2中的物理量进行测定的测定装置7的一例。
测定装置7在固定于基座71的安装板72上安装橡胶致动器2的一个闭塞构件23,另一个闭塞构件23安装于能够移动的可动板73。橡胶致动器2的连接口24与供给部75连通,该供给部75包括检测压力(使橡胶致动器2发生变形的第一物理量)的压力传感器,用于向橡胶致动器2供给加压流体。在橡胶致动器2的两端的闭塞构件23上安装有电气特性检测部76,该电气特性检测部76包括检测橡胶致动器2的电阻值(表示电气特性的第二物理量)的传感器。另外,安装有检测与可动板73之间的距离的激光传感器等距离传感器77的固定板74被固定于基座71。距离传感器77与长度确定部78连接。长度确定部78根据由距离传感器77检测出的距离来确定橡胶致动器2的长度。例如,长度确定部78事先存储未供给加压流体的初期状态(在图5中表示为初期状态200。)的橡胶致动器2的长度L和由距离传感器77检测出的距离(La)来作为初始值。而且,长度确定部78通过从初期状态的长度减去供给了加压流体的状态(在图5中表示为供给状态210。)的距离的差,能够确定橡胶致动器2的长度(L=Lb-La)。此外,测定装置7能够安装由负荷传感器和气压缸构成的气压检测部79。
此外,对上述的测定装置7包括用于确定橡胶致动器2的长度的结构的情况进行了说明,但是在本实施方式中,橡胶致动器2的长度的确定不是必须的,因此能够省略用于确定长度的结构。
另外,对供给部75连接计数器80。计数器80对通过由供给部75向橡胶致动器2的加压流体的供给和供给的解除构成的工作循环的循环数进行计数。用于对该工作循环的循环数进行计数的结构不限定于对供给部75连接计数器80。例如,也可以对针对供给部75的指示次数进行计数,也可以通过其它方法对工作循环的循环数进行计数。
测定装置7具备与供给部75、电气特性检测部76以及计数器80连接的控制器70。控制器70进行对供给部75的控制,获取在橡胶致动器2的工作循环时的橡胶致动器2的按时间序列的压力值和电阻值、以及工作循环的循环数(累计循环数)并相对应地进行存储。即,测定装置7在加压流体的供给控制中,能够按时间序列获取非线性地变形的橡胶致动器2的压力特性、电气特性以及循环数的多个数据组合。
具体地说,测定装置7能够以工作循环单位,针对压力特性和电气特性分别按时间序列获取该工作循环内的每隔微小时间(例如0.01秒)的压力值和电阻值。
在图6中示出针对橡胶致动器2的压力特性和电气特性(构件特性)的一例。在图6中示出了包括从测量开始的时间t0起、针对橡胶致动器2开始供给加压流体的时间t1、供给解除的时间t2、以及下一工作循环的测量开始的时间t3的构件特性。另外,将时间t0至时间t3的时间表示为基于一个周期Ta的工作循环。
如图6所示,针对橡胶致动器2的压力特性为,压力值从开始供给加压流体起急剧地上升,通过供给的解除而急剧地下降。电气特性在开始供给加压流体时和供给解除时急剧地变动。对于该工作循环中的压力特性和电气特性,分别每隔微小时间(例如0.01秒)按时间序列测量压力值和电阻值。按时间序列测量出的压力特性和电气特性(构件特性)是测定时的循环数(频度)的工作循环的压力特性和电气特性的分布,也能够理解为表示各波形的形状的图案。
橡胶致动器2被认为随着工作循环的循环数(累计循环数)增加而产生于管状体212的龟裂等问题部位216(图3)的数量、大小具有增大的倾向。随着问题部位216(图3)的数量、大小增大,橡胶致动器2的性能从制造当初的性能(例如表示收缩力的性能)下降。在像这样的问题部位216的数量、大小增加的状况中,橡胶致动器2的电气特性、例如工作循环内的电阻值的最大值具有增大的倾向。
在图7中示出在理想环境下执行橡胶致动器2的耐久试验的情况下估计出的电气特性。
如图7所示,橡胶致动器2的电气特性、例如工作循环内的电阻值的最大值具有随着累计循环数增加而变大的倾向。而且,在末期的循环数Cte时,橡胶致动器2成为无法发挥性能的例如故障状态。如果将从未使用状态的循环数“0”(Ct0)至末期的循环数Cte为止的循环数的范围设为橡胶致动器2的可工作范围CtX,则能够维持橡胶致动器2所具有的性能并且能够进行变形的循环数的性能维持范围CtY一致或变窄(CtX≥CtY)。在本实施方式中,使表示性能状态的性能指标与将性能维持范围CtY以多个阶段(例如三个阶段)进行分割而得到的多个工作循环组中的各个工作循环组进行对应。具体地说,将性能维持范围CtY分类为三个阶段,将表示初期状态、中期状态以及后期状态的性能指标与分类得到的各个循环数的组进行对应。表示初期状态的性能指标是针对循环数Ct0至循环数Ct1的范围的循环数而决定的,表示中期状态的性能指标是针对循环数Ct1至循环数Ct2的范围的循环数而决定的,表示后期状态的性能指标是针对循环数Ct2至循环数Ct3(≤Cte)的范围的循环数而决定的。由此,只要确定循环数就能够确认橡胶致动器2的性能状态。
此外,通过初期状态、中期状态以及后期状态表示的橡胶致动器2的性能指标能够理解为表示橡胶致动器2的寿命的指标。即,橡胶致动器2的性能维持范围按初期状态、中期状态以及后期状态的顺序变小。换言之,累计循环数按初期状态、中期状态以及后期状态的顺序增加。因此,到橡胶致动器2产生问题的末期的循环数Cte为止的循环数的量减少。因而,如果将可工作范围CtX(或性能维持范围CtY)的循环数的总量设为橡胶致动器的寿命,则相当于寿命按初期状态、中期状态以及后期状态的顺序变短。
但是,橡胶致动器2根据使用状况、个体差异而性能下降的程度发生变化。因而,即使确定了电阻值的最大值、循环数,也难以将表示初期状态、中期状态以及后期状态中的任一个性能状态的性能指标作为橡胶致动器2的性能状态而一概地进行对应。因此,在本实施方式中,以能够针对各个橡胶致动器2估计性能指标的方式生成学习模型51。
图5所示的控制器70能够构成为具备未图示的包括CPU的计算机,执行学习数据收集处理。
在图8中示出由控制器70执行的学习数据收集处理的一例。
如图8所示,在步骤S100中,控制器70对供给部75进行加压流体的供给和解除的工作循环的指示。在接下来的步骤S102中,控制器70获取工作循环中的橡胶致动器2的按时间序列的压力值(压力特性)及按时间序列的电阻值(电气特性)与循环数的物理量组合。在接下来的步骤S104中,临时地存储物理量组合(当前的工作循环中的物理量组合)。控制器70在步骤S106中判断是否符合预先决定的判定条件,在否定判断的情况下使处理返回到步骤S100,在肯定判断的情况下使处理进入步骤S108。判定条件应用探测到橡胶致动器2产生了故障等问题的情况以及达到了作为耐久试验而预先决定的规定数量的循环数的情况等任意的结束条件。
控制器70当在步骤S106中进行肯定判断时,在步骤S108中将性能指标与临时地存储的物理量组合进行对应,结束本处理例程。具体地说,针对橡胶致动器2的可工作范围CtX或性能维持范围CtY中的每个工作循环的按时间序列的压力值(压力特性)及电阻值(电气特性)与循环数的每个组合对应性能指标。
在图9A中示出与时间经过相应地由测定装置7的控制器70收集到的橡胶致动器2的电气特性的一例,在图9B中示出橡胶致动器2的压力特性的一例。图9A和图9B示出对未使用的橡胶致动器2进行了重复工作循环直到探测出故障为止的耐久试验时的与时间经过相应的初期状态、中期状态以及后期状态的各状态中的测定结果。此外,在图9A和图9B中,对电阻值(电气特性)和压力值(压力特性)进行了归一化(即,标准化),使得以工作循环为单位的最大值一致。在图示的例子中,橡胶致动器2的压力特性从初期状态至后期状态为大致一致的图案(图9B)。另一方面,电气特性成为随着时间经过而电气特性(电阻值)相对地逐渐不同的图案。特别是,工作循环的后半部分(加压流体的供给被解除的状态)中的电气特性(电阻值)出现了差异(图9A)。
控制器70将从橡胶致动器2的测定开始的循环数Ct0至末期的循环数Cte的可工作范围CtX(或CtY)按比例分配为三份(图7),并与初期状态、中期状态以及后期状态这三个阶段各自的性能指标进行对应。该按比例分配既可以是以使循环数相等的方式进行按比例分配,也可以是以表示稳定的电阻值等的特征性的电阻值为边界进行按比例分配。在与初期状态、中期状态以及后期状态的各性能指标对应的范围内的工作循环中,电气特性具有特征部分。
在图10中示出与初期状态、中期状态以及后期状态的各性能指标进行了对应的范围内的工作循环中的电气特性的一例。在图10中示出了对应有图9A所示的初期状态的性能指标的工作循环中的循环数Ct01时的电气特性。同样地,还示出了对应有中期状态的性能指标的循环数Ct11时的电气特性以及对应有后期状态的性能指标的循环数Ct21时的电气特性。此外,图10所示的电气特性进行了归一化(即标准化),使得以工作循环为单位的电阻值的最大值一致。在图10中,作为一例,将归一化前的电阻值Rx示出在各电气特性的图中。
如图10所示,电气特性虽然随着性能状态从初期状态向后期状态转变而电阻值的最大值变大,但是作为解除了加压流体的供给时的电气特性的分布的图案具有趋向稳定状态这一个特征部分。稳定状态表示电阻值的变动被抑制的特性。另一方面,虽然随着状态转变而电阻值的最小值变小,但是作为归一化后的电气特性的分布的图案的波形的形状在加压流体的解除侧逐渐转变为平坦的形状(在图10中以箭头的长度而示出)。在其它方面,随着从初期状态向后期状态转变而电阻值的最大值和最小值的变动幅度变大。另外,其它特征部分表示包括加压流体的解除侧的电气特性的下降率的程度、例如电阻值的变化率随着从初期状态向后期状态转变而变小等特征部分在内的特性。这些特性被认为会影响橡胶致动器2的性能状态,在学习处理中有效地发挥功能。
因而,控制器70通过进行向橡胶致动器2的加压流体的供给控制,能够对于橡胶致动器2的压力特性、电气特性以及循环数按时间序列进行获取,并与性能指标相对应地进行存储。包括按时间序列存储于该控制器70中的橡胶致动器2的压力特性、电气特性以及循环数与性能指标在内的表示性能状态的物理量的组合成为学习数据。
此外,优选的是,针对多个橡胶致动器2执行上述的图8所示的处理例程来收集更多的学习数据。
接着,参照图11来说明学习处理部52。
学习处理部52包括生成器54和运算器56。生成器54具有考虑按时间序列的输入的前后关系来生成输出的功能。
另外,学习处理部52保持有由测定装置7测定出的每个工作循环的第一输入数据3(压力特性)及第二输入数据4(电气特性)与输出数据6(性能状态)的大量的组合来作为学习用数据。
在图11所示的例子中,生成器54包括输入层540、中间层542以及输出层544,构成了公知的递归神经网络、例如循环神经网络(RNN:Recurrent Neural Network)。递归神经网络(例如RNN)本身是公知的技术,因此省略详细的说明,但中间层542包括具有节点间连接和反馈连接的大量的节点组(神经元组)。向该中间层542输入来自输入层540的数据,作为中间层542的运算结果的数据被输出到输出层544。
具体地说,生成器54是根据被输入的第一输入数据3(压力特性)和第二输入数据4(电气特性)来生成表示性能状态的生成输出数据6A的神经网络。在此,应用上述的性能指标来作为表示性能状态的物理量。该性能状态也可以是循环数。生成输出数据6A是根据第一输入数据3(压力特性)和第二输入数据4(电气特性)估计橡胶致动器2的性能状态(性能指标)所得到的数据。生成器54根据按时间序列输入的第一输入数据3(压力)和第二输入数据4(电气特性),来针对基于非线性变形的橡胶致动器2的性能状态(性能指标)生成表示与通过测定得到的性能状态(性能指标)接近的性能状态(性能指标)的生成输出数据。生成器54通过使用大量的第一输入数据3(压力特性)和第二输入数据4(电气特性)进行学习,能够生成更接近橡胶致动器的性能状态(性能指标)的测定结果的生成输出数据6A。
运算器56是将生成输出数据6A与学习数据的输出数据6进行比较并运算其比较结果的误差的运算器。学习处理部52将生成输出数据6A和学习数据的输出数据6输入到运算器56。与其相应地,运算器56运算生成输出数据6A与学习数据的输出数据6之间的误差,并输出表示其运算结果的信号。
学习处理部52使生成器54进行基于由运算器56运算出的误差来调整节点间的连接的权重参数的学习。具体地说,使用例如梯度下降法、误差逆传播法等方法,将生成器54中的输入层540与中间层542的节点间的连接的权重参数、中间层542内的节点间的连接的权重参数、以及中间层542与输出层544的节点间的连接的权重参数中的各个权重参数反馈给生成器54。即,以学习数据的输出数据6为目标,将所有的节点间的连接优化以使生成输出数据6A与学习数据的输出数据6之间的误差最小化。
学习模型51是通过学习处理部52的学习处理而生成的。学习模型51表现为作为学习处理部52的学习结果的、节点间的连接的权重参数(权重或强度)的信息的集合。
学习处理部52构成为具备未图示的包括CPU的计算机,能够执行学习处理。例如,如图12所示的学习处理的一例那样,在步骤S110中,学习处理部52获取作为针对橡胶致动器2按时间序列测定得到的结果的学习数据、即每个工作循环的第一输入数据3(压力特性)、第二输入数据4(电气特性)以及输出数据6(性能指标)。在步骤S112中,学习处理部52使用作为按时间序列测定得到的结果的学习数据来生成学习模型51。即,获得作为如上述那样使用大量的学习数据进行学习所得到的学习结果的、节点间的连接的权重参数(权重或强度)的信息的集合。然后,在步骤S114中,将表现为作为学习结果的节点间的连接的权重参数(权重或强度)的信息的集合的数据作为学习模型51进行存储。
此外,生成器54具有考虑按时间序列的输入的前后关系来生成输出的功能,上面说明了使用递归神经网络的一例,但本公开的技术不限定于使用递归神经网络。即,本公开的技术只要具有考虑按时间序列的输入的前后关系来生成输出的功能即可,也可以使用其它方法。
而且,在上述弹性体的性能估计装置1中,使用通过上面例示的方法生成的学习完毕的生成器54(即,表现为作为学习结果的节点间的连接的权重参数的信息的集合的数据)来作为学习模型51。若使用充分地进行了学习的学习模型51,则对于非线性地变形的橡胶致动器,根据以工作循环为单位的按时间序列的基于压力值的压力特性和基于电阻值的电气特性来估计性能状态(性能指标)也并非不可能。即,弹性体的性能估计装置1能够根据作为估计对象的橡胶致动器2中的工作循环的压力特性和电气特性,估计作为性能状态的初期状态、中期状态以及后期状态中的某一个状态的性能指标来作为输出。
此外,学习处理部52进行的处理是本公开的学习模型生成装置的处理的一例。另外,弹性体的性能估计装置1是本公开的估计部和估计装置的一例。
上述的弹性体的性能估计装置1例如能够通过使计算机执行表示上述的各功能的程序来实现。
在图13中示出执行用于实现弹性体的性能估计装置1的各种功能的处理的执行装置构成为包括计算机的情况的一例。
图13所示的作为弹性体的性能估计装置1而发挥功能的计算机具备计算机主体100。计算机主体100具备CPU 102、易失性存储器等RAM 104、ROM 106、硬盘装置(HDD)等辅助存储装置108以及输入输出接口(I/O)110。这些CPU 102、RAM 104、ROM 106、辅助存储装置108以及输入输出I/O 110是以能够相互传输数据和指令的方式经由总线112进行了连接的结构。另外,通信接口(I/F)114、以及显示器、键盘等操作显示部116与输入输出I/O 110连接。通信I/F 114作为与外部装置之间输入和输出第一输入数据3、第二输入数据4以及输出数据6的输入输出部而发挥功能。
在辅助存储装置108中存储有用于使计算机主体100作为本公开的估计装置的一例、即弹性体的性能估计装置1而发挥功能的控制程序108P。CPU 102从辅助存储装置108读取控制程序108P并在RAM 104中展开来执行处理。由此,执行了控制程序108P的计算机主体100作为本公开的估计装置的一例、即弹性体的性能估计装置1而进行动作。
此外,在辅助存储装置108中存储有包括学习模型51的学习模型108M和包括各种数据的数据108D。控制程序108P也可以通过CD-ROM等记录介质来提供。
接着,对通过计算机实现的弹性体的性能估计装置中的估计处理进行说明。
在图14中示出基于在计算机主体100中执行的控制程序108P的估计处理的流程的一例。
图14所示的估计处理是当对计算机主体100接通电源时由CPU 102执行的处理。即,CPU 102从辅助存储装置108读取控制程序108P并在RAM 104中展开来执行处理。
首先,在步骤S200中,CPU 102从辅助存储装置108的学习模型108M读取学习模型51并在RAM 104中展开,由此获取学习模型51。具体地说,将成为基于表现为学习模型51的权重参数的节点间连接的网络模型在RAM 104中展开。因此,构筑实现了基于权重参数的节点间连接的学习模型51。
接着,在步骤S202中,CPU 102经由通信I/F 114获取成为估计橡胶致动器2的性能状态的对象的未知的第一输入数据3(压力特性)和未知的第二输入数据4(电气特性)。即,获取性能状态未知的橡胶致动器2中的基于工作循环的压力特性和电气特性。
接着,在步骤S204中,CPU 102使用获取到的学习模型51,来估计与获取到的第一输入数据3(压力特性)及第二输入数据4(电气特性)对应的输出数据6(表示橡胶致动器2的性能状态的性能指标)。
然后,在接下来的步骤S206中,经由通信I/F 114输出作为估计结果的输出数据6(性能指标),并结束本处理例程。
此外,图14所示的估计处理是通过本公开的估计方法执行的处理的一例。
如上面说明的那样,根据本实施方式,对于性能状态未知的橡胶致动器2,能够根据该橡胶致动器2中的基于工作循环的第一输入数据3(压力特性)和第二输入数据4(电气特性),来估计橡胶致动器2的性能状态。即,能够通过输入性能状态未知的橡胶致动器2中的基于工作循环的压力特性和电气特性,来估计初期状态、中期状态以及后期状态中的某一个状态的性能指标作为橡胶致动器2的性能状态。因此,能够通过按时间序列检测工作循环中的橡胶致动器2的压力值和电阻值,来估计橡胶致动器2的性能状态,不需要使用大规模的装置来测量该性能状态。由此,根据本实施方式,能够确定难以通过直接测量橡胶致动器2的结构来确定的橡胶致动器2的性能状态。
接着,对估计橡胶致动器2的性能状态所得到的估计结果进行了验证。
在图15中示出了针对多个橡胶致动器2验证根据基于工作循环的压力特性和电气特性估计出的性能指标的估计结果所得到的验证结果。
在该验证中,测量产生于管状体212的龟裂等问题部位216(图3)的数量、大小,将根据其测量结果分类为初期状态、中期状态以及后期状态中的某一个状态的性能指标的多个橡胶致动器2中的各个橡胶致动器2设为估计对象。而且,针对作为估计对象的橡胶致动器2中的各个橡胶致动器2,获取上述的分类时间点的工作循环的压力特性和电气特性,并估计出各个性能指标。图15中的估计结果表示测量得到的分类结果与根据工作循环的压力特性及电气特性得到的估计结果之间的对应数量。
如图15所示,根据上述的弹性体的性能估计装置1,能够针对橡胶致动器2确认出估计结果与测量得到的分类结果处于适当的对应关系。
(第一变形例)循环数
在上述中,说明了估计性能指标来作为表示性能状态的物理量的情况,但是本公开不限定于此。例如,也可以估计预先决定的标准的橡胶致动器2的可工作范围CtX内、或者性能维持范围CtY内的循环数来作为表示性能状态的物理量。
具体地说,将上述的输出数据6的性能指标替换为预先决定的标准的橡胶致动器2的循环数(累计循环数),通过学习处理部52的学习处理来生成学习模型51即可。此外,能够通过多个橡胶致动器中的可工作范围CtX或性能维持范围CtY的平均值、标准偏差等的运算来导出标准的橡胶致动器2的循环数(累计循环数)。
像这样,通过估计标准的橡胶致动器2的循环数,能够通过工作循环的循环数(累计循环数)来定量地确认作为估计对象的橡胶致动器2的在估计性能状态时的性能状态。
(第二变形例)寿命估计
在上述中,说明了估计性能指标或循环数来作为表示性能状态的物理量的情况,但是本公开不限定于此。例如,也可以估计表示橡胶致动器2的寿命的信息来作为表示性能状态的物理量。
具体地说,使用上述的标准的橡胶致动器2中的循环数的估计,并将作为估计对象的橡胶致动器2中的能够工作的循环数应用为部件寿命指标即可。例如,将上述的标准的橡胶致动器2中的末期的循环数Cte预先存储于存储器,通过从末期的循环数Cte减去所估计出的循环数,能够将在针对作为估计对象的橡胶致动器2估计性能状态时剩余的循环数应用为部件寿命指标。
像这样,通过估计橡胶致动器2的寿命,能够定量地确认作为估计对象的橡胶致动器2所剩余的工作循环的循环数、即寿命。由此,例如能够设定在作为估计对象的橡胶致动器2产生问题之前进行更换等维护的时期。
此外,通过应用上述例子的三个阶段的性能指标、四个阶段以上的多个阶段性的性能指标都能够应用为表示橡胶致动器2的寿命的信息。即,能够通过确定所估计出的性能指标处于末期的循环数Cte为止的哪个阶段,来设为表示橡胶致动器2的寿命的信息。
(第三变形例)仅利用电气特性进行估计
在上述中,针对性能状态未知的橡胶致动器2,根据该橡胶致动器2中的基于工作循环的第一输入数据3(压力特性)和第二输入数据4(电气特性),来估计橡胶致动器2的性能状态。本公开的技术不限定于使用压力特性和电气特性双方来作为输入数据。例如,在作为估计对象的橡胶致动器2以基于预先决定的稳定的压力特性的工作循环进行工作的情况下,通过预先存储压力特性并使用所存储的压力特性,能够省略第一输入数据3(压力特性)。
具体地说,如图16所示,在估计部5中事先存储表示第一输入数据3(压力特性)的信息3M即可。通过这样构成,针对作为估计对象的橡胶致动器2,仅获取给予了压力刺激3P时的电气特性来作为第二输入数据,就能够估计性能状态。
(第二实施方式)
接着,说明第二实施方式。第二实施方式是考虑在估计橡胶致动器2的性能状态时提高估计速度的情形的实施方式。此外,第二实施方式是与第一实施方式大致同样的结构,因此对相同的部分标注相同的附图标记并省略详细的说明。
在一般的递归神经网络中,针对从输入层540向中间层542的节点的连接、中间层542中的节点间的连接及反馈连接、以及从中间层542向输出层544的节点间的连接中的各个连接,将权重参数的信息优化(图11)。但是,对于非线性地变形的橡胶致动器2使用具有时间上的相关性的时间序列数据进行的学习要求庞大的学习时间。另外,在利用按时间序列的学习数据进行学习时,为了进行时间上的追溯,还要求庞大的存储器。
以抑制该要求庞大的时间的学习时间为目的,能够在非线性地变形的橡胶致动器2的长度估计中应用被称为储备池计算的周知的网络模型。被称为储备池计算(RC:Reservoir Computing)的网络模型(下面称为RCN)本身是公知的技术,因此省略详细的说明,但RCN的一例是将递归神经网络的一部分固定(置换为随机的网络)且仅将从中间层542向输出层544的节点间的连接优化。
参照图17来说明使用RCN的学习处理部52A中的学习处理。图17所示的学习处理部52A将图11所示的生成器54替代为生成器54A,将由运算器56导出的误差仅反映在输出层544侧来进行学习,这一点与图11所示的学习处理部52不同。
如图17所示,学习处理部52的生成器54A包括与图11同样的输入层540、代替图11的中间层542且与图11同样的结构的储备池层543、以及与图11同样的输出层544,构成了公知的RCN。在RCN中,针对从输入层540向储备池层543的节点的连接、以及储备池层543中的节点间的连接及反馈连接,设定固定的权重参数的信息(下面称为权重系数)。而且,从储备池层543向输出层544的节点间的连接例如设为线性连接,各个权重参数通过学习数据的学习而被优化。
此外,假设固定的权重系数是预先设定的。该固定的权重系数能够设定作为初始值所决定的系数。另外,关于固定的权重系数,也可以设定使用学习数据并以学习数据的输出数据6为目标来以使生成输出数据6A与学习数据的输出数据6的误差最小化的方式将节点间等的连接进行了对于使误差最小化而言不充分的规定次数或规定时间的优化的情况下的权重系数。
另一方面,规定从储备池层543向输出层544的节点间的连接的权重参数是使用大量的学习数据以使生成输出数据6A与学习数据的输出数据6的误差最小化的方式进行学习而导出的。
包括生成器54A的学习处理部52A构成为具备未图示的包括CPU的计算机,能够执行学习处理。例如,如图18所示的学习处理的一例那样,学习处理部52A获取第一输入数据3(压力特性)、第二输入数据4(电气特性)以及输出数据6(性能指标)来作为学习数据(步骤S120),并构筑输入层540和储备池层543(步骤S122)。在此,虽然与图11所示的生成器54同样,但使用一部分学习数据来进行学习处理。具体地说,获得作为使用一部分学习数据进行学习所得到的学习结果的节点间的连接的权重参数的信息的集合,导出从输入层540向储备池层543的节点的连接、以及储备池层543中的节点间的连接及反馈连接来作为权重系数。通过根据导出的该权重系数来确定输入层540和储备池层543,从而构筑输入层540和储备池层543。
接着,学习处理部52A使用作为按时间序列测定得到的结果的大量学习数据来生成学习模型51(步骤S124)。即,通过仅对从储备池层543向输出层544的节点间的连接进行学习并获得作为学习结果的节点间的连接的权重参数的信息的集合,从而构筑RCN。然后,将在步骤S122中导出的权重系数和步骤S124的表现为作为学习结果的节点间的连接的权重参数的信息的集合的数据作为学习模型51进行存储(步骤S126)。
而且,在上述弹性体的性能估计装置1中,使用所生成的学习完毕的生成器54A作为学习模型51。即,在此,表示从输入层540向储备池层543的节点的连接以及储备池层543中的节点间的连接及反馈连接的权重系数、以及表示从储备池层543向输出层544的节点间的连接的权重参数与学习模型51对应。若使用充分进行了学习的学习模型51,则对于非线性地变形的橡胶致动器,根据工作循环中的压力特性和电气特性来估计性能指标也并非不可能。
如上面说明的那样,根据本实施方式,代替一般的递归神经网络,而通过RCN构筑网络来将学习模型51优化。由此,与通过一般的递归神经网络来构筑学习模型的情况相比,能够抑制所需要的学习时间。另外,在一般的递归神经网络中,也能够抑制为了进行时间上的追溯所需要的庞大的存储器(存储器容量)。
(第三实施方式)
接着,说明第三实施方式。第三实施方式是考虑提高用于估计橡胶致动器2的性能状态的学习模型51的学习效果的实施方式。此外,第三实施方式是与第一实施方式及第二实施方式大致同样的结构,因此对相同的部分标注相同的附图标记并省略详细的说明。
如上述那样,通过使用将递归神经网络的一部分固定的RCN,能够抑制学习时间。但是,在对于从输入层540向储备池层543的节点的连接以及储备池层543中的节点间的连接及反馈连接使用了固定的权重参数的情况下,存在学习的效果不充分的情况。这是由于即使学习从储备池层543向输出层544的节点间的连接的权重参数,在基于固定的权重参数而设定了有限个数的节点的储备池层543中,有时从储备池层543的输出也不是优化充分的输出。因此,设想使储备池层543中使用的递归神经网络的结构复杂,但会需要储备池层543的设定时间,因此并不优选。
另外,储备池计算(RCN)如周知的那样是将输入通过向高维空间进行非线性变换来射影到高维的特征空间。针对这一点,代替递归神经网络,已知有在储备池层543中使用非线性的动态系统的被称为物理储备池计算(PRC:Physical Reservoir Computing)的网络模型(下面称为PRCN)。PRC和PRCN本身是公知的技术,因此省略详细的说明,但是能够利用为在储备池层543中贮存与非线性地变形的橡胶致动器2的变形相关的数据。即,PRCN能够较佳地应用于非线性地变形的橡胶致动器2的性能状态的估计。
在此,参照图19来说明学习处理部52B中的学习处理。图19所示的学习处理部52B将图17所示的生成器54A替代为生成器54B,将由运算器56导出的误差仅反映在输出层544侧来进行学习,这一点与图17所示的学习处理部52A的不同。
如图19所示,学习处理部52B的生成器54B包括与图11同样的输入层540、代替图17的储备池层543的物理储备池层545、以及与图11同样的输出层544,构成了公知的PRCN。PRCN本身是公知的技术,因此省略详细的说明,但在PRCN中,如上述那样针对从输入层540向储备池层543的节点的连接设定固定的权重系数。物理储备池层545构成为针对大量的按时间序列的相关关系贮存特征量并输出与输入接近的多个特征量。而且,从物理储备池层545向输出层544的节点间的连接例如设为线性连接,各个权重参数通过使用大量的学习数据进行使生成输出数据6A与学习数据的输出数据6的误差最小化的学习来被优化。
此外,固定的权重系数如上述那样可以设定作为初始值所决定的系数,也可以设定使用学习数据进行了规定次数或规定时间的优化的情况下的权重系数。
物理储备池层545贮存橡胶致动器2的大量的按时间序列的物理上的相关关系,提取与来自输入层540的未知的输入数据(压力特性和电气特性)接近的输入数据(压力特性和电气特性)所对应的性能状态(性能指标),并作为多个特征量输出到输出层544。在概念上,作为橡胶致动器2的行为,针对在工作循环中按时间序列变化的压力特性和电气特性,事先存储大量的与作为性能状态的性能指标的相关关系,选择与未知的输入(压力特性和电气特性)接近的多个橡胶致动器2的性能状态(性能指标)中的各个性能状态(性能指标)作为特征量并进行输出。由此,能够抑制执行复杂的计算。
包括生成器54B的学习处理部52B构成为具备未图示的包括CPU的计算机,能够执行学习处理。例如,如图20所示的学习处理的一例那样,学习处理部52B获取作为按时间序列测定得到的结果的学习数据、即第一输入数据3(压力特性)、第二输入数据4(电气特性)以及输出数据6(性能状态)(步骤S130),构筑输入层540和物理储备池层545(步骤S132)。输入层540设为设定预先决定的权重系数的层。因此,通过根据预先决定的权重系数来确定从输入层540向物理储备池层545的节点的连接,从而构筑输入层540。另一方面,物理储备池层545设为贮存有大量的各个学习数据,即针对工作循环的压力特性和电气特性贮存有大量的与性能状态的相关关系。因此,物理储备池层545通过针对基于学习数据的按时间序列变化的压力值和电阻值贮存与作为非线性行为的长度的相关关系来作为特征量并构成为输出其中的与输入接近的多个特征量来构筑。
接着,在步骤S134中,学习处理部52B使用作为按时间序列测定得到的结果的大量的学习数据来生成学习模型51。即,通过仅对从物理储备池层545向输出层544的节点间的连接进行学习并获得作为学习结果的节点间的连接的权重参数的信息的集合,由此构筑PRCN。接着,将在步骤S132中导出的权重系数、以及作为步骤S134的学习结果的表现为节点间的连接的权重参数的信息的集合的数据作为学习模型51进行存储(步骤S136)。
而且,在上述弹性体的性能估计装置1中,将所生成的学习完毕的生成器54B用作学习模型51。即,在此,表示从输入层540向物理储备池层545的节点的连接、物理储备池层545、以及从物理储备池层545向输出层544的节点间的连接的权重参数与学习模型51对应。
弹性体的性能估计装置1针对作为未知的输入数据的与工作循环对应的橡胶致动器2的压力特性及电气特性,提取物理储备池层545中所贮存的橡胶致动器2的按时间序列的物理上的相关关系中的、与来自输入层540的未知的输入数据(压力特性和电气特性)接近的输入数据(压力特性和电气特性)所对应的性能状态(性能指标),并作为多个特征量输出到输出层544。然后,输出层544根据进行学习所得到的权重参数将来自物理储备池层545的多个特征量例如进行线性连接而估计为橡胶致动器2的性能状态(性能指标)。若使用充分地进行了学习的学习模型51,则对于橡胶致动器2,根据压力特性和电气特性来估计性能状态(性能指标)也并非不可能。
如上面说明的那样,根据本公开,代替RCN而通过PRCN构筑网络来将学习模型51优化。由此,与通过RCN构筑学习模型的情况相比,实现学习模型51的学习效果的提高。
像这样,代替RCN而通过PRCN构筑网络来将学习模型51优化,由此能够估计出与实际的橡胶致动器2的长度极为接近的橡胶致动器2的长度。
如上述那样,在本公开中,说明了应用橡胶致动器来作为构件的情况,但是当然构件并不限定于橡胶致动器。另外,说明如下的情况:作为与构件的变形相应地变化且种类不同的至少三个物理量,将表示压力的大小的压力值作为第一物理量,将表示电气特性的大小的电阻值作为第二物理量,将表示变形的大小的长度作为目标物理量,根据压力值和电阻值来估计长度。但是,第一物理量、第二物理量以及目标物理量的各个物理量并不限定于此,目标物理量也可以设定为压力值或电阻值。
上面使用各实施方式进行了说明,但是本公开的技术范围不限定于上述实施方式所记载的范围。能够在不脱离要旨的范围内对上述实施方式施加各种变更或改进,施加该变更或改进所得到的方式也包含在本公开的技术范围内。
另外,在上述实施方式中,说明了通过基于使用流程图的处理的软件结构来实现检查处理的情况,但不限定于此,例如也可以设为通过硬件结构来实现各处理的方式。
另外,也可以将弹性体的性能估计装置的一部分、例如学习模型等神经网络构成为硬件电路。
在2021年5月11日申请的日本专利申请2021-080622号的公开整体通过参照并入本说明书。关于本说明书所记载的所有的文献、专利申请以及技术标准,与具体地且个别地记载各个文献、专利申请以及技术标准以参照的形式并入的情况相同程度地以参照的形式并入本说明书中。
Claims (10)
1.一种估计装置,包括估计部,所述估计部对将表示与线性或非线性地变形的构件中的所述变形相应地按时间序列发生变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据用作学习用数据、并以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型,输入表示估计对象构件中的多个构件特性的物理量,来估计表示与所述估计对象构件的变形有关的性能状态的物理量。
2.根据权利要求1所述的估计装置,其中,
所述构件的电气特性与所述变形相应地变化,
表示所述多个构件特性的物理量包括表示使所述构件变形的压力特性的第一物理量以及表示与所述构件的变形相应地变化的电气特性的第二物理量,
表示与所述构件的变形有关的性能状态的物理量包括表示使所述构件进行过变形的频度的第三物理量,
所述学习模型以将所述第一物理量和所述第二物理量作为输入且输出所述第三物理量的方式进行学习。
3.根据权利要求2所述的估计装置,其中,
所述构件的内部被形成为空心,并且所述构件包括因向空心的所述内部供给加压流体而沿规定方向产生收缩力的弹性体,
所述第一物理量是表示供给所述加压流体和所述加压流体的供给解除的情况下的按时间序列的多个压力值的压力特性,
所述第二物理量是表示所述弹性体的与所述第一物理量相应地变化的按时间序列的多个电阻值的电气特性,
所述第三物理量是表示与将规定频度以多个阶段进行分割而得到的多个频度组中的各个频度组对应的性能状态的性能指标,所述规定频度被预先决定为表示能够维持规定性能并且能够进行变形的所述构件的性能状态的物理量。
4.根据权利要求2所述的估计装置,其中,
所述构件的内部被形成为空心,并且所述构件包括因向空心的所述内部供给加压流体而沿规定方向产生收缩力的弹性体,
所述第一物理量是表示供给所述加压流体和所述加压流体的供给解除的情况下的按时间序列的多个压力值的压力特性,
所述第二物理量是表示所述弹性体的与所述第一物理量相应地变化的按时间序列的多个电阻值的电气特性,
所述第三物理量是表示从使所述构件进行过变形的频度下的性能状态至达到被预先决定为能够维持规定性能并且能够进行变形的所述构件的性能状态的规定频度的性能状态的部件寿命指标。
5.根据权利要求1至4中的任一项所述的估计装置,其中,
所述学习模型是使用递归型神经网络进行学习而生成的模型。
6.根据权利要求1至5中的任一项所述的估计装置,其中,
所述学习模型是使用基于储备池计算的网络进行学习而生成的模型。
7.根据权利要求1至5中的任一项所述的估计装置,其中,
所述学习模型是使用基于物理储备池计算的网络进行学习而生成的模型,所述物理储备池计算使用了积累有表示所述构件的工作状态的物理量、表示与所述变形相应地变化的构件特性的物理量以及表示所述构件的性能的物理量的多组数据的储备池。
8.一种估计方法,在所述估计方法中计算机进行以下处理:
对将表示与线性或非线性地变形的构件中的所述变形相应地按时间序列变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据用作学习用数据、并以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型,输入表示估计对象构件中的多个构件特性的物理量,来估计表示与所述估计对象构件的变形有关的性能状态的物理量。
9.一种程序,用于使计算机作为估计部而发挥功能,
所述估计部对将表示与线性或非线性地变形的构件中的所述变形相应地按时间序列变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据用作学习用数据、并以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型,输入表示估计对象构件中的多个构件特性的物理量,来估计表示与所述估计对象构件的变形有关的性能状态的物理量。
10.一种学习模型生成装置,包括:
获取部,其获取表示与线性或非线性地变形的构件中的所述变形相应地按时间序列变化且种类不同的多个构件特性的物理量以及表示与所述构件的变形有关的性能状态的物理量的多组数据;以及
学习模型生成部,其基于所述获取部的获取结果,来生成以输入表示所述多个构件特性的物理量且输出表示与所述构件的变形有关的性能状态的物理量的方式进行了学习的学习模型。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021080622A JP2022174668A (ja) | 2021-05-11 | 2021-05-11 | 推定装置、推定方法、プログラム、及び学習モデル生成装置 |
JP2021-080622 | 2021-05-11 | ||
PCT/JP2022/019726 WO2022239749A1 (ja) | 2021-05-11 | 2022-05-09 | 推定装置、推定方法、プログラム、及び学習モデル生成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117396744A true CN117396744A (zh) | 2024-01-12 |
Family
ID=84029612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280033593.4A Pending CN117396744A (zh) | 2021-05-11 | 2022-05-09 | 估计装置、估计方法、程序以及学习模型生成装置 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4339583A1 (zh) |
JP (1) | JP2022174668A (zh) |
CN (1) | CN117396744A (zh) |
WO (1) | WO2022239749A1 (zh) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5240378A (en) | 1975-09-27 | 1977-03-29 | Kansai Keiki Kogyo Kk | Rotary tester for disc of watthour meter |
JP3034917B2 (ja) * | 1990-07-24 | 2000-04-17 | オリンパス光学工業株式会社 | 内視鏡装置 |
JPH07319507A (ja) * | 1994-05-26 | 1995-12-08 | Bridgestone Corp | ロボット制御装置 |
WO2011086638A1 (ja) * | 2010-01-15 | 2011-07-21 | パナソニック株式会社 | 弾性体アクチュエータ駆動機構の制御装置及び制御方法、並びに、制御プログラム |
JP5432420B2 (ja) * | 2011-08-12 | 2014-03-05 | パナソニック株式会社 | 空圧人工筋駆動機構の制御装置、制御方法、および制御プログラム |
US20150369264A1 (en) * | 2014-06-20 | 2015-12-24 | The Regents Of The University Of Michigan | Sensing method for fiber-driven motion systems |
CN104834808A (zh) * | 2015-04-07 | 2015-08-12 | 青岛科技大学 | 基于bp神经网络的橡胶减振器使用寿命预测方法 |
JP2017101809A (ja) * | 2015-12-04 | 2017-06-08 | 国立大学法人 岡山大学 | 人工筋 |
TWM590060U (zh) | 2019-11-18 | 2020-02-01 | 邱永順 | 遮罩 |
-
2021
- 2021-05-11 JP JP2021080622A patent/JP2022174668A/ja active Pending
-
2022
- 2022-05-09 EP EP22807450.6A patent/EP4339583A1/en active Pending
- 2022-05-09 WO PCT/JP2022/019726 patent/WO2022239749A1/ja active Application Filing
- 2022-05-09 CN CN202280033593.4A patent/CN117396744A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4339583A1 (en) | 2024-03-20 |
JP2022174668A (ja) | 2022-11-24 |
WO2022239749A1 (ja) | 2022-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114829870B (zh) | 估计装置、估计方法、程序以及学习模型生成装置 | |
CN101832872A (zh) | 基于空间坐标监测的识别受损索和支座位移的递进式方法 | |
CN114117840A (zh) | 一种基于仿真和试验数据混合驱动的结构性能预测方法 | |
CN117396744A (zh) | 估计装置、估计方法、程序以及学习模型生成装置 | |
WO2020166236A1 (ja) | 作業効率評価方法、作業効率評価装置、及びプログラム | |
CN113688465B (zh) | 一种基于载荷与状态结合的飞行器结构强度数字孪生方法 | |
Jung et al. | Prediction of nonlinear stiffness of automotive bushings by artificial neural network models trained by data from finite element analysis | |
CN105574260A (zh) | 一种多失效模式零部件的寿命指标评定方法 | |
CN112100769A (zh) | 电梯部件性能模型构建方法 | |
US20240219268A1 (en) | Estimation device, estimation method, program, and learning model generation device | |
WO2023189445A1 (ja) | 推定装置、推定方法、プログラム、及び学習モデル生成装置 | |
PETKOVIĆ et al. | Applications and adaptive neuro-fuzzy estimation of conductive silicone rubber properties | |
EP1419423A1 (en) | Method for isolating sources of drifts in output properties for machines and processes | |
CN112214888B (zh) | 一种基于索力监测的支承索健康监测方法 | |
Jabban et al. | Pressure sensitive skin for prosthetic hands: 2d contact location determination using output connections from a single side | |
TWI829076B (zh) | 藉由機器學習輔助模擬壓力數值進行虛實校正的學習方法 | |
WO2022131138A1 (ja) | 推定装置、推定方法、推定プログラム、及び学習モデル生成装置 | |
Cao et al. | Engine Life Prediction based on Degradation Data | |
zu Westerhausen et al. | Design methodology for optimal sensor placement for cure monitoring and load detection of sensor-integrated, gentelligent composite parts | |
WO2023182012A1 (ja) | 推定装置、推定方法、推定プログラム、及び学習モデル生成装置 | |
Al‐Haik et al. | Artificial intelligence techniques in simulation of viscoplasticity of polymeric composites | |
Lam et al. | Neural network models for fabric drape prediction | |
CN114341750A (zh) | 用于配置和操作热能存储系统的方法和热能存储系统 | |
Suh et al. | Remaining Useful Life Prediction of Lithium-ion Batteries using Spatio-temporal Multimodal Attention Networks | |
Deaconescu et al. | Study Concerning the Hysteresis of Pneumatic Muscles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |