CN112867973A - 感性反馈控制装置 - Google Patents

感性反馈控制装置 Download PDF

Info

Publication number
CN112867973A
CN112867973A CN201980070348.9A CN201980070348A CN112867973A CN 112867973 A CN112867973 A CN 112867973A CN 201980070348 A CN201980070348 A CN 201980070348A CN 112867973 A CN112867973 A CN 112867973A
Authority
CN
China
Prior art keywords
control
operator
target
comfort level
feedback control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980070348.9A
Other languages
English (en)
Inventor
山本透
木下拓矢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobelco Construction Machinery Co Ltd
Hiroshima University NUC
Original Assignee
Kobelco Construction Machinery Co Ltd
Hiroshima University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobelco Construction Machinery Co Ltd, Hiroshima University NUC filed Critical Kobelco Construction Machinery Co Ltd
Publication of CN112867973A publication Critical patent/CN112867973A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/2025Particular purposes of control systems not otherwise provided for
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B6/00Internal feedback arrangements for obtaining particular characteristics, e.g. proportional, integral or differential
    • G05B6/02Internal feedback arrangements for obtaining particular characteristics, e.g. proportional, integral or differential electric
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2503/00Evaluating a particular growth phase or type of persons or animals
    • A61B2503/20Workers
    • A61B2503/22Motor vehicles operators, e.g. drivers, pilots, captains
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/18Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state for vehicle drivers or machine operators
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02FDREDGING; SOIL-SHIFTING
    • E02F9/00Component parts of dredgers or soil-shifting machines, not restricted to one of the kinds covered by groups E02F3/00 - E02F7/00
    • E02F9/20Drives; Control devices
    • E02F9/2004Control mechanisms, e.g. control levers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Mining & Mineral Resources (AREA)
  • Civil Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Structural Engineering (AREA)
  • Mechanical Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明的感性反馈控制装置中,感性检测器检测与对象设备的输出相对应的操作人员的生命体征信息,基于该生命体征信息决定操作人员的舒适度。第1控制部基于关于舒适度的第1目标值与舒适度的差值来决定关于输出的第2目标值。第2控制部基于第2目标值与输出的差值来决定对对象设备的控制输入。δ设定部针对操作人员对对象设备的操作输入及控制输入分别进行与操作人员的操作水平相对应的加权。加法器将被加权后的操作输入和控制输入相加,并将所得的值输入到对象设备。

Description

感性反馈控制装置
技术领域
本发明涉及感性反馈控制装置。
背景技术
据日本内阁府的调查显示,日本的国内生产总值(GDP)虽高但幸福感却低。即,在关于GDP的“物质财富”与关于幸福感的“精神财富”之间存在着较大的差距。
作为弥补这样的差距的对策之一,可考虑通过让已实现高度化的“物质”(福利辅助设备等)进行考虑了人的感性的动作来增加精神财富(例如专利文献1)。此外,有关“感性(sensibility)”的可视化技术,正进行着预想了社会实践的研究(例如专利文献2)。
然而,大多数关于感性的研究是关于产品的设计评价及设计等静态领域的研究,几乎没有关于特别是以操作人员操作的汽车或工程机械等设备作为对象而动态地控制操作人员的感性的研究。
现有技术文献
专利文献
专利文献1:日本专利公开公报特开2018-36773号
专利文献2:日本专利公开公报特开2017-74356号。
发明内容
本发明的目的在于提供一种感性反馈控制装置,在操作人员操作的设备能够反馈控制操作人员的感性。
本发明的一个方面所涉及的感性反馈装置包括:对象设备,由操作人员操作;感性检测器,检测所述操作人员对于所述对象设备的输出u(t)的生命体征信息x(t),基于该生命体征信息x(t)决定所述操作人员的舒适度y(t);第1控制部,基于关于所述舒适度y(t)的第1目标值r(t)与所述舒适度y(t)的差值来决定关于所述输出u(t)的第2目标值w(t);第2控制部,基于所述第2目标值w(t)与所述输出u(t)的差值来决定对所述对象设备的控制输入vc(t);加权设定部,针对所述操作人员对所述对象设备的操作输入vh(t)及所述控制输入vc(t),分别进行对应于所述操作人员的操作水平的加权;以及,加法器,将由所述加权设定部分别加权后的所述操作输入vh(t)和所述控制输入vc(t)相加,并将所得的值输入到所述对象设备。
附图说明
图1是实施方式所涉及的感性反馈控制装置的结构图。
图2是实施方式所涉及的感性反馈控制装置中所使用的感性多轴模型的示意图。
图3是说明实施方式所涉及的感性反馈控制装置中所使用的数据库驱动型控制的图。
图4是表示基于实施方式所涉及的感性反馈控制装置而获得的效果的图。
图5是对图1所示的感性反馈控制装置中δ为1的情况下的结构进行简化来表示的图。
图6是实施方式所涉及的感性反馈控制装置中所使用的FRIT的方块图。
图7是表示操作人员脑内的速度误差eh(t)与舒适度y(t)的关系的图形。
图8是表示本数值例中各阶跃(时刻)的舒适度y(t)、输出u(t)(速度)及控制输入v(t)(转矩)的图形。
图9是表示各阶跃(时刻)中所调整的控制参数(PID增益)的图形。
图10是比较例所涉及的感性反馈控制装置的结构图。
图11是表示在比较例中通过数据库驱动型控制一边进行控制部的控制参数的调整一边进行感性反馈控制的结果的图形。
具体实施方式
以下,参照附图来说明本发明的实施方式所涉及的感性反馈控制装置。本发明的范围并不限定于以下的实施方式,其是可以在本发明的技术思想的范围内任意变更的。
图1是实施方式所涉及的感性反馈控制装置的结构图。如图1所示,感性反馈控制装置100具备对象设备10、感性检测器(sensibility meter)20、第1控制部30、第2控制部40、δ设定部50、数据库60、控制输入调整部70及操作输入调整部80。δ设定部50、控制输入调整部70及操作输入调整部80是加权设定部的一个例子。而且,感性反馈控制装置100具备减法器A1、A2及加法器A3。对象设备10是被操作人员操作的例如汽车或工程机械等设备。图1中,第1控制部30、第2控制部40、感性检测器20、减法器A1、A2及加法器A3例如由CPU等处理器构成。数据库60例如由固态驱动器或硬盘驱动器等非易失性存储器构成。
感性检测器20检测与对象设备10的输出u(t)相对应的操作人员的生命体征信息x(t),基于该生命体征信息x(t)决定操作人员的舒适度y(t)。对象设备10的输出u(t)例如是液压挖掘机的响应速度。
减法器A1计算第1目标值(目标舒适度r(t))与舒适度y(t)的差值e(t),并将其输入到第1控制部30。
第1控制部30基于减法器A1计算的差值e(t)决定关于输出u(t)的第2目标值(目标输出w(t)),并将其输入到减法器A2。
减法器A2计算目标输出w(t)与输出u(t)的差值ε(t),并将其输入到第2控制部40。
第2控制部40基于减法器A2计算的差值ε(t)决定对对象设备10的控制输入vc(t),并将其输入到控制输入调整部70。
δ设定部50设定针对操作人员的对对象设备10的操作输入vh(t)的权重值(1-δ)。δ设定部50设定针对控制输入vc(t)的权重值(δ)。δ设定部50根据操作人员的操作水平设定权重值(1-δ)及权重值(δ)。
控制输入调整部70使δ设定部50设定的针对控制输入vc(t)的权重值(δ)乘以控制输入vc(t),并将结果输入到加法器A3。
操作输入调整部80使δ设定部50设定的针对操作输入vh(t)的权重值(1-δ)乘以操作输入vh(t),并将结果输入到加法器A3。
加法器A3使从控制输入调整部70输入的δ·vc(t)与从操作输入调整部80输入的(1-δ)·vh(t)相加,并将相加值输入到对象设备10。
对象设备10获取从加法器A3输入的相加值,根据该相加值计算输出u(t)。
其次,说明感性检测器20的详细情况。
(感性检测器)
本实施方式中,感性检测器20基于与对象设备的输出u(t)相对应的操作人员的生命体征信息x(t)计算舒适度y(t)。操作人员的生命体征信息x(t)例如是操作人员的面部表情、操作人员的皮肤电阻、操作人员的上肢肌电、操作人员的上肢肌电、表示操作人员的语音的语音信息等。感性检测器20例如通过CCD摄像机检测操作人员的面部表情便可。感性检测器20例如通过心率传感器检测心率便可。感性检测器20例如通过CCD摄像机检测呼吸(次数或深度)便可。感性检测器20通过皮肤阻抗传感器检测皮肤电阻便可。感性检测器20例如通过肌电传感器检测上肢肌电及下肢肌电便可。感性检测器20通过麦克风检测语音信息便可。
人在看到了什么或听到了什么或者接触到什么或被触及到什么的时候,有时会抱有欢心雀跃或喜不自禁或提心吊胆或忐忑不安这样的感情或情感。这样的感情或情感是基于人类复杂且高级的大脑活动而引起的。感情或情感的形成与包含运动神经和感觉神经的身体性神经系统、包含交感神经和副交感神经的自主神经系统、以及记忆或经验等密切相关。为此,感性(sensibility)被定义为在更高级的层次俯瞰情感反应的高级大脑功能,该情感反应是通过将综合了外部感受信息(躯体神经系统的信息)和内部感受信息(自主神经系统的信息)的信息与过去的经验及记忆进行对照而产生的。换言之,感性是基于预测(印象)和结果(感觉信息)之间的差距与经验及知识的比较而让人猛然地得以理会的高级大脑功能。
作为这样的高级大脑功能的感性有必要从各种观点综合性地进行理解。感性例如可以从人是否感到愉快、舒适或舒畅或者相反地从人是否感到难受、不愉快或不舒畅这样的“愉快·不愉快”的观点来进行理解。此外,感性例如可以从人是否处于觉醒、兴奋或活泼状态或者相反地从人是否处于模糊、沉静或不活泼状态这样的“活泼·不活泼”的观点来进行理解。此外,感性例如可以从人是否期待或预期着什么而欢心雀跃或者相反地从人的欢欣雀跃感觉是否被阻碍这样的“期待感”的观点来进行理解。
使愉快·不愉快和活泼·不活泼表示在2个轴上的罗素(Russell)环形模型为公知。感情可以用该环形模型来表示。然而,感性是将预测(印象)和结果(感觉信息)的差距与经验及知识进行比较的高级大脑功能。因此,感性不能用由愉快·不愉快和活泼·不活泼的2个轴构成已有的环形模型来充分地表示。为此,本实施方式中,例如通过对罗素环形模型追加作为第3轴的时间轴(例如期待感)而成的感性多轴模型来把握感性。
图2是实施方式所涉及的感性反馈控制装置中所使用的感性多轴模型的示意图。如图2所示,感性多轴模型可以以“愉快·不愉快”(感情价)作为第1轴,以“活泼·不活泼”(活泼度)作为第2轴,以“时间(期待感)”作为第3轴来进行表示。使感性成为多轴模型化的优点在于:通过计算各个轴的评价值并对它们进行综合,从而定量地评价概念模糊而广泛的感性,也就是说能够实现可视化。具体而言,基于感性多轴模型的各个轴的大脑生理信息,求取各个轴的大脑生理指标值(EEG愉快、EEG活泼、EEG期待感)。此外,基于被实验人员的主观统计数据,获得表示感性多轴模型的各个轴的加权系数(a、b、c)的主观心理轴。于是,利用大脑生理指标值和主观心理轴,并且使用下面那样的计算式便能够评价感性值。被实验人员的主观统计数据是表示处于某一状态的被实验人员的脑波与被实验人员对这一状态的反应(主观)之间的关系的数据,是被预先学习而得的数据。
感性值=[主观心理轴]*[大脑生理指标值]=a*EEG愉快+b*EEG活泼+c*EEG期待感
感性检测器20例如通过将上述的各种传感器所检测的生命体征信息x(t)输入指定的运算式来计算大脑生理指标值。于是,感性检测器20通过将所计算的大脑生理指标值输入上述的计算式来计算感性值。而且,感性检测器20将所计算的感性值作为舒适度y(t)来输出。
其次,说明第1控制部30的详细情况。
(第1控制部)
第1控制部30例如执行以KP、KI、KD分别作为控制参数的下述式(1)所示的PID控制。
式1
Figure DEST_PATH_IMAGE002
目标输出w(t)是PID控制中的操作量。KP、KI、KD分别是PID控制中的比例增益、积分增益及微分增益。比例增益、积分增益及微分增益被称作PID增益。差值e(t)是PID控制中的偏差。此处,以差值e(t)接近零的方式调整w(t)。
本实施方式中,虽然以使舒适度y(t)接近目标舒适度r(t)来提高舒适度y(t)来作为目的,但是,在反馈控制中难以设定适合于每个操作人员的目标输出w(t)。为此,本实施方式采用了如图1所示那样的级联控制系统。由此,本实施方式通过给予目标舒适度r(t)而能够自动生成适合于各个操作人员的目标输出w(t)。此时,可认为人的感性为时变系统、非线性系统。因此,如图1所示,第1控制部30进行利用数据库60的反馈控制(数据库驱动型控制:例如参照「胁谷伸等,利用FRIT法的非线性PID控制系统的设计、测量控制,Vol.52,No.10,pp.885-891(2013)」)。数据库60中逐次地储存有第1控制部30的PID增益的调整上所需要的数据例如目标舒适度r(t)、舒适度y(t)及目标输出w(t)等。目标舒适度r(t)例如采用被预先决定的值。
图3是说明实施方式所涉及的感性反馈控制装置中所使用的数据库驱动型控制的图。第1控制部30的数据库驱动型控制在后面的实施例中作详细叙述。本实施方式所涉及的数据库驱动型控制例如可以利用使用梯度法的学习功能,也可以利用组合梯度法和FRIT(Fictitious Reference Iterative Tuning)法而成的离线学习,或者利用组合梯度法和FRIT法的在线学习。
例如,本实施方式中,基于数据库60所储存的数据中的系统当前状态下处于邻域的邻域数据来计算式(1)所示的控制参数。此处计算的控制参数采用通过在后述的实施例中所说明的在线学习而获得的控制参数。但是,这只不过是一个例子,式(1)所示的控制参数也可以是通过在后述的实施例中所说明的离线学习而获得的控制参数。
其次,说明第2控制部40的详细情况。
(第2控制部)
第2控制部40例如执行以KP'、KI'、KD'分别作为控制参数的下述式(2)所示的PID控制。
式2
Figure DEST_PATH_IMAGE004
控制输入vc(t)是PID控制中的操作量。KP’、KI’、KD’分别是PID控制中的比例增益、积分增益及微分增益。差值ε(t)是PID控制中的偏差。此处,以差值ε(t)成为零的方式调整控制输入vc(t)。
第2控制部40的控制参数例如是与对象设备10对应的已有的参数。已有的参数可以是固定的常数,也可以是可变参数。
(δ设定部)
δ设定部50基本上对于技能高的操作人员设定相对低的权重值(δ),而对于技能低的操作人员设定相对高的权重值(δ)。δ设定部50预先保持有例如将按5个等级被预先评价的操作人员的技能水准与对应于各技能水准的权重值(δ)对应关联而成的技能数据。而且,δ设定部50在操作人员的技能水准被输入后,基于技能数据来决定与所输入的技能水准相对应的权重值(δ)便可。或者,δ设定部50也可以基于操作人员进行实验操作时的实验结果来评价该操作人员的水准,并且基于该评价的结果来设定权重值(δ)。
(效果)
如以上所说明的那样,本实施方式的感性反馈控制装置100中,感性检测器20检测与对象设备10的输出u(t)相对应的操作人员的生命体征信息x(t),基于该生命体征信息x(t)决定操作人员的舒适度y(t)。此外,第1控制部30基于关于舒适度y(t)的第1目标值(目标舒适度)r(t)与舒适度y(t)的差值e(t)来决定关于输出u(t)的目标输出w(t)。此外,第2控制部40基于目标输出w(t)与输出u(t)的差值ε(t)来决定对对象设备10的控制输入vc(t)。这样,感性反馈控制装置100利用感性检测器20、第1控制部30及第2控制部40能够进行反馈操作人员的对对象设备10的感性(具体而言为舒适度y(t))的控制。
图4是表示基于本实施方式的感性反馈控制装置100而获得的效果的图。图4的例子中,感性反馈控制装置100例如被应用于由液压挖掘机构成的对象设备10。由此,图4所示的对象设备10便能够进行反馈操作人员的感性的控制。因此,感性反馈控制装置100便能够使本来与操作人员的技能水准无关地被划一设计的对象设备10作出与具有各种各样的技能水准的操作人员相对应的输出响应。因此,感性反馈控制装置100能够提高具有各种各样的技能水准的操作人员的舒适度。
此外,包含δ设定部50、控制输入调整部70及操作输入调整部80的加权设定部针对操作人员的对对象设备10的操作输入vh(t)及控制输入vc(t)分别进行与操作人员的操作水平相对应的加权,将加权后的操作输入vh(t)和控制输入vc(t)相加,并将相加结果输入到对象设备10。因此,加权设定部能够根据操作人员的操作水平来设定恰当的感性反馈的程度。由此,加权设定部例如通过针对非熟练操作人员提高感性反馈的程度而能够降低对象设备10中的该操作人员的操作输入的反映度。相反,加权设定部通过针对熟练操作人员降低感性反馈的程度而能够提高对象设备10中的该操作人员的操作输入的反映度。
此外,本实施方式的感性反馈控制装置100中,感性检测器20也可以将操作人员的感情价(valence)、活泼度及期待感这3个信息作为生命体征信息x(t)来检测,并且将从这3个信息的相关性而获得的感性值作为舒适度y(t)来决定。此情况下,由于作为感性的“舒适度”被定量地评价,因此,感性反馈控制的精度被提高。此情况下,基于这3个信息的相关性来获得的感性值例如通过利用AI的机器学习来运算这3个信息和感性值。
此外,本实施方式的感性反馈控制装置100中还可以包括逐次储存目标舒适度r(t)、目标输出w(t)及舒适度y(t)的数据库60,第1控制部30也可以利用储存于数据库60的数据,一边进行控制参数的调整一边决定目标输出w(t)。此情况下,无需使作为非线性系统的操作人员的感性模型化,通过利用数据库驱动型控制便能够进行感性反馈控制。
此外,本实施方式的感性反馈控制装置100中,在对象设备10为工程机械的情况下,操作人员能够以可以获得与脑内的工程机械的目标输出(例如液压挖掘机的目标响应速度)相同的输出u(t)的方式来操作现实的工程机械。
此外,本实施方式的感性反馈控制装置100中,第1控制部30的数据库驱动型控制可以利用学习功能。此情况下,随着操作人员对对象设备10的操作时间的增加,对象设备10逐渐地变化为能够进行更适合于该操作人员的输出响应。由此,感性反馈控制装置100能够进一步提高操作人员的舒适度。
(实施例)
以下,说明感性反馈控制装置100的实施例。该实施例中,δ被设定为“1”,仅控制输入vc(t)被输入对象设备10。此外,该实施例中,主要说明第1控制部30进行的数据库驱动型控制。
图5是表示图1所示的感性反馈控制装置100中将δ设定为1的情况下的结构的图。图5中,对与图1相同的结构要素附以相同的符号。此外,图5中,δ设定部50、控制输入调整部70、操作输入调整部80及加法器A3的图示被省略。
本实施例中,对象设备10为液压挖掘机。对象设备10的输出u(t)为液压挖掘机的铲斗的响应速度。对对象设备10的控制输入vc(t)为转矩。响应速度例如通过传感器而被测量。响应速度也可以是铲斗以外的动臂及斗杆等其它的构件的响应速度从而取代铲斗的响应速度。即,响应速度是铲斗、斗杆及动臂等作业装置的响应速度。
此外,本实施例中,作为控制对象的操作人员的舒适度y(t)被视为非线性系统,对第1控制部30应用数据库驱动型控制。此外,内环的第2控制部40以KP’=1.5、KI’=0.1、KD’=0.1进行式(2)所示的PID控制。因此,本实施例中,第2控制部40的控制参数不是调整对象。
本实施例中,作为控制对象的舒适度y(t)以下述的式(3)所示的离散时间非线性系统(以下简略为“系统”。)来进行表示。
式3
Figure DEST_PATH_IMAGE006
式(3)中,舒适度y(t)是系统的输出。f()是非线性函数。φ(t-1)被称作信息矢量,表示系统的时刻t之前的状态。信息矢量φ(t-1)由下述的式(4)定义。
式4
Figure DEST_PATH_IMAGE008
此处,目标输出w(t)是对舒适度y(t)的控制的系统的输入。ny是系统的输出的次数。nw是系统的输入的次数。在数据库驱动型控制中,各操作数据以式(4)的形式被储存于数据库60(参照图3)。φ(t)是表示当前的系统的状态的信息矢量,被称作请求点(查询)。
作为第1控制部30的控制律,采用以下述的式(5)所示的速度型I-PD控制律。
式5
Figure DEST_PATH_IMAGE010
式(5)中,e(t)是控制误差信号。在r(t)作为目标舒适度时,e(t)由下述的式(6)定义。
式6
Figure DEST_PATH_IMAGE012
式(5)中,KP(t)、KI(t)、KD(t)分别是在各阶跃(时刻t)中的比例增益、积分增益及微分增益。而且,Δ(:=1-z-1)是差值算子。z-1是延迟算子。
本实施例中,第1控制部30采用FRIT法,并且利用由1次的动作实验而获得的输入输出数据w0(t)及y0(t)和基于这些实验数据而生成的伪参照输入~r(t),直接地计算第1控制部30的控制参数。图6是本实施例中所使用的FRIT的方块图。图6中,System为第2控制部40、对象设备10及感性检测器20。C(z-1)为控制器。控制器能够由下述的式(7)表示。
式7
Figure DEST_PATH_IMAGE014
式(7)中,n是控制律的次数。PID控制律的情况下,n=2。如图6所示,C(z-1)的输入输出关系由下述的式(8)表示。
式8
Figure DEST_PATH_IMAGE016
基于式(8),伪参照输入r如下述的式(9)那样而被计算。
式9
Figure DEST_PATH_IMAGE018
在FRIT法中,如图6所示,采用具有预先设计的所希望的特征的参照模型Gm(z-1)。基于对伪参照输入r的参照模型Gm(z-1)的输出ym(t),第1控制部30以使输出ym(t)与y0(t)的误差成为较小的方式计算控制参数。参照模型Gm(z-1)由下述的式(10)、式(11)的特征多项式表示。
式10
Figure DEST_PATH_IMAGE020
式11
Figure DEST_PATH_IMAGE022
式(11)中,α表示控制系统的上升特征。σ表示与衰减特征有关系的参数。α、σ可以分别随意设定。Ts是采样时间。具体而言,σ是控制系统的输出达到阶跃(step)式的目标值的大约60%为止的时间。此外,α较为理想的是被设定在0以上且2.0以下的范围。α=0表示Binomial(二项式)模型的响应。α=1表示Butterworth(巴特沃斯)模型的响应。
以下,说明数据库驱动型PID控制器的设计步骤。
<初始数据库的生成>
数据库驱动型控制中,在不存在过去的储存数据的情况下,在原理上无法进行局部控制器(local controller)的设计。因此,本实施例中,基于在某一平衡点周围获得的输入输出数据,采用Zieglar&Nichols(ZN)法或Chien,Hrones&Reswick(CHR)法等来计算PID增益(控制参数),生成包含由PID增益和前述的输入输出数据构成的信息矢量(由下述的式(12)表示)的初始数据库。ZN法被公开于文献「J.G.Zieglar等,Optimum settings forautomatic controllers,Trans.ASME,Vol.64,No.8,pp.759-768(1942)」。CHR法被公开于文献「K.L.Chien等,On the Automatic Control of Generalized Passive Systems,Trans.ASME,Vol.74,pp.175-185(1972)」。在平衡点周围所获得的输入输出数据例如是相同特征的数据集。
式12
Figure DEST_PATH_IMAGE024
式(12)中,j=1、2、···、N(0),i=1、2、···M,-φ(j)、K(j)分别由下述的式(13)、式(14)给出。
式13
Figure DEST_PATH_IMAGE026
式14
Figure DEST_PATH_IMAGE028
N(0)为初始数据数量(初始数据库中的信息矢量的数量)。M是要素数量。由于初始数据库中的PID增益为固定,因此,K(1)=K(2)=···=K(N(0))。
在系统的非运转时,利用在系统的运转中储存于数据库60的操作数据,执行生成以上的初始数据库的处理。
<距离的计算,邻域的选择>
请求点-φ(t)与储存于数据库的信息矢量-φ(j)之间的距离由以下述的式(15)表示的加权L1范数来求得。
式15
Figure DEST_PATH_IMAGE030
N(t)是在时刻t储存于数据库的数据数量(信息矢量的数量)。-φl(j)是第j个信息矢量的第l个要素。-φl(t)是在时刻t的请求点的第l个要素。max-φl(m)是存在于数据库的所有的信息矢量(-φ(j):j=1、2、···、N(t))的第l个要素中最大的要素。min-φl(m)是所述第l个要素中最小的要素。
本实施例中,按式(15)所示的距离d的升序从数据库选择k个信息矢量,将所选择的数据集作为邻域数据来定义。
<局部控制器的结构>
其次,本实施例中,对如前述那样选择的邻域数据应用以下述的式(16)所示的局部线性加权平均法(Linearly Weighted Average∶LWA),构成局部控制器。
式16
Figure DEST_PATH_IMAGE032
此处,wi是对包含在邻域数据的第i个信息矢量中的K(i)的权重,由下述的式(17)来给予。
式17
Figure DEST_PATH_IMAGE034
通过以上的步骤来计算在各个时刻t的PID增益。而且,为了使数据库驱动型控制系统在各个平衡点能够恰当地调整PID增益,由必有进行数据库的学习(控制参数的更新)。为此,本实施例中,应用FRIT,并且从数据库的构建所使用的初始数据通过学习,在离线的情况下更新数据库内的各个数据集中的PID增益。离线是系统运转之前的状态,例如是对象设备10的非运转时。
<利用FRIT的数据库驱动型控制的离线学习>
以下,具体地说明利用FRIT的数据库驱动型控制的离线学习。首先,为了计算闭环数据中的请求点-φ0(t)中的PID增益,通过式(15)计算请求点与数据库60内的信息矢量之间的距离,并且从计算结果选择k个邻域数据。接着,通过式(16)计算PID增益。对所计算的PID增益应用由下述的式(18)、式(19)所示的最速下降法。由此,进行PID增益Kold(t)的学习,导出新的Knew
式18
Figure DEST_PATH_IMAGE036
式19
Figure DEST_PATH_IMAGE038
式(18)及式(19)中,η是学习系数,J(t+1)是由下述的式(20)、式(21)定义的评价规范。
式20
Figure DEST_PATH_IMAGE040
式21
Figure DEST_PATH_IMAGE042
其中,ym(t)如下述的式(22)那样而被设计。
式22
Figure DEST_PATH_IMAGE044
式(22)中,Gm(1)=1+p1+p2(参照式(10))。
此外,式(18)的右边第2项的各个偏微分如式(23)那样展开。
式23
Figure DEST_PATH_IMAGE046
式(23)中,Γ(t)如下述的式(24)那样而被表示。
式24
Figure DEST_PATH_IMAGE048
基于式(23)中包含有伪参照输入r(t),式(18)便成为基于FRIT的离线学习。利用由式(18)所获得的Knew(t),更新数据库中的各邻域数据。该步骤反复进行至由式(20)所示的评价规范成为充分地小为止。由此,获取最优的数据库。在对系统应用数据库驱动型控制之际,针对各阶跃(时刻)的每一者,按照在前述的“初始数据库的生成”、“距离的计算、邻域的选择”、“局部控制器的结构”中所说明的步骤来构成局部控制器。由此,能够获得对于非线性系统更有效的控制性能。
<利用FRIT的数据库驱动型控制的在线学习>
通过上述的离线学习而获得的PID增益进一步通过下述的在线学习而被更新。在线学习是指在系统的在线时来进行。在线是表示系统为运转中的状态。
在线学习中,对通过离线学习而获得的PID增益应用式(25)、式(26)所示的最速下降法。
式25
Figure DEST_PATH_IMAGE050
式26
Figure DEST_PATH_IMAGE052
式(25)、式(26)中,η学习系数,J(t+1)是由下述的式(27)、式(28)定义的评价规范。式(28)中,式(21)所示的y0(t)成为y(t)这一点与离线学习相异。
ym(t)由式(29)所表示。
式27
Figure DEST_PATH_IMAGE054
式28
Figure DEST_PATH_IMAGE056
式29
Figure DEST_PATH_IMAGE058
Gm(z-1)是参照模型的特征多项式,由式(30)、式(31)表示。
式30
Figure DEST_PATH_IMAGE060
式31
Figure DEST_PATH_IMAGE062
δ是控制系统的上升特征。σ是与衰减特征有关系的参数。δ、σ分别由设计者随意设定。式(25)的右边第2项的偏微分由式(32)表示。
式32
Figure DEST_PATH_IMAGE064
通过在线学习而计算的PID增益作为式(1)的控制参数而被应用。
<数值例>
以下,说明本实施例所涉及的感性反馈控制的数值例。
此处,图5所示的对象设备(操作人员操作的设备)10为液压挖掘机。此情况下,对象设备10由下述的式(33)的一阶滞后系统表示。
式33
Figure DEST_PATH_IMAGE066
另一方面,舒适度y(t)用下述的式(34)、式(35)所示的韦伯·费希纳定律(参照「I.P.Herman,Physics of the Human Body∶Biological and Medical Physics,Biomedical Engineering,Springer-Verlag GmbH & CO.KG(2007)」)来表示。式(34)、式(35)中,舒适度y(t)的最大值为1。
式34
Figure DEST_PATH_IMAGE068
式35
Figure DEST_PATH_IMAGE070
式(34)、式(35)中,wh(t)是操作人员在脑内所具有的液压挖掘机的目标速度,然而,这对于控制系统而言是未知的。eh(t)是在操作人员的脑内感到的液压挖掘机的速度误差。
根据式(34),如果操作人员的脑内的速度误差eh(t)完全为零,则舒适度y(t)便成为最大的1。E(t)是关于舒适度y(t)的变量,具有因操作人员的不同而不同的值。图7是表示操作人员的脑内的速度误差eh(t)与舒适度y(t)的关系的图形。如图7所示,速度误差eh(t)越大则舒适度y(t)越下降。此外,E(t)越大则舒适度y(t)的下降率越大。
以下说明的数值例中的各个设定参数为r=0.8,wh=40,σ=10,α=0,η=[80、60、80]。
对内环的第2控制部40使用已有的控制参数。在外环的第1控制部30的控制参数的调整上,采用了对非线性系统有效的数据库驱动型控制(参照「胁谷伸等,利用FRIT法的非线性PID控制系统的设计、测量及控制,Vol.52,No.10,pp.885-891(2013)」)。
此外,用于获取初始数据{u0、y0}的外环(第1控制部30)的PID增益为KP=3.5,KI=0.5,KD=3.5。内环(第2控制部40)的PID增益为KP’=1.5,KI’=0.1,KD’=0.1。
在以上的设定中,通过数据库驱动型控制一边进行第1控制部30的控制参数的调整一边进行感性反馈控制。图8是表示本数值例中各阶跃(时刻)的舒适度y(t)、输出u(t)(速度)及控制输入vc(t)(转矩)的图形。图9是表示各阶跃(时刻)中所调整的控制参数(PID增益)的图形。
如式(34)所示那样,舒适度y(t)是非线性系统。因此,如图8上侧的图形所示,在PID增益为固定的状态下所获得的初始数据y0并不跟随目标舒适度r(=0.8)。另一方面,本实施例通过数据库驱动型控制来调整PID增益。因此,如图8上侧的图形所示,舒适度y跟随目标舒适度r。由此可知,在本实施例中实现了感性反馈控制。这是基于如图9所示那样相应地调整了PID增益。
操作人员脑内的目标输出wh(=40:目标速度)对于控制系统而言是未知的,但是,由本实施例所获得的目标输出w(目标速度)最终成为40(图8的中央的图形)。根据此情况,若分析数据库便能够推测到操作人员脑内的目标速度。
此外,如图8下侧的图形所示可知,在负荷大时,随此,大的控制输入vc(t)(转矩)被自动算出。
(比较例)
以下,说明本实施方式的感性反馈控制装置的比较例。该比较例仅通过外环来实现感性反馈控制。也就是说,该比较例省略了关于对象设备的内侧的控制循环。以下,利用该比较例说明本实施方式的感性反馈控制中的级联控制系统(外环+内环)的有效性。
图10是比较例所涉及的感性反馈控制装置的结构图。如图10所示,比较例所涉及的感性反馈控制装置200具备对象设备10、感性检测器20、控制部30A及数据库60A。对象设备10是与前述的实施例同样地由操作人员操作的液压挖掘机。感性检测器20与图1所示的本实施方式的感性反馈控制装置200的感性检测器20同样。感性检测器20检测与对象设备10的输出u(t)相对应的操作人员的生命体征信息x(t),基于该生命体征信息x(t)决定操作人员的舒适度y(t)。控制部30A基于关于舒适度y(t)的目标值(目标舒适度)r(t)与舒适度y(t)的差值e(t)来决定对对象设备10的控制输入vc(t)。
控制部30A例如以KP"、KI"、KD"分别作为PID增益,执行下述式(36)所示的PID控制。
式36
Figure DEST_PATH_IMAGE072
此外,控制部30A进行利用数据库60A的数据库驱动型控制。数据库60A中逐次地储存有控制部30A的PID增益的调整上所需要的数据例如目标舒适度r(t)、舒适度y(t)及控制输入vc(t)等。
本比较例中,对象设备10的输出u(t)也是液压挖掘机的铲斗的响应速度,对对象设备10的控制输入vc(t)也是转矩。
图11是表示在比较例中通过数据库驱动型控制一边进行控制部30A的控制参数的调整一边进行感性反馈控制的结果的图形。图11中,上侧的图形表示各阶跃(时刻)的舒适度y(t)。中央的图形表示各阶跃(时刻)的输出u(t)(速度)。下侧的图形表示各阶跃(时刻)的控制输入vc(t)(转矩)。用于获取初始数据{u0、y0}的控制部30A的PID增益与前述的实施例同样地为KP=3.5,KI=0.5,KD=3.5。其他的参数也与前述的实施例同样地为r=0.8,wh=40,σ=10,α=0,η=[80、60、80]。
如图11上侧的图形所示,在比较例中,通过数据库驱动型控制来调整PID增益,但是,舒适度y并不跟随目标舒适度r。即,比较例所涉及的感性反馈控制不能够实现充分的控制性能。
根据该结果,本实施方式的感性反馈控制中,通过级联控制系统而提高了内环(第2控制部40)的顺应性。由此,本实施方式使得控制系统的设计变得容易,能够提高感性反馈控制的精度。
以上,说明了关于本发明的实施方式(包含实施例),但是,本发明并不仅限于前述的实施方式,其是可以在发明范围内进行各种变更的。即,前述的实施方式的说明只不过是本质性的例示,本发明并没有限制其应用对象或其用途的意图。
例如,本实施方式中,以液压挖掘机(工程机械)为例来说明了感性反馈控制装置,但是,其同样可以应用于由操作人员操作的其它设备。

Claims (6)

1.一种感性反馈控制装置,其特征在于包括:
对象设备,由操作人员操作;
感性检测器,检测所述操作人员对于所述对象设备的输出u(t)的生命体征信息x(t),基于该生命体征信息x(t)决定所述操作人员的舒适度y(t);
第1控制部,基于关于所述舒适度y(t)的第1目标值r(t)与所述舒适度y(t)的差值来决定关于所述输出u(t)的第2目标值w(t);
第2控制部,基于所述第2目标值w(t)与所述输出u(t)的差值来决定对所述对象设备的控制输入vc(t);
加权设定部,针对所述操作人员对所述对象设备的操作输入vh(t)及所述控制输入vc(t),分别进行对应于所述操作人员的操作水平的加权;以及,
加法器,将由所述加权设定部分别加权后的所述操作输入vh(t)和所述控制输入vc(t)相加,并将所得的值输入到所述对象设备。
2.根据权利要求1所述的感性反馈控制装置,其特征在于:
所述感性检测器将操作人员的感情价、活泼度及期待感这3个信息作为所述生命体征信息x(t)来检测,并将从该3个信息的相关性获得的感性值作为所述舒适度y(t)来决定。
3.根据权利要求1或2所述的感性反馈控制装置,其特征在于还包括:
数据库,逐次储存所述第1目标值r(t)、所述第2目标值w(t)及所述舒适度y(t);其中,
所述第1控制部利用储存于所述数据库的数据,一边进行控制参数的调整一边决定所述第2目标值w(t)。
4.根据权利要求1至3中任一项所述的感性反馈控制装置,其特征在于:
所述对象设备是工程机械。
5.根据权利要求4所述的感性反馈控制装置,其特征在于:
所述输出u(t)是所述工程机械具备的作业装置的响应速度。
6.根据权利要求3所述的感性反馈控制装置,其特征在于:
所述控制参数是比例增益Kp(t)、积分增益KI(t)及微分增益KD(t)。
CN201980070348.9A 2018-11-01 2019-10-25 感性反馈控制装置 Pending CN112867973A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-206633 2018-11-01
JP2018206633A JP7154954B2 (ja) 2018-11-01 2018-11-01 感性フィードバック制御装置
PCT/JP2019/041919 WO2020090659A1 (ja) 2018-11-01 2019-10-25 感性フィードバック制御装置

Publications (1)

Publication Number Publication Date
CN112867973A true CN112867973A (zh) 2021-05-28

Family

ID=70464020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980070348.9A Pending CN112867973A (zh) 2018-11-01 2019-10-25 感性反馈控制装置

Country Status (5)

Country Link
US (1) US11926991B2 (zh)
EP (1) EP3855258B1 (zh)
JP (1) JP7154954B2 (zh)
CN (1) CN112867973A (zh)
WO (1) WO2020090659A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140656A (zh) * 2006-09-04 2008-03-12 张德富 一种音乐消费行为分析的方法
JP2008058459A (ja) * 2006-08-30 2008-03-13 Toyota Motor Corp 運転評価装置
JP2012022041A (ja) * 2010-07-12 2012-02-02 Mazda Motor Corp 車両用運転技量育成装置
CN102679505A (zh) * 2012-06-13 2012-09-19 重庆大学 房间温度控制方法
WO2017104793A1 (ja) * 2015-12-17 2017-06-22 国立大学法人広島大学 乗員の感性向上システム
JP2017136992A (ja) * 2016-02-04 2017-08-10 スズキ株式会社 車両用スロープ収納機構

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8872640B2 (en) 2011-07-05 2014-10-28 Saudi Arabian Oil Company Systems, computer medium and computer-implemented methods for monitoring health and ergonomic status of drivers of vehicles
JP6590411B2 (ja) 2015-10-16 2019-10-16 国立大学法人広島大学 感性評価方法
JP2017136922A (ja) 2016-02-02 2017-08-10 富士通テン株式会社 車両制御装置、車載機器制御装置、地図情報生成装置、車両制御方法及び車載機器制御方法
EP3438352B1 (en) * 2016-03-31 2021-01-27 Hitachi Construction Machinery Co., Ltd. System for changing output characteristics of construction machinery
US10351000B2 (en) 2016-08-01 2019-07-16 International Business Machines Corporation Intelligent vehicle fuel gauge
JP6833195B2 (ja) 2016-08-30 2021-02-24 国立大学法人広島大学 データ指向型フィードバック制御装置およびデータ指向型フィードバック制御方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008058459A (ja) * 2006-08-30 2008-03-13 Toyota Motor Corp 運転評価装置
CN101140656A (zh) * 2006-09-04 2008-03-12 张德富 一种音乐消费行为分析的方法
JP2012022041A (ja) * 2010-07-12 2012-02-02 Mazda Motor Corp 車両用運転技量育成装置
CN102679505A (zh) * 2012-06-13 2012-09-19 重庆大学 房间温度控制方法
WO2017104793A1 (ja) * 2015-12-17 2017-06-22 国立大学法人広島大学 乗員の感性向上システム
JP2017136992A (ja) * 2016-02-04 2017-08-10 スズキ株式会社 車両用スロープ収納機構

Also Published As

Publication number Publication date
EP3855258A1 (en) 2021-07-28
EP3855258A4 (en) 2021-12-15
US11926991B2 (en) 2024-03-12
EP3855258B1 (en) 2022-10-05
JP7154954B2 (ja) 2022-10-18
JP2020071766A (ja) 2020-05-07
US20210395977A1 (en) 2021-12-23
WO2020090659A1 (ja) 2020-05-07

Similar Documents

Publication Publication Date Title
US20170312582A1 (en) Force Profile Control For The Application Of Horizontal Resistive Force
JP6833195B2 (ja) データ指向型フィードバック制御装置およびデータ指向型フィードバック制御方法
CN112673378B (zh) 推断器生成装置、监视装置、推断器生成方法以及推断器生成程序
JP6446126B2 (ja) 処理システム及びプログラム
Perez Reynoso et al. A custom EOG-based HMI using neural network modeling to real-time for the trajectory tracking of a manipulator robot
CN112867973A (zh) 感性反馈控制装置
Kinoshita et al. Design of a database-driven kansei feedback control system using a hydraulic excavators simulator
CN114730162A (zh) 反馈控制装置
JP7217874B2 (ja) 評価装置、制御装置、操作主体感向上システム、評価方法、及びコンピュータプログラム
Kinoshita et al. Design and Experimental Analysis of a Database-Driven Kansei Feedback Control System using EEG Data
KR20060026297A (ko) 로봇의 감성합성장치 및 방법
JP6204234B2 (ja) 運動療法装置の制御装置および制御方法
Chotimah et al. Chronic Kidney Disease Diagnosis System using Sequential Backward Feature Selection and Artificial Neural Network
CN112906291A (zh) 一种基于神经网络的建模方法及装置
Telban A nonlinear motion cueing algorithm with a human perception model
RU193607U1 (ru) Устройство управления электроприводом объекта, находящегося под воздействием внешних возмущений, на основе нейронных сетей
Kaminskas et al. Predictor-based control of human emotions when reacting to a dynamic virtual 3D face stimulus
Righeto et al. Nonlinear plant identification by wavelets
Kashihara Nonlinear system identification based on convolutional neural networks for multiple drug interactions
TWI839549B (zh) 機械人身體保健系統、機械人身體保健方法、以及機械人身體保健程式
JP5442480B2 (ja) マッサージ機、及びマッサージ力の設定方法
US12020789B1 (en) Systems and methods enabling baseline prediction correction
US20240038395A1 (en) Machine learning-based prediction of treatment requirements for neovascular age-related macular degeneration (namd)
JP5540992B2 (ja) 移乗装置、その制御方法及び制御プログラム
CN117216498A (zh) 水泥回转窑的运行工况的预测系统以及预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination