CN108080751B - 数值控制装置 - Google Patents

数值控制装置 Download PDF

Info

Publication number
CN108080751B
CN108080751B CN201711160358.0A CN201711160358A CN108080751B CN 108080751 B CN108080751 B CN 108080751B CN 201711160358 A CN201711160358 A CN 201711160358A CN 108080751 B CN108080751 B CN 108080751B
Authority
CN
China
Prior art keywords
workpiece
learning
point
numerical controller
synchronization error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711160358.0A
Other languages
English (en)
Other versions
CN108080751A (zh
Inventor
渡边彻
久保田彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Publication of CN108080751A publication Critical patent/CN108080751A/zh
Application granted granted Critical
Publication of CN108080751B publication Critical patent/CN108080751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23GTHREAD CUTTING; WORKING OF SCREWS, BOLT HEADS, OR NUTS, IN CONJUNCTION THEREWITH
    • B23G11/00Feeding or discharging mechanisms combined with, or arranged in, or specially adapted for use in connection with, thread-cutting machines
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/402Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control arrangements for positioning, e.g. centring a tool relative to a hole in the workpiece, additional detection means to correct position
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/182Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by the machine tool function, e.g. thread cutting, cam making, tool direction control
    • G05B19/186Generation of screw- or gearlike surfaces
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31455Monitor process status
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/45Nc applications
    • G05B2219/45216Tapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Mechanical Engineering (AREA)
  • Numerical Control (AREA)

Abstract

本发明提供一种能够维持刚性攻丝的加工精度并能够缩短周期的数值控制装置。上述数值控制装置具备:刚性攻丝控制部,其使主轴的转速和进给速度同步来执行刚性攻丝;同步误差监视部,其在设定为工件上表面以上的高度的R点开始或结束对主轴的转速和进给速度的同步误差的监视;以及工件上表面检测部,其检测工件上表面的位置。代替上述R点,上述同步误差监视部在工件上表面的位置开始对同步误差的监视。

Description

数值控制装置
技术领域
本发明涉及一种数值控制装置,特别涉及一种能够缩短刚性攻丝的周期的数值控制装置。
背景技术
刚性攻丝是使主轴的转速和进给速度同步,由此通过固定的间距进行螺纹切削的加工方法。例如在日本专利第3433967号中公开现有的刚性攻丝的一例。
使用图1来说明现有的刚性攻丝。将开始主轴的转速和进给速度的同步的位置称为R点。R点被设定在离工件上表面预定距离的上方。数值控制装置使主轴快进移动到R点。这样能够缩短周期。R点之后以能够确保同步精度程度的进给速度进行加工。
一般从数值控制装置的指令到实际的轴动作(Z方向的移动以及轴旋转)之前,会产生某种程度的延迟,如果进给速度过快则不能够确保同步精度。
现有的数值控制装置暂时在R点使主轴的移动停止。因为通过暂时消除至此产生的动作相对于指令的延迟,来确保以后的同步精度。数值控制装置在R点以后监视同步精度,如果超过指定的误差量则设为错误。
近年来,为了缩短周期而不实施在R点的轴停止的情形增加。这是因为例如有周期缩短或抑制由于轴停止而产生的碰撞的请求。但是,不实施在R点的轴停止,由此会产生以下的问题。
首先,R点的钻孔轴的位置偏差量,即针对指令,主轴的动作延迟变大,刚性攻丝的同步误差、即主轴与钻孔轴之间的同步误差也变大。因此,如果与目前同样地监视R点以后的同步精度,则错误的发生频率变高。为了抑制这点,当不进行在R点的轴停止时,在同步精度监视处理中必须较大地设定应该判定为错误的误差量的阈值。作为结果,与进行在R点的轴停止的情况相比有可能加工精度变差。即,会产生以下缺点:当忽略由于在R点不进行轴停止而产生的误差时,则会看漏本来不应该看漏的误差。
另外,如果数值控制装置掌握工件上表面的位置,则在R点不进行轴停止的情况下,有可能通过最迟从工件上表面进行严密的同步精度监视也能够维持加工精度。但是,目前为止还未提出这样的方法。
或者,如果增大R点与工件上表面的距离,则能够在使工具从R点移动到工件上表面的期间吸收钻孔轴的位置偏差量,所以即使在R点未停止轴也有能够在某种程度上维持攻丝的加工精度的可能性。但是,如果增大R点和工件上表面的距离则会有周期变长的问题。
使用图2进一步说明该问题。上图表示R点和工件上表面的距离接近时钻孔方向的主轴速度和位置偏差量的时间变化。此时,虽然能够缩短周期,但是切削开始时的误差量变大。另一方面,下图表示R点和工件上表面的距离较远时钻孔方向的主轴速度和位置偏差量的时间变化。此时,能够减小切削开始时的误差量,但是周期延长。
发明内容
本发明是为了解决这样的问题点而提出的,其目的在于提供一种能够维持刚性攻丝的加工精度并能够缩短周期的数值控制装置。
本发明的一个实施方式的数值控制装置具备:刚性攻丝控制部,其使主轴的转速和进给速度同步地执行刚性攻丝;以及同步误差监视部,其在设定为工件上表面以上的高度的R点开始或结束对主轴的转速和进给速度的同步误差的监视,上述数值控制装置还具备检测上述工件上表面的位置的工件上表面检测部,作为上述R点的代替,上述同步误差监视部在上述工件上表面的位置开始对上述同步误差的监视。
其他实施方式的数值控制装置具备:刚性攻丝控制部,其使主轴的转速和进给速度同步地执行刚性攻丝;以及同步误差监视部,其在设定为工件上表面以上的高度的R点开始或结束对主轴的转速和进给速度的同步误差的监视,上述数值控制装置还具备:工件上表面检测部,其检测上述工件上表面的位置;以及机械学习部,其至少在输入上述工件上表面的位置作为状态数据时,以输出在上述状态数据中周期以及工件上表面的同步误差满足预定条件的上述R点的方式进行学习,上述同步误差监视部在上述机械学习部输出的上述R点开始对上述同步误差的监视。
其他实施方式的数值控制装置具备:刚性攻丝控制部,其使主轴的转速和进给速度同步地执行刚性攻丝;以及同步误差监视部,其在设定为工件上表面以上的高度的R点,开始或结束对主轴的转速和进给速度的同步误差的监视,数值控制装置还具备检测上述工件上表面的位置的工件上表面检测部,作为上述R点的代替,上述同步误差监视部在上述工件上表面的位置结束上述同步误差的监视。
根据本发明,能够提供一种既能够维持刚性攻丝的加工精度又能够缩短周期的数值控制装置。
附图说明
通过参照附图对以下实施例的说明,能够明确本发明的上述以及其他目的、特征。这些附图中:
图1是说明现有的刚性攻丝的图。
图2是说明现有的刚性攻丝的问题点的图。
图3是说明实施方式1的数值控制装置的刚性攻丝的图。
图4是说明实施方式2的数值控制装置的刚性攻丝的图。
图5是说明实施方式2的数值控制装置的机械学习部概要的图。
图6是说明实施方式2的数值控制装置的机械学习部动作的图。
图7是表示实施方式1的数值控制装置的结构的框图。
图8是表示实施方式2的数值控制装置的结构的框图。
图9是说明强化学习算法的基本概念的图。
图10是表示神经元模型的示意图。
图11是表示具有三层权重的神经网络的示意图。
具体实施方式
以下,结合附图说明本发明的实施方式。
<实施方式1>
实施方式1的数值控制装置100的特征在于不是从R点而是从工件上表面开始同步误差监视。
图7是表示本发明实施方式1的数值控制装置100的结构的框图。数值控制装置100具有刚性攻丝控制部110、同步误差监视部120以及工件上表面检测部130。数值控制装置100是典型地具备了中央处理装置(CPU)、存储装置以及输入输出装置的信息处理装置,通过由CPU执行预定的程序,逻辑上实现刚性攻丝控制部110、同步误差监视部120以及工件上表面检测部130。
刚性攻丝控制部110控制主轴,执行刚性攻丝。同步误差监视部120在进行工件上表面之后的加工时,监视同步误差,并在误差量超过了预定的阈值时输出错误。工件上表面检测部130在刚性攻丝控制部110执行刚性攻丝之前,检测工件上表面的位置并存储检测出的位置。
接着,说明实施方式1的数值控制装置100的典型动作。一般在执行刚性攻丝之前实施对工件钻开底孔的处理。工件上表面检测部130在执行对工件钻开底孔的处理中,监视主轴的负荷转矩,并且存储负荷增大而超过阈值的时间点的工具的前端位置(图3的左图,为钻孔加工)。该位置被推定为工件的上表面。
接着,刚性攻丝控制部110执行刚性攻丝。这里刚性攻丝控制部110不在R点执行轴停止。另外,同步误差监视部120也不进行R点以后的同步误差监视。
同步误差监视部120始终监视工具的前端位置,并且与工件上表面检测部130所存储的工件的上表面位置进行比较。当工具的前端位置达到工件的上表面时,同步误差监视部120开始同步误差的监视处理(图3的右图,为刚性攻丝)。
更具体地说,同步误差监视部120通过以下的计算式来计算同步误差。
同步误差=(主轴换算位置偏差的差的正侧最大值)-(主轴换算位置偏差的差的负侧最大值)。
主轴换算位置偏差的差=(主轴位置偏差量/齿轮比)-(钻孔轴位置偏差量×主轴每旋转一次的脉冲数)/螺纹的导程。
这里齿轮比是主轴电动机和主轴的齿轮比,典型为1:1。
主轴位置偏差量是针对数值控制装置的角度指令表示实际的主轴的延迟角度的脉冲数。钻孔轴位置偏差量是表示针对数值控制装置的指令,实际的轴的延迟量的脉冲数。
在本实施方式中,将应该判定为错误的误差量的阈值设定为比从R点开始了同步误差监视的情况要小。通常因为从R点到达工件上表面的期间吸收钻孔轴的位置偏差量,同步误差也变小。因此,不需要无意义地采用大的阈值,而是通过设定适当的阈值,能够检测出本来不应该看漏的错误。
根据本实施方式,数值控制装置100不是从R点而是从工件上表面实施同步误差监视。这样,能够防止由于轴在R点停止而造成的周期的下降,也能够维持加工精度。
<实施方式2>
实施方式2的数值控制装置100具备自动调整R点位置的机构。
图8是表示本发明实施方式2的数值控制装置100的结构的框图。数值控制装置100具有刚性攻丝控制部110、同步误差监视部120、工件上表面检测部130以及机械学习部140。数值控制装置100是典型地具备了中央处理装置(CPU)、存储装置以及输入输出装置的信息处理装置,通过由CPU执行预定的程序,逻辑上实现刚性攻丝控制部110、同步误差监视部120、工件上表面检测部130以及机械学习部140。
刚性攻丝控制部110控制主轴,执行刚性攻丝。同步误差监视部120在进行R点之后的加工时,监视同步误差,并在误差量超过了预定的阈值时输出错误。工件上表面检测部130在刚性攻丝控制部110执行刚性攻丝之前,检测工件上表面的位置并存储检测出的位置。机械学习部140是预先实施学习的机械学习器,即在某个条件下,输出能够得到最佳的周期和工件上表面的同步误差的R点位置。
接着,说明实施方式1的数值控制装置100的典型动作。首先,与实施方式1同样,工件上表面检测部130检测并存储工件上表面的位置(图4的左图,为钻孔加工)。接着,机械学习部140以上述工件上表面位置为代表,输入主轴进给速度、主轴转速等状态数据,并使用学习完毕的人工智能来输出能够将周期和工件上表面的同步误差最优化的R点位置(图4的右图,为刚性攻丝)。
接着,刚性攻丝控制部110执行刚性攻丝。刚性攻丝控制部110不在R点执行轴停止。同步误差监视部120在R点开始同步误差监视处理。这样,在本实施方式中使用通过机械学习被最优化的R点,从而能够缩短周期和确保加工精度。
这里,说明机械学习部140的结构。机械学习部140是用于求出刚性攻丝的最优R点的机械学习器。机械学习部140将主轴进给速度、主轴转速、工件上表面位置等设为加工状态的数据(以下称为状态数据),进行在将这些状态数据作为前提而使R点变动时与周期以及工件上表面的同步误差相关的机械学习,由此能够导出与状态数据对应的最优的R点。
以下,简单说明在本实施方式中导入的机械学习。
<1.机械学习>
机械学习通过分析从被输入到进行机械学习的装置(以下为机械学习器)中的数据集合中提取其中有用的规则和知识表现、判断基准等,输出其判定结果,并且通过进行知识的学习来实现。机械学习的方法有各种各样,但是大致分为“有教师学习”、“无教师学习”以及“强化学习”。进一步,有被称为“深层学习”的方法,即在实现这些方法的基础上学习提取特征量本身的方法。
“有教师学习”指将某个输入和结果(标签)的数据集大量地赋予机械学习器,由此能够学习位于这些数据集中的特征,并通过归纳获得从输入推定出结果的模型即其关系性。这能够使用后述的神经网络等算法来实现。
“无教师学习”指将输入数据大量地赋予学习装置,由此学习输入数据如何分布,并且即使不赋予相应的教师输出数据,也学习针对输入数据进行压缩、分类、整形等的装置的方法。能够将位于这些数据集中的特征聚类到相似的特征中。使用其结果设置某些基准,进行使其为最优的输出的分配,由此能够实现输出的预测。另外,作为“无教师学习”和“有教师学习”的中间问题设定,也有称为“半有教师学习”的,这种情况为只存在一部分输入和输出的数据的组,这以外只是输入的数据。在本实施方式中,通过无教师学习使用实际不使加工机动作也能够取得的数据,能够高效地进行学习。
“强化学习”指不仅判定和分类,还学习行为,由此考虑对环境施加行为的相互作用来学习适当的行为,即为了使未来所得到的回报为最大的学习方法。在强化学习中,机械学习器能够从完全不知道行为引起的结果的状态、或者从不完全知道的状态开始学习。另外,也能够将以模拟人的动作的方式进行了事先学习(上述的有教师学习或逆强化学习的方法)的状态设为初始状态,从好的开始地点开始学习。
另外,需要考虑在对加工机适用机械学习时,加工机实际开始动作并能够将其结果作为数据而得到的情况,即需要一边试错一边搜索最优的行为。因此,在本实施方式中,采用通过赋予回报,机械学习器自动学习达到目标的行为的强化学习的算法作为机械学习器的主要学习算法。
图9是说明强化学习算法的基本概念的图。在强化学习中,通过成为学习的主体的智能体(机械学习器)和成为控制对象的环境(控制对象系统)的交换,能够推进智能体的学习和行为。更具体地说,在智能体和环境之间进行以下的交换:(1)智能体观测某个时间点的环境的状态st,(2)根据观测结果和过去的学习来选择自己能采取的行为at并执行行为at,(3)根据某些规则以及行为at的执行,环境的状态st变化为下一个状态st+1,(4)智能体根据作为行为at的结果的状态变化来获取回报rt+1,(5)智能体根据状态st、行为at、回报rt+1以及过去的学习结果来推进学习。
在强化学习的初始阶段,智能体完全不了解在(2)的行为选择中用于选择针对环境的状态st的最优的行为at的价值判断基准。因此智能体在某个状态st下选择各种行为at,并根据针对此时的行为at所赋予的回报rt+1来学习更优良的行为的选择、即正确的价值判断的基准。
在上述的(5)的学习中,智能体获取观测到的状态st、行为at、回报rt+1的制图作为成为用于判断将来能够取得的回报量的基准的信息。例如,如果在各个时刻所取得的状态个数为m、所取得的行为的个数为n,则通过重复行为能够得到存储针对状态st和行为at的组的回报rt+1的m×n的二维排列。
并且,使用表示根据上述得到的制图而选择出的状态和行为有多优良的函数即价值函数(评价函数),在重复行为过程中更新价值函数(评价函数),从而学习针对状态的最优的行为。
状态价值函数V(st)是表示某个状态st是有多良好的状态的价值函数。状态价值函数V(st)表现为将状态设为自变量的函数,在重复行为的过程中的学习中,根据针对某个状态的行为而得到的回报、通过该行为而转移的未来状态的价值等进行更新。根据强化学习的算法来定义状态价值函数V(st)的更新式,例如在作为强化学习算法之一的TD学习中,通过以下的数式1来更新状态价值函数V(st)。另外,在数式1中α是学习系数,γ被称为折扣率,被定义在0≤α≤1,0<γ≤1的范围。
[数式1]
V(st)←V(st)+α[rt+1+γV(st+1)-V(st)]
另外,行为价值函数Q(st,at)是表示在某个状态st,行为at是有多良好的行为的价值函数。行为价值函数Q(st,at)表现为将状态和行为设为自变量的函数,在重复行为的过程中的学习中,根据针对某个状态的行为而得到的回报、通过该行为而转移的未来状态的价值等进行更新。根据强化学习的算法来定义行为价值函数Q(st,at)的更新式,例如在作为代表的强化学习算法之一的Q学习中,通过以下的数式2来更新行为价值函数Q(st,at)。另外,在数式2中α是学习系数,γ被称为折扣率,被定义在0≤α≤1,0<γ≤1的范围。
[数式2]
Figure BDA0001474794050000081
该数式表示基于根据行为at的结果返回的回报rt+1来更新状态st的行为at的评价值Q(st,at)的方法。表示如果回报rt+1+行为at的下一个状态的最良行为max(a)的评价值Q(st+1,max(a))比状态st的行为at的评价值Q(st,at)要大,则增大Q(st,at),相反如果小,则Q(st,at)也减小。即,使某个状态的某个行为的价值接近作为结果即时返回的回报、该行为的下一个状态的最良的行为价值。
在Q学习中,目标为重复这样的更新,由此最终Q(st,at)成为期待值E[Σγtrt](在根据最优的行为状态发生变化时得到期待值。当然,因为不了解这些情况,所以必须一边探索一边学习)。
然后,在上述的(2)的行为选择中,使用通过过去的学习而生成的价值函数(评价函数)来选择在当前的状态st下将来的回报(rt+1+rt+2+……)成为最大的行为at(使用状态价值函数V(st)时,用于转移到价值更高的状态的行为、使用行为价值函数Q(st,at)时,在该状态下价值最高的行为)。另外,在智能体的学习过程中也有以学习的进展为目的,在(2)的行为选择中通过一定的概率来选择随机的行为的方法(ε贪婪法)。
另外,作为存储作为学习结果的价值函数(评价函数)的方法,有针对所有的状态行为对(s,a)将其值保持为表格(行为价值表)的方法、准备将上述价值函数进行近似的函数的方法。在后者的方法中,能够通过以随机梯度下降法等方法调整近似函数的参数来实现上述的更新式。作为近似函数能够使用神经网络等的有教师学习器。
神经网络例如由用于实现模拟了图10所示的神经元的模型的神经网络的运算装置以及存储器等构成。图2是表示神经元的模型的示意图。
如图10所示,神经元输出针对多个输入x(这里作为一例为输入x1~输入x3)的输出y。与该输入x对应的权重w(w1~w3)与各个输入x1~输入x3相乘。这样,神经元输出通过接下来的数式3表现的输出y。另外,在数式3中,输入x、输出y以及权重w都是向量。另外,θ是偏置,fk是激活函数。
[数式3]
Figure BDA0001474794050000091
接着,参照图11说明具有组合了上述神经元的3层权重的神经网络。图11是表示具有D1~D3的3层权重的神经网络的示意图。如图11所示,从神经网络的左侧输入多个输入x(这里作为一例为输入x1~输入x3),从右侧输出结果y(这里作为一例为结果y1~结果y3)。
具体地说,输入x1~输入x3与相应的权重相乘后分别输入到3个神经元N11~N13中。与这些输入相乘的权重被汇总标记为w1。神经元N11~N13分别输出z11~z13。
这些z11~z13被汇总标记为特征向量z1,能够视为提取了输入向量的特征量的向量。该特征向量z1是权重w1与权重w2之间的特征向量。
z11~z13与相应的权重相乘后分别输入到2个神经元N21、N22中。与这些特征向量相乘的权重被汇总标记为w2。神经元N21、N22分别输出z21、z22。这些被汇总标记为特征向量z2。该特征向量z2是权重w2与权重w3之间的特征向量。
特征向量z21、z22与相应的权重相乘后输入分别到3个神经元N31~N33中。与这些特征向量相乘的权重被汇总标记为w3。
最后,神经元N31~N33分别输出结果y1~y3。
神经网络的动作中有学习模式和价值预测模式,在学习模式中使用学习数据集来学习权重w,使用其参数在预测模式中进行加工机的行为判断(为了方便,写为预测,但是可以是检测、分类、推论等多种任务)。
在预测模式中能够即时学习实际使加工机运作而得到的数据,并反映到接下来的行为中(在线学习),也能够使用预先收集到的数据群进行汇总后的学习,以后一直通过该参数进行检测模式(批量学习)。有可能存在如下情形,即其中间的每次在数据某种程度滞留时夹入学习模式。
能够通过误差反向传播法(反向传播:Backpropagation)来学习w1~w3。误差的信息从右侧进入,流到左侧。误差反向传播法是为了针对各个神经元减小输入了输入x时的输出y和真的输出y(教师)之间的差分而分别调整(学习)权重的方法。
神经网络能够在3层以上进一步增加层(称为深层学习)。能够阶段性地进行输入的特征提取,并仅根据教师数据自动获得用于反馈结果的运算装置。
通过将这种神经网络作为近似函数来使用,能够重复上述强化学习过程中的(1)~(5)并存储上述的价值函数(评价函数)作为神经网络来推进学习。
在某个环境中结束了学习后,即使在新的环境中也进行追加的学习,由此能够适应该环境地推进学习。因此,如本发明那样适用于线放电加工机的模拟装置中的型芯的各个焊接区间的位置和长度的调整,由此即使是在适用于新的加工前提条件(成为加工对象的工件的形状、工件厚度、工件素材的密度、焊接区间最小距离、每个焊接单位长度的耐力、使型芯掉下时的力等)的情况下,也能够对过去的型芯的各个焊接区间的位置和长度的调整的学习进行追加新的加工前提条件的学习,由此能够在短时间进行型芯的各个焊接区间的位置和长度的调整的学习。
另外,在强化学习中,作为经由网络等连接了多个智能体的系统,在智能体间共享状态s、行为a、回报r等信息并用于各自的学习,由此进行每个智能体考虑其他的智能体的环境而进行学习的分散强化学习,从而能够进行高效的学习。本发明中在被组装到多个环境(线放电加工机的模拟装置)中的多个智能体(机械学习器)经由网络等进行连接的状态下进行分散机械学习,由此能够高效地进行线放电加工机的模拟装置中的型芯的各个焊接区间的位置和长度的调整的学习。
另外,作为强化学习的算法,公知有Q学习、SARSA法、TD学习、AC法等各种方法,但是作为适用于本发明的方法可以采用任意的强化学习算法。上述的每个强化学习算法都是公知的,所以省略本说明书中的各个算法的详细说明。
接着,说明机械学习部140的实施方式。
<2.实施方式>
图5是表示机械学习部140中的R点的最优化机械学习的概念的图。另外,图5中只表示本实施方式的机械学习的说明所需要的结构。
机械学习部140包括状态观测部141、判定数据取得部142、学习部143、意图决定部144。学习部143包括回报计算部1431、价值函数更新部1432。
状态观测部141取得状态数据作为用于确定环境(<1.机械学习>中说明的状态st)的信息。在本实施方式中,作为状态数据而使用主轴的进给速度、主轴转速、工件上表面位置。主轴的进给速度以及主轴转速是数值控制装置100能够从加工机取得的数据。能够通过工件上表面检测部130取得工件上表面位置。另外,作业者也可以适当决定使用哪个数据作为状态数据。
另外,在本实施方式中机械学习部140对环境输出的信息(在<1.机械学习>说明的行为at)是R点的位置。另外,在本实施方式中,如图6所示,采用周期的长短(正/负回报)、工件上表面的同步误差(正/负回报)作为对机械学习部140赋予的回报(在<1.机械学习>说明的回报rt)。例如,关于周期,将按照程序指令在R点加工时的周期作为基准值,当与基准值相等时赋予0的回报,当比基准值长时赋予-5的回报,当比基准值短时赋予+5的回报。关于工件上表面的同步误差,当与预先决定的基准值相等时赋予0的回报,当比预先决定的基准值大时赋予-20的回报,当比预先决定的基准值小时赋予+5的回报。另外,作业者也可以适当决定根据哪个数据赋予怎样的回报。
在本实施方式中,机械学习部140根据上述的输入数据、输出数据、回报来进行机械学习。在机械学习中,通过输入数据的组合来定义状态st,以定义后的状态st为前提的R点的设定成为行为at,并且对于通过行为at进行了刚性攻丝的结果进行评价计算的值为回报rt+1,如在<1.机械学习>说明的那样,将其应用到与机械学习的算法对应的价值函数(评价函数)的更新式,从而推进学习。
意图决定部144根据学习部143学习的结果和当前状态的数据来决定并输出最优的R点的位置。这里所说的R点的位置的决定相当于用于机械学习的行为a。R点的位置例如可以作为能够选择R点的位置的行为(例如,行为1=工件上表面+0.1mm、行为2=工件上表面+0.2mm、……)来准备,根据过去的学习结果选择在将来能够得到的回报变为最大的行为。另外,也可以采用上述的ε贪婪法,并通过预定的概率选择随机的行为,由此谋求学习部143的学习进展。
然后,意图决定部144将通过行为的选择而决定的R点的位置输出给同步误差监视部120。之后,进行回报计算部1431的评价值的计算以及状态观测部141的状态数据的取得,通过重复机械学习能够得到更加优秀的学习结果。
如果上述学习结束,则机械学习部140可以不进行新的学习,并直接使用学习结束时的学习数据来进行运转。另外,也可以在其他的数值控制装置100上安装学习结束后的机械学习部140(或者复制了其他机械学习部140的结束后的学习数据的机械学习部140),并直接使用学习结束时的学习数据来进行运转。
数值控制装置100的机械学习部140可以单独进行机械学习,但是如果还具备多个数值控制装置100分别与外部的通信单元,则能够分别收发机械学习部140所存储的学习结果并进行共享,能够更高效地进行机械学习。例如,在多个数值控制装置100中使不同的R点位置分别在预定的范围内变动,在每个数值控制装置100之间交换状态数据和学习数据,从而并行地推进学习,由此能够高效地进行学习。
这样在多个数值控制装置100之间进行交换时,通信可以经由作为上位装置的主计算机进行,也可以直接在数值控制装置100之间进行通信,也可以使用云,但是会有处理大量数据的情况,因此最好尽量是通信速度快的通信单元。
<实施方式3>
实施方式3的数值控制装置100具有将从工件拔出工具后的R点的位置最优化的特点。
在实施方式1以及实施方式2中,说明对工件进行加工前的时间点,即,使工具贯穿到工件之前的时间点的R点的设定方法。在实施方式3中,说明从工件拔出工具后的R点的设定方法。
如图1所示,目前使工具贯穿到工件之前的时间点的R点与从工件拔出工具后的时间点的R点被设定在相同的位置。但是,R点是将主轴的转速和进给速度之间的同步状态设为接通/切断的点。即,从工件拔出工具后的R点是解除至此维持的同步状态的点。通常,如果从工件拔出工具,则没有以后也应该维持同步状态的理由。因此,从工件拔出工具后的最优的R点的位置是工件上表面。
实施方式3的数值控制装置100的结构与实施方式1相同。即,数值控制装置100具有刚性攻丝控制部110、同步误差监视部120以及工件上表面检测部130。
刚性攻丝控制部110控制主轴并执行刚性攻丝。同步误差监视部120在进行工件上表面(将实施方式1作为前提的情况)或R点(将实施方式2或现有技术作为前提的情况)之后的加工时,监视同步误差,并在误差量超过了预定的阈值时输出错误。另外,同步误差监视部120在从工件上表面拔出工具的时间点结束同步误差的监视。工件上表面检测部130在刚性攻丝控制部110执行刚性攻丝之前,检测工件上表面的位置并存储检测出的位置。
进一步说明同步误差监视部120的动作。同步误差监视部120在执行刚性攻丝过程中也始终监视工具的前端位置,并且与工件上表面检测部130所存储的工件的上表面位置进行比较。在工具前端经过工件上表面暂时到达孔底,并反转后再次到达工件上表面时,同步误差监视部120结束同步误差的监视处理。
根据本实施方式,数值控制装置100在从工件上表面拔出工具的时间点结束同步误差监视。换句话说,在工件上表面设定拔出工具后的R点。这样,目前能够省略在刚性攻丝结束后从工件上表面到达R点期间所进行的同步误差监视处理,能够提高周期。
另外,本发明不限于上述实施方式,能够在不脱离主旨的范围进行适当变更。本发明在该发明的范围内,能够进行实施方式的任意结构要素的变形或实施方式的任意结构要素的省略。
例如,在上述实施方式中,工件上表面检测部130根据底孔加工的主轴负荷来检测出工件上表面,但是本发明不限定于此,也可以使用其他任意的方法,例如距离传感器等来检测工件上表面位置。

Claims (3)

1.一种数值控制装置,在设定为超过工件上表面的高度的R点开始或结束主轴的转速与进给速度的同步,执行刚性攻丝,在R点不停止主轴的轴移动,该数值控制装置的特征在于,
该数值控制装置还具备:工件上表面检测部,其检测上述工件上表面的位置,
该数值控制装置具备:同步误差监视部,其在上述工件上表面的位置开始用于判断同步误差的误差量是否超过了预定的阈值的监视。
2.一种数值控制装置,在设定为超过工件上表面的高度的R点开始或结束主轴的转速与进给速度的同步,执行刚性攻丝,在R点不停止主轴的轴移动,该数值控制装置的特征在于,
该数值控制装置还具备:
工件上表面检测部,其检测上述工件上表面的位置;以及
机械学习部,其至少在将上述工件上表面的位置作为状态数据输入时,以输出能够使在上述状态数据中周期以及工件上表面的同步误差最优化的上述R点的方式进行学习。
3.一种数值控制装置,在设定为超过工件上表面的高度的R点开始或结束主轴的转速与进给速度的同步,执行刚性攻丝,在R点不停止主轴的轴移动,该数值控制装置的特征在于,
该数值控制装置具备:
工件上表面检测部,其检测上述工件上表面的位置;以及
同步误差监视部,其在上述工件上表面的位置结束用于判断同步误差的误差量是否超过了预定的阈值的监视。
CN201711160358.0A 2016-11-21 2017-11-20 数值控制装置 Active CN108080751B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016226254A JP6412086B2 (ja) 2016-11-21 2016-11-21 数値制御装置
JP2016-226254 2016-11-21

Publications (2)

Publication Number Publication Date
CN108080751A CN108080751A (zh) 2018-05-29
CN108080751B true CN108080751B (zh) 2020-06-02

Family

ID=62068709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711160358.0A Active CN108080751B (zh) 2016-11-21 2017-11-20 数值控制装置

Country Status (4)

Country Link
US (1) US10459424B2 (zh)
JP (1) JP6412086B2 (zh)
CN (1) CN108080751B (zh)
DE (1) DE102017010759B4 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210053970A (ko) 2018-10-12 2021-05-12 딥마인드 테크놀로지스 리미티드 TVT(temporal value transport)를 사용하여 롱 타임 스케일에 대한 에이전트 제어
TWI779456B (zh) * 2021-01-08 2022-10-01 仁一生醫股份有限公司 雙主軸加工的運動控制方法及雙主軸加工設備
JPWO2023026368A1 (zh) * 2021-08-24 2023-03-02
CN114488949B (zh) * 2022-01-19 2024-06-11 成都飞机工业(集团)有限责任公司 实现数控加工状态监控数据与学习数据同步的方法和装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4509126A (en) * 1982-06-09 1985-04-02 Amca International Corporation Adaptive control for machine tools
US4778313A (en) * 1987-05-18 1988-10-18 Manuflex Corp. Intelligent tool system
JPH0451959Y2 (zh) * 1987-11-27 1992-12-07
JPH01301017A (ja) * 1988-05-30 1989-12-05 Okuma Mach Works Ltd タッピング制御方法
JPH0241814A (ja) 1988-08-03 1990-02-13 Fanuc Ltd リジッドタップの動作確認装置
JPH0669659B2 (ja) * 1988-12-12 1994-09-07 日立精機株式会社 切削監視装置
JPH0777691B2 (ja) * 1989-04-28 1995-08-23 オ−クマ株式会社 数値制御方法及びその装置
US5165828A (en) * 1991-08-12 1992-11-24 Penn Engineering & Manufacturing Corp. Cam-actuated thread tapper
JP3433967B2 (ja) * 1993-04-22 2003-08-04 ファナック株式会社 リジッドタップ制御装置
US6233497B1 (en) * 1997-09-18 2001-05-15 Mitsubishi Denki Kabushiki Kaisha Contact detecting method and an apparatus for the same
JP3787481B2 (ja) * 2000-03-30 2006-06-21 株式会社ジェイテクト 工作機械における切削工具の負荷検出方法および装置
JP4043996B2 (ja) 2003-01-20 2008-02-06 ファナック株式会社 サーボモータ駆動制御装置
JP4070744B2 (ja) * 2004-04-28 2008-04-02 ファナック株式会社 同期制御装置
JP4361071B2 (ja) * 2005-07-08 2009-11-11 ファナック株式会社 サーボ制御装置
JP5314110B2 (ja) * 2011-11-25 2013-10-16 ファナック株式会社 マスタ軸とスレーブ軸との同期制御を行うモータ制御装置
JP5890275B2 (ja) * 2012-08-08 2016-03-22 オークマ株式会社 高速同期軸位置制御装置
CN105122160B (zh) * 2013-04-08 2017-07-14 三菱电机株式会社 数控装置
TWI492008B (zh) * 2013-11-01 2015-07-11 Ind Tech Res Inst 工作機械控制系統及其方法
JP5815784B2 (ja) * 2014-04-08 2015-11-17 ファナック株式会社 同期加工における同期誤差を低減するサーボ制御装置
DE102015103047B3 (de) * 2015-03-03 2016-08-18 Trumpf Laser- Und Systemtechnik Gmbh Initiale Abstandseinnahme für die Laserbearbeitung
JP6034913B2 (ja) 2015-03-30 2016-11-30 ファナック株式会社 主軸と送り軸との同期運転を制御する工作機械の制御装置及び制御方法

Also Published As

Publication number Publication date
US20180143612A1 (en) 2018-05-24
US10459424B2 (en) 2019-10-29
JP6412086B2 (ja) 2018-10-24
DE102017010759B4 (de) 2021-08-05
DE102017010759A1 (de) 2018-05-24
JP2018083238A (ja) 2018-05-31
CN108080751A (zh) 2018-05-29

Similar Documents

Publication Publication Date Title
US10289075B2 (en) Machine learning apparatus for optimizing cycle processing time of processing machine, motor control apparatus, processing machine, and machine learning method
US10082771B2 (en) Machine learning method and machine learning apparatus learning operating command to electric motor and machine tool including machine learning apparatus
CN108080751B (zh) 数值控制装置
US10668619B2 (en) Controller and machine learning device
JP6619192B2 (ja) 移動軸異常負荷警告機能を有するワイヤ放電加工機
US9830559B2 (en) Machine learning unit, spindle replacement judging device, controller, machine tool, production system, and machine learning method, which are able to judge necessity of spindle replacement
CN108241342B (zh) 数值控制装置以及机器学习装置
US10502253B2 (en) Machine learning device for learning assembly operation and component assembly system
US10466658B2 (en) Numerical controller and machine learning device
US11119464B2 (en) Controller and machine learning device
CN106560997B (zh) 机械学习装置以及电动机控制装置
US10698380B2 (en) Numerical controller
JP6659652B2 (ja) 加工条件調整装置及び機械学習装置
US20190291270A1 (en) Controller, machine learning device, and system
US10908572B2 (en) Programmable controller and machine learning device
US11897066B2 (en) Simulation apparatus
US10908599B2 (en) Testing device and machine learning device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant