KR102224970B1 - 제어 장치 및 기계 학습 장치 - Google Patents

제어 장치 및 기계 학습 장치 Download PDF

Info

Publication number
KR102224970B1
KR102224970B1 KR1020180141090A KR20180141090A KR102224970B1 KR 102224970 B1 KR102224970 B1 KR 102224970B1 KR 1020180141090 A KR1020180141090 A KR 1020180141090A KR 20180141090 A KR20180141090 A KR 20180141090A KR 102224970 B1 KR102224970 B1 KR 102224970B1
Authority
KR
South Korea
Prior art keywords
machining
path
processing
learning
environment
Prior art date
Application number
KR1020180141090A
Other languages
English (en)
Other versions
KR20190056993A (ko
Inventor
도모히토 오오사와
Original Assignee
화낙 코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 화낙 코퍼레이션 filed Critical 화낙 코퍼레이션
Publication of KR20190056993A publication Critical patent/KR20190056993A/ko
Application granted granted Critical
Publication of KR102224970B1 publication Critical patent/KR102224970B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/19Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by positioning or contouring control systems, e.g. to control position from one programmed point to another or to control movement along a programmed continuous path
    • G05B19/21Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by positioning or contouring control systems, e.g. to control position from one programmed point to another or to control movement along a programmed continuous path using an incremental digital measuring device
    • G05B19/25Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by positioning or contouring control systems, e.g. to control position from one programmed point to another or to control movement along a programmed continuous path using an incremental digital measuring device for continuous-path control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23HWORKING OF METAL BY THE ACTION OF A HIGH CONCENTRATION OF ELECTRIC CURRENT ON A WORKPIECE USING AN ELECTRODE WHICH TAKES THE PLACE OF A TOOL; SUCH WORKING COMBINED WITH OTHER FORMS OF WORKING OF METAL
    • B23H7/00Processes or apparatus applicable to both electrical discharge machining and electrochemical machining
    • B23H7/02Wire-cutting
    • B23H7/06Control of the travel curve of the relative movement between electrode and workpiece
    • B23H7/065Electric circuits specially adapted therefor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23HWORKING OF METAL BY THE ACTION OF A HIGH CONCENTRATION OF ELECTRIC CURRENT ON A WORKPIECE USING AN ELECTRODE WHICH TAKES THE PLACE OF A TOOL; SUCH WORKING COMBINED WITH OTHER FORMS OF WORKING OF METAL
    • B23H7/00Processes or apparatus applicable to both electrical discharge machining and electrochemical machining
    • B23H7/14Electric circuits specially adapted therefor, e.g. power supply
    • B23H7/20Electric circuits specially adapted therefor, e.g. power supply for programme-control, e.g. adaptive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23HWORKING OF METAL BY THE ACTION OF A HIGH CONCENTRATION OF ELECTRIC CURRENT ON A WORKPIECE USING AN ELECTRODE WHICH TAKES THE PLACE OF A TOOL; SUCH WORKING COMBINED WITH OTHER FORMS OF WORKING OF METAL
    • B23H7/00Processes or apparatus applicable to both electrical discharge machining and electrochemical machining
    • B23H7/02Wire-cutting
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/37Measurements
    • G05B2219/37506Correction of position error
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40499Reinforcement learning algorithm
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/45Nc applications
    • G05B2219/45043EDM machine, wire cutting
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/45Nc applications
    • G05B2219/45221Edm, electrical discharge machining, electroerosion, ecm, chemical

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
  • Numerical Control (AREA)

Abstract

와이어 방전 가공기를 제어하는 제어 장치가 구비하는 기계 학습 장치는, 상태 관측부가 관측한 상태 변수 (S) (보정량, 가공 경로, 가공 조건, 가공 환경에 관한 데이터를 포함한다) 와, 판정 데이터 취득부가 취득한 판정 데이터를 사용하여, 가공 경로의 보정을 기계 학습한다. 그 학습 결과를 사용함으로써, 와이어 방전 가공기에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경에 따른, 가공 경로의 보정을, 자동적이고 또한 정확하게 실시하는 것이 가능해진다.

Description

제어 장치 및 기계 학습 장치{CONTROLLER AND MACHINE LEARNING DEVICE}
본 발명은 제어 장치 및 기계 학습 장치에 관한 것이다.
와이어 커트 방전 가공기에 의한 가공 중에는, 도 7 에 나타내는 바와 같이, 와이어 전극과 피가공물 사이에 발생하는 방전의 반발력이나 가공액의 수류에 의해 와이어 전극에 휨이 발생한다. 이와 같은 휨에 의한 영향을 고려하지 않고 가공을 실시한 경우, 코너부 및 원호부에 있어서, 와이어 전극의 휨량 (와이어 전극의 지연량) 에 의해 코너부에서 가공 경로와 실제의 와이어 궤적 사이에 엇갈림이 발생하여, 가공물에 볼록부 결손이나 오목부 제거 잔재가 발생한다 (도 8). 이와 같이, 코너부 및 원호부에 있어서는 와이어 전극의 휨량의 영향이 크게 나타나 코너부의 형상 정밀도가 크게 저하되어, 소위 「코너 늘어짐」이 발생하여, 의도한 바와 같은 형상이 가공에 의해 얻어지지 않는 문제가 있다.
종래, 「코너 늘어짐」을 방지하기 위해서, 코너부 및 원호부에서는, 가공 조건 (방전 조건) 이나 가공 속도의 자동 조정 (가공 조건 제어), 및 가공 경로의 자동 보정 (가공 경로 보정) 을 실시하는 기술이 있다 (일본 공개특허공보 소58-120428호, 일본 공개특허공보 평05-228736호, 일본 공개특허공보 2014-148036호). 이와 같은 종래 기술을 사용함으로써, 와이어 전극이 가공 경로의 코너부나 원호부에 가까워졌을 때 가공 조건을 변경하고, 방전 전압이나 가공액의 압력, 액량을 제어하여 와이어 전극에 가해지는 압력을 저감시키는 것에 의해 휨량을 작게 함으로써, 코너부나 원호부에 있어서의 침투나 제거 잔재가 작아지도록 할 수 있다. 또, 와이어 전극의 휨이 발생하고 있는 부분이 지령 경로대로 이동하도록 와이어 전극의 지령 경로를 보정함으로써, 코너부나 원호부에 있어서의 침투나 제거 잔재가 작아지도록 할 수 있다. 이들 가공 조건 제어 및 가공 경로 보정은, 수치 제어 장치가 계산하는 가공 경로의 형상 데이터 (블록 길이, 코너 각도, 원호 반경, 원호 중심각 등) 에 기초하여 제어가 실시된다.
그러나, 와이어 전극이 가공 경로의 코너부나 원호부에 가까워졌을 때 가공 조건을 변경하는 종래 기술에서는, 가공 속도를 의도적으로 변경함으로써 와이어의 휨을 완화시키고 있으므로, 그 만큼 가공 속도가 저하되어, 가공 시간이 증대된다는 문제가 있다.
또, 와이어 전극의 휨을 고려하여 가공 경로를 보정하는 종래 기술에서는, 숙련된 작업자가 경험칙에 기초하여 가공 경로를 보정할 필요가 있어, 단순한 형상으로는 잘 보정할 수 있는 경우도 있지만, 모두 코너에 대해 효과적인 보정을 실시할 수 있다고는 할 수 없다.
그래서 본 발명의 목적은, 와이어 방전 가공에 있어서 가공 시간을 필요 이상으로 증대시키지 않고 코너 늘어짐을 방지할 수 있는 최적의 가공 경로를 산출하는 것이 가능한 제어 장치 및 기계 학습 장치를 제공하는 것이다.
본 발명에서는, 와이어 방전 가공기를 제어하는 제어 장치에 대해 기계 학습 장치를 도입하고, 기계 학습에 의해 코너부 및 원호부에 있어서 가공 시간을 필요 이상으로 증대시키지 않고 코너 늘어짐을 방지할 수 있는 최적의 가공 경로를 학습함으로써 상기 과제를 해결한다.
본 발명의 일 양태에 의한 제어 장치는, 가공 프로그램에 기초하여 와이어 방전 가공기를 제어하여 워크를 가공하는 제어 장치로서, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 상기 가공에 있어서의 가공 경로의 보정을 학습하는 기계 학습 장치를 구비한다. 그리고, 상기 기계 학습 장치는, 상기 가공에 있어서의 가공 경로의 보정량을 나타내는 보정량 데이터, 상기 가공의 부분 가공 경로를 나타내는 가공 경로 데이터, 상기 가공의 가공 조건을 나타내는 가공 조건 데이터, 및 상기 가공의 가공 환경에 관련된 가공 환경 데이터를, 환경의 현재 상태를 나타내는 상태 변수로서 관측하는 상태 관측부와, 상기 보정량에 의해 보정된 가공 경로에 기초하는 가공의 가공 정밀도의 적부 (適否) 판정 결과를 나타내는 가공 정밀도 판정 데이터, 및 상기 보정량에 의해 보정된 가공 경로에 기초하는 가공에 걸리는 가공 시간의 적부 판정 결과를 나타내는 가공 시간 판정 데이터를, 판정 데이터로서 취득하는 판정 데이터 취득부와, 상기 상태 변수와 상기 판정 데이터를 사용하여, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경과, 상기 가공에 있어서의 가공 경로의 보정을 관련지어 학습하는 학습부를 구비한다.
상기 학습부는, 상기 적부 판정 결과에 관련된 리워드 (보상) 를 구하는 리워드 계산부와, 상기 리워드를 사용하여, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 상기 가공에 있어서의 가공 경로의 보정의 가치를 나타내는 함수를 갱신하는 가치 함수 갱신부를 구비해도 된다. 그리고, 상기 리워드 계산부는, 상기 가공 정밀도가 높을수록, 또, 상기 가공 시간의 증대가 적을수록 높은 리워드를 부여해도 된다.
상기 학습부는, 상기 상태 변수와 상기 판정 데이터를 다층 구조로 연산해도 된다.
본 발명의 다른 양태에 의한 제어 장치는, 가공 프로그램에 기초하여 와이어 방전 가공기를 제어하여 워크를 가공하는 제어 장치로서, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 상기 가공에 있어서의 가공 경로의 보정을 학습한 기계 학습 장치를 구비한다. 그리고, 상기 기계 학습 장치는, 상기 가공에 있어서의 가공 경로의 보정량을 나타내는 보정량 데이터, 상기 가공의 부분 가공 경로를 나타내는 가공 경로 데이터, 상기 가공의 가공 조건을 나타내는 가공 조건 데이터, 및 상기 가공의 가공 환경에 관련된 가공 환경 데이터를, 환경의 현재 상태를 나타내는 상태 변수로서 관측하는 상태 관측부와, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경과, 상기 가공에 있어서의 가공 경로의 보정을 관련지어 학습한 학습부와, 상기 상태 관측부가 관측한 상태 변수와, 상기 학습부에 의한 학습 결과에 기초하여, 가공 경로의 보정량을 출력하는 추정 결과 출력부를 구비한다.
상기 기계 학습 장치는, 클라우드 서버에 존재해도 된다.
본 발명의 일 양태에 의한 기계 학습 장치는, 가공 프로그램에 기초하여 워크를 가공하는 와이어 방전 가공기에 의한 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 상기 가공에 있어서의 가공 경로의 보정을 학습한다. 이 기계 학습 장치는, 상기 가공에 있어서의 가공 경로의 보정량을 나타내는 보정량 데이터, 상기 가공의 부분 가공 경로를 나타내는 가공 경로 데이터, 상기 가공의 가공 조건을 나타내는 가공 조건 데이터, 및 상기 가공의 가공 환경에 관련된 가공 환경 데이터를, 환경의 현재 상태를 나타내는 상태 변수로서 관측하는 상태 관측부와, 상기 보정량에 의해 보정된 가공 경로에 기초하는 가공의 가공 정밀도의 적부 판정 결과를 나타내는 가공 정밀도 판정 데이터, 및 상기 보정량에 의해 보정된 가공 경로에 기초하는 가공에 걸리는 가공 시간의 적부 판정 결과를 나타내는 가공 시간 판정 데이터를, 판정 데이터로서 취득하는 판정 데이터 취득부와, 상기 상태 변수와 상기 판정 데이터를 사용하여, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경과, 상기 가공에 있어서의 가공 경로의 보정을 관련지어 학습하는 학습부를 구비한다.
본 발명의 다른 양태에 의한 기계 학습 장치는, 가공 프로그램에 기초하여 워크를 가공하는 와이어 방전 가공기에 의한 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 상기 가공에 있어서의 가공 경로의 보정을 학습한 기계 학습 장치이다. 이 가공 경로의 보정을 학습 완료한 기계 학습 장치는, 상기 가공에 있어서의 가공 경로의 보정량을 나타내는 보정량 데이터, 상기 가공의 부분 가공 경로를 나타내는 가공 경로 데이터, 상기 가공의 가공 조건을 나타내는 가공 조건 데이터, 및 상기 가공의 가공 환경에 관련된 가공 환경 데이터를, 환경의 현재 상태를 나타내는 상태 변수로서 관측하는 상태 관측부와, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경과, 상기 가공에 있어서의 가공 경로의 보정을 관련지어 학습한 학습부와, 상기 상태 관측부가 관측한 상태 변수와, 상기 학습부에 의한 학습 결과에 기초하여, 가공 경로의 보정량을 출력하는 추정 결과 출력부를 구비한다.
본 발명에 의해, 와이어 방전 가공에 있어서 가공 시간을 필요 이상으로 증대시키지 않고 코너 늘어짐을 방지할 수 있는 최적의 가공 경로를 산출할 수 있다.
도 1 은, 제 1 실시형태에 의한 제어 장치의 개략적인 하드웨어 구성도이다.
도 2 는, 제 1 실시형태에 의한 제어 장치의 개략적인 기능 블록도이다.
도 3 은, 제어 장치의 일 형태를 나타내는 개략적인 기능 블록도이다.
도 4 는, 기계 학습 방법의 일 형태를 나타내는 개략적인 플로 차트이다.
도 5A 는, 뉴런을 설명하는 도면이다.
도 5B 는, 뉴럴 네트워크를 설명하는 도면이다.
도 6 은, 제어 장치를 장착한 시스템의 일 형태를 나타내는 개략적인 기능 블록도이다.
도 7 은, 와이어 커트 방전 가공에 있어서의 와이어 전극의 휨에 대해 설명하는 도면이다.
도 8 은, 종래 기술에 있어서의 가공 경로의 코너부 및 원호부에서의 코너 늘어짐에 대해 설명하는 도면이다.
도 1 은 제 1 실시형태에 의한 제어 장치의 주요부를 나타내는 개략적인 하드웨어 구성도이다. 제어 장치 (1) 는, 예를 들어 와이어 방전 가공기를 제어하는 제어 장치로서 실장할 수 있다.
본 실시형태에 의한 제어 장치 (1) 가 구비하는 CPU (11) 는, 제어 장치 (1) 를 전체적으로 제어하는 프로세서이다. CPU (11) 는, ROM (12) 에 격납된 시스템·프로그램을 버스 (20) 를 개재하여 판독 출력하고, 그 시스템·프로그램에 따라 제어 장치 (1) 전체를 제어한다. RAM (13) 에는 일시적인 계산 데이터나 표시 데이터, 도시되지 않은 입력부를 통하여 오퍼레이터가 입력한 각종 데이터 등이 일시적으로 격납된다.
불휘발성 메모리 (14) 는, 예를 들어 도시되지 않은 배터리에 의해 백업되거나 하여, 제어 장치 (1) 의 전원이 오프되어도 기억 상태가 유지되는 메모리로서 구성된다. 불휘발성 메모리 (14) 에는, 인터페이스 (15) 를 통하여 외부 기기 (72) 로부터 판독 입력된 가공 프로그램이나 표시기/MDI 유닛 (70) 을 통하여 입력된 가공 프로그램, 제어 장치 (1) 의 각 부나 와이어 방전 가공기로부터 취득된 각종 데이터 (예를 들어, 와이어 방전 가공의 가공 조건, 와이어나 워크의 정보, 와이어 방전 가공기의 각 축 위치, 와이어 위치, 외기온, 가공액 온도, 가공액의 저항률, 노즐 간격 등) 가 기억되어 있다. 불휘발성 메모리 (14) 에 기억된 가공 프로그램이나 각종 데이터는, 실행시/이용시에는 RAM (13) 에 전개 (展開) 되어도 된다. 또, ROM (12) 에는, 공지된 해석 프로그램 등의 각종 시스템·프로그램 (후술하는 기계 학습 장치 (100) 와의 상호 작용을 제어하기 위한 시스템·프로그램을 포함한다) 이 미리 기록되어 있다.
인터페이스 (15) 는, 제어 장치 (1) 와 어댑터 등의 외부 기기 (72) 와 접속하기 위한 인터페이스이다. 외부 기기 (72) 측으로부터는 프로그램이나 각종 파라미터 등이 판독 입력된다. 또, 제어 장치 (1) 내에서 편집한 프로그램이나 각종 파라미터 등은, 외부 기기 (72) 를 통하여 외부 기억 수단에 기억시킬 수 있다. 프로그래머블·머신·컨트롤러 (PMC) (16) 는, 제어 장치 (1) 에 내장된 시퀀스·프로그램에 의해 와이어 방전 가공기 및 그 와이어 방전 가공기의 주변 장치 (예를 들어, 공구 교환용의 로봇 핸드와 같은 액추에이터) 에 I/O 유닛 (17) 을 통하여 신호를 출력하고 제어한다. 또, 와이어 방전 가공기의 본체에 배비된 조작반의 각종 스위치 등의 신호를 수취하고, 그 신호에 필요한 처리를 한 후에, CPU (11) 에 건네준다.
표시기/MDI 유닛 (70) 은 디스플레이나 키보드 등을 구비한 수동 데이터 입력 장치이다. 인터페이스 (18) 는 표시기/MDI 유닛 (70) 의 키보드로부터의 지령, 데이터를 수취하여 CPU (11) 에 건네준다. 인터페이스 (19) 는 각 축을 수동으로 구동시킬 때 사용하는 수동 펄스 발생기 등을 구비한 조작반 (71) 에 접속되어 있다.
와이어 방전 가공기가 구비하는 축을 제어하기 위한 축 제어 회로 (30) 는 CPU (11) 로부터의 축의 이동 지령량을 수취하여, 축의 지령을 서보 앰프 (40) 에 출력한다. 서보 앰프 (40) 는 이 지령을 받아, 와이어 방전 가공기가 구비하는 축을 이동시키는 서보 모터 (50) 를 구동시킨다. 축의 서보 모터 (50) 는 위치·속도 검출기를 내장하고, 이 위치·속도 검출기로부터의 위치·속도 피드백 신호를 축 제어 회로 (30) 에 피드백하여, 위치·속도의 피드백 제어를 실시한다. 또한, 도 1 의 하드웨어 구성도에서는 축 제어 회로 (30), 서보 앰프 (40), 서보 모터 (50) 는 1 개씩밖에 나타나 있지 않지만, 실제로는 제어 대상이 되는 와이어 방전 가공기에 구비된 축의 수만큼 준비된다.
인터페이스 (21) 는, 제어 장치 (1) 와 기계 학습 장치 (100) 를 접속하기 위한 인터페이스이다. 기계 학습 장치 (100) 는, 기계 학습 장치 (100) 전체를 통괄 제어하는 프로세서 (101) 와, 시스템·프로그램 등을 기억한 ROM (102), 기계 학습에 관련된 각 처리에 있어서의 일시적인 기억을 실시하기 위한 RAM (103), 및 학습 모델 등의 기억에 사용되는 불휘발성 메모리 (104) 를 구비한다. 기계 학습 장치 (100) 는, 인터페이스 (21) 를 통하여 제어 장치 (1) 에 의해 취득 가능한 각 정보 (예를 들어, 가공 프로그램, 와이어 방전 가공의 가공 조건, 와이어나 워크의 정보, 와이어 방전 가공기의 각 축의 위치, 와이어의 위치, 외기온, 가공액의 온도, 가공액의 저항률, 노즐 간격 등) 를 관측할 수 있다. 또, 제어 장치 (1) 는, 기계 학습 장치 (100) 로부터 출력되는, 와이어 방전 가공기의 가공 경로의 조정 지령을 받아, 와이어 방전 가공기를 제어한다.
도 2 는, 제 1 실시형태에 의한 제어 장치 (1) 와 기계 학습 장치 (100) 의 개략적인 기능 블록도이다. 도 2 에 나타낸 각 기능 블록은, 도 1 에 나타낸 제어 장치 (1) 가 구비하는 CPU (11), 및 기계 학습 장치 (100) 의 프로세서 (101) 가, 각각의 시스템·프로그램을 실행하고, 제어 장치 (1) 및 기계 학습 장치 (100) 의 각 부의 동작을 제어함으로써 실현된다.
본 실시형태의 제어 장치 (1) 는, 불휘발성 메모리 (14) 에 기억된 가공 프로그램 및 기계 학습 장치 (100) 로부터 출력된 가공 경로의 보정량의 추정 결과에 기초하여 와이어 방전 가공기 (2) 를 제어하는 제어부 (34) 를 구비한다.
한편, 제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 는, 와이어 방전 가공기 (2) 에 의한 가공의 와이어 위치의 전후의 가공 경로 (이하, 부분 가공 경로라고 한다), 가공 조건 및 가공 환경에 대한, 가공 경로의 보정량의 추정을, 이른바 기계 학습에 의해 스스로 학습하기 위한 소프트웨어 (학습 알고리즘 등) 및 하드웨어 (프로세서 (101) 등) 를 포함한다. 제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 가 학습하는 것은, 와이어 방전 가공기에 의한 가공의 부분 가공 경로, 가공 조건 및 가공 환경과, 가공 경로의 보정량의, 상관성을 나타내는 모델 구조에 상당한다.
도 2 에 기능 블록에서 나타내는 바와 같이, 제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 는, 와이어 방전 가공기 (2) 의 가공 경로의 보정량을 나타내는 보정량 데이터 (S1) 와, 와이어 방전 가공기의 현재의 와이어 위치의 부분 가공 경로를 나타내는 가공 경로 데이터 (S2) 와, 가공 조건을 나타내는 가공 조건 데이터 (S3) 와, 가공 환경에 관련된 가공 환경 데이터 (S4) 를 포함하는 환경의 현재 상태를 나타내는 상태 변수 (S) 를 관측하는 상태 관측부 (106) 와, 와이어 방전 가공기 (2) 에 의한 가공에 있어서 가공 경로가 보정된 경우에 있어서의 가공 정밀도를 나타내는 가공 정밀도 판정 데이터 (D1) 및 와이어 방전 가공기에 의한 가공 운전에 있어서의 가공 시간을 나타내는 가공 시간 판정 데이터 (D2) 를 포함하는 판정 데이터 (D) 를 취득하는 판정 데이터 취득부 (108) 와, 상태 변수 (S) 와 판정 데이터 (D) 를 사용하여, 와이어 방전 가공기에 의한 가공의 부분 가공 경로와, 가공 조건 및 가공 환경에, 가공 경로의 보정량을 관련지어 학습하는 학습부 (110) 를 구비한다.
상태 관측부 (106) 가 관측하는 상태 변수 (S) 중, 보정량 데이터 (S1) 는, 와이어 방전 가공기 (2) 에 의한 가공의 가공 경로에 대한 보정량으로서 취득할 수 있다. 와이어 방전 가공기 (2) 에 의한 가공의 가공 경로에 대한 보정량으로는, 예를 들어 가공 경로의 진행 방향에 대한 좌우 방향으로의 오프셋값 (좌우 어느 하나의 방향을 정 (正) 부호로 한 오프셋량) 으로서 정의할 수 있다.
상태 관측부 (106) 가 관측하는 상태 변수 (S) 중, 가공 경로 데이터 (S2) 는, 와이어의 현재 위치로부터, 그 와이어의 현재 위치의 전후의 가공 경로를 소정의 샘플링 거리로 분할한 점에 대한 벡터 데이터의 계열로서 취득할 수 있다. 와이어의 현재 위치의 전후의 가공 경로를 나타내는 샘플링점에 대한 벡터 데이터는, 와이어의 현재 위치를 원점으로 하고, 와이어의 진행 방향을 소정의 축이 되도록 좌표값을 변환함으로써 정규화된 경우의 벡터 데이터로 해도 된다.
상태 관측부 (106) 가 관측하는 상태 변수 (S) 중, 가공 조건 데이터 (S3)는, 와이어 방전 가공기 (2) 에 의한 와이어 방전 가공기 (2) 의 가공 조건의 세트로서 취득할 수 있다. 와이어 방전 가공의 가공 조건으로는, 예를 들어 전압값, 전류값, 와이어의 이동 속도, 단위 시간당의 방전 횟수, 가공액압 등을 들 수 있다.
상태 관측부 (106) 가 관측하는 상태 변수 (S) 중, 가공 환경 데이터 (S4) 는, 와이어 방전 가공기 (2) 에 의한 와이어 방전 가공의 환경 조건의 세트로서 취득할 수 있다. 와이어 방전 가공기 (2) 의 환경 조건으로는, 예를 들어 워크 재질, 워크 판 두께, 와이어 직경, 노즐 간격 등을 들 수 있다.
보정량 데이터 (S1) 는, 기계 학습 장치 (100) 가 학습부 (110) 의 학습 결과에 기초하여 현재보다 1 개 전의 학습 주기에 와이어 방전 가공기 (2) 에 의해 실시된 가공의 부분 가공 경로, 가공 조건, 가공 환경에 대해, 현재의 학습 주기에 있어서 결정한 가공 경로의 보정량을 그대로 사용할 수 있고, 이와 같은 수법을 취하는 경우에는, 기계 학습 장치 (100) 는 가공 경로의 보정량을 학습 주기마다 RAM (103) 에 일시적으로 기억시켜 두고, 상태 관측부 (106) 는, RAM (103) 으로부터 1 개 전의 학습 주기에 있어서의 가공 경로의 보정량을 이번 학습 주기의 보정량 데이터 (S1) 로서 취득하도록 해도 된다.
판정 데이터 취득부 (108) 는, 가공 정밀도 판정 데이터 (D1) 로서, 와이어 방전 가공기 (2) 에 의한 가공에 의해 가공 경로의 보정이 실시된 경우에 있어서의 가공 정밀도를 사용할 수 있다. 판정 데이터 취득부 (108) 가 사용하는 가공 정밀도 판정 데이터 (D1) 로는, 가공 경로가 보정되어 실제로 가공이 실시된 경로를 레이저 측정기나 카메라 등의 측정기 (3) 에 의해 측정하고, 그것이 가공 프로그램에 의해 지령되는 가공 경로와 얼마나 일치하고 있는지 (얼마나 오차가 적은지) 를 나타내는 값을 사용하도록 해도 된다.
또, 판정 데이터 취득부 (108) 는, 가공 시간 판정 데이터 (D2) 로서, 와이어 방전 가공기 (2) 에 의한 가공에 의해 가공 경로의 보정이 실시된 경우에 있어서의 가공 경로의 가공에 걸린 시간을 사용할 수 있다. 판정 데이터 취득부 (108) 가 사용하는 가공 시간 판정 데이터 (D2) 로는, 예를 들어 가공 경로를 보정하지 않고 가공한 경우에 걸리는 예측 가공 시간과, 가공 경로를 보정한 경우에 실제로 걸린 가공 시간의 차분이 얼마나 작은지 (얼마나 시간을 들이지 않고 보정된 가공을 실시할 수 있었는지) 를 나타내는 값을 사용하도록 해도 된다.
학습부 (110) 에 동시에 입력되는 상태 변수 (S) 는, 학습부 (110) 에 의한 학습 주기로 생각한 경우, 판정 데이터 (D) 가 취득된 1 학습 주기 전의 데이터에 기초하는 것이 된다. 이와 같이, 제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 가 학습을 진행시키는 동안, 환경에 있어서는, 가공 경로 데이터 (S2), 가공 조건 데이터 (S3) 및 가공 환경 데이터 (S4) 의 취득, 취득한 각 데이터에 기초하여 추정된 보정량 데이터 (S1) 에 기초한 와이어 방전 가공기의 가공 경로의 보정, 판정 데이터 (D) 의 취득이 반복하여 실시된다.
학습부 (110) 는, 기계 학습으로 총칭되는 임의의 학습 알고리즘에 따라, 와이어 방전 가공기 (2) 에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경에 대한, 가공 경로의 보정을 학습한다. 학습부 (110) 는, 전술한 상태 변수 (S) 와 판정 데이터 (D) 를 포함하는 데이터 집합에 기초하는 학습을 반복 실행할 수 있다. 와이어 방전 가공기에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경에 대한 가공 경로의 보정의 학습 사이클의 반복 중, 상태 변수 (S) 는, 상기한 바와 같이 1 학습 주기 전에 있어서의 부분 가공 경로, 가공 조건이나 환경 조건, 및 1 학습 주기 전에 있어서 결정된 가공 경로의 보정으로부터 취득하고, 또 판정 데이터 (D) 는, 보정된 가공 경로에 기초하는 가공의 적부 판정 결과로 한다.
이와 같은 학습 사이클을 반복함으로써, 학습부 (110) 는, 와이어 방전 가공기 (2) 에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경과, 가공 경로의 보정의 상관성을 암시하는 특징을 자동적으로 식별할 수 있다. 학습 알고리즘의 개시시에는 와이어 방전 가공기 (2) 에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경과, 가공 경로의 보정의 상관성은 실질적으로 알려지지 않았지만, 학습부 (110) 는, 학습을 진행시킴에 따라 서서히 특징을 식별하여 상관성을 해석한다. 와이어 방전 가공기 (2) 에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경과, 가공 경로의 보정의 상관성이, 어느 정도 신뢰할 수 있는 수준까지 해석되면, 학습부 (110) 가 반복 출력하는 학습 결과는, 현재 상태 (요컨대 와이어 방전 가공기에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경) 에 대해, 가공 경로의 보정을 어떻게 해야 할 것인지라는 행동의 선택 (요컨대 의사 결정) 을 실시하기 위해서 사용할 수 있는 것이 된다. 요컨대 학습부 (110) 는, 학습 알고리즘의 진행에 수반하여, 와이어 방전 가공기 (2) 에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경과, 현상태에 대해 가공 경로의 보정을 어떠한 값으로 해야 할 것인지라는 행동의, 상관성을 최적의 해답에 서서히 근접하게 할 수 있다.
추정 결과 출력부 (122) 는, 학습부 (110) 가 학습한 결과에 기초하여, 가공 경로의 보정량을 결정하고, 결정된 보정량을 제어부 (34) 에 출력한다. 추정 결과 출력부 (122) 는, 학습부 (110) 에 의한 학습이 완료된 상태에 있어서, 기계 학습 장치 (100) 에 와이어 방전 가공기 (2) 에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경이 입력되면, 가공 경로의 보정량을 출력한다.
상기한 바와 같이, 제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 는, 상태 관측부 (106) 가 관측한 상태 변수 (S) 와 판정 데이터 취득부 (108) 가 취득한 판정 데이터 (D) 를 사용하여, 학습부 (110) 가 기계 학습 알고리즘에 따라, 가공 경로의 보정을 학습한다. 상태 변수 (S) 는, 보정량 데이터 (S1), 가공 경로 데이터 (S2), 가공 조건 데이터 (S3) 및 가공 환경 데이터 (S4) 와 같은 데이터로 구성되고, 또 판정 데이터 (D) 는, 제어 장치 (1) 가 와이어 방전 가공기 (2) 및 측정기 (3) 로부터 취득한 정보를 해석함으로써 일의적으로 구해진다. 따라서, 제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 에 의하면, 학습부 (110) 의 학습 결과를 사용함으로써, 와이어 방전 가공기 (2) 에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경에 따른, 가공 경로의 보정을, 자동적이고 또한 정확하게 실시하는 것이 가능해진다.
그리고, 가공 경로의 보정을, 자동적으로 실시할 수 있으면, 와이어 방전 가공기 (2) 에 의한 가공의 부분 가공 경로 (가공 경로 데이터 (S2)), 가공 조건 (가공 조건 데이터 (S3)), 및 가공 환경 (가공 환경 데이터 (S4)) 을 파악하는 것만으로, 가공 경로의 보정의 적절한 값을 신속히 결정할 수 있다. 따라서, 가공 경로의 보정의 결정을 효율적으로 실시할 수 있다.
상기 구성을 갖는 기계 학습 장치 (100) 에서는, 학습부 (110) 가 실행하는 학습 알고리즘은 특별히 한정되지 않고, 기계 학습으로서 공지된 학습 알고리즘을 채용할 수 있다. 도 3 은, 도 2 에 나타내는 제어 장치 (1) 의 일 형태로서, 학습 알고리즘의 일례로서 강화 학습을 실행하는 학습부 (110) 를 구비한 구성을 나타낸다. 강화 학습은, 학습 대상이 존재하는 환경의 현재 상태 (요컨대 입력) 를 관측함과 함께 현재 상태에서 소정의 행동 (요컨대 출력) 을 실행하고, 그 행동에 대해 어떠한 리워드를 부여한다는 사이클을 시행 착오적으로 반복하여, 리워드의 총계가 최대화되는 방책 (본원의 기계 학습 장치에서는 가공 경로의 보정) 을 최적의 해답으로서 학습하는 수법이다.
도 3 에 나타내는 제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 에 있어서, 학습부 (110) 는, 상태 변수 (S) 에 기초하여 가공 경로의 보정이 실시된 경우에 있어서의 와이어 방전 가공기에 의한 가공의 적부 판정 결과 (상태 변수 (S) 가 취득된 후의 학습 주기에서 사용되는 판정 데이터 (D) 에 상당) 에 관련된 리워드 (R) 를 구하는 리워드 계산부 (112) 와, 리워드 (R) 를 사용하여, 가공 경로의 보정의 가치를 나타내는 함수 (Q) 를 갱신하는 가치 함수 갱신부 (114) 를 구비한다. 학습부 (110) 는, 가치 함수 갱신부 (114) 가 함수 (Q) 의 갱신을 반복함으로써 와이어 방전 가공기에 의한 가공에 있어서의 가공 경로, 가공 조건, 가공 환경에 대한 가공 경로의 보정을 학습한다.
학습부 (110) 가 실행하는 강화 학습의 알고리즘의 일례를 설명한다. 이 예에 의한 알고리즘은, Q 학습 (Q-learning) 으로서 알려지는 것으로서, 행동 주체의 상태 (s) 와, 그 상태 (s) 에서 행동 주체가 선택할 수 있는 행동 (a) 을 독립 변수로 하고, 상태 (s) 에서 행동 (a) 을 선택한 경우의 행동의 가치를 나타내는 함수 (Q) (s, a) 를 학습하는 수법이다. 상태 (s) 에서 가치 함수 (Q) 가 가장 높아지는 행동 (a) 을 선택하는 것이 최적의 해답이 된다. 상태 (s) 와 행동 (a) 의 상관성이 알려지지 않은 상태에서 Q 학습을 개시하고, 임의의 상태 (s) 에서 여러 가지의 행동 (a) 을 선택하는 시행 착오를 반복함으로써, 가치 함수 (Q) 를 반복하여 갱신하고, 최적의 해답에 근접하게 한다. 여기서, 상태 (s) 에서 행동 (a) 을 선택한 결과로서 환경 (요컨대 상태 (s)) 이 변화했을 때, 그 변화에 따른 리워드 (요컨대 행동 (a) 의 가중치) (r) 가 얻어지도록 구성하고, 보다 높은 리워드 (r) 가 얻어지는 행동 (a) 을 선택하도록 학습을 유도함으로써, 가치 함수 (Q) 를 비교적 단시간에 최적의 해답에 근접하게 할 수 있다.
가치 함수 (Q) 의 갱신식은, 일반적으로 하기의 (1) 식과 같이 나타낼 수 있다. (1) 식에 있어서, st 및 at 는 각각 시각 (t) 에 있어서의 상태 및 행동이며, 행동 (at) 에 의해 상태는 st+1 로 변화한다. rt+1 은, 상태가 st 로부터 st+1 로 변화함으로써 얻어지는 리워드이다. maxQ 의 항은, 시각 t+1 에서 최대의 가치 함수 (Q) 가 되는 (최대의 가치 함수가 (Q) 가 된다고 시각 (t) 에서 생각되고 있다) 행동 (a) 을 실시했을 때의 Q 를 의미한다. α 및 γ 는 각각 학습 계수 및 할인율이고, 0 < α ≤ 1, 0 < γ ≤ 1 로 임의 설정된다.
Figure 112018113907105-pat00001
...... (1)
학습부 (110) 가 Q 학습을 실행하는 경우, 상태 관측부 (106) 가 관측한 상태 변수 (S) 및 판정 데이터 취득부 (108) 가 취득한 판정 데이터 (D) 는, 갱신식의 상태 (s) 에 해당하고, 현재 상태 (요컨대, 와이어 방전 가공기에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경) 에 대한 가공 경로의 보정을 어떻게 결정해야 할 것인지라는 행동은, 갱신식의 행동 (a) 에 해당하고, 리워드 계산부 (112) 가 구하는 리워드 (R) 는, 갱신식의 리워드 (r) 에 해당한다. 따라서 가치 함수 갱신부 (114) 는, 현재 상태에 대한 가공 경로의 보정의 가치를 나타내는 함수 (Q) 를, 리워드 (R) 를 사용한 Q 학습에 의해 반복 갱신한다.
리워드 계산부 (112) 가 구하는 리워드 (R) 는, 예를 들어, 가공 경로의 보정을 결정한 후에 결정된 가공 경로의 보정에 기초하여 와이어 방전 가공기에 의한 가공이 실시되었을 때, 와이어 방전 가공기에 의한 가공의 적부 판정 결과가 「적합」이라고 판정되는 경우 (예를 들어, 보정된 가공 경로에 기초하여 가공된 부분의 가공 정밀도가 높았을 경우, 보정된 가공 경로에 기초하는 가공에 걸리는 가공 시간의 증가량이 적었을 경우 등) 에 정 (正) (플러스) 의 리워드 (R) 로 하고, 가공 경로의 보정을 결정한 후에 결정된 가공 경로의 보정에 기초하여 와이어 방전 가공기에 의한 가공이 실시되었을 때, 와이어 방전 가공기의 가동 상태의 적부 판정 결과가 「부적합」이라고 판정되는 경우 (예를 들어, 보정된 가공 경로에 기초하여 가공된 부분의 가공 정밀도가 미리 정한 소정의 임계값보다 나빴을 경우, 보정된 가공 경로에 기초하는 가공에 걸리는 가공 시간의 증가량이 미리 정한 소정의 임계값 이상이었을 경우 등) 에 부 (負) (마이너스) 의 리워드 (R) 로 할 수 있다. 정부의 리워드 (R) 의 절대값은, 서로 동일해도 되고 상이해도 된다. 또, 판정의 조건으로서, 판정 데이터 (D) 에 포함되는 복수의 값을 조합하여 판정하도록 해도 된다.
또, 와이어 방전 가공기에 의한 가공의 적부 판정 결과를, 「적합」및 「부적합」의 2 가지뿐만 아니라 복수 단계로 설정할 수 있다. 예로서, 와이어 방전 가공기에 의한 가공에 있어서의 가공 정밀도의 지표로서 허용 오차가 Emax 인 경우, 와이어 방전 가공기에 의한 가공에서 발생한 오차 (E) 가, 0 ≤ E < Emax/5 일 때에는 리워드 (R) = 5 를 부여하고, Emax/5 ≤ E < Emax/2 일 때에는 리워드 (R) = 3 을 부여하고, Emax/2 ≤ E < Emax 일 때에는 리워드 (R) = 2 를, Emax ≤ E 일 때에는 리워드 (R) = 1 을 부여하는 구성으로 할 수 있다. 또, 예를 들어 와이어 방전 가공기에 의한 가공에 걸리는 가공 시간이 미리 정한 소정의 임계값을 상회한 경우 등에는, 큰 마이너스 리워드를 부여하는 것과 같이, 학습의 목적에 맞추어 리워드의 부여를 적절히 조정해도 된다. 또한, 학습의 초기 단계는 Emax 를 비교적 크게 설정하고, 학습이 진행됨에 따라 Emax 를 축소하는 구성으로 할 수도 있다.
가치 함수 갱신부 (114) 는, 상태 변수 (S) 와 판정 데이터 (D) 와 리워드 (R) 를, 함수 (Q) 로 나타내는 행동 가치 (예를 들어 수치) 와 관련지어 정리한 행동 가치 테이블을 가질 수 있다. 이 경우, 가치 함수 갱신부 (114) 가 함수 (Q) 를 갱신한다는 행위는, 가치 함수 갱신부 (114) 가 행동 가치 테이블을 갱신한다는 행위와 동일한 의미이다. Q 학습의 개시시에는 환경의 현재 상태와 가공 경로의 보정의 상관성은 알려지지 않았기 때문에, 행동 가치 테이블에 있어서는, 여러 가지 상태 변수 (S) 와 판정 데이터 (D) 와 리워드 (R) 가, 무작위로 정한 행동 가치의 값 (함수 (Q)) 과 관련지은 형태로 준비되어 있다. 또한 리워드 계산부 (112) 는, 판정 데이터 (D) 를 알 수 있으면, 이것에 대응하는 리워드 (R) 를 즉시 산출할 수 있어, 산출된 값 (R) 이 행동 가치 테이블에 기록된다.
와이어 방전 가공기의 가동 상태의 적부 판정 결과에 따른 리워드 (R) 를 사용하여 Q 학습을 진행시키면, 보다 높은 리워드 (R) 가 얻어지는 행동을 선택하는 방향으로 학습이 유도되고, 선택한 행동을 현재 상태에서 실행한 결과로서 변화되는 환경의 상태 (요컨대 상태 변수 (S) 및 판정 데이터 (D)) 에 따라, 현재 상태에서 실시하는 행동에 대한 행동 가치의 값 (함수 (Q)) 이 재기록되어 행동 가치 테이블이 갱신된다. 이 갱신을 반복함으로써, 행동 가치 테이블에 표시되는 행동 가치의 값 (함수 (Q)) 은, 적정한 행동 (본 발명의 경우, 보다 와이어 방전 가공기에 의한 가공의 사이클 타임이 크게 증대되지 않는 범위에서 가공 정밀도를 향상시키는 행동) 일수록 큰 값이 되도록 재기록할 수 있다. 이와 같이 하여, 알려지지 않은 환경의 현재 상태 (와이어 방전 가공기에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경) 와 그에 대한 행동 (가공 경로의 보정) 의 상관성이 서서히 명백해진다. 요컨대 행동 가치 테이블의 갱신에 의해, 와이어 방전 가공기에 의한 가공에 있어서의 부분 가공 경로, 가공 조건, 가공 환경과, 가공 경로의 보정의 관계가 최적의 해답에 서서히 근접하게 된다.
도 4 를 참조하여, 학습부 (110) 가 실행하는 상기한 Q 학습의 플로 (요컨대 기계 학습 방법의 일 형태) 를 추가로 설명한다.
먼저 스텝 SA01 에서, 가치 함수 갱신부 (114) 는, 그 시점에서의 행동 가치 테이블을 참조하면서, 상태 관측부 (106) 가 관측한 상태 변수 (S) 가 나타내는 현재 상태에서 실시하는 행동으로서 가공 경로의 보정량을 무작위로 선택한다. 다음으로 가치 함수 갱신부 (114) 는, 스텝 SA02 에서, 상태 관측부 (106) 가 관측하고 있는 현재 상태의 상태 변수 (S) 를 받아들이고, 스텝 SA03 에서, 판정 데이터 취득부 (108) 가 취득하고 있는 현재 상태의 판정 데이터 (D) 를 받아들인다. 다음으로 가치 함수 갱신부 (114) 는, 스텝 SA04 에서, 판정 데이터 (D) 에 기초하여, 가공 경로의 보정량이 적당했는지의 여부를 판단하고, 적당한 경우, 스텝 SA05 에서, 리워드 계산부 (112) 가 구한 정의 리워드 (R) 를 함수 (Q) 의 갱신식에 적용하고, 이어서 스텝 SA06 에서, 현재 상태에 있어서의 상태 변수 (S) 및 판정 데이터 (D) 와 리워드 (R) 와 행동 가치의 값 (갱신 후의 함수 (Q)) 을 사용하여 행동 가치 테이블을 갱신한다. 스텝 SA04 에서, 가공 경로의 보정이 적당하지 않았다고 판단한 경우, 스텝 SA07 에서, 리워드 계산부 (112) 가 구한 부의 리워드 (R) 를 함수 (Q) 의 갱신식에 적용하고, 이어서 스텝 SA06 에서, 현재 상태에 있어서의 상태 변수 (S) 및 판정 데이터 (D) 와 리워드 (R) 와 행동 가치의 값 (갱신 후의 함수 (Q)) 을 사용하여 행동 가치 테이블을 갱신한다. 학습부 (110) 는, 스텝 SA01 ∼ SA07 을 반복함으로써 행동 가치 테이블을 반복하여 갱신하고, 가공 경로의 보정의 학습을 진행시킨다. 또한, 스텝 SA04 로부터 스텝 SA07 까지의 리워드 (R) 를 구하는 처리 및 가치 함수의 갱신 처리는, 판정 데이터 (D) 에 포함되는 각각의 데이터에 대해 실행된다.
전술한 강화 학습을 진행시킬 때, 예를 들어 뉴럴 네트워크를 응용할 수 있다. 도 5A 는, 뉴런의 모델을 모식적으로 나타낸다. 도 5B 는, 도 5A 에 나타내는 뉴런을 조합하여 구성한 3 층의 뉴럴 네트워크의 모델을 모식적으로 나타낸다. 뉴럴 네트워크는, 예를 들어, 뉴런의 모델을 본뜬 연산 장치나 기억 장치 등에 의해 구성할 수 있다.
도 5A 에 나타내는 뉴런은, 복수의 입력 (x) (여기서는 일례로서, 입력 (x1) ∼ 입력 (x3)) 에 대한 결과 (y) 를 출력하는 것이다. 각 입력 (x1 ∼ x3) 에는, 이 입력 (x) 에 대응하는 가중치 (w) (w1 ∼ w3) 가 가해진다. 이로써, 뉴런은, 다음 (2) 식에 의해 표현되는 결과 (y) 를 출력한다. 또한, (2) 식에 있어서, 입력 (x), 결과 (y) 및 가중치 (w) 는, 모두 벡터이다. 또, θ 는 바이어스이고, fk 는 활성화 함수이다.
Figure 112018113907105-pat00002
....... (2)
도 5B 에 나타내는 3 층의 뉴럴 네트워크는, 좌측으로부터 복수의 입력 (x) (여기서는 일례로서, 입력 (x1, x2, x3)) 이 입력되고, 우측으로부터 결과 (y) (여기서는 일례로서, 결과 (y1, y2, y3)) 가 출력된다. 도시된 예에서는, 입력 (x1, x2, x3) 의 각각에 대응하는 가중치 (총칭하여 w1 로 나타낸다) 가 곱해져, 개개의 입력 (x1, x2, x3) 이 모두 3 개의 뉴런 (N11, N12, N13) 에 입력되어 있다.
뉴런 (N11 ∼ N13) 의 각각의 출력을, 총칭하여 z1 로 나타낸다. 출력 (z1) 은, 입력 벡터의 특징량을 추출한 특징 벡터라고 간주할 수 있다. 도 5B 의 예에서는, 특징 벡터 (z1) 의 각각에 대응된 가중치 (총칭하여 w2 로 나타낸다) 가 곱해져, 개개의 특징 벡터 (z1) 가 모두 2 개의 뉴런 (N21, N22) 에 입력되어 있다. 특징 벡터 (z1) 은, 가중치 (w1) 와 가중치 (w2) 사이의 특징을 나타낸다.
뉴런 (N21 ∼ N22) 의 각각의 출력을, 총칭하여 z2 로 나타낸다. 출력 (z2) 은, 특징 벡터 (z1) 의 특징량을 추출한 특징 벡터라고 간주할 수 있다. 도 5B 의 예에서는, 특징 벡터 (z2) 의 각각에 대응된 가중치 (총칭하여 w3 으로 나타낸다) 가 곱해져, 개개의 특징 벡터 (z2) 가 모두 3 개의 뉴런 (N31, N32, N33) 에 입력되어 있다. 특징 벡터 (z2) 는, 가중치 (w2) 와 가중치 (w3) 사이의 특징을 나타낸다. 마지막으로 뉴런 (N31 ∼ N33) 은, 각각 결과 (y1 ∼ y3) 을 출력한다.
또한, 3 층 이상의 층을 이루는 뉴럴 네트워크를 사용한, 이른바 딥 러닝의 수법을 사용하는 것도 가능하다.
제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 에 있어서는, 상태 변수 (S) 와 판정 데이터 (D) 를 입력 (x) 으로 하고, 학습부 (110) 가 상기한 뉴럴 네트워크에 따르는 다층 구조의 연산을 실시함으로써, 가공 경로의 보정 (결과 (y)) 을 출력할 수 있다. 또, 제어 장치 (1) 가 구비하는 기계 학습 장치 (100) 에 있어서는, 뉴럴 네트워크를 Q 학습에 있어서의 가치 함수로서 사용하여, 상태 변수 (S) 와 행동 (a) 을 입력 (x) 으로 하고, 학습부 (110) 가 상기한 뉴럴 네트워크에 따르는 다층 구조의 연산을 실시함으로써, 당해 상태에 있어서의 당해 행동의 가치 (결과 (y)) 를 출력할 수도 있다. 또한, 뉴럴 네트워크의 동작 모드에는, 학습 모드와 가치 예측 모드가 있고, 예를 들어 학습 모드에서 학습 데이터 세트를 사용하여 가중치 (w) 를 학습하고, 학습한 가중치 (w) 를 사용하여 가치 예측 모드에서 행동의 가치 판단을 실시할 수 있다. 또한 가치 예측 모드에서는, 검출, 분류, 추론 등을 실시할 수도 있다.
상기한 제어 장치 (1) 의 구성은, 기계 학습 장치 (100) 의 프로세서 (101) 가 실행하는 기계 학습 방법 (혹은 소프트웨어) 으로서 기술할 수 있다. 이 기계 학습 방법은, 가공 경로의 보정을 학습하는 기계 학습 방법으로서, 컴퓨터의 CPU 가, 보정량 데이터 (S1), 가공 경로 데이터 (S2), 가공 조건 데이터 (S3) 및 가공 환경 데이터 (S4) 를, 와이어 방전 가공기의 가공을 실시하는 환경의 현재 상태를 나타내는 상태 변수 (S) 로서 관측하는 스텝과, 결정된 가공 경로의 보정에 기초하는 와이어 방전 가공기에 의한 가공의 적부 판정 결과를 나타내는 판정 데이터 (D) 를 취득하는 스텝과, 상태 변수 (S) 와 판정 데이터 (D) 를 사용하여, 가공 경로 데이터 (S2), 가공 조건 데이터 (S3) 및 가공 환경 데이터 (S4) 와, 가공 경로의 보정을 관련지어 학습하는 스텝을 갖는다.
도 6 은, 제어 장치 (1) 를 구비한 제 2 실시형태에 의한 시스템 (170) 을 나타낸다. 시스템 (170) 은, 셀 컴퓨터나 호스트 컴퓨터, 클라우드 서버 등의 컴퓨터의 일부로서 실장된 적어도 1 대의 제어 장치 (1) 와, 시험의 대상이 되는 복수의 와이어 방전 가공기 (2) 와, 제어 장치 (1), 와이어 방전 가공기 (2) 를 서로 접속하는 유선/무선의 네트워크 (172) 를 구비한다.
상기 구성을 갖는 시스템 (170) 은, 기계 학습 장치 (100) 를 구비하는 제어 장치 (1) 가, 학습부 (110) 의 학습 결과를 사용하여, 와이어 방전 가공기 (2) 에 의한 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 가공 경로의 보정을, 각각의 와이어 방전 가공기 (2) 마다 자동적이고 또한 정확하게 구할 수 있다. 또, 제어 장치 (1) 의 기계 학습 장치 (100) 가, 복수의 와이어 방전 가공기 (2) 의 각각에 대해 얻어진 상태 변수 (S) 및 판정 데이터 (D) 에 기초하여, 모든 와이어 방전 가공기 (2) 에 공통되는 가공 경로의 보정을 학습하고, 그 학습 결과를 모든 와이어 방전 가공기에 의한 가공에 있어서 공유하도록 구성할 수 있다. 따라서 시스템 (170) 에 의하면, 보다 다양한 데이터 집합 (상태 변수 (S) 및 판정 데이터 (D) 를 포함한다) 을 입력으로 하여, 가공 경로의 보정의 학습의 속도나 신뢰성을 향상시킬 수 있다.
이상, 본 발명의 실시형태에 대해 설명했지만, 본 발명은 상기 서술한 실시형태의 예에만 한정되지 않고, 적절한 변경을 가함으로써 여러 가지 양태로 실시할 수 있다.
예를 들어, 기계 학습 장치 (100) 가 실행하는 학습 알고리즘이나 연산 알고리즘, 제어 장치 (1) 가 실행하는 제어 알고리즘 등은, 상기 서술한 것에 한정되지 않고, 여러 가지 알고리즘을 채용할 수 있다.
또, 상기한 실시형태에서는 제어 장치 (1) 와 기계 학습 장치 (100) 가 상이한 CPU 를 갖는 장치로서 설명하고 있지만, 기계 학습 장치 (100) 는 제어 장치 (1) 가 구비하는 CPU (11) 와, ROM (12) 에 기억되는 시스템·프로그램에 의해 실현되도록 해도 된다.
상기한 실시형태에서는, 제어 장치 (1) 가 기계 학습 장치 (100) 로부터 출력되는 가공 경로의 보정량의 추정 결과에 기초하여, 가공 중에 가공 경로를 보정하는 예를 나타냈지만, 가공 프로그램에 의해 지령되는 가공 경로와, 기계 학습 장치 (100) 로부터 출력되는 가공 경로의 보정량의 추정 결과의 계열에 기초하여 가공 경로의 보정이 고려된 새로운 가공 프로그램을 작성하고, 작성된 가공 프로그램을 출력하는 구성을 형성해도 된다. 기계 학습 장치 (100) 를 구비하지 않는 와이어 방전 가공기 (2) 에, 가공 경로의 보정을 고려한 가공 프로그램을 제공함으로써, 와이어 방전 가공기 (2) 가 기계 학습 장치 (100) 와 오프 라인의 상태에서도 적절한 가공 경로에 의한 가공을 실시하게 할 수 있다.

Claims (7)

  1. 가공 프로그램에 기초하여 와이어 방전 가공기를 제어하여 워크를 가공하는 제어 장치로서,
    상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 상기 가공에 있어서의 가공 경로의 보정을 학습하는 기계 학습 장치를 구비하고,
    상기 기계 학습 장치는,
    상기 가공에 있어서의 가공 경로의 보정량을 나타내는 보정량 데이터, 상기 가공의 부분 가공 경로를 나타내는 가공 경로 데이터, 상기 가공의 가공 조건을 나타내는 가공 조건 데이터, 및 상기 가공의 가공 환경에 관련된 가공 환경 데이터를, 환경의 현재 상태를 나타내는 상태 변수로서 관측하는 상태 관측부와,
    상기 보정량에 의해 보정된 가공 경로에 기초하는 가공의 가공 정밀도의 적부 판정 결과를 나타내는 가공 정밀도 판정 데이터, 및 상기 보정량에 의해 보정된 가공 경로에 기초하는 가공에 걸리는 가공 시간의 적부 판정 결과를 나타내는 가공 시간 판정 데이터를, 판정 데이터로서 취득하는 판정 데이터 취득부와,
    상기 상태 변수와 상기 판정 데이터를 사용하여, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경과, 상기 가공에 있어서의 가공 경로의 보정을 관련지어 학습하는 학습부를 구비하는, 제어 장치.
  2. 제 1 항에 있어서,
    상기 학습부는,
    상기 적부 판정 결과에 관련된 리워드를 구하는 리워드 계산부와,
    상기 리워드를 사용하여, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 상기 가공에 있어서의 가공 경로의 보정의 가치를 나타내는 함수를 갱신하는 가치 함수 갱신부를 구비하고,
    상기 리워드 계산부는, 상기 가공 정밀도가 높을수록, 또, 상기 가공 시간의 증대가 적을수록 높은 리워드를 부여하는, 제어 장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 학습부는, 상기 상태 변수와 상기 판정 데이터를 다층 구조로 연산하는, 제어 장치.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 기계 학습 장치는, 클라우드 서버에 존재하는, 제어 장치.
  5. 가공 프로그램에 기초하여 워크를 가공하는 와이어 방전 가공기에 의한 가공의 부분 가공 경로, 가공 조건 및 가공 환경에 대한 상기 가공에 있어서의 가공 경로의 보정을 학습하는 기계 학습 장치에 있어서,
    상기 가공에 있어서의 가공 경로의 보정량을 나타내는 보정량 데이터, 상기 가공의 부분 가공 경로를 나타내는 가공 경로 데이터, 상기 가공의 가공 조건을 나타내는 가공 조건 데이터, 및 상기 가공의 가공 환경에 관련된 가공 환경 데이터를, 환경의 현재 상태를 나타내는 상태 변수로서 관측하는 상태 관측부와,
    상기 보정량에 의해 보정된 가공 경로에 기초하는 가공의 가공 정밀도의 적부 판정 결과를 나타내는 가공 정밀도 판정 데이터, 및 상기 보정량에 의해 보정된 가공 경로에 기초하는 가공에 걸리는 가공 시간의 적부 판정 결과를 나타내는 가공 시간 판정 데이터를, 판정 데이터로서 취득하는 판정 데이터 취득부와,
    상기 상태 변수와 상기 판정 데이터를 사용하여, 상기 가공의 부분 가공 경로, 가공 조건 및 가공 환경과, 상기 가공에 있어서의 가공 경로의 보정을 관련지어 학습하는 학습부를 구비하는, 기계 학습 장치.
  6. 삭제
  7. 삭제
KR1020180141090A 2017-11-17 2018-11-15 제어 장치 및 기계 학습 장치 KR102224970B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017222156A JP6680748B2 (ja) 2017-11-17 2017-11-17 制御装置及び機械学習装置
JPJP-P-2017-222156 2017-11-17

Publications (2)

Publication Number Publication Date
KR20190056993A KR20190056993A (ko) 2019-05-27
KR102224970B1 true KR102224970B1 (ko) 2021-03-08

Family

ID=64316327

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180141090A KR102224970B1 (ko) 2017-11-17 2018-11-15 제어 장치 및 기계 학습 장치

Country Status (6)

Country Link
US (1) US11067961B2 (ko)
EP (1) EP3486845B1 (ko)
JP (1) JP6680748B2 (ko)
KR (1) KR102224970B1 (ko)
CN (1) CN109794657B (ko)
TW (1) TWI711982B (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6474449B2 (ja) * 2017-04-07 2019-02-27 ファナック株式会社 調整装置及び調整方法
WO2020255370A1 (ja) * 2019-06-21 2020-12-24 三菱電機株式会社 加工条件探索装置およびワイヤ放電加工機
KR102422358B1 (ko) * 2019-06-28 2022-07-18 미쓰비시덴키 가부시키가이샤 가공 조건 탐색 장치 및 가공 조건 탐색 방법
WO2021001974A1 (ja) * 2019-07-03 2021-01-07 三菱電機株式会社 機械学習装置、数値制御装置、ワイヤ放電加工機および機械学習方法
CN114040826B (zh) * 2019-07-05 2022-11-01 三菱电机株式会社 机器学习装置、线放电加工系统及机器学习方法
US20230076571A1 (en) * 2020-02-05 2023-03-09 Fanuc Corporation Device for controlling wire electrical discharge machining apparatus
JP7186944B2 (ja) * 2020-03-27 2022-12-12 株式会社日立ハイテクソリューションズ 加工装置および加工方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017030067A (ja) * 2015-07-30 2017-02-09 ファナック株式会社 加工時間測定機能とオンマシン測定機能を有する制御装置付き加工装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58120428A (ja) 1981-12-30 1983-07-18 Fanuc Ltd ワイヤカツト放電加工機の制御法
KR920002268A (ko) * 1990-07-17 1992-02-28 유끼노리 가까즈 인텔리젠트가공장치
JP3009755B2 (ja) * 1991-05-24 2000-02-14 三菱電機株式会社 放電加工用加工条件生成装置
JP2566345B2 (ja) * 1991-05-27 1996-12-25 洋太郎 畑村 加工機械
JPH05228736A (ja) * 1992-02-25 1993-09-07 Fanuc Ltd ワイヤカット放電加工機の制御方法
JPH07285029A (ja) * 1994-04-18 1995-10-31 Sharp Corp 工作機械におけるシャープエッジの加工方法
US5770830A (en) * 1995-11-13 1998-06-23 Industrial Technology Research Institute Method and apparatus for wire-cutting curved workpieces by compensating machining parameters on wire-cut electric discharge machine
JP3832433B2 (ja) * 2000-10-27 2006-10-11 三菱電機株式会社 ワイヤ放電加工方法及び装置
JP2002189510A (ja) * 2000-12-22 2002-07-05 Mori Seiki Co Ltd 加工関連情報生成装置、及びこれを備えた数値制御装置
JP5722382B2 (ja) 2013-01-09 2015-05-20 ファナック株式会社 コーナ部で加工経路の補正を行うワイヤ放電加工機
US10189103B2 (en) 2013-10-31 2019-01-29 Mitsubishi Electric Corporation Wire electrical discharge machining apparatus
US9463571B2 (en) * 2013-11-01 2016-10-11 Brian Corporation Apparatus and methods for online training of robots
JP6267156B2 (ja) * 2015-05-29 2018-01-24 ファナック株式会社 微小ブロックのコーナ制御を行うワイヤカット放電加工機用数値制御装置
JP6169655B2 (ja) * 2015-07-30 2017-07-26 ファナック株式会社 工作機械、シミュレーション装置、及び機械学習器
JP6240689B2 (ja) * 2015-07-31 2017-11-29 ファナック株式会社 人の行動パターンを学習する機械学習装置、ロボット制御装置、ロボットシステム、および機械学習方法
JP6140228B2 (ja) * 2015-08-27 2017-05-31 ファナック株式会社 加工条件を調整しながら加工を行うワイヤ放電加工機
JP6619192B2 (ja) 2015-09-29 2019-12-11 ファナック株式会社 移動軸異常負荷警告機能を有するワイヤ放電加工機
JP6721785B2 (ja) * 2016-09-15 2020-07-15 グーグル エルエルシー ロボット操作のための深層強化学習

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017030067A (ja) * 2015-07-30 2017-02-09 ファナック株式会社 加工時間測定機能とオンマシン測定機能を有する制御装置付き加工装置

Also Published As

Publication number Publication date
EP3486845B1 (en) 2023-06-21
CN109794657A (zh) 2019-05-24
TW201923611A (zh) 2019-06-16
EP3486845A1 (en) 2019-05-22
JP6680748B2 (ja) 2020-04-15
TWI711982B (zh) 2020-12-01
CN109794657B (zh) 2021-10-26
KR20190056993A (ko) 2019-05-27
US20190155245A1 (en) 2019-05-23
JP2019093451A (ja) 2019-06-20
US11067961B2 (en) 2021-07-20

Similar Documents

Publication Publication Date Title
KR102224970B1 (ko) 제어 장치 및 기계 학습 장치
CN109002012B (zh) 控制装置以及机器学习装置
JP6680756B2 (ja) 制御装置及び機械学習装置
US10121107B2 (en) Machine learning device and method for optimizing frequency of tool compensation of machine tool, and machine tool having the machine learning device
CN108994818B (zh) 控制装置以及机器学习装置
CN108723889B (zh) 加减速控制装置
JP6557285B2 (ja) 制御装置及び機械学習装置
CN110549005B (zh) 加工条件调整装置以及机器学习装置
JP6767416B2 (ja) 加工条件調整装置及び機械学習装置
JP2019111637A (ja) 切粉除去装置及び情報処理装置
JP6659652B2 (ja) 加工条件調整装置及び機械学習装置
JP2019185125A (ja) 制御装置及び機械学習装置
JP2019168973A (ja) 駆動装置及び機械学習装置
CN110501973B (zh) 模拟装置
JP2019141869A (ja) 制御装置及び機械学習装置
JP2018190068A (ja) 制御装置及び機械学習装置
JP6841852B2 (ja) 制御装置及び制御方法
JP2019204369A (ja) プログラマブルコントローラ及び機械学習装置

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant