KR102556642B1 - 기계 학습 훈련을 위한 데이터 생성방법 - Google Patents

기계 학습 훈련을 위한 데이터 생성방법 Download PDF

Info

Publication number
KR102556642B1
KR102556642B1 KR1020210019095A KR20210019095A KR102556642B1 KR 102556642 B1 KR102556642 B1 KR 102556642B1 KR 1020210019095 A KR1020210019095 A KR 1020210019095A KR 20210019095 A KR20210019095 A KR 20210019095A KR 102556642 B1 KR102556642 B1 KR 102556642B1
Authority
KR
South Korea
Prior art keywords
data
information
virtual environment
generating
present
Prior art date
Application number
KR1020210019095A
Other languages
English (en)
Other versions
KR20220115742A (ko
Inventor
김덕수
김대건
김영우
조재수
박요한
한현규
송영기
Original Assignee
한국기술교육대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국기술교육대학교 산학협력단 filed Critical 한국기술교육대학교 산학협력단
Priority to KR1020210019095A priority Critical patent/KR102556642B1/ko
Publication of KR20220115742A publication Critical patent/KR20220115742A/ko
Application granted granted Critical
Publication of KR102556642B1 publication Critical patent/KR102556642B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/12Geometric CAD characterised by design entry means specially adapted for CAD, e.g. graphical user interfaces [GUI] specially adapted for CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Architecture (AREA)
  • Human Computer Interaction (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은, 물체의 자세 인식의 학습을 위한 데이터를 생성하는 장치에 의해 수행되는 방법으로서, 물체의 자세 인식 대상이 되는 물체에 관한 형상 정보를 생성하는 단계; 형상 정보를 이용하여 상기 물체가 위치하는 가상환경을 생성하는 단계; 및 가상환경에서 상기 물체를 촬영하는 단계를 포함하는 데이터 생성방법을 개시한다. 본 발명에 따르면, 인공지능 학습 모델의 목적 함수에 적합한 데이터를 생성할 수 있다.

Description

기계 학습 훈련을 위한 데이터 생성방법{METHOD OF GENERATING DATA FOR MACHINE LEARNING TRAINING}
본 발명은 기계 학습 훈련을 위한 데이터 생성방법에 관한 것으로, 더욱 상세하게는 물체의 자세 인식을 위한 인공 신경망의 학습용 데이터 생성방법에 관한 것이다.
제조 공정 자동화는 수작업 공정보다 효율성이 높고, 인력 감소로 인한 자동화 장비 교체의 필요성 증가 및 비전과 로봇 기술의 발전으로 산업혁명 이후 꾸준히 발전해왔다. 제조 공정 자동화는 단순 반복 작업을 대체할 수 있는 로봇개발에 집중되어 로봇 반복 정밀도 향상 등과 같은 하드웨어 관련 분야에서 주로 연구되어 왔다.
그러나 전자분야의 부품 포장 및 조립공정 작업에 대한 자동화는 기술개발의 한계로 인하여 여전히 수작업에 의존하고 있다. 최근 4차 산업혁명으로 인하여 스마트공장 분야가 대두되면서 실시간 모니터링, 부품조립, 물류 및 작업 내역 추적관리, 작업 상태파악, 불량관리 등의 분야에 자동화를 위한 인공지능기술이 적용되고 있다.
전자부품 포장 및 조립 공정 자동화에 대한 수요의 증가로 부품조립 분야에서는 인공지능기술을 기반으로 움직이는 물체를 인식하고 추적하여 로봇이 물체를 파지할 수 있도록 하는 비주얼 서보잉 기술 개발이 활발히 진행되고 있다. 비주얼 서보잉을 이용한 물체 추적 기술은 위치기반 시각적 제어(Position Based Visual Servoing, PBVS)와 이미지기반 시각적 제어(Image Based Visual Servoing, IBVS)로 분류될 수 있다.
PBVS는 3차원 공간 속의 물체와 2차원 공간의 영상과의 관계를 이용하여 제어하는 기법으로써, 카메라 내외부 매개 변수 추출 및 영상 왜곡으로 인한 오차 보상이 필요하다는 단점이 있다.
IBVS는 카메라 내외부 매개변수 추출은 필요하지 않지만, 카메라 영상에서 획득한 특징점들이 영상 위의 목표 위치로 이동하는 제어 방식을 카메라 영상에 의존하고 있기 때문에 조명 등 외부 환경 변화에 영향을 받아 제어가 어려운 단점이 있다. 따라서 이러한 단점을 보완하기 위해 두 가지 방법을 결합하여 사용하는 기술 등의 연구개발이 진행되고 있다.
제조 현장의 작업자들이 작업하고 있는 조립분야를 로봇으로 대체하기 위해서는 물체 검출 정확도가 높고 실시간 처리 기술이 요구되기 때문에 실제 현장에 적용할 수 있는 상용화 단계의 기술 개발은 미흡한 편이다. 현재 연구단계에서, 저속 동적 물체에 대한 비주얼 서보잉 기술은 로봇이 안정적으로 물체를 추적하는 단계까지 기술이 개발되어 있는 실정이다.
고속 동적 물체 조립의 경우, 물체 검출의 정확도 및 자세 추정 정밀도를 높이는 연구가 진행되어 왔지만, 동적 물체의 경우 속도가 높을수록 영상 블러링이 많이 발생하기 때문에 물체 검출 정확도와 자세 추정 정밀도가 떨어지는 문제점이 발생한다.
로봇은 비주얼 서보잉을 위해 먼저 타겟 물체를 정하고 그 물체의 위치와 방향을 인지해야 한다. 다음 로봇은 이미 알고 있는 DB를 통해 물체를 인식하고 스테레오 카메라를 통해 그 물체에 대한 3차원 좌표를 구한다. 또한 비주얼 서보잉을 위해서 그 물체의 자세가 추정되어야 한다. 물체의 자세 추정을 통해 비주얼 서보잉이 수행될 수 있다.
물체 인식을 위해 물체의 크기, 회전, 이동에 불변인 디스크립터(descriptor)를 사용하는 SIFT(Scale Invariant Feature Transform)를 사용한다. SIFT를 통해 물체가 인식된다.
3차원 정보 획득을 위해 스테레오 비전을 사용될 수 있다. 두 영상 간의 매칭은 SIFT를 이용하여 매칭을 수행한 후, 3차원 정보가 획득된다. 획득된 3차원 정보들을 가지고 원하는 물체의 자세 추정이 수행된다. 정확한 자세 추정을 위해 3차원 정보를 이용하여 위치 오차를 통한 매칭 검증이 수행된다.
산업 현장 제조 공정과정에 실제 적용하기 위해서는 먼저, 실시간으로 안정적인 물체 검출이 이루어져야 한다. 그러나 기존 전통방식을 동적 물체 조립에 적용할 경우 정확한 물체 검출 및 자세 추정 정밀도가 저하되는 문제점이 발생될 수 있다.
최근에는 인공지능 알고리즘, 예를 들어 인공 신경망에 기반하는 물체 인식 기술이 로봇의 비주얼 서보잉에 사용되고 있다. 그런데, 인공 신경망을 비주얼 서보잉에 이용하기 위해서는, 인공 신경망에 대한 학습이 선행되어야 한다.
인공 신경망의 학습에는 학습용 데이터와 테스트용 데이터가 필요하고, 인공 신경망의 학습 효율은 데이터의 양과 질에 달려있기 때문에 양질의 다량의 데이터가 필요하다. 그런데 학습에 필요한 데이터를 직접 만들어서 사용되는 경우 보다는 이미 만들어진 공공 데이터를 이용하기 때문에, 목적 함수에 적합한 학습용 데이터 및 테스트용 데이터를 얻는 것은 어려운 일이다.
관련 발명으로서 공개번호 제10-2021-0002410호의 발명은, 외형인식모델 학습용 데이터셋 구축 방법, 장치 및 프로그램에 관한 것으로, 학습용 영상데이터 획득단계, 학습용 영상데이터 제공단계, 세부 개별외형특성 획득단계 및 학습용 데이터셋 구축 단계를 포함하는 방법을 개시하고 있으나, 어떻게 학습용 영상데이터를 획득하는 지에 대해서는 구체적인 언급이 없다.
관련 발명으로서 등록번호 제10-2207489호의 발명은, 데이터 생성방법에 관한 것으로, 냉동기기의 운전에 관한 데이터 수집에 있어서, 실제 데이터를 기반으로 어떻게 인공데이터를 생성하는 지에 대한 언급이 없다.
관련 발명으로서 공개번호 제10-2021-0004162호의 발명은, 인공지능 머신러닝 학습을 위한 데이터셋 자동 생성 장치 및 SW와 그의 제어 방법에 관한 것으로, 공간에 위치한 물품에 대한 이미지를 획득하는 카메라를 포함하는 데이터셋 자동 생성 인공지능 장치를 개시하고 있으나, 카메라는 사람에 의해 수동으로 조작될 수 밖에 없기 때문에 자동화의 문제점이 있다.
위에 소개된 관련 발명들은 인공지능 모델의 학습에 필요한 데이터를 생성한다는 발명의 목적 면에서 본 발명과 공통점이 있을 수는 있으나, 가상환경을 통해 영상을 직접 생성하는 본 발명의 구성과 구별되고, 따라서 효과 면에서도 큰 차이를 보이고 있다.
한국 공개 특허 제10-2021-0002410호 (2021.01.08 공개) 한국 등록 특허 제10-2207489호 (2021,01.26 공고) 한국 공개 특허 제10-2021-0004162호 (2021.01.13 공개)
본 발명이 해결하고자 하는 일 과제는, 공공 데이터에 의존하여 학습을 수행했던 종래 기술에 따른 인공지능 학습 모델의 학습 훈련의 문제점을 해결하는 것이다.
본 발명이 해결하고자 하는 일 과제는, 인공지능 학습 모델의 목적 함수에 적합한 학습용 및 테스트용 데이터를 직접 생성할 수 있는 방법을 제안하는 것이다.
본 발명이 해결하고자 하는 일 과제는, 물체의 3차원 설계 정보를 이용하여 물체의 자세 인식의 학습에 필요한 데이터를 직접 생성할 수 있는 방법을 제안하는 것이다.
본 발명의 일 실시 예에 따른 데이터 생성방법은, 물체의 자세 인식의 학습을 위한 데이터를 생성하는 장치에 의해 수행되는 방법으로서, 물체의 자세 인식 대상이 되는 물체에 관한 형상 정보를 생성하는 단계; 형상 정보를 이용하여 상기 물체가 위치하는 가상환경을 생성하는 단계; 및 가상환경에서 물체를 촬영하는 단계를 포함하도록 구성될 수 있다.
본 발명의 일 실시 예에 따른 데이터 생성방법은, 물체의 자세 인식의 학습을 위한 데이터를 생성하는 장치에 의해 수행되는 방법으로서, 물체의 자세 인식 대상이 되는 물체에 관한 형상 정보를 생성하는 단계; 형상 정보를 이용하여 상기 물체가 위치하는 가상환경을 생성하는 단계; 및 가상환경에서 물체를 촬영하는 단계를 포함하고, 물체에 관한 형상 정보를 생성하는 단계는, 물체에 관한 CAD 모델을 생성하는 단계를 포함하도록 구성될 수 있다.
본 발명의 일 실시 예에 따른 데이터 생성방법은, 물체의 자세 인식의 학습을 위한 데이터를 생성하는 장치에 의해 수행되는 방법으로서, 물체의 자세 인식 대상이 되는 물체에 관한 형상 정보를 생성하는 단계; 형상 정보를 이용하여 상기 물체가 위치하는 가상환경을 생성하는 단계; 및 가상환경에서 물체를 촬영하는 단계를 포함하고, 가상환경을 생성하는 단계는, 물체가 속하는 3차원 공간을 정의하기 위해 기준 축에 관한 정보를 수신하는 단계; 기준 축에 대해 상기 물체의 기준 자세에 관한 정보를 수신하는 단계; 및 물체의 배경에 관한 정보를 수신하는 단계를 포함하도록 구성될 수 있다.
본 발명의 일 실시 예에 따른 데이터 생성방법은, 물체의 자세 인식의 학습을 위한 데이터를 생성하는 장치에 의해 수행되는 방법으로서, 물체의 자세 인식 대상이 되는 물체에 관한 형상 정보를 생성하는 단계; 형상 정보를 이용하여 상기 물체가 위치하는 가상환경을 생성하는 단계; 및 가상환경에서 물체를 촬영하는 단계를 포함하고, 물체를 촬영하는 단계는, 상기 물체에 대한 RGB 정보 및 깊이 정보를 수집하는 단계를 포함하도록 구성될 수 있다.
본 발명의 일 실시 예에 따른 데이터 생성 시스템은, 물체의 자세 인식의 대상이 되는 물체에 관한 형상 정보를 이용하여 물체 및 물체가 속하는 3차원 공간을 생성하는 가상환경 설정부; 가상환경에서 상기 물체를 촬영하는 가상 촬영부; 및 촬영된 영상, 물체에 관한 정보 및 촬영에 사용된 카메라 정보가 포함된 데이터를 생성하는 학습용 데이터 생성부를 포함하도록 구성될 수 있다.
또한, 데이터 생성방법은, 런타임 핸들러를 이용하여 오일러 각도로 출력되는 물체의 자세 정보의 기준축을 설정하는 단계를 더 포함하도록 구성될 수 있다.
또한, 데이터 생성방법은, 물체에 관한 CAD 파일을 이용하여 메쉬 파일을 생성하는 단계를 더 포함하도록 구성될 수 있다.
또한, 데이터 생성방법은, 카메라에 관한 정보를 수신하는 단계를 더 포함하도록 구성될 수 있다.
또한, 데이터 생성방법은, 물체의 좌표 값 정보 및 회전 정보를 수신하는 단계를 더 포함하도록 구성될 수 있다.
또한, 데이터 생성방법은, 이미지의 크기, 상기 물체의 위치, 물체의 자세 및 물체의 점유 범위에 관한 정보를 포함하는 데이터를 생성하는 단계를 더 포함하도록 구성될 수 있다.
기타 실시 예의 구체적인 사항은 "발명을 실시하기 위한 구체적인 내용" 및 첨부 "도면"에 포함되어 있다.
본 발명의 이점 및/또는 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 각종 실시 예를 참조하면 명확해질 것이다.
그러나 본 발명은 이하에서 개시되는 각 실시 예의 구성만으로 한정되는 것이 아니라 서로 다른 다양한 형태로도 구현될 수도 있으며, 단지 본 명세서에서 개시한 각각의 실시 예는 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구범위의 각 청구항의 범주에 의해 정의될 뿐임을 알아야 한다.
본 발명에 의하면, 인공지능 학습 모델의 목적 함수에 적합한 데이터를 생성할 수 있다.
또한, 물체의 위치 및 회전 정보가 포함된 데이터를 물체 자세 인식의 인공지능 모델의 학습에 이용할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 데이터 생성 시스템의 블록도이다.
도 2는 본 발명의 일 실시 예에 따른 데이터 생성 시스템의 네트워크 관계도이다.
도 3은 본 발명의 일 실시 예에 따른 데이터 생성 방법의 흐름도이다.
도 4는 본 발명의 일 실시 예에 따른 데이터 생성 방법의 예시도이다.
도 5는 본 발명의 일 실시 예에 따른 데이터 생성 시스템 사용자 인터페이스의 예시도이다.
도 6은 본 발명의 일 실시 예에 따른 데이터 생성 시스템 사용자 인터페이스의 예시도이다.
도 7은 본 발명의 일 실시 예에 따른 데이터 생성방법에 의해 생성된 데이터의 예시도이다.
본 발명을 상세하게 설명하기 전에, 본 명세서에서 사용된 용어나 단어는 통상적이거나 사전적인 의미로 무조건 한정하여 해석되어서는 아니 되며, 본 발명의 발명자가 자신의 발명을 가장 최선의 방법으로 설명하기 위해서 각종 용어의 개념을 적절하게 정의하여 사용할 수 있고, 더 나아가 이들 용어나 단어는 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 함을 알아야 한다.
즉, 본 명세서에서 사용된 용어는 본 발명의 바람직한 실시 예를 설명하기 위해서 사용되는 것일 뿐이고, 본 발명의 내용을 구체적으로 한정하려는 의도로 사용된 것이 아니며, 이들 용어는 본 발명의 여러 가지 가능성을 고려하여 정의된 용어임을 알아야 한다.
또한, 본 명세서에서, 단수의 표현은 문맥상 명확하게 다른 의미로 지시하지 않는 이상, 복수의 표현을 포함할 수 있으며, 유사하게 복수로 표현되어 있다고 하더라도 단수의 의미를 포함할 수 있음을 알아야 한다.
본 명세서의 전체에 걸쳐서 어떤 구성 요소가 다른 구성 요소를 "포함"한다고 기재하는 경우에는, 특별히 반대되는 의미의 기재가 없는 한 임의의 다른 구성 요소를 제외하는 것이 아니라 임의의 다른 구성 요소를 더 포함할 수도 있다는 것을 의미할 수 있다.
더 나아가서, 어떤 구성 요소가 다른 구성 요소의 "내부에 존재하거나, 연결되어 설치된다"라고 기재한 경우에는, 이 구성 요소가 다른 구성 요소와 직접적으로 연결되어 있거나 접촉하여 설치되어 있을 수 있고, 일정한 거리를 두고 이격되어 설치되어 있을 수도 있으며, 일정한 거리를 두고 이격되어 설치되어 있는 경우에 대해서는 해당 구성 요소를 다른 구성 요소에 고정 내지 연결하기 위한 제 3의 구성 요소 또는 수단이 존재할 수 있으며, 이 제 3의 구성 요소 또는 수단에 대한 설명은 생략될 수도 있음을 알아야 한다.
반면에, 어떤 구성 요소가 다른 구성 요소에 "직접 연결"되어 있다거나, 또는 "직접 접속"되어 있다고 기재되는 경우에는, 제 3의 구성 요소 또는 수단이 존재하지 않는 것으로 이해하여야 한다.
마찬가지로, 각 구성 요소 간의 관계를 설명하는 다른 표현들, 즉 " ~ 사이에"와 "바로 ~ 사이에", 또는 " ~ 에 이웃하는"과 " ~ 에 직접 이웃하는" 등도 마찬가지의 취지를 가지고 있는 것으로 해석되어야 한다.
또한, 본 명세서에서 "일면", "타면", "일측", "타측", "제 1", "제 2" 등의 용어는, 사용된다면, 하나의 구성 요소에 대해서 이 하나의 구성 요소가 다른 구성 요소로부터 명확하게 구별될 수 있도록 하기 위해서 사용되며, 이와 같은 용어에 의해서 해당 구성 요소의 의미가 제한적으로 사용되는 것은 아님을 알아야 한다.
또한, 본 명세서에서 "상", "하", "좌", "우" 등의 위치와 관련된 용어는, 사용된다면, 해당 구성 요소에 대해서 해당 도면에서의 상대적인 위치를 나타내고 있는 것으로 이해하여야 하며, 이들의 위치에 대해서 절대적인 위치를 특정하지 않는 이상은, 이들 위치 관련 용어가 절대적인 위치를 언급하고 있는 것으로 이해하여서는 아니된다.
또한, 본 명세서에서는 각 도면의 각 구성 요소에 대해서 그 도면 부호를 명기함에 있어서, 동일한 구성 요소에 대해서는 이 구성 요소가 비록 다른 도면에 표시되더라도 동일한 도면 부호를 가지고 있도록, 즉 명세서 전체에 걸쳐 동일한 참조 부호는 동일한 구성 요소를 지시하고 있다.
본 명세서에 첨부된 도면에서 본 발명을 구성하는 각 구성 요소의 크기, 위치, 결합 관계 등은 본 발명의 사상을 충분히 명확하게 전달할 수 있도록 하기 위해서 또는 설명의 편의를 위해서 일부 과장 또는 축소되거나 생략되어 기술되어 있을 수 있고, 따라서 그 비례나 축척은 엄밀하지 않을 수 있다.
또한, 이하에서, 본 발명을 설명함에 있어서, 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 구성, 예를 들어, 종래 기술을 포함하는 공지 기술에 대해 상세한 설명은 생략될 수도 있다.
이하, 본 발명의 실시 예에 대해 관련 도면들을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시 예에 따른 데이터 생성 시스템의 블록도이다.
도 1을 참조하면, 데이터 생성 시스템(100)은 제어부(110), 입력 장치(120), 출력 장치(130), 저장 장치(140), 통신 장치(150), 및 메모리(160)를 포함하도록 구성될 수 있다. 그리고 메모리(160)는 런타임 핸들러(161), 임포트/엑스포트(162), 가상환경 설정부(163), 장면 컨트롤러(164) 및 카메라 컨트롤러(165)를 포함하도록 구성될 수 있다.
제어부(110)는, 프로세서(processor)에 해당하는 중앙처리장치 형태로 구현될 수 있고, 데이터 생성방법을 구성하는 명령어 셋을 실행하는 기능을 수행한다.
제어부(110)는 사용자 입력장치, 카메라, 출력 장치, 저장 장치, 통신 장치로의 데이터 송신 및 이들로부터의 데이터 수신을 통해 이들의 동작을 기본적으로 제어할 수 있다.
사용자 입력 장치(121)는, 데이터 생성방법(S100)의 실행에 있어서 필요한 각종 사용자 입력, 예를 들어 문자, 숫자 입력 등을 수신하는 기능을 수행한다.
카메라(122)는 실제 촬영된 이미지를 제공하는 기능을 한다. 예를 들어 카메라(122)는 가상환경에서 사용될 배경 이미지로서, 실제 공장 내의 조립라인이 촬영된 이미지, 예를 들어 RGB 정보 및 깊이 정보를 포함하는 이미지를 배경 이미지로 데이터 생성 장치(100)에 제공할 수 있다.
출력 장치(130)는, 데이터 생성방법(S100)의 실행에 있어서 사용자에게 각종 데이터와 정보, 예를 들어 런타임 핸들러(161), 사용자 인터페이스 등을 디스플레이 하거나, 소리를 출력하는 기능을 수행한다.
저장 장치(140)는, 데이터 생성방법의 실행에 있어서 각종 데이터와 정보, 예를 들어 물체의 3차원 형상 정보, 카메라 정보 등을 저장하는 기능을 수행한다.
통신 장치(150)는, 데이터 생성방법의 실행에 있어서 카메라를 비롯하여 각종 외부 기기 및 외부 기기, 예를 들어 서버와 다양한 프로토콜을 통해 데이터를 송신 및 수신하는 기능을 수행한다. 따라서 통신 장치는 내부적으로 다양한 프로토콜에 대응하는 통신 모듈, 예를 들어 병렬통신 모듈, 직렬통신 모듈, 근거리 통신 모듈, 셀룰러 통신 모듈, 무선랜 통신 모듈, 및 인터넷 통신 모듈 등을 포함하도록 구성될 수 있다.
메모리(160)는 전원의 ON/OFF에 따라 저장된 데이터가 유지되거나 사라지는 비휘발성 또는 휘발성 반도체 소자를 통해서 구현될 수 있다. 메모리(170)는 소프트웨어 형태로 구현된 명령 수행 모듈들을 로드하고, 이를 저장하는 기능을 수행한다.
런타임 핸들러(161)는, 3차원 가상공간에 기준 축을 설정하고, 기준 축에 따라 물체를 배치하는 기능을 수행한다.
임포트/엑스포트(162)는 물체의 입체 형상 정보, 예를 들어 3D CAD 파일을 읽어 들이고, 변환된 다른 형태의 파일을 출력하는 기능을 한다.
가상환경 설정부(163)는 물체에 관한 정보 및 배경에 관한 정보를 수신하고 이를 이용하여 가상환경을 설정하고, 가상환경에서 배치된 카메라의 설정에 따라 물체를 촬영하는 기능을 한다.
가상환경 설정부(163)는, 실제 물체가 놓여 있거나, 물체가 움직이는 생산 라인의 작업 환경에 근접하도록, 가상환경에서 조명의 위치, 방향, 및 조도를 제어할 수 있다.
장면 컨트롤러(164)는 가상환경에서 물체 및 배경을 포함하는 장면을 컨트롤하는 기능을 한다.
카메라 컨트롤러(165)는 가상환경에서 카메라 정보에 기반하여 배치된 카메라를 컨트롤하는 기능을 한다. 가상환경에 배치된 카메라는 가상의 카메라에 해당한다. 사용자는, 가상환경 설정부(163)를 이용하여 가상환경에 다양한 종류의 카메라 중에서 촬영에 사용될 카메라를 선택할 수 있다.
도 2는 본 발명의 일 실시 예에 따른 데이터 생성 시스템의 네트워크 관계도이다.
도 2를 참조하면, 데이터 생성 시스템(100)은 네트워크(300)를 통해 통신할 수 있도록 서버(200)와 연결될 수 있다.
서버(300)는 물체에 대한 3차원 형상 정보, 3차원 CAD 파일 등을 데이터 생성 시스템(100)에 제공할 수 있다. 그 밖에 서버(300)는 가상환경에 필요한 카메라에 관한 정보 등을 데이터 생성 시스템(100)에 제공할 수 있다.
네트워크(300)는 유선 및 무선 네트워크, 예를 들어, LAN(local area network), WAN(wide area network), TCP/IP의 인터넷(internet), 인트라넷(intranet) 및 엑스트라넷(extranet), 그리고 모바일 네트워크, 예를 들어 셀룰러, 3G, LTE, WiFi 네트워크, 애드혹 네트워크 및 이들의 조합을 비롯한 임의의 적절한 통신 네트워크 일 수 있다.
네트워크(300)는 허브, 브리지, 라우터, 스위치 및 게이트웨이와 같은 네트워크 요소들의 연결을 포함할 수 있다. 네트워크(300)는 인터넷과 같은 공용 네트워크 및 안전한 기업 사설 네트워크와 같은 사설 네트워크를 비롯한 하나 이상의 연결된 네트워크들, 예컨대 다중 네트워크 환경을 포함할 수 있다. 네트워크(300)에의 액세스는 하나 이상의 유선 또는 무선 액세스 네트워크들을 통해 제공될 수 있다.
도 3은 본 발명의 일 실시 예에 따른 데이터 생성 방법의 흐름도이다.
도 4는 본 발명의 일 실시 예에 따른 데이터 생성 방법의 예시도이다.
도 4를 참조하면, 도 3을 참조하면, 데이터 생성 방법(S100)은 물체에 관한 형상 정보 생성(S110), 물체에 관한 형상 정보를 이용하여 가상환경 생성(S120), 가상환경에서 물체를 촬영(S130) 및 촬영 정보를 이용하여 학습에 필요한 데이터 생성(S140)을 포함하도록 구성될 수 있다.
도 1의 데이터 생성 시스템(100)은 도 3의 데이터 생성방법(S100)을 수행하는 주체에 해당한다.
S110 단계에서 데이터 생성 시스템(100)은, 데이터 생성 시스템(100)은 물체에 관한 형상 정보를 생성할 수 있다. 도 4를 참조하면, 물체에 관한 형상 정보는 컴퓨터 지원 설계(Computer Aided Design, CAD)에 의해 생성된 3D 설계 파일일 수 있다. 데이터 생성 시스템(100)은 임포트/익스포트(162)를 이용하여 컴퓨터 지원 설계를 통해 제작된 3D 설계 파일을 읽어 들이고, 다른 프로그램 모듈이 공유할 수 있도록 이를 다른 형태의 파일로 변환하여 출력할 수 있다.
S120 단계에서 데이터 생성 시스템(100)은, 물체에 관한 형상 정보를 이용하여 가상환경을 생성할 수 있다. 도 4를 참조하면, 가상환경은, 기준 축 설정, 물체의 기준 자세 설정 및 장면 설정을 포함하도록 구성될 수 있다. 장면 설정에는 주변 환경 및 물체의 재질 등이 표현될 수 있다.
S130 단계에서 데이터 생성 시스템(100)은, 데이터 생성 시스템(100)은 가상환경에서 물체를 촬영할 수 있다. 도 4를 참조하면, 데이터 생성 시스템(100) 가상환경에 가상의 카메라를 배치하고 물체의 랜덤한 면을 촬영할 수 있다. 임의의 자세 및 위치를 구현하기 위해 카메라가 회전하거나, 물체가 자유낙하할 수 있다.
S140 단계에서 데이터 생성 시스템(100)은, 데이터 생성 시스템(100)은 촬영 정보를 이용하여 학습에 필요한 데이터를 생성할 수 있다. 도 4를 참조하면 학습용 데이터 및 테스트용 데이터가 생성될 수 있으며, 이들 데이터는, RGB 이미지, 깊이 이미지와 물체 및 배경에 관한 정보를 포함할 수 있다.
본 발명의 일 실시 예에 따른 데이터 생성방법은 대용량의 이미지 데이터를 이용하여 인공 신경망의 일종인 CNN(Convolutional Neural Network)를 학습하여 다양한 정보를 주는 알고리즘을 위하여 대용량의 데이터를 자율적으로 생성할 수 있다.
데이터 생성 시스템(100)은 고해상도의 이미지를 생성할 수 있는 렌더링 기술을 이용하여 실제 사진 이미지와 유사한 데이터를 생성하고, 가상환경에서의 깊이 값을 이용하여 깊이 이미지를 생성할 수 있다.
데이터 생성방법에 의해 생성된 이미지에 대해서 물체의 위치를 특정할 수 있는 좌표 값과, 이미지 사진 상에서 물체의 회전 정도를 알 수 있도록 각 축에 대한 회전 정도인 오일러 각도를 출력한다. 이 회전 정보는 카메라의 위치 및 각도를 모두 고려하여 생성된 각도로 이미지상에서 물체가 취하는 자세 정보를 가진다.
본 발명의 일 실시 예에 따른, 데이터 생성방법(S100)은 이를 실행하는 명령어 셋을 포함하는 프로그램 형태로 구현될 수 있다. 데이터 생성방법을 실행하는 프로그램은, 프로그램은 기준 축 설정 프로그램에 해당하는 런타임 핸들러, 공유 폴더, 장면 촬영 프로그램에 해당하는 가상환경 설정부를 포함하도록 구성될 수 있다.
본 발명의 일 실시 예에 따른 프로그램은, 사용자에게 필요한 정보를 입력 받는 프로그램과 실제 동작 프로그램을 분리한 구조로서, 기준 축 설정 프로그램에서, 데이터를 생성할 때 카메라의 속성 및 물체의 재질, 장면의 배경 등을 선택할 수 있도록 하였다. 이 정보는 기준 축 설정 프로그램과 장면 촬영 프로그램 둘 모두 접근할 수 있는 공유 폴더에 출력되어 생성된다. 장면 촬영 프로그램에서는 이 정보들을 가지고 가상 환경의 구성, 카메라의 속성을 변경하여 사용자가 원하는 데이터를 생성할 수 있도록 한다.
기준 축 설정 프로그램에 해당하는 런타임 핸들러(161)는 사용자가 원하는 데이터를 출력할 수 있도록 세부사항들을 조정할 수 있다.
임포트/엑스포트(162)는 정보를 입력 받을 수 있는 환경을 제공하는 그래픽 유저 인터페이스와 데이터를 생성하고 싶은 3D 모델 파일(.obj, .3ds)을 임포트하고 공유 폴더에 저장할 파일들을 출력하는 임포트/엑스포트 기능을 제공한다.
런타임 핸들러(161)는 오일러 각도로서 출력되는 물체의 자세 정보의 기준 축을 사용자가 설정할 수 있도록 물체를 직접 돌려가며 기준 축을 맞출 수 있는 기능을 제공한다. 이에 대한 정보들은 공유 폴더에 저장된다.
공유폴더에 저장되는 파일은 3D 모델 파일을 유니티 프로그램에서 재구현할 수 있도록 변환된 메쉬 파일과, 카메라 설정 및 물체에 대한 정보가 담긴 파일이다. 공유 폴더는 기준 축 설정 프로그램에 해당하는 런타임 핸들러(161)와 장면 촬영 프로그램에 해당하는 가상환경 설정부(163)가 모두 접근할 수 있도록 설정된 폴더이다.
가상환경 설정부(163)는 공유 폴더에 저장되어 있는 파일 정보들을 통해서 이미지를 생성할 때 쓰이는 카메라의 세부사항들을 설정하여 주고 대상이 되는 물체의 재질 등의 속성을 설정하고, 공유 폴더 안의 파일들에 대한 정보들이 모두 반영된 가상환경에서 물체에 대한 영상을 생성할 수 있다.
가상환경 설정부(163)는 인식 대상이 되는 물체를 랜덤한 자세를 취하게 하고 가상의 카메라를 이용하여 물체에 대한 영상을 생성할 수 있다. 또는 카메라 자체가 일정한 각도로 회전하면서 물체에 대한 영상이 촬영될 수 있다. 카메라는, 물체에 대한 RGB 이미지를 먼저 촬영하게 하고, 그 후 물체에 대한 깊이 이미지를 RGB 이미지를 생성할 때와 동일한 물체와 카메라의 위치, 자세를 맞춘 후에 생성하도록 구성될 수 있다.
인식 대상 물체의 다양한 면이 자연스럽게 생성되기 위해, 물체를 가상환경에서 자유낙하 시키고, 떨어지면서 자세가 변하는 물체가 촬영될 수 있다. 여기서, 물체는, 그 형상에 따라 자유낙하 시에 물리적 법칙, 예를 들어 모멘트에 의한 회전을 통해 랜덤한 면이 촬영될 수 있다.
임포트/엑스포트(162)는 가상환경 설정부(163)에 의해 생성된 이미지들에 대하여 각 이미지와 같은 이름을 가진 바이너리 파일을 생성하는데 여기에는 이미지의 크기, 물체의 위치, 물체의 자세 및 이미지에서 물체가 점유하는 범위에 대한 정보를 포함된다.
도 5는 본 발명의 일 실시 예에 따른 데이터 생성 시스템 사용자 인터페이스의 예시도이다.
도 5를 참조하면, 기준 축이 설정된 후, 물체가 배치된 가상환경이 묘사되어 있다.
도 6은 본 발명의 일 실시 예에 따른 데이터 생성 시스템 사용자 인터페이스의 예시도이다.
도 6을 참조하면, 기준 축이 설정된 후, 물체가 배치된 가상환경의 배경 화면이 묘사되어 있다.
도 7은 본 발명의 일 실시 예에 따른 데이터 생성방법에 의해 생성된 데이터의 예시도이다.
도 7을 참조하면, 본 발명의 일 실시 예에 따른 데이터 생성 시스템(100)의 의해 생성된 데이터의 구조가 묘사되어 있다. 생성된 데이터는, RGB 이미지, 깊이 정보(Depth image) 및 자세정보를 포함할 수 있다. 여기서 자세정보는, 물체의 중심 좌표(x, y, z)에 관한 정보, 카메라 시점에서 기준 자세 대비 회전 정보를 포함할 수 있다.
이와 같이 본 발명의 일 실시 예에 따르면, 인공지능 학습 모델의 목적 함수에 적합한 데이터를 생성할 수 있다.
또한, 물체의 위치 및 회전 정보가 포함된 데이터를 물체 자세 인식의 인공지능 모델의 학습에 이용할 수 있다.
이상, 일부 예를 들어서 본 발명의 바람직한 여러 가지 실시 예에 대해서 설명하였지만, 본 "발명을 실시하기 위한 구체적인 내용" 항목에 기재된 여러 가지 다양한 실시 예에 관한 설명은 예시적인 것에 불과한 것이며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 이상의 설명으로부터 본 발명을 다양하게 변형하여 실시하거나 본 발명과 균등한 실시를 행할 수 있다는 점을 잘 이해하고 있을 것이다.
또한, 본 발명은 다른 다양한 형태로 구현될 수 있기 때문에 본 발명은 상술한 설명에 의해서 한정되는 것이 아니며, 이상의 설명은 본 발명의 개시 내용이 완전해지도록 하기 위한 것으로 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이며, 본 발명은 청구범위의 각 청구항에 의해서 정의될 뿐임을 알아야 한다.
100: 데이터 생성 시스템
110: 제어부
120: 입력 장치
121: 사용자 입력 장치
122: 카메라
130: 출력 장치
140: 저장 장치
150: 통신 장치
160: 메모리
161: 런타임 핸들러
162: 임포트/엑스포트
163: 가상환경 설정부
164: 장면 컨트롤러
165: 카메라 컨트롤러

Claims (5)

  1. 삭제
  2. 삭제
  3. 물체의 자세 인식의 학습을 위한 데이터를 생성하는 장치에 의해 수행되는 방법으로서,
    물체의 자세 인식 대상이 되는 물체에 관한 3차원 형상 정보를 생성하는 단계;
    상기 3차원 형상 정보를 이용하여 상기 물체가 위치하는 3차원 가상환경을 생성하는 단계; 및
    상기 3차원 가상환경에서 상기 물체를 촬영하는 단계를 포함하고,
    상기 3차원 가상환경을 생성하는 단계는,
    상기 물체가 속하는 3차원 공간을 정의하기 위해 기준 축에 관한 정보를 수신하는 단계;
    상기 기준 축에 대해 상기 물체의 기준 자세에 관한 정보를 수신하는 단계; 및
    상기 물체의 배경에 관한 정보를 수신하는 단계를 포함하도록 구성되며,
    상기 물체를 촬영하는 단계는,
    상기 물체에 대한 RGB 정보 및 깊이 정보를 수집하는 단계를 포함하도록 구성되며,
    상기 물체를 촬영하는 단계는 상기 물체가 자유 낙하하면서 변하는 자세를 촬영하도록 구성되며,
    상기 물체의 변하는 자세는 모멘트의 회전을 통해 얻어지는,
    데이터 생성방법.
  4. 삭제
  5. 삭제
KR1020210019095A 2021-02-10 2021-02-10 기계 학습 훈련을 위한 데이터 생성방법 KR102556642B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210019095A KR102556642B1 (ko) 2021-02-10 2021-02-10 기계 학습 훈련을 위한 데이터 생성방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210019095A KR102556642B1 (ko) 2021-02-10 2021-02-10 기계 학습 훈련을 위한 데이터 생성방법

Publications (2)

Publication Number Publication Date
KR20220115742A KR20220115742A (ko) 2022-08-18
KR102556642B1 true KR102556642B1 (ko) 2023-07-18

Family

ID=83112102

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210019095A KR102556642B1 (ko) 2021-02-10 2021-02-10 기계 학습 훈련을 위한 데이터 생성방법

Country Status (1)

Country Link
KR (1) KR102556642B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002260010A (ja) 2001-02-28 2002-09-13 Konami Computer Entertainment Japan Inc 画像の生成方法及びそれに用いるプログラム
KR101947650B1 (ko) * 2017-11-14 2019-05-20 국방과학연구소 게임 엔진 기반의 머신 러닝 학습이미지 생성 장치 및 방법
US20190377980A1 (en) 2018-06-07 2019-12-12 Microsoft Technology Licensing, Llc Generating training data for machine learning classifier

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101964282B1 (ko) * 2015-12-22 2019-04-01 연세대학교 산학협력단 3d 모델을 활용한 2d 영상 학습 데이터 생성 시스템 및 그 생성방법
US20190362235A1 (en) * 2018-05-23 2019-11-28 Xiaofan Xu Hybrid neural network pruning
KR20200136723A (ko) * 2019-05-28 2020-12-08 한국전자통신연구원 가상 도시 모델을 이용하여 객체 인식을 위한 학습 데이터 생성 방법 및 장치
KR20200141373A (ko) 2019-06-10 2020-12-18 (주)사맛디 외형인식모델 학습용 데이터셋 구축 방법, 장치 및 프로그램
KR102503116B1 (ko) 2019-07-03 2023-02-22 주식회사 현대아이티앤이 인공지능 머신러닝 학습을 위한 데이터셋 자동 생성 장치와 그의 제어 방법
KR102207489B1 (ko) 2020-01-14 2021-01-26 엘지전자 주식회사 데이터 생성방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002260010A (ja) 2001-02-28 2002-09-13 Konami Computer Entertainment Japan Inc 画像の生成方法及びそれに用いるプログラム
KR101947650B1 (ko) * 2017-11-14 2019-05-20 국방과학연구소 게임 엔진 기반의 머신 러닝 학습이미지 생성 장치 및 방법
US20190377980A1 (en) 2018-06-07 2019-12-12 Microsoft Technology Licensing, Llc Generating training data for machine learning classifier

Also Published As

Publication number Publication date
KR20220115742A (ko) 2022-08-18

Similar Documents

Publication Publication Date Title
JP6885485B2 (ja) 複数カメラネットワークを利用して静止シーン及び/又は移動シーンを取り込むためのシステム及び方法
CN111897332A (zh) 一种语义智能变电站机器人仿人巡视作业方法及系统
CN110176032B (zh) 一种三维重建方法及装置
JP2024050711A (ja) 物体識別のための方法および計算システム
CN109760045B (zh) 一种离线编程轨迹生成方法及基于该方法的双机器人协同装配系统
CN114912287A (zh) 基于目标6d位姿估计的机器人自主抓取仿真系统及方法
US11403764B2 (en) Method and computing system for processing candidate edges
CN111383263A (zh) 机器人抓取物体系统、方法及装置
CN113379849A (zh) 基于深度相机的机器人自主识别智能抓取方法及系统
CN109903323B (zh) 用于透明物体识别的训练方法、装置、存储介质及终端
CN115903541A (zh) 一种基于孪生场景的视觉算法仿真数据集生成及验证方法
CN112534367A (zh) 学习装置、控制装置、学习方法以及学习程序
Ben et al. Research on visual orientation guidance of industrial robot based on cad model under binocular vision
CN114187312A (zh) 目标物的抓取方法、装置、系统、存储介质及设备
KR102556642B1 (ko) 기계 학습 훈련을 위한 데이터 생성방법
CN113984037B (zh) 一种基于任意方向目标候选框的语义地图构建方法
Kiyokawa et al. Efficient collection and automatic annotation of real-world object images by taking advantage of post-diminished multiple visual markers
CN115219492B (zh) 一种三维物体的外观图像采集方法及装置
JP2021013947A (ja) 自動溶接システム、自動溶接方法、学習装置、推定装置、及びプログラム
CN113510691A (zh) 一种抹灰机器人的智能视觉系统
KR102624242B1 (ko) 로봇 기반 2d 및 3d 매칭 서비스 제공 시스템
Kao et al. Object pose estimation and feature extraction based on PVNet
Ayten Real-Time Implementation of Image Based PLC Control for a Robotic Platform
CN112070835B (zh) 机械臂位姿预测方法、装置、存储介质及电子设备
TWI834495B (zh) 物件姿態辨識方法及系統

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant