KR102505670B1 - 학습 데이터 생성 장치 - Google Patents

학습 데이터 생성 장치 Download PDF

Info

Publication number
KR102505670B1
KR102505670B1 KR1020210027593A KR20210027593A KR102505670B1 KR 102505670 B1 KR102505670 B1 KR 102505670B1 KR 1020210027593 A KR1020210027593 A KR 1020210027593A KR 20210027593 A KR20210027593 A KR 20210027593A KR 102505670 B1 KR102505670 B1 KR 102505670B1
Authority
KR
South Korea
Prior art keywords
learning data
distance
unit
reference line
photographing unit
Prior art date
Application number
KR1020210027593A
Other languages
English (en)
Other versions
KR20220124322A (ko
Inventor
김용은
노형주
송광열
Original Assignee
한국자동차연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국자동차연구원 filed Critical 한국자동차연구원
Priority to KR1020210027593A priority Critical patent/KR102505670B1/ko
Publication of KR20220124322A publication Critical patent/KR20220124322A/ko
Application granted granted Critical
Publication of KR102505670B1 publication Critical patent/KR102505670B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Feedback Control In General (AREA)
  • Image Analysis (AREA)

Abstract

학습 데이터 생성 장치가 개시된다. 본 발명의 학습 데이터 생성 장치는 물체 외부에 학습 데이터 생성을 위한 학습영역을 형성하는 학습영역 형성부; 상기 물체를 촬영하는 촬영부; 및 상기 촬영부에 의해 촬영된 영상에서 상기 학습영역의 형성하는 기준라인과 상기 물체 간의 거리 변화를 토대로, 다수의 바운딩 박스를 포함하는 학습 데이터를 생성하는 학습 데이터 생성모듈을 포함하는 것을 특징으로 한다.

Description

학습 데이터 생성 장치{APPARATUS FOR MANUFACTURING LEARNING DATA}
본 발명은 학습 데이터 생성 장치에 관한 것으로서, 더욱 상세하게는 대상이 되는 물체를 다양한 거리와 각도에서 촬영하고 이를 기초로 학습 데이터를 생성하는 학습 데이터 생성 장치에 관한 것이다.
딥러닝(Deep Learning)은 다양한 응용 분야에서 기존의 비전 기반 접근 방법(Hand Crafted Feature)보다 월등한 성능을 보여준다. 딥러닝 기술 중 합성곱 신경망(Convolutional Neural Network)은 영상 인식, 자연어 처리, 게임 등의 많은 분야에 적용되어 우수한 결과를 보여주고 있다.
기존의 합성곱 기반의 학습 방식은 상당히 많은 양의 학습 데이터가 필요하다. 영상 혹은 음성의 경우 간단한 방식으로 학습 데이터를 확보할 수 있으나, 3D 딥러닝의 경우 대규모의 학습 데이터를 획득하는 것이 어렵다.
최근에는 3D 비전 기술 기술의 발전으로 저렴한 3D 획득 장치가 보급되었으나, 여전히 대규모의 3D 데이터를 확보하는 것은 쉽지 않다.
이에, 종래에는 대규모의 학습 데이터를 획득하기 위한 여러 방법이 제시되었으나 인식률과 정확도가 저하되는 등의 문제점이 있었다.
본 발명의 배경기술은 대한민국 등록특허 10-1879735호(2018.07.12)의 '자동적인 학습데이터 생성 방법 및 장치와 이를 이용하는 자가 학습 장치 및 방법'에 개시되어 있다.
본 발명은 전술한 문제점을 개선하기 위해 창안된 것으로서, 본 발명의 일 측면에 따른 목적은 바운딩 박스 생성을 위한 4각 박스 형상의 기준라인 중앙에 물체를 위치시켜 카메라로 해당 물체를 다양한 각도와 거리에서 촬영하고, 촬영된 각도와 거리에 따라 변화하는 기준라인과 물체 간의 거리 변화를 토대로 학습 데이터를 생성하는 학습 데이터 생성 장치를 제공하는 데 있다.
본 발명의 일 측면에 따른 학습 데이터 생성 장치는 물체 외부에 학습 데이터 생성을 위한 학습영역을 형성하는 학습영역 형성부; 상기 물체를 촬영하는 촬영부; 및 상기 촬영부에 의해 촬영된 영상에서 상기 학습영역의 형성하는 기준라인과 상기 물체 간의 거리 변화를 토대로, 다수의 바운딩 박스를 포함하는 학습 데이터를 생성하는 학습 데이터 생성모듈을 포함하는 것을 특징으로 한다.
본 발명의 상기 학습영역 형성부는 상기 학습영역의 각 꼭지점 위치에 배치되는 4개의 지지부를 포함하고, 상기 기준라인은 상기 지지부 사이에 각각 연결되는 것을 특징으로 한다.
본 발명의 상기 지지부는 몸체부; 및 상기 몸체부에 설치되어 기 설정된 표식이 인쇄된 표식부를 포함하는 것을 특징으로 한다.
본 발명의 상기 표식부는 상기 몸체부에 높이 조절이 가능하게 설치되는 것을 특징으로 한다.
본 발명의 상기 학습 데이터 생성모듈은 상기 촬영부에 의해 촬영된 영상에서 상기 기준라인과 상기 물체를 검출하는 영상 처리부; 및 상기 촬영부의 위치 변화량 기준값에 따른 상기 기준라인과 상기 물체 간의 거리 변화량 기준값을 검출하고, 상기 거리 변화량 기준값을 이용하여 다수의 바운딩 박스를 포함하는 학습 데이터를 생성하는 학습 데이터 처리부를 포함하는 것을 특징으로 한다.
본 발명의 상기 학습 데이터 처리부는 상기 촬영부의 위치를 검출하는 위치 검출부; 상기 기준라인과 상기 물체 간의 거리를 검출하는 거리 검출부; 상기 촬영부의 위치 변화량별로 상기 기준라인과 상기 물체 간의 거리 변화량을 검출하는 거리 변화량 검출부; 및 상기 촬영부의 위치 변화량 기준값에 따른 상기 기준라인과 상기 물체 간의 거리 변화량 기준값을 검출하고, 상기 거리 변화량 기준값을 기초로 상기 촬영부의 위치 변화량 각각에 대한 상기 기준라인과 상기 물체 간의 거리 변화량을 검출하여, 다수의 바운딩 박스를 포함하는 학습 데이터를 생성하는 학습 데이터 생성부를 포함하는 것을 특징으로 한다.
본 발명의 상기 학습 데이터 생성부는 상기 물체의 x축에서의 최대값과 최소값과 y축에서의 최대값과 최소값이 만나는 4개의 점을 연결하여 바운딩 박스를 생성하는 것을 특징으로 한다.
본 발명의 상기 학습 데이터 생성부는 바운딩 박스로서 상기 물체를 내포하는 최외곽 박스를 생성하는 것을 특징으로 한다.
본 발명의 상기 촬영부의 위치는, 상기 촬영부의 회전 각도와 촬영거리 중 적어도 하나를 포함하는 것을 특징으로 한다.
본 발명의 상기 촬영부의 회전각도는 상기 촬영부의 x축 방향으로의 회전 각도, 상기 촬영부의 y축 방향으로의 회전 각도, 상기 촬영부의 z축 방향으로의 회전 각도, 및 상기 촬영부의 xyz축 중 2개 축 방향으로의 회전 각도를 포함하는 것을 특징으로 한다.
본 발명의 상기 기준라인과 상기 물체 간의 거리는 상기 기준라인과 상기 물체 간의 수직 거리인 것을 특징으로 한다.
본 발명의 일 측면에 따른 학습 데이터 생성 장치는 바운딩 박스 생성을 위한 4각 박스 형상의 기준라인 중앙에 물체를 위치시켜 카메라로 해당 물체를 다양한 각도와 거리에서 촬영하고, 촬영된 각도와 거리에 따라 변화하는 기준라인과 물체 간의 거리 변화를 토대로 학습 데이터를 빠르게 생성한다.
도 1 은 본 발명의 일 실시예에 따른 학습 데이터 생성 장치의 구성도이다.
도 2 는 본 발명의 일 실시예에 따른 표식부를 나타낸 도면이다.
도 3 은 본 발명의 일 실시예에 따른 표식부의 높이 조절 예를 나타낸 도면이다.
도 4 는 본 발명의 일 실시예에 따른 학습 데이터 생성 모듈의 블럭 구성도이다.
도 5 는 본 발명의 일 실시예에 따른 촬영부의 회전별 물체의 형태 변화를 개략적으로 나타낸 도면이다.
도 6 은 본 발명의 일 실시예에 따른 최외곽 박스의 예시도이다.
도 7 은 본 발명의 일 실시예에 따른 바운딩 박스 생성 예를 나타낸 도면이다.
이하에서는 본 발명의 일 실시예에 따른 학습 데이터 생성 장치를 첨부된 도면들을 참조하여 상세하게 설명한다. 이러한 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서, 이는 이용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1 은 본 발명의 일 실시예에 따른 학습 데이터 생성 장치의 구성도이고, 도 2 는 본 발명의 일 실시예에 따른 표식부를 나타낸 도면이며, 도 3 은 본 발명의 일 실시예에 따른 표식부의 높이 조절 예를 나타낸 도면이며, 도 4 는 본 발명의 일 실시예에 따른 학습 데이터 생성 모듈의 블럭 구성도이며, 도 5 는 본 발명의 일 실시예에 따른 촬영부의 회전별 물체의 형태 변화를 개략적으로 나타낸 도면이며, 도 6 은 본 발명의 일 실시예에 따른 최외곽 박스의 예시도이다.
도 7 은 본 발명의 일 실시예에 따른 바운딩 박스 생성 예를 나타낸 도면이다.
도 1 을 참조하면, 본 발명의 일 실시예에 따른 학습 데이터 생성 장치는 학습영역 형성부(10), 촬영부(20) 및 학습 데이터 생성 모듈(30)을 포함한다.
학습영역 형성부(10)는 학습 데이터 생성을 위한 학습영역을 형성한다.
학습영역은 학습을 위해 생성된 직사각형 형태의 영역이다. 학습영역 내부에는 학습 대상이 되는 물체(40)가 위치한다. 학습 대상이 되는 물체(40)는 학습 데이터를 생성할 물체(40)이다.
학습영역은 4각 박스를 형성하는 4개의 기준라인(14)을 통해 형성될 수 있다. 즉, 4개의 기준라인(14)을 통해 학습영역이 형성되고, 이 학습영역 내부에 물체(40)가 위치한다.
기준라인(14)은 촬영부(20)에 의해 촬영된 영상에서 인식될 수 있다. 이 경우, 기준라인(14)은 영상 내에서 물체(40)의 형태와 크기 변화를 인식하기 위한 기준이 된다. 예컨대, 영상 내에서 기준라인(14)과 물체(40) 간의 거리는 촬영부(20)의 촬영 위치, 예를 들어 촬영부(20)의 회전각도 또는 촬영거리에 따라 변화하게 된다. 이러한 기준라인(14)과 물체(40) 간의 거리 변화는 다수의 바운딩 박스(50)를 생성하기 위한 기준 정보가 될 수 있다. 이에 대해서는 후술한다.
본 실시예에서는 학습영역이 직사각형 행태인 것을 예시로 설명하였으나, 본 발명의 기술적 범위는 이에 한정되지 않는다.
학습영역 형성부(10)는 지지부(11) 및 기준라인(14)을 포함한다.
지지부(11)는 복수 개가 구비되며, 각각은 학습영역의 꼭지점에 위치하여 기준라인(14)을 지지한다. 지지부(11)의 위치에 따라 학습영역의 형태가 결정될 수 있다. 일 예로, 학습영역이 직사각형인 경우, 지지부(11)는 4개가 구비될 수 있다.
지지부(11)는 몸체부(12) 및 표식부(13)를 포함한다.
표식부(13)는 기준라인(14)을 식별하기 용이하도록 표식이 인쇄된다.
도 2 를 참조하면, 표식부(13)는 원형의 플레이트로 형성될 수 있다. 표식부(13)에는 그 중심에 십자 모양으로 인쇄된 원이 인쇄될 수 있다. 십자 모양의 각 직선 방향으로 기준라인(14)이 연장됨으로써, 기준라인(14)에 대한 식별이 더욱 용이하게 이루어질 수 있다.
몸체부(12)는 표식부(13)를 아래에서 지지한다.
몸체부(12)는 베이스(122), 연결봉(123), 및 연결부(121)를 포함한다.
연결봉(123)은 베이스(122)에 지지되고 타단이 표식부(13)의 하단에 고정된다.
연결봉(123)은 베이스(122)에 지지되되, 각각은 도 3 에 도시된 바와 같이 베이스(122)에 수직 방향으로 연장될 수 있다. 이에 따라 표시부(13)는 그 높이가 조절될 수 있다. 표식부(13)의 높이가 조절됨으로써, 다양한 높이의 물체(40)에 대해서도 학습 데이터를 생성할 수 있게 된다.
연결부(121)는 4개의 몸체부(12)를 기준라인(14)으로 연결시킨다.
기준라인(14)은 각 몸체부(12)에 연결되어 학습영역을 형성한다. 기준라인(14)은 영상 내에서 인식 정확도가 향상될 수 있도록 다양한 색상으로 제작될 수 있다.
기준라인(14)은 끈으로 제작될 수 있으나, 이 외에도 막대로도 제작될 수 있다.
이와 같이, 몸체부(12)가 학습영역의 각 꼭지점 위치에 위치하고, 기준라인(14)이 연결부에 의해 각각 연결됨으로써, 기준라인(14)에 의해 직사각형의 학습영역이 형성된다.
촬영부(20)는 학습영역 형성부(10)와 물체(40)를 촬영한다. 촬영부(20)는 학습영역 형성부(10)와 물체(40)를 다양한 위치, 예컨대 다양한 회전각도와 촬영거리에서 촬영할 수 있다. 이때, 촬영부(20)에 의해 촬영된 영상 내 물체(40)는 촬영부(20)의 위치에 따라 다양한 크기와 형태로 나타난다.
학습 데이터 생성 모듈(30)은 촬영부(20)에 의해 촬영된 영상에서 학습영역의 형성하는 기준라인(14)과 물체(40)의 최외곽 라인(41)을 검출하여 물체(40)의 최외곽 라인(41) 간의 거리 변화를 토대로 바운딩 박스(50)를 포함하는 다수의 학습 데이터를 생성한다.
학습 데이터 생성 모듈(30)은 영상 처리부(31) 및 학습 데이터 처리부(32)를 포함한다.
영상 처리부(31)는 촬영부(20)에 의해 촬영된 영상에서 기준라인(14)과 물체(40)를 검출한다.
학습 데이터 처리부(32)는촬영부(20)에 의해 촬영된 영상에서 학습영역의 형성하는 기준라인(14)과 물체(40) 간의 거리 변화를 토대로, 바운딩 박스(50)를 포함하는 다수의 학습 데이터를 생성한다.
학습 데이터 처리부(32)는 위치 검출부(321), 거리 검출부(322), 거리 변화량 검출부 및 학습 데이터 생성부(323)를 포함한다.
위치 검출부(321)는 촬영부(20)의 위치를 검출한다. 위치 검출부(321)는 촬영부(20)의 위치로서 촬영부(20)의 회전각도와 촬영거리를 검출할 수 있다.
촬영부(20)의 회전각도에는 촬영부(20)의 x축 방향으로의 회전 각도, 촬영부(20)의 y축 방향으로의 회전 각도, 촬영부(20)의 z축 방향으로의 회전 각도, 및 촬영부(20)의 xyz축 중 2개 축 방향으로의 회전 각도가 포함될 수 있다.
즉, 촬영부(20)는 회전 각도와 촬영거리를 포함하는 다양한 위치에서 물체(40)를 촬영할 수 있다. 이때, 물체(40)의 크기는 촬영부(20)와 물체(40) 간의 촬영거리에 따라 증가 또는 감소될 수 있다. 물체(40)의 형태는 도 5 에 도시된 바와 같이 촬영부(20)의 회전 각도에 따라 다양하게 형성될 수 있다.
위치 검출부(321)는 촬영부(20)의 위치를 감지하기 위한 센서일 수 있으나, 사용자로부터 촬영부(20)의 위치를 직접 입력받을 수도 있다. 위치 검출부(321)가 촬영부(20)의 위치를 검출하는 방식은 특별히 한정되는 것은 아니다.
거리 검출부(322)는 기준라인(14)과 물체(40) 간의 거리를 검출한다.
기준라인(14)과 물체(40) 간의 거리는 기준라인(14)과 물체(40)의 테두리 간의 수직 및 수평방향으로 수직 거리이다.
좀 더 구체적으로 설명하면, 거리 검출부(322)는 물체(40)를 중심으로 수직 방향에 위치한 2개의 기준라인(14) 중 적어도 하나를 검출하고, 물체(40)를 중심으로 수평 방향에 위치한 2개의 기준라인(14) 중 적어도 하나를 검출한다.
거리 검출부(322)는 물체(40)의 테두리의 좌표값 중에서 x축 방향으로의 좌표값이 가장 큰 최대값과 가장 작은 최소값을 각각 검출한다. 또한, 거리 검출부(322)는 물체(40)의 테두리의 좌표값 중에서 y축 방향으로의 좌표값이 가장 큰 최대값과 가장 작은 최소값을 검출한다.
거리 검출부(322)는 y축 방향으로의 최대값과 최소값 중 수직 방향에 위치한 기준라인(14)과 상대적으로 더 가까운 좌표값(최대값과 최소값 중 어느 하나)과의 거리(a)(이하 간단히 '수직 거리'라 한다)를 검출한다.
또한, 거리 검출부(322)는 x축 방향으로의 최대값과 최소값 중 수평 방향에 위치한 기준라인(14)과 상대적으로 더 가까운 좌표값(최대값과 최소값 중 어느 하나)과의 거리(b)(이하 간단히 '수평 거리'라 한다)를 검출한다.
즉, 거리 검출부(322)는 기준라인(14)과 물체(40) 간의 거리로서, 물체(40)의 수직방향으로의 최대값과 최소값 중 어느 하나와 수직 방향에 위치한 기준라인(14) 간의 수직 거리(b), 및 물체(40)의 수평방향으로의 최대값과 최소값 중 어느 하나와 수평 방향에 위치한 기준라인(14) 간의 수평 거리(a)를 검출한다.
학습 데이터 생성부(323)는 촬영부(20)의 위치 변화량 기준값에 따른 기준라인(14)과 물체(40) 간의 거리 변화량 기준값을 검출하고, 거리 변화량 기준값을 기초로 촬영부(20)의 위치 변화량 각각에 대한 기준라인(14)과 물체(40) 간의 거리 변화량을 검출한다.
좀 더 구체적으로 설명하면, 학습 데이터 생성부(323)는 촬영부(20)의 위치별로, 거리 검출부(322)에 의해 검출된 기준라인(14)과 물체(40) 간의 수직거리(a)와 수평거리(b)를 검출한다.
이때, 학습 데이터 생성부(323)는 기 설정된 촬영부(20)의 회전 각도 기준값에 대한 기준라인(14)과 물체(40) 간의 수직거리(a)와 수평거리(b)를 검출한다.
이어, 학습 데이터 생성부(323)는 초기 위치에서의 기준라인(14)과 물체(40) 간의 수직거리(a) 및 수평거리(b)를, 회전 각도 기준값에 대한 기준라인(14)과 물체(40) 간의 수직거리(a) 및 수평거리(b)와 각각 비교하여, 그 변화량에 따라 촬영부(20)의 회전 각도 기준값에 대한 기준라인(14)과 물체(40) 간의 거리 변화량 기준값을 검출한다.
또한, 학습 데이터 생성부(323)부는 기 설정된 촬영부(20)의 촬영거리 기준값에 대한 기준라인(14)과 물체(40) 간의 수직거리(a)와 수평거리(b)를 검출한다.
이어, 학습 데이터 생성부(323)는 초기 위치에서의 기준라인(14)과 물체(40) 간의 수직거리(a) 및 수평거리(b)를, 촬영거리 기준값에 대한 기준라인(14)과 물체(40) 간의 수직거리(a) 및 수평거리(b)와 각각 비교하여, 그 변화량에 따라 촬영부(20)의 촬영거리 기준값에 대한 기준라인(14)과 물체(40) 간의 거리 변화량 기준값을 검출한다.
상기한 바와 같이, 촬영부(20)의 위치 변화량 기준값에 따른 기준라인(14)과 물체(40) 간의 거리 변화량 기준값(회전 각도 기준값에 대한 기준라인(14)과 물체(40) 간의 거리 변화량 기준값, 및 촬영부(20)의 촬영거리 기준값에 대한 기준라인(14)과 물체(40) 간의 거리 변화량 기준값)이 검출됨에 따라, 학습 데이터 생성부(323)는 기준라인(14)과 물체(40) 간의 거리 변화량 기준값을 기초로 촬영부(20)의 위치 변화량 각각에 대한 기준라인(14)과 물체(40) 간의 거리 변화량을 검출하여, 다수의 바운딩 박스(50)를 포함하는 학습 데이터를 생성한다.
즉, 학습 데이터 생성부(323)는 초기 위치에서의 기준라인(14)과 물체(40) 간의 거리를 검출한다.
이어, 학습 데이터 생성부(323)는 촬영부(20)의 초기 위치로부터 촬영부(20)의 위치를 가상으로 변경한다.
이와 같이 촬영부(20)의 위치를 가상으로 변경할 때마다, 학습 데이터 생성부(323)는 초기 위치에서의 기준라인(14)과 물체(40) 간의 거리에, 기준라인(14)과 물체(40) 간의 거리 변화량 기준값을 적용함으로써, 다수의 촬영부(20)의 위치에서의 기준라인(14)과 물체(40) 간의 거리를 검출한다.
아울러, 학습 데이터 생성부(323)는 상기한 바와 같이 다수의 기준라인(14)과 물체(40) 간의 거리를 토대로 바운딩 박스(50)를 포함하는 학습 데이터를 생성한다.
이 경우 학습 데이터 생성부(323)는 도 6 에 도시된 바와 같이, 다수의 기준라인(14)과 물체(40) 간의 거리를 토대로 해당 물체(40)를 내포하는 다수의 최외곽 박스(41)를 생성할 수 있으며, 이러한 최외곽 박스(41)를 바운딩 박스(50)로 하여 학습 데이터를 생성할 수 있다.
또한, 학습 데이터 생성부(323)는 도 7 에 도시된 바와 같이 물체(40)의 x축에서의 최대값과 최소값과 y축에서의 최대값과 최소값이 만나는 4개의 점을 연결하여 바운딩 박스(50)를 설정할 수 있다.
즉, 학습 데이터 생성부(323)는 상기한 바와 같이 생성된 최외곽 박스(41)의 4개의 점(x1, y1) (x2, y2), (x3, y3), (x4, y4) 중에서, x축 좌표값 중 최소값과 최대값의 각 축, 및 y축 좌표값 중 최대값과 최소값의 각 축이 만나는 4점을 바운딩 박스(50)로 설정하여 학습 데이터를 생성할 수 있다.
이와 같이, 본 발명의 일 측면에 따른 학습 데이터 생성 장치는 바운딩 박스 생성을 위한 4각 박스 형상의 기준라인 중앙에 물체(40)를 위치시켜 카메라로 해당 물체(40)를 다양한 각도와 거리에서 촬영하고, 촬영된 각도와 거리에 따라 변화하는 기준라인과 물체(40) 간의 거리 변화를 토대로 학습 데이터를 빠르게 생성한다.
본 명세서에서 설명된 구현은, 예컨대, 방법 또는 프로세스, 장치, 소프트웨어 프로그램, 데이터 스트림 또는 신호로 구현될 수 있다. 단일 형태의 구현의 맥락에서만 논의(예컨대, 방법으로서만 논의)되었더라도, 논의된 특징의 구현은 또한 다른 형태(예컨대, 장치 또는 프로그램)로도 구현될 수 있다. 장치는 적절한 하드웨어, 소프트웨어 및 펌웨어 등으로 구현될 수 있다. 방법은, 예컨대, 컴퓨터, 마이크로프로세서, 집적 회로 또는 프로그래밍가능한 로직 디바이스 등을 포함하는 프로세싱 디바이스를 일반적으로 지칭하는 프로세서 등과 같은 장치에서 구현될 수 있다. 프로세서는 또한 최종-사용자 사이에 정보의 통신을 용이하게 하는 컴퓨터, 셀 폰, 휴대용/개인용 정보 단말기(personal digital assistant: "PDA") 및 다른 디바이스 등과 같은 통신 디바이스를 포함한다.
본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며 당해 기술이 속하는 기술분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호범위는 아래의 특허청구범위에 의하여 정해져야할 것이다.
10: 학습영역 형성부 11:지지부
12: 몸체부 13: 표식부
14: 기준라인 20: 촬영부
30: 학습 데이터 생성 모듈 31: 영상 처리부
32: 학습 데이터 처리부 321: 위치 검출부
322: 거리 검출부 323: 학습 데이터 생성부
41: 최외곽 라인 50: 바운딩 박스

Claims (11)

  1. 물체 외부에 학습 데이터 생성을 위한 학습영역을 형성하는 학습영역 형성부;
    상기 물체를 촬영하는 촬영부; 및
    상기 촬영부에 의해 촬영된 영상에서 상기 학습영역의 형성하는 기준라인과 상기 물체 간의 거리 변화를 토대로, 다수의 바운딩 박스를 포함하는 학습 데이터를 생성하는 학습 데이터 생성모듈을 포함하고,
    상기 학습 데이터 생성모듈은 상기 촬영부에 의해 촬영된 영상에서 상기 기준라인과 상기 물체를 검출하는 영상 처리부; 및 상기 촬영부의 위치 변화량 기준값에 따른 상기 기준라인과 상기 물체 간의 거리 변화량 기준값을 검출하고, 상기 거리 변화량 기준값을 이용하여 다수의 바운딩 박스를 포함하는 학습 데이터를 생성하는 학습 데이터 처리부를 포함하며,
    상기 학습 데이터 처리부는 상기 촬영부의 위치를 검출하는 위치 검출부; 상기 기준라인과 상기 물체 간의 거리를 검출하는 거리 검출부; 상기 촬영부의 위치 변화량별로 상기 기준라인과 상기 물체 간의 거리 변화량을 검출하는 거리 변화량 검출부; 및 상기 촬영부의 위치 변화량 기준값에 따른 상기 기준라인과 상기 물체 간의 거리 변화량 기준값을 검출하고, 상기 거리 변화량 기준값을 기초로 상기 촬영부의 위치 변화량 각각에 대한 상기 기준라인과 상기 물체 간의 거리 변화량을 검출하여, 다수의 바운딩 박스를 포함하는 학습 데이터를 생성하는 학습 데이터 생성부를 포함하며,
    상기 학습 데이터 생성부는 상기 물체의 x축에서의 최대값과 최소값과 y축에서의 최대값과 최소값이 만나는 4개의 점을 연결하여 바운딩 박스를 생성하며,
    상기 촬영부의 위치는, 상기 촬영부의 회전 각도와 촬영거리 중 적어도 하나를 포함하며,
    상기 촬영부의 회전각도는 상기 촬영부의 x축 방향으로의 회전 각도, 상기 촬영부의 y축 방향으로의 회전 각도, 상기 촬영부의 z축 방향으로의 회전 각도, 및 상기 촬영부의 xyz축 중 2개 축 방향으로의 회전 각도를 포함하는 것을 특징으로 하는 학습 데이터 생성 장치.
  2. 제 1 항에 있어서, 상기 학습영역 형성부는
    상기 학습영역의 각 꼭지점 위치에 배치되는 4개의 지지부를 포함하고, 상기 기준라인은 상기 지지부 사이에 각각 연결되는 것을 특징으로 하는 학습 데이터 생성 장치.
  3. 제 2 항에 있어서, 상기 지지부는
    몸체부; 및
    상기 몸체부에 설치되어 기 설정된 표식이 인쇄된 표식부를 포함하는 것을 특징으로 하는 학습 데이터 생성 장치.
  4. 제 3 항에 있어서, 상기 표식부는
    상기 몸체부에 높이 조절이 가능하게 설치되는 것을 특징으로 하는 학습 데이터 생성 장치.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 제 1 항에 있어서, 상기 학습 데이터 생성부는
    바운딩 박스로서 상기 물체를 내포하는 최외곽 박스를 생성하는 것을 특징으로 하는 학습 데이터 생성 장치.
  9. 삭제
  10. 삭제
  11. 제 1 항에 있어서, 상기 기준라인과 상기 물체 간의 거리는
    상기 기준라인과 상기 물체 간의 수직 거리인 것을 특징으로 하는 학습 데이터 생성 장치.
KR1020210027593A 2021-03-02 2021-03-02 학습 데이터 생성 장치 KR102505670B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210027593A KR102505670B1 (ko) 2021-03-02 2021-03-02 학습 데이터 생성 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210027593A KR102505670B1 (ko) 2021-03-02 2021-03-02 학습 데이터 생성 장치

Publications (2)

Publication Number Publication Date
KR20220124322A KR20220124322A (ko) 2022-09-14
KR102505670B1 true KR102505670B1 (ko) 2023-03-06

Family

ID=83278927

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210027593A KR102505670B1 (ko) 2021-03-02 2021-03-02 학습 데이터 생성 장치

Country Status (1)

Country Link
KR (1) KR102505670B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014178957A (ja) 2013-03-15 2014-09-25 Nec Corp 学習データ生成装置、学習データ作成システム、方法およびプログラム
US20210012524A1 (en) * 2018-03-29 2021-01-14 National University Corporation NARA Institute of Science and Technology Learning dataset creation method and device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102645202B1 (ko) * 2017-01-03 2024-03-07 한국전자통신연구원 기계 학습 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014178957A (ja) 2013-03-15 2014-09-25 Nec Corp 学習データ生成装置、学習データ作成システム、方法およびプログラム
US20210012524A1 (en) * 2018-03-29 2021-01-14 National University Corporation NARA Institute of Science and Technology Learning dataset creation method and device

Also Published As

Publication number Publication date
KR20220124322A (ko) 2022-09-14

Similar Documents

Publication Publication Date Title
CN106595528B (zh) 一种基于数字散斑的远心显微双目立体视觉测量方法
US10977829B2 (en) Depth camera calibration device and method thereof
CN104848858B (zh) 二维码以及用于机器人的视觉-惯性组合导航系统及方法
CN104217441B (zh) 一种基于机器视觉的机械臂定位抓取方法
CN104537659B (zh) 双摄像机的自动标定方法和系统
US9866820B1 (en) Online calibration of cameras
JP4885867B2 (ja) 位置情報検出装置、位置情報検出方法及び位置情報検出プログラム
US20130114861A1 (en) Device and method for recognizing three-dimensional position and orientation of article
JP2011083882A (ja) ロボットシステム
CN106092054A (zh) 一种电力线路识别精准定位导航方法
CN108022264A (zh) 相机位姿确定方法及设备
CN109345597B (zh) 一种基于增强现实的相机标定图像采集方法及装置
CN109101963A (zh) 证件图像自动正向的方法、图像处理装置和可读存储介质
KR20180105875A (ko) 단일 영상을 이용한 카메라 캘리브레이션 방법 및 이를 위한 장치
JP5554654B2 (ja) 画像処理方法、携帯情報端末及びプログラム
JP2020180914A (ja) 対象物の位置姿勢を検出する装置、方法およびプログラム
JP5228614B2 (ja) パラメータ計算装置、パラメータ計算システムおよびプログラム
CN107687821B (zh) 用于深孔洞旋转件形貌测量的多相机光刀系统标定方法
JP5219090B2 (ja) 3次元形状測定装置、3次元形状測定方法
KR102505670B1 (ko) 학습 데이터 생성 장치
JP2011069797A (ja) 変位量測定装置及び変位量測定方法
JP4707423B2 (ja) 部品位置検出方法及び装置
JPWO2018167971A1 (ja) 画像処理装置、制御方法及び制御プログラム
KR20230171859A (ko) 사물 식별 장치 및 이를 이용한 입체 영상 생성 방법
CN114037758B (zh) 基于图像的摄像机姿态感知系统

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant