KR20210144294A - 이미지 분할 모델 학습 장치 및 방법 - Google Patents

이미지 분할 모델 학습 장치 및 방법 Download PDF

Info

Publication number
KR20210144294A
KR20210144294A KR1020200061438A KR20200061438A KR20210144294A KR 20210144294 A KR20210144294 A KR 20210144294A KR 1020200061438 A KR1020200061438 A KR 1020200061438A KR 20200061438 A KR20200061438 A KR 20200061438A KR 20210144294 A KR20210144294 A KR 20210144294A
Authority
KR
South Korea
Prior art keywords
image set
generating
original
masks
segmentation model
Prior art date
Application number
KR1020200061438A
Other languages
English (en)
Inventor
김지훈
신승호
우세원
Original Assignee
삼성에스디에스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성에스디에스 주식회사 filed Critical 삼성에스디에스 주식회사
Priority to KR1020200061438A priority Critical patent/KR20210144294A/ko
Priority to US16/884,981 priority patent/US11341653B2/en
Publication of KR20210144294A publication Critical patent/KR20210144294A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06K9/00718
    • G06K9/627
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • G06T5/75Unsharp masking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)

Abstract

이미지 분할 모델 학습 장치 및 방법이 개시된다. 개시되는 일 실시예에 따른 이미지 분할 모델 학습 장치는, 라벨링되지 않은(unlabeled) 원본 이미지 셋(image set)과 사전 학습된 이미지 분할(image segmentation) 모델을 이용하여 원본 마스크(mask)를 생성하는 예측부, 원본 이미지 셋과 원본 마스크에 기초하여 합성 이미지 셋을 생성하고, 합성 이미지 셋에 기초하여 모조 레이블(pseudo label)을 생성하는 레이블 생성부, 모조 레이블을 이용하여 원본 이미지 셋과 합성 이미지 셋에 대한 모조 라벨링(pseudo labeling)을 수행함으로써 학습 이미지 셋을 생성하는 전처리부 및 학습 이미지 셋에 기초하여 이미지 분할 모델을 추가로 학습시키는 모델 학습부를 포함한다.

Description

이미지 분할 모델 학습 장치 및 방법{APPRATUS AND METHOD FOR TRAINING MODEL FOR IMAGE SEGMENTATION}
개시되는 실시예들은 이미지 분할(image segmentation)을 위한 모델을 학습시키는 기술에 관한 것이다.
최근, 컴퓨터 비전(computer vision) 기술의 영역은 이미지를 단순히 분류(classification)하고, 이미지 내에 포함된 세부적인 구성을 검출(detection)하는 것을 넘어서, 이미지 내의 모든 픽셀들의 레이블(label)을 예측하는 이미지 분할(image segmentation)로 확대되고 있다.
이때, 이미지 분할을 수행하기 위해 미리 학습된 모델이 사용되는데, 사용자가 보다 정확한 예측 결과를 얻기 위해서는 모델의 학습이 보다 많이 이루어져야 하고, 이 과정에서 미리 라벨링(labeling) 된 수많은 데이터를 필요로 한다.
그러나, 실제 존재하는 데이터 중에는 라벨링되지 않은(unlabeled) 데이터가 훨씬 많고, 모델의 학습을 위해 이러한 데이터에 일일이 라벨링을 수행하기에는 과도한 비용과 시간이 소요된다는 한계점이 있다.
때문에, 진일보된 이미지 분할 기술을 구현하기 위해서 라벨링되지 않은 데이터들을 이용하여 자체적으로 모델을 학습시키는 구조를 구축할 필요성이 대두되고 있다.
대한민국 공개특허공보 제10-2017-0034226호 (2017.03.28. 공개)
개시되는 실시예들은 이미지 분할(image segmentation)을 위한 모델을 학습시키기 위한 것이다.
일 실시예에 따른 이미지 분할 모델 학습 장치는, 라벨링되지 않은(unlabeled) 원본 이미지 셋(image set)과 사전 학습된 이미지 분할(image segmentation) 모델을 이용하여 복수의 원본 마스크(mask)를 생성하는 예측부, 상기 원본 이미지 셋과 상기 복수의 원본 마스크에 기초하여 합성 이미지 셋을 생성하고, 상기 합성 이미지 셋에 기초하여 복수의 모조 레이블(pseudo label)을 생성하는 레이블 생성부, 상기 복수의 모조 레이블을 이용하여 상기 원본 이미지 셋과 상기 합성 이미지 셋에 대한 모조 라벨링(pseudo labeling)을 수행함으로써 학습 이미지 셋을 생성하는 전처리부 및 상기 학습 이미지 셋에 기초하여 상기 이미지 분할 모델을 추가로 학습시키는 모델 학습부를 포함한다.
상기 레이블 생성부는, 상기 복수의 원본 마스크 중 적어도 하나에 기초하여 복수의 변형된 마스크를 생성하는 마스크 생성부, 상기 원본 이미지 셋과 상기 복수의 변형된 마스크에 기초하여 상기 합성 이미지 셋을 생성하는 합성부, 상기 합성 이미지 셋에 포함된 합성 이미지 각각이 상기 원본 이미지 셋에 포함된 이미지로 판단될 확률을 추정하는 추정부 및 상기 복수의 변형된 마스크 중 상기 확률이 기 설정된 값 이상인 합성 이미지의 생성을 위해 이용된 마스크의 경계 정보(boundary information)를 상기 모조 레이블로 결정하는 결정부를 포함할 수 있다.
상기 마스크 생성부는, 상기 복수의 원본 마스크 중 적어도 하나의 경계 정보를 변경함으로써 상기 복수의 변형된 마스크를 생성할 수 있다.
상기 레이블 생성부는, 상기 원본 이미지 셋에 포함된 이미지 중 적어도 일부와 상기 복수의 변형된 마스크의 매칭 쌍 및 상기 합성 이미지의 생성을 위한 합성 파라미터를 생성하는 에이전트(agent)를 더 포함할 수 있고, 상기 합성부는, 상기 매칭 쌍 및 상기 합성 파라미터에 기초하여 상기 합성 이미지 셋을 생성할 수 있다.
상기 전처리부는, 상기 복수의 모조 레이블을 이용하여 상기 원본 이미지 셋에 상기 모조 라벨링을 수행함으로써 제1 학습 이미지 셋을 생성할 수 있고, 상기 복수의 모조 레이블을 이용하여 상기 합성 이미지 셋에 상기 모조 라벨링을 수행함으로써 제2 학습 이미지 셋을 생성할 수 있다.
상기 전처리부는, 상기 원본 이미지 셋에 포함된 적어도 하나의 원본 이미지에 상기 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 상기 원본 이미지 셋에 모조 라벨링을 수행할 수 있고, 상기 합성 이미지 셋에 포함된 적어도 하나의 합성 이미지에 상기 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 상기 합성 이미지 셋에 모조 라벨링을 수행할 수 있다.
다른 실시예에 따른 이미지 분할 모델 학습 장치는, 생성된 상기 복수의 모조 레이블의 개수가 기 설정된 값 이상인 경우, 상기 이미지 분할 모델의 학습을 완료하는 학습 완료부를 더 포함할 수 있다.
일 실시예에 따른 이미지 분할 모델 학습 방법은, 하나 이상의 프로세서들, 및 상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 방법으로서, 라벨링되지 않은(unlabeled) 원본 이미지 셋(image set)과 사전 학습된 이미지 분할(image segmentation) 모델을 이용하여 복수의 원본 마스크(mask)를 생성하는 단계, 상기 원본 이미지 셋과 상기 복수의 원본 마스크에 기초하여 합성 이미지 셋을 생성하는 단계, 상기 합성 이미지 셋에 기초하여 복수의 모조 레이블(pseudo label)을 생성하는 단계, 상기 복수의 모조 레이블을 이용하여 상기 원본 이미지 셋과 상기 합성 이미지 셋에 대한 모조 라벨링(pseudo labeling)을 수행함으로써 학습 이미지 셋을 생성하는 단계 및 상기 학습 이미지 셋에 기초하여 상기 이미지 분할 모델을 추가로 학습시키는 단계를 포함한다.
상기 합성 이미지 셋을 생성하는 단계는, 상기 복수의 원본 마스크 중 적어도 하나에 기초하여 복수의 변형된 마스크를 생성하는 단계 및 상기 원본 이미지 셋과 상기 복수의 변형된 마스크에 기초하여 상기 합성 이미지 셋을 생성하는 단계를 포함할 수 있다.
상기 복수의 모조 레이블을 생성하는 단계는, 상기 합성 이미지 셋에 포함된 합성 이미지 각각이 상기 원본 이미지 셋에 포함된 이미지로 판단될 확률을 추정하는 단계 및 상기 복수의 변형된 마스크 중 상기 확률이 기 설정된 값 이상인 합성 이미지의 생성을 위해 이용된 마스크의 경계 정보(boundary information)를 상기 모조 레이블로 결정하는 단계를 포함할 수 있다.
상기 복수의 변형된 마스크를 생성하는 단계는, 상기 복수의 원본 마스크 중 적어도 하나의 경계 정보를 변경함으로써 상기 복수의 변형된 마스크를 생성할 수 있다.
상기 복수의 모조 레이블을 생성하는 단계는, 상기 원본 이미지 셋에 포함된 이미지 중 적어도 일부와 상기 복수의 변형된 마스크의 매칭 쌍 및 상기 합성 이미지의 생성을 위한 합성 파라미터를 생성하는 단계를 더 포함할 수 있고, 상기 합성 이미지 셋을 생성하는 단계는, 상기 매칭 쌍 및 상기 합성 파라미터에 기초하여 상기 합성 이미지 셋을 생성할 수 있다.
상기 학습 이미지 셋을 생성하는 단계는, 상기 복수의 모조 레이블을 이용하여 상기 원본 이미지 셋에 상기 모조 라벨링을 수행함으로써 제1 학습 이미지 셋을 생성할 수 있고, 상기 복수의 모조 레이블을 이용하여 상기 합성 이미지 셋에 상기 모조 라벨링을 수행함으로써 제2 학습 이미지 셋을 생성할 수 있다.
상기 학습 이미지 셋을 생성하는 단계는, 상기 원본 이미지 셋에 포함된 적어도 하나의 원본 이미지에 상기 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 상기 원본 이미지 셋에 모조 라벨링을 수행할 수 있고, 상기 합성 이미지 셋에 포함된 적어도 하나의 합성 이미지에 상기 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 상기 합성 이미지 셋에 모조 라벨링을 수행할 수 있다.
다른 실시예에 따른 이미지 분할 모델 학습 방법은, 생성된 상기 복수의 모조 레이블의 개수가 기 설정된 값 이상인 경우, 상기 이미지 분할 모델의 학습을 완료하는 단계를 더 포함할 수 있다.
개시되는 실시예들에 따르면, 라벨링(labeling)이 되어있지 않은 이미지 셋(image set)을 이용하여 자체적으로 모조 레이블(pseudo label)을 생성함으로써, 데이터의 라벨링에 소모되는 비용과 시간을 효과적으로 절감할 수 있다.
또한 개시되는 실시예들에 따르면, 생성된 모조 레이블을 이용하여 기존의 이미지 셋과 합성된 이미지 셋 모두에 모조 라벨링(pseudo labeling)을 수행함으로써, 기존의 이미지 셋에만 모조 라벨링을 수행하는 것에 비해 훨씬 더 많은 학습 데이터를 획득할 수 있다.
도 1은 일 실시예에 따른 이미지 분할 모델 학습 장치를 설명하기 위한 블록도
도 2는 일 실시예에 따른 원본 데이터와 원본 마스크를 비교하여 설명하기 위한 예시도
도 3은 일 실시예에 따른 레이블 생성부를 상세히 설명하기 위한 블록도
도 4는 일 실시예에 따른 모조 레이블을 생성하는 일 예를 설명하기 위한 도면
도 5는 일 실시예에 따른 학습 이미지 셋을 설명하기 위한 예시도
도 6은 일 실시예에 따른 이미지 분할 모델 학습 방법을 설명하기 위한 흐름도
도 7은 추가적인 실시예에 따른 이미지 분할 모델 학습 방법을 설명하기 위한 흐름도
도 8은 일 실시예에 따른 합성 이미지 셋을 생성하는 단계를 상세히 설명하기 위한 흐름도
도 9는 일 실시예에 따른 모조 레이블을 생성하는 단계를 상세히 설명하기 위한 흐름도
도 10은 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경을 예시하여 설명하기 위한 블록도
이하, 도면을 참조하여 구체적인 실시형태를 설명하기로 한다. 이하의 상세한 설명은 본 명세서에서 기술된 방법, 장치 및/또는 시스템에 대한 포괄적인 이해를 돕기 위해 제공된다. 그러나 이는 예시에 불과하며 개시되는 실시예들은 이에 제한되지 않는다.
실시예들을 설명함에 있어서, 관련된 공지기술에 대한 구체적인 설명이 개시되는 실시예들의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 개시되는 실시예들에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 상세한 설명에서 사용되는 용어는 단지 실시예들을 기술하기 위한 것이며, 결코 제한적이어서는 안 된다. 명확하게 달리 사용되지 않는 한, 단수 형태의 표현은 복수 형태의 의미를 포함한다. 본 설명에서, "포함" 또는 "구비"와 같은 표현은 어떤 특성들, 숫자들, 단계들, 동작들, 요소들, 이들의 일부 또는 조합을 가리키기 위한 것이며, 기술된 것 이외에 하나 또는 그 이상의 다른 특성, 숫자, 단계, 동작, 요소, 이들의 일부 또는 조합의 존재 또는 가능성을 배제하도록 해석되어서는 안 된다.
이하의 실시예들에서, '이미지 분할(image segmentation)'은 이미지에 포함된 모든 픽셀(pixel)의 레이블(label)을 예측하여 기 지정된 개수의 클래스(class)로 분류하는 컴퓨터 비전 분야의 세부 분야를 지칭한다.
도 1은 일 실시예에 따른 이미지 분할 모델 학습 장치(100)를 설명하기 위한 블록도이다.
도 1을 참조하면, 일 실시예에 따른 이미지 분할 모델 학습 장치(100)는 예측부(110), 레이블 생성부(120), 전처리부(130) 및 모델 학습부(140)를 포함한다.
예측부(110)는 라벨링되지 않은(unlabeled) 원본 이미지 셋(image set)과 사전 학습된 이미지 분할(image segmentation) 모델을 이용하여 복수의 원본 마스크(mask)를 생성한다.
이하에서, '마스크'는 이미지 상의 일 부분을 이루는 경계에 대한 정보와 그 경계 내부의 이미지에 대한 정보를 함께 지칭한다.
일 실시예에 따르면, 이미지 분할 모델은 컨볼루셔널 뉴럴 네트워크(CNN; Convolutional Neural Network) 구조 및 복수의 전결합 레이어(Fully-connected layers)를 포함할 수 있다.
구체적으로, 이미지 분할 모델은 마스크 R-CNN(Mask R-CNN) 구조를 포함할 수 있다.
레이블 생성부(120)는 원본 이미지 셋과 복수의 원본 마스크에 기초하여 합성 이미지 셋을 생성하고, 생성된 합성 이미지 셋에 기초하여 복수의 모조 레이블(pseudo label)을 생성한다.
일 실시예에 따르면, '모조 레이블'은 이미지 분할 모델의 입력으로 사용되어 이미지 분할 모델이 원본 이미지 셋 내의 이미지들 또는 합성 이미지 셋 내의 이미지들을 식별할 수 있도록, 이미지 분할 모델 학습 장치(100)에 의해 자체적으로 생성된 레이블을 의미할 수 있다.
전처리부(130)는 복수의 모조 레이블을 이용하여 원본 이미지 셋과 합성 이미지 셋에 대한 모조 라벨링(pseudo labeling)을 수행함으로써 학습 이미지 셋을 생성한다. 이하에서, '모조 라벨링'은 모조 레이블을 원본 이미지 셋 내의 적어도 일부 이미지 또는 합성 이미지 셋 내의 적어도 일부 이미지에 라벨링하는 것을 지칭한다.
일 실시예에 따르면, 전처리부(130)는 레이블 생성부(120)에 의해 생성된 복수의 모조 레이블을 이용하여 원본 이미지 셋에 모조 라벨링을 수행함으로써 제1 학습 이미지 셋을 생성할 수 있다.
구체적으로, 전처리부(130)는 원본 이미지 셋에 포함된 적어도 하나의 원본 이미지에 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 원본 이미지 셋에 모조 라벨링을 수행함으로써, 제1 학습 이미지 셋을 생성할 수 있다.
이하에서, '경계 정보(boundary information)'라 함은, 원본 마스크의 경계를 구성하는 꼭지점(vertex) 또는 선분(line)을 특정하는 2차원 공간 상의 좌표 값일 수 있다.
또한 일 실시예에 따르면, 전처리부(130)는 레이블 생성부(120)에 의해 생성된 복수의 모조 레이블을 이용하여 합성 이미지 셋에 모조 라벨링을 수행함으로써 제2 학습 이미지 셋을 생성할 수 있다.
구체적으로, 전처리부(130)는 합성 이미지 셋에 포함된 적어도 하나의 합성 이미지에 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 합성 이미지 셋에 모조 라벨링을 수행함으로써, 제2 학습 이미지 셋을 생성할 수 있다.
모델 학습부(140)는 학습 이미지 셋에 기초하여 이미지 분할 모델을 추가로 학습시킨다.
일 실시예에 따르면, 학습 이미지 셋은 모조 라벨링된 제1 학습 이미지 셋과 모조 라벨링된 제2 학습 이미지 셋을 포함하므로, 모델 학습부(140)는 지도 학습(supervised learning)에 적용되는 다양한 학습 방법을 이용하여 이미지 분할 모델을 학습시킬 수 있다.
한편 추가적인 실시예에 따르면, 이미지 분할 모델 학습 장치(100)는 예측부(110), 레이블 생성부(120), 전처리부(130) 및 모델 학습부(140)에 더하여 학습 완료부(미도시)를 더 포함할 수 있다.
이때 예를 들어, 학습 완료부(미도시)는 레이블 생성부(120)에 의해 생성된 복수의 모조 레이블의 개수가 원본 이미지 셋에 포함된 이미지의 개수 이상인 경우, 이미지 분할 모델의 학습을 완료할 수 있다.
즉 다시 말하면, 복수의 모조 레이블의 개수가 원본 이미지 셋에 포함된 이미지의 개수 이상인 경우, 학습 완료부(미도시)는 원본 이미지 셋에 포함된 이미지 한 개당 적어도 하나의 모조 레이블이 매칭되었다고 판단하여 이미지 분할 모델의 학습을 완료할 수 있다.
도 2는 일 실시예에 따른 원본 데이터와 원본 마스크를 비교하여 설명하기 위한 예시도이다. 도 2의 (a)는 일 실시예에 따른 원본 데이터를 나타내는 도면이며, 도 2의 (b)는 일 실시예에 따라 해당 원본 데이터에 기초하여 생성된 원본 마스크 중 경계 정보를 나타내는 도면이다.
먼저 도 2의 (a)를 참조하면, 하단에는 대기 중인 차량이 나타나 있고, 중앙부에는 차량 전방에 위치한 보도를 횡단하는 여러 명의 사람들이 나타나 있다. 보도의 양측에는 보도와 색상이 구분되는 인도가 나타나 있으며, 뒤편의 배경 부분에는 수목과 건물 등의 객체가 나타나 있다.
이때, 일 실시예에 따른 이미지 분할 모델 학습 장치(100)가 도 2의 (a)에 나타난 사람과 인도를 인식하여 이미지 분할을 수행하는 이미지 분할 모델을 이용한다고 가정하자.
이 경우, 일 실시예에 따른 이미지 분할 모델 학습 장치(100)는 상술한 이미지 분할 모델을 이용하여 도 2의 (a)에 나타난 사람과 인도 각각의 경계 정보와 경계 내부의 이미지 정보를 포함하는 원본 마스크를 생성할 수 있다.
다음으로, 도 2의 (b)는 위와 같이 생성된 원본 마스크에 포함된 경계 정보를 예시적으로 나타내며, 구체적으로는 도 2의 (a)에 나타난 사람 중 일부와 도보 양측의 인도에 대한 경계 정보를 나타낸다.
일 실시예에 따르면, 이미지 분할 모델 학습 장치(100)는 도 2의 (b)에 나타난 경계 정보를 변경하여 복수의 변형된 경계 정보를 생성하고, 복수의 변형된 경계 정보와 변형된 경계 내부의 이미지 정보를 포함하는 복수의 변형된 마스크를 생성할 수 있다.
도 3은 일 실시예에 따른 레이블 생성부(120)를 상세히 설명하기 위한 블록도이다.
도 3을 참조하면, 일 실시예에 따른 레이블 생성부(120)는 마스크 생성부(121), 합성부(123), 추정부(125) 및 결정부(127)를 포함할 수 있다.
마스크 생성부(121)는 복수의 원본 마스크 중 적어도 하나에 기초하여 복수의 변형된 마스크를 생성할 수 있다.
일 실시예에 따르면, 마스크 생성부(121)는 복수의 원본 마스크 중 적어도 하나의 경계 정보를 변경함으로써 복수의 변형된 마스크를 생성할 수 있다.
구체적으로, 마스크 생성부(121)는 복수의 원본 마스크 중 적어도 하나의 경계를 구성하는 꼭지점(vertex) 또는 선분(line)을 특정하는 2차원 공간 상의 좌표 값을 변경하여 복수의 변형된 마스크를 생성할 수 있다.
예를 들어, 마스크 생성부(121)는 복수의 원본 마스크 중 적어도 하나의 경계를 구성하는 꼭지점 중 1개를 임의로 선택하고, 해당 꼭지점을 특정하는 좌표 값에 기 설정된 범위 내의 난수를 곱하여 복수의 변형된 마스크를 생성할 수 있다. 이를 통해, 레이블 생성부(120)는 다양한 합성 이미지를 포함하는 합성 이미지 셋과 다양한 모조 레이블을 생성할 수 있고, 이에 기초하여 이미지 분할 모델 장치(100)가 이미지 분할 모델을 더욱 효과적으로 학습시킬 수 있다.
합성부(123)는 원본 이미지 셋과 복수의 변형된 마스크에 기초하여 합성 이미지 셋을 생성할 수 있다.
일 실시예에 따르면, 레이블 생성부(120)는 원본 이미지 셋에 포함된 이미지 중 적어도 일부와 복수의 변형된 마스크의 매칭 쌍 및 합성 이미지의 생성을 위한 합성 파라미터를 생성하는 에이전트(agent)를 더 포함할 수 있으며, 합성부(123)는 상술한 에이전트에 의해 생성된 매칭 쌍 및 합성 파라미터에 기초하여 합성 이미지 셋을 생성할 수 있다.
구체적으로, 에이전트는 원본 이미지 셋에 포함된 이미지 중 적어도 일부와 복수의 변형된 마스크를 매핑하여 복수의 매칭 쌍을 생성하고, 합성부(123)에서 매핑된 매칭 쌍끼리 합성하는 데 필요한 합성 파라미터를 생성할 수 있다.
일 실시예에 따르면, 합성부(123)는 동일한 매칭 쌍에 포함된 원본 이미지(이하, '매칭 이미지'라 지칭한다)와 변형된 마스크(이하, '매칭 마스크'라 지칭한다)가 있을 때, 매칭 이미지 상에서 매칭 마스크에 대응되는 위치의 이미지를 잘라낸 뒤, 일부가 잘린 매칭 이미지와 매칭 마스크를 연접(concatenate)하여 합성 이미지를 생성한다.
추정부(125)는 합성 이미지 셋에 포함된 합성 이미지 각각이 원본 이미지 셋에 포함된 이미지로 판단될 확률을 추정할 수 있다.
일 실시예에 따르면, 추정부(125)는 이미지 분할 모델과 별도의 인공 신경망을 포함할 수 있으며, 추정부(125)로 입력되는 이미지 각각이 원본 이미지 셋 내의 이미지인지, 합성 이미지 셋 내의 이미지인지를 구분하도록 학습될 수 있다.
구체적으로, 추정부(125)는 원본 이미지 셋 및 합성 이미지 셋을 입력 받되, 입력된 각 이미지가 원본 이미지 셋에 포함된 이미지인 경우 상술한 확률이 1이 되도록 추정하고, 입력된 각 이미지가 합성 이미지 셋에 포함된 이미지인 경우 상술한 확률이 0이 되도록 추정하는 것을 목표로 학습될 수 있다. 이때, 학습에 이용되는 손실 함수는 예를 들어, binary cross entropy 함수일 수 있으나 반드시 이에 한정되는 것은 아니다.
결정부(127)는 복수의 변형된 마스크 중 추정부(125)가 추정한 확률이 기 설정된 값 이상인 합성 이미지의 생성을 위해 이용된 마스크의 경계 정보를 모조 레이블로 결정할 수 있다.
도 4는 일 실시예에 따른 모조 레이블을 생성하는 일 예를 설명하기 위한 도면이다.
도 4를 참조하면, 마스크 생성부(121)는 오각형 형태의 원본 마스크(420)를 입력 받아 경계 정보 중 일부인 꼭지점 하나를 임의로 선택하고, 선택된 꼭지점을 임의의 거리만큼 이동시켜 다양한 도형 형태를 갖는 복수의 변형된 마스크를 생성할 수 있다.
이후, 에이전트는 차량 후면이 촬영된 원본 이미지(410)와 마스크 생성부(121)에서 생성된 복수의 변형된 마스크를 입력 받아 매칭 쌍 및 합성 파라미터를 생성할 수 있다.
이후, 합성부(123)는 에이전트에서 생성된 매칭 쌍과 합성 파라미터에 기초하여 차량 후면에 다양한 도형 형태를 갖는 복수의 변형된 마스크가 합성된 합성 이미지 셋을 생성할 수 있다.
이후, 추정부(125)는 합성 이미지 셋 내의 복수의 합성 이미지 각각이 원본 이미지 셋 내의 이미지로 판단될 확률을 각각 추정하여, 추정한 확률이 기 설정된 값 이상인 경우에 대응되는 변형된 마스크의 경계 정보를 모조 레이블로 선택할 수 있다.
예를 들어, 도 4에 도시된 복수의 합성 이미지 중 가장 우측의 합성 이미지에 대해 추정한 확률이 기 설정된 값 이상인 경우, 추정부(125)는 해당 합성 이미지를 생성하는 데 사용된 변형된 마스크의 경계 정보를 모조 레이블로 선택할 수 있다.
도 5는 일 실시예에 따른 학습 이미지 셋(550)을 설명하기 위한 예시도이다.
도 5에 도시된 학습 이미지 셋은 예를 들어, 상술한 이미지 분할 모델 학습 장치(100)에 의해 생성될 수 있다.
도 5를 참조하면, 예시적으로 원본 이미지 셋(510)에는 자전거를 나타내는 이미지(이하, '자전거 이미지'라 지칭한다)와 관람차를 나타내는 이미지(이하, '관람차 이미지'라 지칭한다)가 포함되어 있다.
아울러, 예시적으로 합성 이미지 셋(520)에서는 관람차 이미지의 일부가 합성된 자전거 이미지(이하, '합성된 자전거 이미지'라 지칭한다) 및 자전거 이미지의 일부가 합성된 관람차 이미지(이하, '합성된 관람차 이미지'라 지칭한다)가 포함되어 있다.
구체적으로, 합성된 자전거 이미지는 관람차 이미지 중 원형 구조물 부분에 대응되는 일부 이미지가 자전거 이미지의 앞 바퀴 부분에 합성되어 있고, 합성된 관람차 이미지는 자전거 이미지 중 앞 바퀴의 오른쪽 아래 부분에 대응되는 일부 이미지가 관람차 이미지의 원형 구조물 부분에 합성되어 있다.
이때, 모조 레이블은 관람차 이미지 중 원형 구조물 부분에 대응되는 경계 정보 및 자전거 이미지 중 앞 바퀴의 오른쪽 아래 부분에 대응되는 경계 정보를 포함할 수 있다.
이어서, 이미지 분할 모델 학습 장치(100)는 자전거 이미지에 관람차 이미지 중 원형 구조물 부분에 대응되는 경계 정보를 표시하고, 관람차 이미지에 자전거 이미지 중 앞 바퀴의 오른쪽 아래 부분에 대응되는 경계 정보를 표시함으로써 모조 라벨링을 수행할 수 있고, 그 결과 제1 학습 이미지 셋(530)을 생성할 수 있다.
마찬가지로, 이미지 분할 모델 학습 장치(100)는 합성된 자전거 이미지에 관람차 이미지 중 원형 구조물 부분에 대응되는 경계 정보를 표시하고, 합성된 관람차 이미지에 자전거 이미지 중 앞 바퀴의 오른쪽 아래 부분에 대응되는 경계 정보를 표시함으로써 모조 라벨링을 수행할 수 있고, 그 결과 제2 학습 이미지 셋(540)을 생성할 수 있다.
이후, 이미지 분할 모델 학습 장치(100)는 제1 학습 이미지 셋(530) 및 제2 학습 이미지 셋(540)을 포함하는 학습 이미지 셋(550)에 기초하여 이미지 분할 모델을 추가로 학습시킬 수 있다.
도 6은 일 실시예에 따른 이미지 분할 모델 학습 방법을 설명하기 위한 흐름도이다. 도 6에 도시된 방법은 예를 들어, 상술한 이미지 분할 모델 학습 장치(100)에 의해 수행될 수 있다.
610 단계에서, 이미지 분할 모델 학습 장치(100)는 라벨링되지 않은 원본 이미지 셋과 사전 학습된 이미지 분할 모델을 이용하여 복수의 원본 마스크를 생성한다.
620 단계에서, 이미지 분할 모델 학습 장치(100)는 원본 이미지 셋과 복수의 원본 마스크에 기초하여 합성 이미지 셋을 생성한다.
630 단계에서, 이미지 분할 모델 학습 장치(100)는 합성 이미지 셋에 기초하여 복수의 모조 레이블을 생성한다.
640 단계에서, 이미지 분할 모델 학습 장치(100)는 복수의 모조 레이블을 이용하여 원본 이미지 셋과 합성 이미지 셋에 대한 모조 라벨링을 수행함으로써 학습 이미지 셋을 생성한다.
650 단계에서, 이미지 분할 모델 학습 장치(100)는 학습 이미지 셋에 기초하여 이미지 분할 모델을 추가로 학습시킨다.
도 7은 추가적인 실시예에 따른 이미지 분할 모델 학습 방법을 설명하기 위한 흐름도이다. 도 7에 도시된 방법은 예를 들어, 상술한 이미지 분할 모델 학습 장치(100)에 의해 수행될 수 있다.
710 단계 내지 750 단계는, 도 6을 참조하여 상술한 610 단계 내지 650 단계와 대응되는 바, 이에 대한 보다 구체적인 설명은 생략하도록 한다.
750 단계에서, 이미지 분할 모델 학습 장치(100)는 720 단계에서 생성한 복수의 모조 레이블의 개수가 기 설정된 값 이상인 경우, 이미지 분할 모델의 학습을 완료할 수 있다.
일 실시예에 따르면, 기 설정된 값은 750 단계의 수행 전 사용자에 의해 설정된 값일 수 있다.
도 8은 일 실시예에 따른 합성 이미지 셋을 생성하는 단계를 상세히 설명하기 위한 흐름도이다. 도 8에 도시된 방법은 예를 들어, 상술한 이미지 분할 모델 학습 장치(100)에 의해 수행될 수 있다.
810 단계에서, 이미지 분할 모델 학습 장치(100)는, 도 6의 610 단계 또는 도 7의 710 단계에서 생성한 복수의 원본 마스크 중 적어도 하나에 기초하여 복수의 변형된 마스크를 생성할 수 있다.
820 단계에서, 이미지 분할 모델 학습 장치(100)는 원본 이미지 셋과 복수의 변형된 마스크에 기초하여 합성 이미지 셋을 생성할 수 있다.
도 9는 일 실시예에 따른 모조 레이블을 생성하는 단계를 상세히 설명하기 위한 흐름도이다. 도 9에 도시된 방법은 예를 들어, 상술한 이미지 분할 모델 학습 장치(100)에 의해 수행될 수 있다.
910 단계에서, 이미지 분할 모델 학습 장치(100)는 도 7의 820 단계에서 생성한 합성 이미지 셋에 포함된 합성 이미지 각각이 원본 이미지 셋에 포함된 이미지로 판단될 확률을 추정할 수 있다.
920 단게에서, 이미지 분할 모델 학습 장치(100)는 복수의 변형된 마스크 중 추정한 확률이 기 설정된 값 이상인 합성 이미지의 생성을 위해 이용된 마스크의 경계 정보를 모조 레이블로 결정할 수 있다.
상술한 도 6 내지 도 9에 도시된 흐름도에서는 상기 방법을 복수 개의 단계로 나누어 기재하였으나, 적어도 일부의 단계들은 순서를 바꾸어 수행되거나, 다른 단계와 결합되어 함께 수행되거나, 생략되거나, 세부 단계들로 나뉘어 수행되거나, 또는 도시되지 않은 하나 이상의 단계가 부가되어 수행될 수 있다.
도 10은 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경(10)을 예시하여 설명하기 위한 블록도이다. 도시된 실시예에서, 각 컴포넌트들은 이하에 기술된 것 이외에 상이한 기능 및 능력을 가질 수 있고, 이하에 기술된 것 이외에도 추가적인 컴포넌트를 포함할 수 있다.
도시된 컴퓨팅 환경(10)은 컴퓨팅 장치(12)를 포함한다. 일 실시예에서, 컴퓨팅 장치(12)는 이미지 분할 모델 학습 장치(100)일 수 있다.
컴퓨팅 장치(12)는 적어도 하나의 프로세서(14), 컴퓨터 판독 가능 저장 매체(16) 및 통신 버스(18)를 포함한다. 프로세서(14)는 컴퓨팅 장치(12)로 하여금 앞서 언급된 예시적인 실시예에 따라 동작하도록 할 수 있다. 예컨대, 프로세서(14)는 컴퓨터 판독 가능 저장 매체(16)에 저장된 하나 이상의 프로그램들을 실행할 수 있다. 상기 하나 이상의 프로그램들은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 상기 컴퓨터 실행 가능 명령어는 프로세서(14)에 의해 실행되는 경우 컴퓨팅 장치(12)로 하여금 예시적인 실시예에 따른 동작들을 수행하도록 구성될 수 있다.
컴퓨터 판독 가능 저장 매체(16)는 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능 저장 매체(16)에 저장된 프로그램(20)은 프로세서(14)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독 가능 저장 매체(16)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 컴퓨팅 장치(12)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.
통신 버스(18)는 프로세서(14), 컴퓨터 판독 가능 저장 매체(16)를 포함하여 컴퓨팅 장치(12)의 다른 다양한 컴포넌트들을 상호 연결한다.
컴퓨팅 장치(12)는 또한 하나 이상의 입출력 장치(24)를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(22) 및 하나 이상의 네트워크 통신 인터페이스(26)를 포함할 수 있다. 입출력 인터페이스(22) 및 네트워크 통신 인터페이스(26)는 통신 버스(18)에 연결된다. 입출력 장치(24)는 입출력 인터페이스(22)를 통해 컴퓨팅 장치(12)의 다른 컴포넌트들에 연결될 수 있다. 예시적인 입출력 장치(24)는 포인팅 장치(마우스 또는 트랙패드 등), 키보드, 터치 입력 장치(터치패드 또는 터치스크린 등), 음성 또는 소리 입력 장치, 다양한 종류의 센서 장치 및/또는 촬영 장치와 같은 입력 장치, 및/또는 디스플레이 장치, 프린터, 스피커 및/또는 네트워크 카드와 같은 출력 장치를 포함할 수 있다. 예시적인 입출력 장치(24)는 컴퓨팅 장치(12)를 구성하는 일 컴포넌트로서 컴퓨팅 장치(12)의 내부에 포함될 수도 있고, 컴퓨팅 장치(12)와는 구별되는 별개의 장치로 컴퓨팅 장치(12)와 연결될 수도 있다.
한편, 본 발명의 실시예는 본 명세서에서 기술한 방법들을 컴퓨터상에서 수행하기 위한 프로그램, 및 상기 프로그램을 포함하는 컴퓨터 판독 가능 기록매체를 포함할 수 있다. 상기 컴퓨터 판독 가능 기록매체는 프로그램 명령, 로컬 데이터 파일, 로컬 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나, 또는 컴퓨터 소프트웨어 분야에서 통상적으로 사용 가능한 것일 수 있다. 컴퓨터 판독 가능 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광 기록 매체, 및 롬, 램, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 프로그램의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.
이상에서 본 발명의 대표적인 실시예들을 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리범위는 설명된 실시예에 국한되어 정해져서는 안 되며, 후술하는 청구범위뿐만 아니라 이 청구범위와 균등한 것들에 의해 정해져야 한다.
10: 컴퓨팅 환경
12: 컴퓨팅 장치
14: 프로세서
16: 컴퓨터 판독 가능 저장 매체
18: 통신 버스
20: 프로그램
22: 입출력 인터페이스
24: 입출력 장치
26: 네트워크 통신 인터페이스
100: 이미지 분할 모델 학습 장치
110: 예측부
120: 레이블 생성부
121: 마스크 생성부
123: 합성부
125: 추정부
127: 결정부
130: 전처리부
140: 모델 학습부

Claims (15)

  1. 라벨링되지 않은(unlabeled) 원본 이미지 셋(image set)과 사전 학습된 이미지 분할(image segmentation) 모델을 이용하여 복수의 원본 마스크(mask)를 생성하는 예측부;
    상기 원본 이미지 셋과 상기 복수의 원본 마스크에 기초하여 합성 이미지 셋을 생성하고, 상기 합성 이미지 셋에 기초하여 복수의 모조 레이블(pseudo label)을 생성하는 레이블 생성부;
    상기 복수의 모조 레이블을 이용하여 상기 원본 이미지 셋과 상기 합성 이미지 셋에 대한 모조 라벨링(pseudo labeling)을 수행함으로써 학습 이미지 셋을 생성하는 전처리부; 및
    상기 학습 이미지 셋에 기초하여 상기 이미지 분할 모델을 추가로 학습시키는 모델 학습부를 포함하는, 이미지 분할 모델 학습 장치.
  2. 청구항 1에 있어서,
    상기 레이블 생성부는,
    상기 복수의 원본 마스크 중 적어도 하나에 기초하여 복수의 변형된 마스크를 생성하는 마스크 생성부;
    상기 원본 이미지 셋과 상기 복수의 변형된 마스크에 기초하여 상기 합성 이미지 셋을 생성하는 합성부;
    상기 합성 이미지 셋에 포함된 합성 이미지 각각이 상기 원본 이미지 셋에 포함된 이미지로 판단될 확률을 추정하는 추정부; 및
    상기 복수의 변형된 마스크 중 상기 확률이 기 설정된 값 이상인 합성 이미지의 생성을 위해 이용된 마스크의 경계 정보(boundary information)를 상기 모조 레이블로 결정하는 결정부를 포함하는, 이미지 분할 모델 학습 장치.
  3. 청구항 2에 있어서,
    상기 마스크 생성부는,
    상기 복수의 원본 마스크 중 적어도 하나의 경계 정보를 변경함으로써 상기 복수의 변형된 마스크를 생성하는, 이미지 분할 모델 학습 장치.
  4. 청구항 2에 있어서,
    상기 레이블 생성부는,
    상기 원본 이미지 셋에 포함된 이미지 중 적어도 일부와 상기 복수의 변형된 마스크의 매칭 쌍 및 상기 합성 이미지의 생성을 위한 합성 파라미터를 생성하는 에이전트(agent)를 더 포함하고,
    상기 합성부는,
    상기 매칭 쌍 및 상기 합성 파라미터에 기초하여 상기 합성 이미지 셋을 생성하는, 이미지 분할 모델 학습 장치.
  5. 청구항 1에 있어서,
    상기 전처리부는,
    상기 복수의 모조 레이블을 이용하여 상기 원본 이미지 셋에 상기 모조 라벨링을 수행함으로써 제1 학습 이미지 셋을 생성하고,
    상기 복수의 모조 레이블을 이용하여 상기 합성 이미지 셋에 상기 모조 라벨링을 수행함으로써 제2 학습 이미지 셋을 생성하는, 이미지 분할 모델 학습 장치.
  6. 청구항 5에 있어서,
    상기 전처리부는,
    상기 원본 이미지 셋에 포함된 적어도 하나의 원본 이미지에 상기 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 상기 원본 이미지 셋에 모조 라벨링을 수행하고,
    상기 합성 이미지 셋에 포함된 적어도 하나의 합성 이미지에 상기 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 상기 합성 이미지 셋에 모조 라벨링을 수행하는, 이미지 분할 모델 학습 장치.
  7. 청구항 1에 있어서,
    생성된 상기 복수의 모조 레이블의 개수가 기 설정된 값 이상인 경우, 상기 이미지 분할 모델의 학습을 완료하는 학습 완료부를 더 포함하는, 이미지 분할 모델 학습 장치.
  8. 하나 이상의 프로세서들, 및
    상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 방법으로서,
    라벨링되지 않은(unlabeled) 원본 이미지 셋(image set)과 사전 학습된 이미지 분할(image segmentation) 모델을 이용하여 복수의 원본 마스크(mask)를 생성하는 단계;
    상기 원본 이미지 셋과 상기 복수의 원본 마스크에 기초하여 합성 이미지 셋을 생성하는 단계;
    상기 합성 이미지 셋에 기초하여 복수의 모조 레이블(pseudo label)을 생성하는 단계;
    상기 복수의 모조 레이블을 이용하여 상기 원본 이미지 셋과 상기 합성 이미지 셋에 대한 모조 라벨링(pseudo labeling)을 수행함으로써 학습 이미지 셋을 생성하는 단계; 및
    상기 학습 이미지 셋에 기초하여 상기 이미지 분할 모델을 추가로 학습시키는 단계를 포함하는, 이미지 분할 모델 학습 방법.
  9. 청구항 8에 있어서,
    상기 합성 이미지 셋을 생성하는 단계는,
    상기 복수의 원본 마스크 중 적어도 하나에 기초하여 복수의 변형된 마스크를 생성하는 단계; 및
    상기 원본 이미지 셋과 상기 복수의 변형된 마스크에 기초하여 상기 합성 이미지 셋을 생성하는 단계를 포함하는, 이미지 분할 모델 학습 방법.
  10. 청구항 9에 있어서,
    상기 복수의 모조 레이블을 생성하는 단계는,
    상기 합성 이미지 셋에 포함된 합성 이미지 각각이 상기 원본 이미지 셋에 포함된 이미지로 판단될 확률을 추정하는 단계; 및
    상기 복수의 변형된 마스크 중 상기 확률이 기 설정된 값 이상인 합성 이미지의 생성을 위해 이용된 마스크의 경계 정보(boundary information)를 상기 모조 레이블로 결정하는 단계를 포함하는, 이미지 분할 모델 학습 방법.
  11. 청구항 9에 있어서,
    상기 복수의 변형된 마스크를 생성하는 단계는,
    상기 복수의 원본 마스크 중 적어도 하나의 경계 정보를 변경함으로써 상기 복수의 변형된 마스크를 생성하는, 이미지 분할 모델 학습 방법.
  12. 청구항 10에 있어서,
    상기 복수의 모조 레이블을 생성하는 단계는,
    상기 원본 이미지 셋에 포함된 이미지 중 적어도 일부와 상기 복수의 변형된 마스크의 매칭 쌍 및 상기 합성 이미지의 생성을 위한 합성 파라미터를 생성하는 단계를 더 포함하고,
    상기 합성 이미지 셋을 생성하는 단계는,
    상기 매칭 쌍 및 상기 합성 파라미터에 기초하여 상기 합성 이미지 셋을 생성하는, 이미지 분할 모델 학습 방법.
  13. 청구항 8에 있어서,
    상기 학습 이미지 셋을 생성하는 단계는,
    상기 복수의 모조 레이블을 이용하여 상기 원본 이미지 셋에 상기 모조 라벨링을 수행함으로써 제1 학습 이미지 셋을 생성하고,
    상기 복수의 모조 레이블을 이용하여 상기 합성 이미지 셋에 상기 모조 라벨링을 수행함으로써 제2 학습 이미지 셋을 생성하는, 이미지 분할 모델 학습 방법.
  14. 청구항 13에 있어서,
    상기 학습 이미지 셋을 생성하는 단계는,
    상기 원본 이미지 셋에 포함된 적어도 하나의 원본 이미지에 상기 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 상기 원본 이미지 셋에 모조 라벨링을 수행하고,
    상기 합성 이미지 셋에 포함된 적어도 하나의 합성 이미지에 상기 복수의 모조 레이블 중 하나에 대응되는 경계 정보를 표시하여 상기 합성 이미지 셋에 모조 라벨링을 수행하는, 이미지 분할 모델 학습 방법.
  15. 청구항 8에 있어서,
    생성된 상기 복수의 모조 레이블의 개수가 기 설정된 값 이상인 경우, 상기 이미지 분할 모델의 학습을 완료하는 단계를 더 포함하는, 이미지 분할 모델 학습 방법.
KR1020200061438A 2020-05-22 2020-05-22 이미지 분할 모델 학습 장치 및 방법 KR20210144294A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200061438A KR20210144294A (ko) 2020-05-22 2020-05-22 이미지 분할 모델 학습 장치 및 방법
US16/884,981 US11341653B2 (en) 2020-05-22 2020-05-27 Apparatus and method for training model for image segmentation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200061438A KR20210144294A (ko) 2020-05-22 2020-05-22 이미지 분할 모델 학습 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20210144294A true KR20210144294A (ko) 2021-11-30

Family

ID=78608193

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200061438A KR20210144294A (ko) 2020-05-22 2020-05-22 이미지 분할 모델 학습 장치 및 방법

Country Status (2)

Country Link
US (1) US11341653B2 (ko)
KR (1) KR20210144294A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102655359B1 (ko) 2023-12-29 2024-04-05 주식회사 더매트릭스 생성형 ai 모델을 이용해 인페인팅 서비스 제공 서버, 시스템, 방법 및 프로그램
KR102657627B1 (ko) 2024-01-19 2024-04-17 주식회사 더매트릭스 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램
KR102661488B1 (ko) 2024-01-19 2024-04-26 주식회사 더매트릭스 생성형 ai 모델을 이용한 특수효과 합성 및 3d 모델 생성 서비스 제공 서버, 시스템, 방법 및 프로그램
KR102662411B1 (ko) 2024-01-19 2024-04-30 주식회사 더매트릭스 생성형 ai 모델을 이용한 동적 객체 추적, 인페인팅 및 아웃페인팅 서비스 제공 서버, 시스템, 방법 및 프로그램

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11830131B2 (en) * 2018-02-06 2023-11-28 Veo Robotics, Inc. Workpiece sensing for process management and orchestration
US11468550B2 (en) 2019-07-22 2022-10-11 Adobe Inc. Utilizing object attribute detection models to automatically select instances of detected objects in images
US11107219B2 (en) 2019-07-22 2021-08-31 Adobe Inc. Utilizing object attribute detection models to automatically select instances of detected objects in images
US11631234B2 (en) 2019-07-22 2023-04-18 Adobe, Inc. Automatically detecting user-requested objects in images
US11468110B2 (en) 2020-02-25 2022-10-11 Adobe Inc. Utilizing natural language processing and multiple object detection models to automatically select objects in images
US11055566B1 (en) 2020-03-12 2021-07-06 Adobe Inc. Utilizing a large-scale object detector to automatically select objects in digital images
US11587234B2 (en) * 2021-01-15 2023-02-21 Adobe Inc. Generating class-agnostic object masks in digital images
US11972569B2 (en) 2021-01-26 2024-04-30 Adobe Inc. Segmenting objects in digital images utilizing a multi-object segmentation model framework
US20230252774A1 (en) * 2022-02-09 2023-08-10 Adobe Inc. Open vocabulary instance segmentation
CN117197471B (zh) * 2023-11-07 2024-02-09 中国地质大学(武汉) 一种岩性制图方法及计算机设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170034226A (ko) 2015-09-18 2017-03-28 삼성전자주식회사 객체 인식 장치 및 방법, 객체 인식 모델 학습 장치 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10242449B2 (en) * 2017-01-04 2019-03-26 Cisco Technology, Inc. Automated generation of pre-labeled training data
US10867210B2 (en) * 2018-12-21 2020-12-15 Waymo Llc Neural networks for coarse- and fine-object classifications

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170034226A (ko) 2015-09-18 2017-03-28 삼성전자주식회사 객체 인식 장치 및 방법, 객체 인식 모델 학습 장치 및 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102655359B1 (ko) 2023-12-29 2024-04-05 주식회사 더매트릭스 생성형 ai 모델을 이용해 인페인팅 서비스 제공 서버, 시스템, 방법 및 프로그램
KR102660062B1 (ko) 2023-12-29 2024-04-23 주식회사 더매트릭스 프레임에 최적화된 네거티브 프롬프트를 활용한 인페인팅 서비스를 제공하는 서버, 시스템, 방법 및 프로그램
KR102657627B1 (ko) 2024-01-19 2024-04-17 주식회사 더매트릭스 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램
KR102661488B1 (ko) 2024-01-19 2024-04-26 주식회사 더매트릭스 생성형 ai 모델을 이용한 특수효과 합성 및 3d 모델 생성 서비스 제공 서버, 시스템, 방법 및 프로그램
KR102662411B1 (ko) 2024-01-19 2024-04-30 주식회사 더매트릭스 생성형 ai 모델을 이용한 동적 객체 추적, 인페인팅 및 아웃페인팅 서비스 제공 서버, 시스템, 방법 및 프로그램

Also Published As

Publication number Publication date
US11341653B2 (en) 2022-05-24
US20210366128A1 (en) 2021-11-25

Similar Documents

Publication Publication Date Title
KR20210144294A (ko) 이미지 분할 모델 학습 장치 및 방법
US11367271B2 (en) Similarity propagation for one-shot and few-shot image segmentation
CN110879959B (zh) 生成数据集的方法及装置、利用其的测试方法及测试装置
JP6441980B2 (ja) 教師画像を生成する方法、コンピュータおよびプログラム
US10825148B2 (en) Boundary-aware object removal and content fill
KR102509666B1 (ko) 텍스트 및 오디오 기반 실시간 얼굴 재연
KR20210149530A (ko) 이미지 분류 모델 학습 방법 및 이를 수행하기 위한 장치
JP7129529B2 (ja) 人工知能の使用による3dオブジェクトへのuvマッピング
US11062502B2 (en) Three-dimensional modeling volume for rendering images
KR102664916B1 (ko) 익스플레이너블 셀프-포커스드 어텐션을 이용하여 행동 예측을 수행하는 방법 및 장치
JP2024511043A (ja) モデル注入を用いた点群データ拡張のためのシステム、および方法
US11650717B2 (en) Using artificial intelligence to iteratively design a user interface through progressive feedback
US20220301298A1 (en) Multi-task self-training for learning general representations
US11842468B2 (en) Synthesizing digital images utilizing image-guided model inversion of an image classifier
Yurtsever et al. Photorealism in driving simulations: Blending generative adversarial image synthesis with rendering
US11755688B2 (en) Apparatus and method for generating training data for a machine learning system
CN116363363A (zh) 无监督域适应语义分割方法、装置、设备及可读存储介质
US20220215228A1 (en) Detection method, computer-readable recording medium storing detection program, and detection device
US20230230406A1 (en) Facilitating identification of fillable regions in a form
KR20210142930A (ko) 퓨 샷 학습 방법 및 이를 수행하기 위한 장치
US20230141734A1 (en) Digital image inpainting utilizing plane panoptic segmentation and plane grouping
KR20220052223A (ko) 객체 감지를 위한 라벨링 장치 및 방법
KR20220049754A (ko) 영상 분류 모델 학습 장치 및 방법
KR20220048593A (ko) 데이터 라벨링 장치 및 방법
CN110688511A (zh) 细粒度图像检索方法、装置、计算机设备及存储介质