WO2019231162A1

WO2019231162A1 - 이미지 분할 방법 및 장치

Info

Publication number: WO2019231162A1
Application number: PCT/KR2019/006132
Authority: WO
Inventors: 송효섭; 이준호; 송지은
Original assignee: 삼성에스디에스 주식회사
Priority date: 2018-05-31
Filing date: 2019-05-22
Publication date: 2019-12-05
Also published as: US11715197B2; KR20190136493A; EP3686841A4; EP3686841B1; US20200320711A1; EP3686841A1; CN111164645A; KR102580062B1

Abstract

이미지 분할 장치 및 방법이 개시된다. 본 발명의 일 실시예에 따른 이미지 분할 방법은, 하나 이상의 프로세서들, 및 상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되며, (a) 이미지를 입력받는 단계, (b) 상기 입력된 이미지를 중첩적으로 분할하여 1 세대 조각 이미지 세트를 생성하는 단계, (c) 상기 1 세대 조각 이미지 세트로부터 2 세대 이상의 조각 이미지 세트를 생성하되, 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 적어도 하나를 중첩적으로 분할하여 후속 세대 조각 이미지 세트를 생성하는 단계를 포함한다.

Description

이미지 분할 방법 및 장치

개시되는 실시예들은 이미지 분할 기술과 관련된다.

종래의 딥 러닝(deep learning) 기반의 분류기술의 문제점은 분류기를 학습할 때 고해상도 이미지의 풍부한 정보를 모두 사용하지 못하는 문제점과, 부분 정보를 사용하여 분류된 결과는 2차적으로 다른 조건들을 적용하는 과정을 거쳐야 최종 분류가 가능하다는 문제점이 존재한다.

영상을 입력으로 하여 딥 러닝 기반의 물체 분류기를 학습시키고자 하는 경우, 분류하고자 하는 대상의 영상에서 물체에 해당하는 영역을 지정하고, 지정된 영역에 대한 레이블(label)을 할당(annotation)하는 과정을 거친 후, 학습을 위해 선정된 딥 러닝 네트워크의 입력단과 일치하도록 균일한 크기로 축소 혹은 확대(resize)한 후 학습을 진행하는 방법이 일반적이다.

이러한 방법은 겉모습만으로 구분되는 사람-개-고양이 이미지 분류와 같은 경우에는 큰 효과를 얻을 수 있다. 그러나, 겉모습은 동일하지만 색상, 패턴, 질감 등과 같은 내부 정보의 차이를 고려해야만 구분이 가능한 이미지의 경우(특히, 고해상도 영상을 축소하여 사용하는 경우)에는 특징이 되는 영역이 축소에 의해 사라지거나, 동일한 모양으로 변경되는 현상이 발생된다. 예를 들면 2000 x 2000 해상도의 영상에서 10x10 영역에 존재하는 원형 모양의 특징은, 전체 영상을 200 x 200으로 일괄 축소하게 되면 1 픽셀의 점이 되거나, 사라질 가능성이 높다. 또 다른 예로 2000 x 2000 해상도의 영상에서 10x10 크기로 존재하는 원 모양, 삼각형 모양, 사각형 모양의 패턴들과 같은 특징은, 전체 영상을 200 x 200으로 일괄 축소하게 되면 모두 1 픽셀의 점으로 같게 변환되어 특징이 사라진다.

한편, 딥 러닝 기반 물체 분류기를 위한 영상 학습의 다른 방법으로는 병렬처리가 용이하도록 동일한 크기의 격자로 일괄적으로 나누어 생성한 조각 이미지를 사용하는 방법이다. 하지만 격자로 나누는 경우 이웃한 조각 이미지들 사이의 연관성을 찾기 어려우며, 생성되는 조각 이미지는 학습의 대상이 되는 물체의 전체 정보가 아니라, 일부분의 정보만 가지고 있을 수도 있다.

조각 이미지를 이용하는 학습 방법은 분류된 조각 이미지의 위치를 찾기 위한 검출(detection, classification 및 localization)을 목적으로 하는 경우에 더 잘 어울리는 방법이다. 검출 기술을 사용하여 해결 가능한 대표적인 문제가 정상/비정상의 분류문제이다. 일반적으로 특이점(singularity)이 발견되면 비정상으로 분류하는 방법이 일반적이다.

하지만, 특이점이 발견되더라도 특이한 정도, 특이점의 개수 등의 여러 가지 복합적인 조합에 의해 정상과 비정상이 분류 가능하므로, 검출 기술을 적용한 이후에도 다양한 조합의 룰(rule)에 의한 필터링을 거쳐야 정확한 정상/비정상 분류가 가능하다. 대표적인 예로, 이미지 내에서 병변이 발견되었다고 무조건 질환으로 판정되지 않고, 병변의 심각한 정도, 병변의 개수 등에 따라 질환이 아닌 정상으로 판정 가능하다.

개시되는 실시예들은 이미지 분할 장치 및 방법을 제공하기 위함이다.

본 발명의 일 실시예에 따른 이미지 분할 방법은, 하나 이상의 프로세서들, 및 상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되며, (a) 이미지를 입력받는 단계, (b) 상기 입력된 이미지를 중첩적으로 분할하여 1 세대 조각 이미지 세트를 생성하는 단계, (c) 상기 1 세대 조각 이미지 세트로부터 2 세대 이상의 조각 이미지 세트를 생성하되, 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 적어도 하나를 중첩적으로 분할하여 후속 세대 조각 이미지 세트를 생성하는 단계를 포함한다.

j(이때, j는 j≥1인 정수) 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각은, 상기 j 세대 조각 이미지 세트에 포함된 다른 하나 이상의 조각 이미지와 중첩되는 영역을 포함할 수 있다.

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 기 설정된 선택 조건을 만족하는 적어도 하나의 조각 이미지를 중첩적으로 분할하여 상기 후속 세대 조각 이미지 세트를 생성할 수 있다.

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각에 대하여, 이미지 내 픽셀 유사도를 산출하는 단계 및 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 상기 픽셀 유사도가 기 설정된 기준 값 이하인 조각 이미지 각각을 중첩적으로 분할하여 상기 후속 세대 조각 이미지 세트를 생성하는 단계를 포함할 수 있다.

상기 (c) 단계는, 상기 픽셀 유사도가 상기 기준 값 이하인 조각 이미지가 존재하지 않는 경우, 상기 후속 세대 조각 이미지 세트의 생성을 종료할 수 있다.

상기 (c) 단계는, 기 설정된 분할 종료 조건이 만족된 경우, 상기 후속 세대 조각 이미지 세트의 생성을 종료할 수 있다.

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각의 크기 및 기 설정된 기준 값에 기초하여 상기 기 설정된 분할 종료 조건이 만족되었는지 여부를 판단할 수 있다.

상기 (c) 단계는, 현재까지 생성된 조각 이미지 세트에 포함된 조각 이미지들의 총 개수 및 기 설정된 기준 값에 기초하여 상기 기 설정된 분할 종료 조건이 만족되었는지 여부를 판단할 수 있다.

상기 이미지 분할 방법은, (d) 상기 입력된 이미지 및 상기 1 세대 내지 n(이때, n은 n≥2인 정수) 세대 조각 이미지 세트 각각에 포함된 복수의 조각 이미지 전체 또는 일부를 기 설정된 크기로 축소하는 단계를 더 포함할 수 있다.

이미지 분할 방법은, (e) 상기 축소된 이미지를 이용하여 딥 러닝 기반의 이미지 분류기를 학습시키는 단계를 더 포함할 수 있다.

본 발명의 일 실시예에 따른 이미지 분할 장치는, 하나 이상의 프로세서, 메모리 및 하나 이상의 프로그램들을 포함하고, 상기 하나 이상의 프로그램들은 상기 메모리에 저장되고, 상기 하나 이상의 프로세서들에 의해 실행되도록 구성되며, 상기 하나 이상의 프로그램들은, (a) 이미지를 입력받는 단계, (b) 상기 입력된 이미지를 중첩적으로 분할하여 1 세대 조각 이미지 세트를 생성하는 단계, (c) 상기 1 세대 조각 이미지 세트로부터 2 세대 이상의 조각 이미지 세트를 생성하되, 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 적어도 하나를 중첩적으로 분할하여 후속 세대 조각 이미지 세트를 생성하는 단계를 실행하기 위한 명령어들을 포함한다.

상기 하나 이상의 프로그램들은, (d) 상기 입력된 이미지 및 상기 1 세대 내지 n(이때, n은 n≥2인 정수) 세대 조각 이미지 세트 각각에 포함된 복수의 조각 이미지 전체 또는 일부를 기 설정된 크기로 축소하는 단계를 실행하기 위한 명령어들을 더 포함할 수 있다.

상기 하나 이상의 프로그램들은, (e) 상기 축소된 이미지를 이용하여 딥 러닝 기반의 이미지 분류기를 학습시키는 단계를 실행하기 위한 명령어들을 더 포함할 수 있다.

본 발명의 실시예들에 따르면, 이미지를 중첩적으로 분할하여 복수 세대의 조각 이미지 세트를 생성함으로써, 이미지 내에서 크기가 작은 특징 영역에 대한 정보 손실 없이 연관성을 가지는 조각 이미지들을 생성할 수 있다.

또한, 본 발명이 실시예들에 따르면, 중첩 분할된 복수 세대의 조각 이미지 세트에 포함된 조각 이미지들을 딥 러닝 기반의 이미지 분류기 학습을 위해 이용하되, 이미지 분류기의 입력 크기로 변환하여 학습을 수행함으로써, 마지막 세대의 조각 이미지 세트에 포함된 조각 이미지는 이전 세대의 조각 이미지 세트에 포함된 조각 이미지에 비해 확대(zoom-in)되어 학습되는 효과를 얻을 수 있으며, 이미지의 전체 정보와 특징이 되는 부분 정보를 같이 조합하여 학습 가능하게 된다.

도 1은 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경을 예시하여 설명하기 위한 블록도이다.

도 2는 본 발명의 일 실시예에 따른 이미지 분할 방법의 순서도

도 3은 입력되는 이미지의 예시도

도 4는 본 발명의 일 실시예에 따른 조각 이미지 생성 과정을 설명하기 위한 도면

도 5 내지 도 8은 본 발명의 다른 실시예에 따른 조각 이미지 생성 과정을 설명하기 위한 도면

도 9 내지 도 14는 본 발명의 또 다른 실시예에 따른 조각 이미지 생성 과정을 설명하기 위한 도면

도 15는 1 세대 조각 이미지 세트의 일 예를 나타낸 도면

도 16은 본 발명의 추가적인 실시예에 따른 이미지 분할 방법의 순서도

도 17은 본 발명의 일 실시예에 따라 생성된 조각 이미지 세트들의 일 예를 나타낸 도면

도 18 및 도 19는 본 발명의 일 실시예에 따른 학습 이미지 세트 생성을 설명하기 위한 예시도

이하, 도면을 참조하여 본 발명의 구체적인 실시형태를 설명하기로 한다. 이하의 상세한 설명은 본 명세서에서 기술된 방법, 장치 및/또는 시스템에 대한 포괄적인 이해를 돕기 위해 제공된다. 그러나 이는 예시에 불과하며 본 발명은 이에 제한되지 않는다.

본 발명의 실시예들을 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 상세한 설명에서 사용되는 용어는 단지 본 발명의 실시예들을 기술하기 위한 것이며, 결코 제한적이어서는 안 된다. 명확하게 달리 사용되지 않는 한, 단수 형태의 표현은 복수 형태의 의미를 포함한다. 본 설명에서, "포함" 또는 "구비"와 같은 표현은 어떤 특성들, 숫자들, 단계들, 동작들, 요소들, 이들의 일부 또는 조합을 가리키기 위한 것이며, 기술된 것 이외에 하나 또는 그 이상의 다른 특성, 숫자, 단계, 동작, 요소, 이들의 일부 또는 조합의 존재 또는 가능성을 배제하도록 해석되어서는 안 된다.

도 1은 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경(10)을 예시하여 설명하기 위한 블록도이다. 도시된 실시예에서, 각 컴포넌트들은 이하에 기술된 것 이외에 상이한 기능 및 능력을 가질 수 있고, 이하에 기술되지 것 이외에도 추가적인 컴포넌트를 포함할 수 있다.

도시된 컴퓨팅 환경(10)은 컴퓨팅 장치(12)를 포함한다. 일 실시예에서, 컴퓨팅 장치(12)는 본 발명의 실시예들에 따른 이미지 분할 장치일 수 있다. 컴퓨팅 장치(12)는 적어도 하나의 프로세서(14), 컴퓨터 판독 가능 저장 매체(16) 및 통신 버스(18)를 포함한다. 프로세서(14)는 컴퓨팅 장치(12)로 하여금 앞서 언급된 예시적인 실시예에 따라 동작하도록 할 수 있다. 예컨대, 프로세서(14)는 컴퓨터 판독 가능 저장 매체(16)에 저장된 하나 이상의 프로그램들을 실행할 수 있다. 상기 하나 이상의 프로그램들은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 상기 컴퓨터 실행 가능 명령어는 프로세서(14)에 의해 실행되는 경우 컴퓨팅 장치(12)로 하여금 예시적인 실시예에 따른 동작들을 수행하도록 구성될 수 있다.

컴퓨터 판독 가능 저장 매체(16)는 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능 저장 매체(16)에 저장된 프로그램(20)은 프로세서(14)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독 가능 저장 매체(16)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 컴퓨팅 장치(12)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.

통신 버스(18)는 프로세서(14), 컴퓨터 판독 가능 저장 매체(16)를 포함하여 컴퓨팅 장치(12)의 다른 다양한 컴포넌트들을 상호 연결한다.

컴퓨팅 장치(12)는 또한 하나 이상의 입출력 장치(24)를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(22) 및 하나 이상의 네트워크 통신 인터페이스(26)를 포함할 수 있다. 입출력 인터페이스(22) 및 네트워크 통신 인터페이스(26)는 통신 버스(18)에 연결된다. 입출력 장치(24)는 입출력 인터페이스(22)를 통해 컴퓨팅 장치(12)의 다른 컴포넌트들에 연결될 수 있다. 예시적인 입출력 장치(24)는 포인팅 장치(마우스 또는 트랙패드 등), 키보드, 터치 입력 장치(터치패드 또는 터치스크린 등), 음성 또는 소리 입력 장치, 다양한 종류의 센서 장치 및/또는 촬영 장치와 같은 입력 장치, 및/또는 디스플레이 장치, 프린터, 스피커 및/또는 네트워크 카드와 같은 출력 장치를 포함할 수 있다. 예시적인 입출력 장치(24)는 컴퓨팅 장치(12)를 구성하는 일 컴포넌트로서 컴퓨팅 장치(12)의 내부에 포함될 수도 있고, 컴퓨팅 장치(12)와는 구별되는 별개의 장치로 컴퓨팅 장치(12)와 연결될 수도 있다.

도 2는 본 발명의 일 실시예에 따른 이미지 분할 방법의 순서도이다.

도 2를 참조하면, 210 단계에서 컴퓨팅 장치(12)는 이미지를 입력받는다.

이때, 입력되는 이미지는 사용자에 의해 입력되거나, 미리 수집된 복수의 이미지들을 포함하는 이미지 데이터베이스로부터 획득된 원본 이미지일 수 있다. 그러나, 반드시 이에 한정되는 것은 아니며, 실시예에 따라, 입력되는 이미지는 예를 들어, 여백이나 배경과 같이 원본 이미지에서 불필요한 영역이 전체 또는 일부 제거된 이미지일 수 있다. 이때, 불필요한 영역의 제거 방법은 반드시 특정한 방법으로 한정되는 것은 아니다.

구체적으로, 도 3은 입력되는 이미지의 예시도이다.

도 3에 도시된 예에서, 310은 사용자에 의해 입력되거나, 이미지 데이터베이스로부터 획득된 망막 이미지(즉, 원본 이미지)의 일 예를 나타내고, 320은 원본 이미지(310)에서 망막 영역을 제외한 여백 영역 중 일부를 제거한 이미지의 일 예를 나타낸다.

이하에서는, 설명의 편의를 위해 입력되는 이미지가 도 3에 도시된 원본 이미지(310)인 것으로 가정하고 설명하나, 실시예에 따라 입력되는 이미지는 원본 이미지(310)에서 여백 영역 중 일부를 제거한 이미지(320)일 수도 있음을 유의하여야 한다.

다시 도 2를 참조하면, 220 단계에서, 컴퓨팅 장치(12)는 입력된 이미지를 중첩적으로 분할하여 1 세대 조각 이미지 세트를 생성한다.

이때, '이미지를 중첩적으로 분할'한다는 의미는 분할 대상 이미지로부터 각각 분할 대상 이미지 중 일부 영역을 포함하는 복수의 조각 이미지를 생성하되, 각각 다른 하나 이상의 조각 이미지와 중첩되는 영역을 포함하도록 복수의 조각 이미지를 생성함을 의미한다.

즉, 1세대 조각 이미지 세트는 각각 입력된 이미지 중 일부 영역을 포함하는 복수의 조각 이미지들을 포함한다. 또한, 1 세대 조각 이미지 세트에 포함된 복수의 조각 이미지들 각각은 1 세대 조각 이미지 세트에 포함된 다른 하나의 조각 이미지와 중첩되는 영역을 포함한다.

도 4는 본 발명의 일 실시예에 따른 조각 이미지 생성 과정을 설명하기 위한 도면이다.

도 4를 참조하면, 컴퓨팅 장치(12)는 입력된 이미지(400) 상에 기 설정된 크기의 윈도우(410)를 배치할 수 있다. 또한, 컴퓨팅 장치(12) 윈도우(410)를 입력된 이미지(400) 내에서 X축 방향 및 Y축 방향으로 기 설정된 거리만큼 순차적으로 이동시키면서, 윈도우(410) 내에 포함된 영역을 각각 입력된 이미지(400)에 대한 조각 이미지로 추출할 수 있다. 이때, 윈도우(410)의 X축 방향 이동 거리는 윈도우(410)의 X 축 방향 길이 보다 작게 설정될 수 있으며, 윈도우(410)의 Y 축 방향 이동 거리는 윈도우(301)의 Y 축 방향 길이 보다 작게 설정될 수 있다.

한편, 도 4에 도시된 예에서, 윈도우(410)의 크기, X축 방향 이동 거리 및 Y 축 방향 이동 거리는 생성할 조각 이미지의 개수, 분할 대상인 이미지의 크기에 따라 변경될 수 있다.

도 5 내지 도 8은 본 발명의 다른 실시예에 따른 조각 이미지 생성 과정을 설명하기 위한 도면이다.

도 5 내지 도 8을 참조하면, 우선, 컴퓨팅 장치(12)는 도 5에 도시된 예와 같이 입력된 이미지(500)를 4등분하여 제1 내지 제4 조각 이미지(510, 520, 530, 540)를 생성할 수 있다.

이후, 컴퓨팅 장치(12)는 도 6에 도시된 예와 같이 입력된 이미지(500)에서 제1 조각 이미지(510)의 하 반면과 제3 조각 이미지(530)의 상 반면에 해당하는 영역을 포함하는 제5 조각 이미지(550)를 생성할 수 있다. 또한, 컴퓨팅 장치(120)는 제2 조각 이미지(520)의 하 반면과 제4 조각 이미지(540)의 상 반면에 해당하는 영역을 포함하는 제6 조각 이미지(560)를 생성할 수 있다.

또한, 컴퓨팅 장치(12)는 도 7에 도시된 예와 같이 입력된 이미지(500)에서 제1 조각 이미지(510)의 우 반면과 제2 조각 이미지(520)의 좌 반면에 해당하는 영역을 포함하는 제7 조각 이미지(570)를 생성할 수 있다. 또한, 컴퓨팅 장치(12)는 입력된 이미지(500)에서 제3 조각 이미지(530)의 우 반면과 제4 조각 이미지(540)의 좌 반면에 해당하는 영역을 포함하는 제8 조각 이미지(580)를 생성할 수 있다.

이후, 컴퓨팅 장치(12)는 도 8에 도시된 예와 같이 입력된 이미지(500)에서 제7 조각 이미지(570)의 하 반면과 제8 조각 이미지(580)의 상 반면에 해당하는 영역을 포함하는 제9 조각 이미지(590)를 생성할 수 있다.

도 9 내지 도 14는 본 발명의 또 다른 실시예에 따른 조각 이미지 생성 과정을 설명하기 위한 도면이다.

도 9 내지 도 14를 참조하면, 우선, 컴퓨팅 장치(12)는 도 9에 도시된 예와 같이 입력된 이미지(600)를 4등분하여 제1 내지 제4 조각 이미지(610, 620, 630, 640)를 생성할 수 있다.

이후, 컴퓨팅 장치(12)는 도 10에 도시된 예와 같이 제1 조각 이미지(610)와 제3 조각 이미지(630)를 각각 상 반면과 하 반면으로 분할한 후, 제1 조각 이미지(610)의 하 반면과 제3 조각 이미지(630)의 상 반면을 결합하여 제5 조각 이미지(650)를 생성할 수 있다.

또한, 컴퓨팅 장치(120)는 도 11에 도시된 예와 같이 제2 조각 이미지(620)와 제4 조각 이미지(640)를 각각 상 반면과 하 반면으로 분할한 후, 제2 조각 이미지(620)의 하 반면과 제4 조각 이미지(640)의 상 반면을 결합하여 제6 조각 이미지(660)를 생성할 수 있다.

또한, 컴퓨팅 장치(12)는 도 12에 도시된 예와 같이 제1 조각 이미지(610)와 제2 조각 이미지(620)를 각각 좌 반면과 우 반면으로 분할한 후, 제1 조각 이미지(610)의 우 반면과 제2 조각 이미지(610)의 좌 반면을 결합하여 제7 조각 이미지(670)를 생성할 수 있다.

또한, 컴퓨팅 장치(12)는 도 13에 도시된 예와 같이 제3 조각 이미지(630)와 제4 조각 이미지(640)를 각각 좌 반면과 우 반면으로 분할한 후, 제3 조각 이미지(630)의 우 반면과 제4 조각 이미지(640)의 좌 반면을 결합하여 제8 조각 이미지(680)를 생성할 수 있다.

또한, 컴퓨팅 장치(12)는 도 14에 도시된 예와 같이 제1 내지 제4 조각 이미지(610, 620, 630, 640)를 각각 4 등분한 후, 제1 조각 이미지(610)의 4 사분면, 제2 조각 이미지(620)의 3 사분면, 제3 조각 이미지(630)의 1 사분면 및 제4 조각 이미지(640)의 2 사분면을 결합하여 제9 조각 이미지(690)를 생성할 수 있다.

한편, 도 15는 상술한 실시예들에 따라 생성된 1 세대 조각 이미지 세트의 일 예를 나타낸 도면이다.

도 15에 도시된 예와 같이, 1 세대 조각 이미지 세트는 9개의 조각 이미지들을 포함하고, 각 조각 이미지들은 다른 하나의 조각 이미지와 중첩되는 영역을 포함함을 확인할 수 있다.

한편, 상술한 예에서는, 입력된 이미지로부터 9개의 조각 이미지를 생성하는 것으로 가정하여 설명하였으나, 생성되는 조각 이미지의 수는 상술한 예와 달리 실시예에 따라 변동 가능하다.

또한, 입력된 이미지로부터 각각 다른 하나 이상의 조각 이미지와 중첩되는 영역을 포함하는 복수의 조각 이미지를 생성할 수만 있다면, 제1 조각 이미지 세트는 상술한 실시예들 외에도 다양한 방식에 의해 생성될 수 있다.

다시 도 2를 참조하면, 230 단계에서, 컴퓨팅 장치(12)는 1세대 조각 이미지 세트로부터 2 세대 이상의 조각 이미지 세트를 생성한다. 이때, 컴퓨팅 장치(12)는 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 적어도 하나를 중첩적으로 분할하여 후속 세대 조각 이미지를 생성한다.

구체적으로, 본 발명의 일 실시예에 따르면, 컴퓨팅 장치(12)는 i(이때, i는 i≥1인 정수) 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 적어도 하나를 중첩적으로 분할하여 i+1 세대 조각 이미지 세트를 생성할 수 있다.

이때, i+1 세대 조각 이미지 세트는 상술한 1세대 조각 이미지 세트 생성 방식과 동일한 방식을 이용하여 생성될 수 있다. 또한, 각 세대의 조각 이미지 세트에 포함된 복수의 조각 이미지 각각은 동일한 세대의 조각 이미지 세트에 포함된 다른 하나 이상의 조각 이미지와 중첩되는 영역을 포함할 수 있다.

도 16은 본 발명의 추가적인 실시예에 따른 이미지 분할 방법의 순서도이다.

도 16에 도시된 순서도에서, 810 단계 및 820 단계는 각각 도 2에 도시된 210 단계 및 220 단계와 동일하므로, 이에 대한 중복적인 설명은 생략한다.

도 16을 참조하면, 830 단계에서, 컴퓨팅 장치(12)는 현재 생성된 조각 이미지 세트의 세대 인덱스 값을 나타내는 i를 1로 설정한다.

840 단계에서, 컴퓨팅 장치(12)는 1 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 기 설정된 선택 조건을 만족하는 조각 이미지가 존재하는지 여부를 판단한다.

구체적으로, 본 발명의 일 실시예에 따르면, 컴퓨팅 장치(120)는 1 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각에 대하여 이미지 내 픽셀 유사도를 산출하고, 산출된 픽셀 유사도가 기 설정된 기준 값 이하인 조각 이미지를 선택할 수 있다. 이때, 픽셀 유사도는 예를 들어, 조각 이미지 내 픽셀들의 밝기, 색상 값, 주파수, 기울기(gradient) 등에 기초하여 산출될 수 있다.

한편, 1 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 기 설정된 선택 조건을 만족하는 조각 이미지가 존재하지 않는 경우, 컴퓨팅 장치(12)는 1 세대 조각 이미지 세트에 대한 후속 세대 조각 이미지 세트 생성을 종료한다.

반면, 1 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 기 설정된 선택 조건을 만족하는 하나 이상의 조각 이미지가 존재하는 경우, 850 단계에서, 컴퓨팅 장치(12)는 선택 조건을 만족하는 하나 이상의 조각 이미지를 각각 추가 분할 대상으로 선택한다.

추가 분할 대상 조각 이미지가 선택된 경우, 860 단계에서, 컴퓨팅 장치(12)는 선택된 조각 이미지 각각을 중첩적으로 분할하여 2 세대 조각 이미지 세트를 생성한다.

이후, 870 단계에서, 컴퓨팅 장치(12)는 기 설정된 분할 종료 조건이 만족되었는지 여부를 판단한다.

이때, 본 발명의 일 실시예에 따르면, 컴퓨팅 장치(12)는 860 단계에서 생성된 2 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각의 크기 및 기 설정된 제1 기준 값에 기초하여 분할 종료 조건이 만족되었는지 여부를 판단할 수 있다. 예를 들어, 2 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 적어도 하나를 중첩적으로 분할하여 생성되는 조각 이미지의 크기가 제1 기준 값보다 작아지는 경우, 컴퓨팅 장치(12)는 분할 종료 조건이 만족된 것으로 판단할 수 있다. 이때, 제1 기준 값은 후술할 딥 러닝(deep learning) 기반의 이미지 분류기에 설정된 입력 이미지 크기와 동일하게 설정될 수 있다.

본 발명의 다른 실시예에 따르면, 컴퓨팅 장치(12)는 현재까지 생성된 조각 이미지 세트에 포함된 조각 이미지의 총 개수 및 기 설정된 제2 기준 값 에 기초하여 분할 조건이 만족되었는지 여부를 판단할 수 있다. 예를 들어, 컴퓨팅 장치(12)는 현재까지 생성된 조각 이미지 세트인 1 세대 및 2 세대 조각 이미지 세트에 포함된 조각 이미지들의 총 개수에 기초하여, 2 세대 조각 이미지 세트로부터 3 세대 조각 이미지 세트를 생성할 경우, 조각 이미지들의 총 개수가 제2 기준 값을 초과하게 되면 분할 종료 조건이 만족된 것으로 판단할 수 있다. 이때, 제2 기준 값은 예를 들어, 연산량을 고려하여 사용자에 의해 적절한 값으로 설정될 수 있다.

한편, 870 단계에서, 분할 종료 조건이 만족되지 않은 경우, 컴퓨팅 장치(12)는 세대 인덱스 값 i를 1만큼 증가 시킨 후, 상술한 분할 종료 조건이 만족되거나, i 세대 조각 이미지 세트에서 상술한 선택 조건을 만족하는 조각 이미지가 존재하지 않을 때까지 840 단계 내지 880 단계를 반복 수행하여 2 세대 이상의 조각 이미지 세트를 생성할 수 있다.

도 17은 본 발명의 일 실시예에 따라 생성된 조각 이미지 세트들의 일 예를 나타낸 도면이다.

도 17에 도시된 예에서는, 입력 이미지(A)로부터 1 세대 내지 3 세대 조각 이미지가 생성된 것으로 가정한다.

도 17을 참조하면, 우선 1 세대 조각 이미지 세트는 입력 이미지(A)를 중첩적으로 분할하여 생성된 9개의 조각 이미지들을 포함한다(A-1 내지 A-9).

또한, 2 세대 조각 이미지 세트는 각각 1 세대 조각 이미지 세트에 포함된 조각 이미지 중 A-7을 중첩적으로 분할하여 생성된 9개의 조각 이미지들(A-7-1 내지 A-7-9)과 A-9를 중첩적으로 분할하여 생성된 9개의 조각 이미지들(A-9-1 내지 A-9-9)을 포함한다.

또한, 3 세대 조각 이미지 세트는 각각 2 세대 조각 이미지 세트에 포함된 조각 이미지 중 A-7-4를 중첩적으로 분할하여 생성된 9개의 조각 이미지들(A-7-4-1 내지 A-7-4-9)과 A-9-2를 중첩적으로 분할하여 생성된 9개의 조각 이미지들(A-9-2-1 내지 A-9-2-9)을 포함한다.

한편, 본 발명의 일 실시예에 따르면, 컴퓨팅 장치(12)는 입력 이미지 및 생성된 조각 이미지 세트들 각각에 포함된 조각 이미지들 중 적어도 일부를 기 설정된 크기로 축소하여 축소된 이미지들을 포함하는 학습 이미지 세트를 생성할 수 있다. 이때, 기 설정된 크기는 딥 러닝 기반의 이미지 분류기에 설정된 입력 이미지 크기와 동일하게 설정될 수 있다.

또한, 컴퓨팅 장치(12)는 학습 이미지 세트를 이용하여 딥 러닝 기반의 이미지 분류기를 학습시킬 수 있다. 한편, 딥 러닝 기반의 이미지 분류기는 입력된 이미지의 인식 내지는 분류를 위한 것으로, 예를 들어, CNN(Convolution Neural Network) 모델일 수 있으나, 복수의 학습 이미지를 이용하여 학습 가능하다면 반드시 특정한 구조로 한정되는 것은 아니다.

도 18 및 도 19는 본 발명의 일 실시예에 따른 학습 이미지 세트 생성을 설명하기 위한 예시도이다.

도 18 및 도 19에 도시된 예에서는 설명의 편의를 위해 입력 이미지로부터 1 세대 조각 이미지 세트를 생성하고, 1 세대 조각 이미지 세트 중 하나의 조각 이미지(1010)로부터 2세대 조각 이미지 세트를 생성한 것으로 가정한다.

도 18을 참조하면, 컴퓨팅 장치(12)는, 예를 들어, 입력 이미지, 1 세대 조각 이미지 세트에 포함된 조각 이미지 및 2 세대 조각 이미지 세트에 포함된 조각 이미지 각각을 기 설정된 크기로 축소하여 축소된 이미지들을 포함하는 학습 이미지 세트를 생성할 수 있다.

다른 예로, 도 19를 참조하면, 컴퓨팅 장치(12)는, 입력 이미지 및 마지막 세대인 2 세대 조각 이미지 세트에 포함된 조각 이미지 각각을 기 설정된 크기로 축소할 수 있다.

또한, 컴퓨팅 장치(12)는 1 세대 조각 이미지 세트에 포함된 조각 이미지들 중 2 세대 조각 이미지 세트 생성을 위해 이용된 조각 이미지(1010)를 제외한 나머지 조각 이미지 각각을 기 설정된 크기로 축소할 수 있다.

이후, 컴퓨팅 장치(12)는 축소된 이미지들을 포함하는 학습 이미지 세트를 생성할 수 있다.

즉, 컴퓨팅 장치(12)는 입력 이미지로부터 1 세대 내지 n(이때, n은 n≥2인 정수) 세대 조각 이미지 세트가 생성된 경우, 실시예에 따라, 도 18에 도시된 예와 같이 1 세대 내지 n 세대 조각 이미지 세트에 포함된 전체 조각 이미지들을 학습 이미지 세트 생성을 위해 이용하거나, 도 19에 도시된 예와 같이 1 세대 내지 n-1 세대 조각 이미지 세트 각각에 포함된 조각 이미지들 중 후속 세대 생성을 위해 이용되지 않은 조각 이미지 및 n 세대 조각 이미지 세트에 포함된 조각 이미지를 학습 이미지 세트 생성을 위해 이용할 수 있다.

한편, 학습 이미지 세트 생성을 위한 조각 이미지 선택은 상술한 예 외에도 학습의 효율성, 학습 결과의 정확성, 연산량 등을 고려하여 다양한 방식으로 변형 실시 가능하다.

한편, 본 발명의 실시예는 본 명세서에서 기술한 방법들을 컴퓨터상에서 수행하기 위한 프로그램, 및 상기 프로그램을 포함하는 컴퓨터 판독 가능 기록매체를 포함할 수 있다. 상기 컴퓨터 판독 가능 기록매체는 프로그램 명령, 로컬 데이터 파일, 로컬 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나, 또는 컴퓨터 소프트웨어 분야에서 통상적으로 사용 가능한 것일 수 있다. 컴퓨터 판독 가능 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광 기록 매체, 및 롬, 램, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 프로그램의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.

이상에서 본 발명의 대표적인 실시예들을 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리범위는 설명된 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims

하나 이상의 프로세서들, 및

상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 방법으로서,

(a) 이미지를 입력받는 단계;

(b) 상기 입력된 이미지를 중첩적으로 분할하여 1 세대 조각 이미지 세트를 생성하는 단계;

(c) 상기 1 세대 조각 이미지 세트로부터 2 세대 이상의 조각 이미지 세트를 생성하되, 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 적어도 하나를 중첩적으로 분할하여 후속 세대 조각 이미지 세트를 생성하는 단계를 포함하는, 이미지 분할 방법.
청구항 1에 있어서,

j(이때, j는 j≥1인 정수) 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각은, 상기 j 세대 조각 이미지 세트에 포함된 다른 하나 이상의 조각 이미지와 중첩되는 영역을 포함하는, 이미지 분할 방법.
청구항 1에 있어서,

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 기 설정된 선택 조건을 만족하는 적어도 하나의 조각 이미지를 중첩적으로 분할하여 상기 후속 세대 조각 이미지 세트를 생성하는, 이미지 분할 방법.
청구항 3에 있어서,

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각에 대하여, 이미지 내 픽셀 유사도를 산출하는 단계; 및

상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 상기 픽셀 유사도가 기 설정된 기준 값 이하인 조각 이미지 각각을 중첩적으로 분할하여 상기 후속 세대 조각 이미지 세트를 생성하는 단계를 포함하는, 이미지 분할 방법.
청구항 4에 있어서,

상기 (c) 단계는, 상기 픽셀 유사도가 상기 기준 값 이하인 조각 이미지가 존재하지 않는 경우, 상기 후속 세대 조각 이미지 세트의 생성을 종료하는, 이미지 분할 방법.
청구항 1에 있어서,

상기 (c) 단계는, 기 설정된 분할 종료 조건이 만족된 경우, 상기 후속 세대 조각 이미지 세트의 생성을 종료하는, 이미지 분할 방법.
청구항 6에 있어서,

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각의 크기 및 기 설정된 기준 값에 기초하여 상기 기 설정된 분할 종료 조건이 만족되었는지 여부를 판단하는, 이미지 분할 방법.
청구항 6에 있어서,

상기 (c) 단계는, 현재까지 생성된 조각 이미지 세트에 포함된 조각 이미지들의 총 개수 및 기 설정된 기준 값에 기초하여 상기 기 설정된 분할 종료 조건이 만족되었는지 여부를 판단하는, 이미지 분할 방법.
청구항 1에 있어서,

(d) 상기 입력된 이미지 및 상기 1 세대 내지 n(이때, n은 n≥2인 정수) 세대 조각 이미지 세트 각각에 포함된 복수의 조각 이미지 전체 또는 일부를 기 설정된 크기로 축소하는 단계를 더 포함하는, 이미지 분할 방법.
청구항 9에 있어서,

(e) 상기 축소된 이미지를 이용하여 딥 러닝 기반의 이미지 분류기를 학습시키는 단계를 더 포함하는, 이미지 분할 방법.
하나 이상의 프로세서;

메모리; 및

하나 이상의 프로그램들을 포함하고,

상기 하나 이상의 프로그램들은 상기 메모리에 저장되고, 상기 하나 이상의 프로세서들에 의해 실행되도록 구성되며,

상기 하나 이상의 프로그램들은,

(a) 이미지를 입력받는 단계;

(b) 상기 입력된 이미지를 중첩적으로 분할하여 1 세대 조각 이미지 세트를 생성하는 단계;

(c) 상기 1 세대 조각 이미지 세트로부터 2 세대 이상의 조각 이미지 세트를 생성하되, 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 적어도 하나를 중첩적으로 분할하여 후속 세대 조각 이미지 세트를 생성하는 단계를 실행하기 위한 명령어들을 포함하는, 이미지 분할 장치.
청구항 11에 있어서,

j(이때, j는 j≥1인 정수) 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각은, 상기 j 세대 조각 이미지 세트에 포함된 다른 하나 이상의 조각 이미지와 중첩되는 영역을 포함하는, 이미지 분할 장치.
청구항 11에 있어서,

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 기 설정된 선택 조건을 만족하는 적어도 하나의 조각 이미지를 중첩적으로 분할하여 상기 후속 세대 조각 이미지 세트를 생성하는, 이미지 분할 장치.
청구항 13에 있어서,

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각에 대하여, 이미지 내 픽셀 유사도를 산출하는 단계; 및

상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 중 상기 픽셀 유사도가 기 설정된 기준 값 이하인 조각 이미지 각각을 중첩적으로 분할하여 상기 후속 세대 조각 이미지 세트를 생성하는 단계를 포함하는, 이미지 분할 장치.
청구항 14에 있어서,

상기 (c) 단계는, 상기 픽셀 유사도가 상기 기준 값 이하인 조각 이미지가 존재하지 않는 경우, 상기 후속 세대 조각 이미지 세트의 생성을 종료하는, 이미지 분할 장치.
청구항 11에 있어서,

상기 (c) 단계는, 기 설정된 분할 종료 조건이 만족된 경우, 상기 후속 세대 조각 이미지 세트의 생성을 종료하는, 이미지 분할 장치.
청구항 16에 있어서,

상기 (c) 단계는, 상기 이전 세대 조각 이미지 세트에 포함된 복수의 조각 이미지 각각의 크기 및 기 설정된 기준 값에 기초하여 상기 기 설정된 분할 종료 조건이 만족되었는지 여부를 판단하는, 이미지 분할 장치.
청구항 16에 있어서,

상기 (c) 단계는, 현재까지 생성된 조각 이미지 세트에 포함된 조각 이미지들의 총 개수 및 기 설정된 기준 값에 기초하여 상기 기 설정된 분할 종료 조건이 만족되었는지 여부를 판단하는, 이미지 분할 장치.
청구항 11에 있어서,

상기 하나 이상의 프로그램들은,

(d) 상기 입력된 이미지 및 상기 1 세대 내지 n(이때, n은 n≥2인 정수) 세대 조각 이미지 세트 각각에 포함된 복수의 조각 이미지 전체 또는 일부를 기 설정된 크기로 축소하는 단계를 실행하기 위한 명령어들을 더 포함하는, 이미지 분할 장치.
청구항 19에 있어서,

상기 하나 이상의 프로그램들은,

(e) 상기 축소된 이미지를 이용하여 딥 러닝 기반의 이미지 분류기를 학습시키는 단계를 실행하기 위한 명령어들을 더 포함하는, 이미지 분할 장치.