WO2024101625A1

WO2024101625A1 - 계층적 모델을 이용한 객체 식별 방법 및 장치

Info

Publication number: WO2024101625A1
Application number: PCT/KR2023/013394
Authority: WO
Inventors: 김대훈; 류제윤
Original assignee: 주식회사 누비랩
Priority date: 2022-11-09
Filing date: 2023-09-07
Publication date: 2024-05-16
Also published as: EP4394704A1; KR20240067618A

Abstract

본 발명은 계층적 모델을 이용한 객체 식별 방법 및 장치에 관한 것으로, 본 발명의 일 실시예에 따른 계층적 모델을 이용한 객체 식별 방법은, 객체 식별 장치가 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 단계; 및 객체 관리 서버가 객체 종류 추론 모델을 기반으로 상기 객체 식별 장치에서 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 단계를 포함한다.

Description

계층적 모델을 이용한 객체 식별 방법 및 장치

본 발명은 객체 식별 방법 및 장치에 관한 것이다.

최근 들어 건강에 대한 관심이 높아지고 있으나 반면에 과체중이나 비만으로 고통받는 사람들도 점차 증가하고 있다. 이러한 과체중이나 비만은 당뇨, 고혈압 등 각종 질환의 원인이 되는 심각한 문제이다.

따라서, 이와 같은 과체중이나 비만을 해결하기 위해서는 자신의 식습관을 분석하는 것이 선행되어야 한다. 일반적으로 본인의 호불호 객체에 대해 알고 있지만 실제로 섭취하는 객체의 종류와 횟수를 기억하지는 못한다. 따라서 자신의 식습관을 분석하기 위해 실제로 섭취하는 객체를 파악하고, 파악한 객체에 대한 정보에 따라 개인의 식습관을 분석할 필요가 있다.

하지만, 현재 공개된 대부분의 기술들은 카메라를 통해 촬영된 객체 이미지를 단순 이미지 검색하는데 그치고 있기 때문에 그 정확도가 현저하게 떨어진다. 또한, 이미지 검색에서 객체 종류 식별의 정확도가 떨어지다 보니 칼로리 계산 등과 같은 다음 단계들에서는 더 큰 오차가 발생한다는 문제점이 있다.

일례로, 실제로 섭취하는 객체를 파악하기 위해서 사용자가 모바일 단말이나 입력 장치를 이용하여 객체 정보를 입력하여야 한다. 여기서, 사용자는 모바일 단말에 실행된 객체 관련 애플리케이션이나 일반 촬영 모드를 실행하여 객체를 촬영한다. 이때, 사용자는 객체 관련 애플리케이션에서 촬영된 객체 이미지를 검색하고 다시 이에 대한 객체 정보를 입력하여야 하는 불편함이 있다. 또는 일반 촬영 모드로 촬영한 경우, 사용자는 앨범에서 촬영한 객체 이미지를 찾고, 찾은 객체 이미지를 객체 관련 애플리케이션에 올리고, 올린 객체 이미지를 다시 찾아서 객체 정보를 입력해야 하는 불편함이 있다. 따라서 객체 촬영과 객체 식별이 별도의 동작으로 이루어져서 불편하기 때문에, 사용자는 몇 개의 객체 이미지를 촬영한 후에는 객체 정보를 올리는 빈도가 급격히 낮아지게 된다.

만약, 사용자가 객체를 촬영만 하고 나중에 객체 정보를 입력하게 되는 경우가 발생할 수 있다. 객체 이미지를 촬영한 기간이 오래 경과된 경우, 사용자는 촬영 때 입력하고자 했던 객체 정보를 기억하지 못해 객체 정보를 기록하지 못하거나, 잘못된 객체 정보를 올려서 식습관 분석에서 오류가 발생할 수 있다. 또한, 사용자가 촬영된 객체 이미지에 대해 여러 가지의 객체 정보를 입력하길 원해도, 애플리케이션마다 설정된 몇 가지 고정된 객체 정보만 입력할 수밖에 없다. 이러한 경우, 객체 정보의 개수가 제한되어 사용자 식습관 분석이 정확히 이루어 지지 않을 수 있다. 이와 같이, 사용자의 불편이 가중됨으로써 객체 식별을 통해 일례로 개인의 식습관을 분석하는 서비스에 대한 만족도가 저하되고 있는 실정이다.

본 발명의 실시예들은 객체 식별 장치에서 객체 영역을 식별하고, 객체 관리 서버에서 객체 종류 정보를 식별함으로써, 객체 식별 속도를 증가시키기 위한, 계층적 모델을 이용한 객체 식별 방법 및 장치를 제공하고자 한다.

본 발명의 실시예들은 객체 영역 추출 모델과 객체 종류 추론 모델을 이용하여 객체의 카테고리를 단계적으로 분류하고 객체 종류 정보를 식별함으로써, 객체 이미지에서 위치한 객체를 신속하게 결정하기 위한, 계층적 모델을 이용한 객체 식별 방법 및 장치를 제공하고자 한다.

다만, 본 발명의 해결하고자 하는 과제는 이에 한정되는 것이 아니며, 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위의 환경에서도 다양하게 확장될 수 있을 것이다.

본 발명의 일 실시예에 따르면, 객체 식별 시스템에 의해 수행되는 객체 식별 방법에 있어서, 객체 식별 장치가 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 단계; 및 객체 관리 서버가 객체 종류 추론 모델을 기반으로 상기 객체 식별 장치에서 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 단계를 포함하는, 계층적 모델을 이용한 객체 식별 방법이 제공될 수 있다.

상기 검출된 객체 영역을 잘라내는 단계는, 상기 학습된 객체 영역 추출 모델을 기반으로 상기 객체 이미지에서 상기 객체를 둘러싸고 있는 박스(Box) 또는 상기 객체가 차지하고 있는 픽셀(Pixel)을 이용하여 객체 영역을 검출할 수 있다.

상기 검출된 객체 영역을 잘라내는 단계는, 상기 학습된 객체 영역 추출 모델의 제1 이미지 인코더를 통해 제1 특징점을 추출하고, 상기 추출된 제1 특징점으로부터 특징점 영역을 추출하여 객체 영역을 추론할 수 있다.

상기 방법은, 상기 객체 식별 장치가 상기 잘라낸 객체 영역에 위치한 객체 종류의 카테고리를 단계적으로 분류하는 단계를 더 포함하고, 상기 객체 종류 정보를 식별하는 단계는, 상기 객체 관리 서버가 상기 분류된 카테고리와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별할 수 있다.

상기 객체 종류의 카테고리를 단계적으로 분류하는 단계는, 상기 객체 식별 장치가 상기 잘라낸 객체 영역에 위치한 객체의 카테고리를 최상위 대분류부터 순차적으로 최하위 소분류까지 단계적으로 분류할 수 있다.

상기 객체 종류 정보를 식별하는 단계는, 상기 객체 관리 서버가 상기 분류된 카테고리인 최하위 소분류와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별할 수 있다.

상기 객체 종류 정보를 식별하는 단계는, 상기 객체 관리 서버가 상기 객체 종류 정보를 상기 분류된 최하위 소분류에 포함된 복수의 클래스 중에서 어느 하나의 클래스로 판별할 수 있다.

상기 객체 종류 정보를 식별하는 단계는, 상기 객체 관리 서버가 상기 분류된 카테고리와 대응되는 객체 종류 추론 모델의 제2 이미지 인코더를 통해 제2 특징점을 추출하고, 상기 추출된 제2 특징점을 특징점 디코더에 입력시켜 객체 종류 정보를 추론할 수 있다.

한편, 본 발명의 다른 실시예에 따르면, 객체 식별 장치에 의해 수행되는 객체 식별 방법에 있어서, 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 단계; 및 객체 종류 추론 모델을 기반으로 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 단계를 포함하는, 계층적 모델을 이용한 객체 식별 방법이 제공될 수 있다.

한편, 본 발명의 다른 실시예에 따르면, 객체 관리 서버에 의해 수행되는 객체 식별 방법에 있어서, 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 단계; 및 객체 종류 추론 모델을 기반으로 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 단계를 포함하는, 계층적 모델을 이용한 객체 식별 방법이 제공될 수 있다.

한편, 본 발명의 다른 실시예에 따르면, 객체 식별 시스템에 있어서, 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 객체 식별 장치; 및 객체 종류 추론 모델을 기반으로 상기 객체 식별 장치에서 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 객체 관리 서버를 포함하는, 계층적 모델을 이용한 객체 식별 시스템이 제공될 수 있다.

상기 객체 식별 장치는, 상기 학습된 객체 영역 추출 모델을 기반으로 상기 객체 이미지에서 상기 객체를 둘러싸고 있는 박스(Box) 또는 상기 객체가 차지하고 있는 픽셀(Pixel)을 이용하여 객체 영역을 검출할 수 있다.

상기 객체 식별 장치는, 상기 학습된 객체 영역 추출 모델의 제1 이미지 인코더를 통해 제1 특징점을 추출하고, 상기 추출된 제1 특징점으로부터 특징점 영역을 추출하여 객체 영역을 추론할 수 있다.

상기 객체 식별 장치는, 상기 객체 식별 장치가 상기 잘라낸 객체 영역에 위치한 객체 종류의 카테고리를 단계적으로 분류하고, 상기 객체 관리 서버는, 상기 분류된 카테고리와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별할 수 있다.

상기 객체 식별 장치는, 상기 잘라낸 객체 영역에 위치한 객체의 카테고리를 최상위 대분류부터 순차적으로 최하위 소분류까지 단계적으로 분류할 수 있다.

상기 객체 관리 서버는, 상기 분류된 카테고리인 최하위 소분류와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별할 수 있다.

상기 객체 관리 서버는, 상기 객체 종류 정보를 상기 분류된 최하위 소분류에 포함된 복수의 클래스 중에서 어느 하나의 클래스로 판별할 수 있다.

상기 객체 관리 서버는, 상기 분류된 카테고리와 대응되는 객체 종류 추론 모델의 제2 이미지 인코더를 통해 제2 특징점을 추출하고, 상기 추출된 제2 특징점을 특징점 디코더에 입력시켜 객체 종류 정보를 추론할 수 있다.

한편, 본 발명의 다른 실시예에 따르면, 객체 식별 장치에 있어서, 하나 이상의 프로그램을 저장하는 메모리; 및 상기 저장된 하나 이상의 프로그램을 실행하는 프로세서를 포함하고, 상기 프로세서는, 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내고, 객체 종류 추론 모델을 이용하여 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는, 계층적 모델을 이용한 객체 식별 장치가 제공될 수 있다.

한편, 본 발명의 다른 실시예에 따르면, 객체 관리 서버에 있어서, 하나 이상의 프로그램을 저장하는 메모리; 및 상기 저장된 하나 이상의 프로그램을 실행하는 프로세서를 포함하고, 상기 프로세서는, 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내고, 객체 종류 추론 모델을 이용하여 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는, 계층적 모델을 이용한 객체 관리 서버가 제공될 수 있다.

개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.

본 발명의 실시예들은 객체 식별 장치에서 객체 영역을 식별하고, 객체 관리 서버에서 객체 종류 정보를 식별함으로써, 객체 식별 속도를 증가시킬 수 있다.

본 발명의 실시예들은 객체 영역 추출 모델과 객체 종류 추론 모델을 이용하여 객체의 카테고리를 단계적으로 분류하고 객체 종류 정보를 식별함으로써, 객체 이미지에서 위치한 객체를 신속하게 결정할 수 있다.

본 발명의 실시예들은 분류 시점의 실시간성이나 객체 식별 장치의 자원 상태나 연산 부하 등을 고려하여 분류해야 하는 카테고리를 조정함으로써, 객체 식별 동작의 효율성을 증가시킬 수 있다.

본 발명의 실시예들은 객체 식별 장치 혼자서 수행하기 곤란한 객체 카테고리 분류 동작이나 객체 정보 결정 동작을 객체 관리 서버와 나누어 신속하게 수행함으로써, 객체 식별 시간이나 객체 식별 정확성을 향상시킬 수 있다.

도 1은 본 발명의 일 실시예에 따른 계층적 모델을 이용한 객체 식별 시스템의 구성을 나타낸 도면이다.

도 2는 본 발명의 일 실시예에 따른 계층적 모델을 이용한 객체 식별 방법을 나타낸 흐름도이다.

도 3은 본 발명의 일 실시예에 사용되는 객체 영역 추론 모델을 나타낸 도면이다.

도 4는 본 발명의 일 실시예에 사용되는 객체 종류 추론 모델을 나타낸 도면이다.

도 5는 본 발명의 일 실시예에 따른 계층적 모델을 이용한 객체 식별 방법을 나타낸 흐름도이다.

도 6 내지 도 9는 본 발명의 일 실시예에 따른 계층적 모델을 이용한 객체 식별 동작의 예시를 나타낸 도면이다.

도 10은 본 발명의 일 실시예에 따른 계층적 모델을 이용한 객체 식별 방법이 객체 관리 서버와 연동하는 동작을 나타낸 도면이다.

본 발명은 다양한 변환을 가할 수 있고 여러가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 구체적으로 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 기술적 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해될 수 있다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들이 용어들에 의해 한정되는 것은 아니다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 본 발명에서 사용한 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나 이는 당 분야에 종사하는 기술자의 의도, 판례, 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 발명에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, 본 발명의 실시예들을 첨부 도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.

먼저, 도 1을 참조하면, 본 발명에 따른 객체 식별 시스템(10)은 객체 식별 장치(100) 및 객체 식별 장치(100)와 통신하는 객체 관리 서버(200)를 포함할 수 있다.

객체 식별 장치(100)는 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 검출된 객체 영역을 잘라낼 수 있다. 그리고 객체 식별 장치(100)는 잘라낸 객체 영역을 객체 관리 서버(200)에 전송할 수 있다.

객체 관리 서버(200)는 객체 종류 추론 모델을 기반으로 객체 식별 장치(100)에서 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별할 수 있다.

이와 같이, 객체 종류 정보를 식별하는 동작은 객체 식별 장치(100)에서 수행하지 않고 객체 관리 서버(200)에서 수행될 수 있다. 여기서, 객체 관리 서버(200)는 클라우드 서버로 구현될 수 있다. 또는, 객체 영역을 검출하는 동작과 객체 종류 정보를 식별하는 동작은 객체 식별 장치(100)에서 모두 수행될 수 있다.

이는 객체 영역 검출 및 객체 종류 식별 동작의 속도를 높이기 위한 것이다. 예를 들어, 사용자가 객체 식별 장치(100)가 포함된 모바일 단말에서 객체(음식)를 사진을 촬영했을 때 촬영한 원본 이미지 파일이 4MB인데, 원본 이미지 파일 4MB을 클라우드에 있는 객체 관리 서버(200)에 전송하면 너무 용량이 크게 된다. 그러므로, 객체 식별 장치(100)는 원본 이미지에서 객체(음식) 영역만 잘라내서 예를 들어 200KB만 클라우드에 있는 객체 관리 서버(200)로 전송할 수 있다. 이와 같이, 모바일 단말에서는 객체 영역을 검출하는 동작만 수행하고, 클라우드에서 객체 종류 정보를 식별하는 동작을 수행할 수도 있다. 또는, 모바일 단말에서 객체 영역을 검출하는 동작과 객체 종류 정보를 식별하는 동작을 모두 수행할 수도 있다.

여기서, 객체 영역을 검출하는 동작과 객체 종류 정보를 식별하는 동작의 주체는 객체 관리 서버(200)로 전송할 데이터 용량, 객체 식별 장치(100)의 하드웨어 성능, 객체 관리 서버(200)와 객체 식별 장치(100) 간의 통신 속도, 객체 영역 추출 모델 또는 객체 종류 추론 모델의 크기 및 객체 종류 정보의 식별 정확도 중에서 적어도 하나를 기반으로 결정될 수 있다. 예를 들어, 기설정된 임계치 보다 데이터 용량이 낮고, 하드웨어 성능이 높고, 통신 속도가 낮고, 모델의 크기가 작고, 정확도가 높은 경우에서는 객체 식별 장치(100)가 객체 영역을 검출하는 동작과 객체 종류 정보를 식별하는 동작을 수행하는 것이 유리할 수 있다. 반대로, 기설정된 임계치 보다 데이터 용량이 높고, 하드웨어 성능이 낮고, 통신 속도가 높고, 모델의 크기가 크고, 정확도가 낮은 경우에서는 객체 식별 장치(100)가 객체 영역을 검출하는 동작을 수행하고, 객체 관리 서버(200)가 객체 종류 정보를 식별하는 동작을 수행하는 것이 유리할 수 있다. 이때, 객체 식별 장치(100)는 검출된 객체 영역을 잘라내는 동작 대신에 검출된 객체 영역을 변환하여 객체 관리 서버(200)에 전송할 수 있다. 예를 들면, 객체 식별 장치(100)는 검출된 객체 영역의 해상도를 낮게 썸네일로 변환해서 객체 관리 서버(200)에 빨리 보내거나, 객체 영역이 포함된 파일을 보낼 때 확장자나 파일 형식을 변환하여 객체 관리 서버(200)에 보낼 수 있다.

한편, 도 1에 도시된 바와 같이, 객체 식별 장치(100)는 통신 모듈(110), 카메라(120), 디스플레이(130), 메모리(140) 및 프로세서(150)를 포함할 수 있다. 객체 관리 서버(200)는 통신 모듈(210), 메모리(220) 및 프로세서(230)를 포함할 수 있다.

그러나 도시된 구성요소 모두가 필수 구성요소인 것은 아니다. 도시된 구성요소보다 많은 구성요소에 의해 객체 식별 시스템(10)이 구현될 수도 있고, 그보다 적은 구성요소에 의해서도 객체 식별 시스템(10)이 구현될 수 있다.

이하, 도 1의 객체 식별 시스템(10)의 각 구성요소들의 구체적인 구성 및 동작을 설명한다.

먼저, 객체 식별 장치(100)의 각 구성요소들의 구체적인 구성 및 동작을 설명한다.

통신 모듈(110)은 객체 식별 장치(100)와 무선 통신 장치들 사이, 또는 객체 식별 장치(100)와 객체 관리 서버(200) 사이의 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 또한, 통신 모듈(110)은 객체 식별 장치(100)를 하나 이상의 네트워크에 연결하는 하나 이상의 모듈을 포함 할 수 있다.

카메라(120)는 사용자의 조작에 따라 이미지 또는 동영상을 촬영할 수 있다. 카메라(120)는 단일 카메라, 복수의 카메라, 단일 이미지 센서, 또는 복수의 이미지 센서로 이루어질 수 있다. 카메라(120)는 적어도 하나의 2D 카메라, 적어도 하나의 3D 카메라, 적어도 하나의 스테레오 카메라, 적어도 하나의 이미지 센서 중에서 적어도 하나로 구성될 수 있다. 여기서, 카메라(120)는 사용자의 조작에 따라 식사 전후에 객체를 이미지 또는 동영상으로 촬영할 수 있다.

디스플레이(130)는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써, 터치 스크린을 구현할 수 있다. 이러한 터치 스크린은, 객체 식별 장치(100)와 사용자 사이의 입력 인터페이스를 제공함과 동시에, 객체 식별 장치(100)와 사용자 사이의 출력 인터페이스를 제공할 수 있다.

메모리(140)는 객체 식별 장치(100)의 다양한 기능을 지원하는 데이터를 저장할 수 있다. 메모리(140)는 객체 식별 장치(100)에서 구동되는 하나 이상의 프로그램, 다수의 응용 프로그램(application program) 또는 애플리케이션(application), 객체 식별 장치(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 객체 관리 서버(200)로부터 다운로드 될 수 있다. 또한, 이러한 응용 프로그램 중 적어도 일부는, 객체 식별 장치(100)의 기본적인 기능을 위하여 존재할 수 있다. 한편, 응용 프로그램은, 메모리(140)에 저장되고, 객체 식별 장치(100) 상에 설치되어, 프로세서(150)에 의하여 객체 식별 장치(100)의 동작(또는 기능)을 수행하도록 구동될 수 있다.

프로세서(150)는 상기 응용 프로그램과 관련된 동작 외에도, 통상적으로 객체 식별 장치(100)의 전반적인 동작을 제어할 수 있다. 프로세서(150)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(140)에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.

일 실시예에서, 프로세서(150)는 메모리(140)에 저장된 하나 이상의 프로그램을 실행함으로써, 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 검출된 객체 영역을 잘라내고, 객체 종류 추론 모델을 기반으로 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별한다.

실시예들에 따르면, 프로세서(150)는 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 상기 객체를 둘러싸고 있는 박스(Box) 또는 객체가 차지하고 있는 픽셀(Pixel)을 이용하여 객체 영역을 검출할 수 있다.

실시예들에 따르면, 프로세서(150)는 학습된 객체 영역 추출 모델의 제1 이미지 인코더를 통해 제1 특징점을 추출하고, 추출된 제1 특징점으로부터 특징점 영역을 추출하여 객체 영역을 추론할 수 있다.

실시예들에 따르면, 프로세서(150)는 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 검출된 객체 영역을 잘라내고 잘라낸 객체 영역에 위치한 객체 종류의 카테고리를 단계적으로 분류하고, 분류된 카테고리와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별할 수 있다.

실시예들에 따르면, 프로세서(150)는 잘라낸 객체 영역에 위치한 객체의 카테고리를 최상위 대분류부터 순차적으로 최하위 소분류까지 단계적으로 분류할 수 있다.

실시예들에 따르면, 프로세서(150)는 분류된 카테고리인 최하위 소분류와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별할 수 있다.

실시예들에 따르면, 프로세서(150)는 객체 종류 정보를 상기 분류된 최하위 소분류에 포함된 복수의 클래스 중에서 어느 하나의 클래스로 판별할 수 있다.

실시예들에 따르면, 프로세서(150)는 분류된 카테고리와 대응되는 객체 종류 추론 모델의 제2 이미지 인코더를 통해 제2 특징점을 추출하고, 추출된 제2 특징점을 특징점 디코더를 입력시켜 객체 종류 정보를 추론 할 수 있다.

실시예들에 따르면, 객체 식별 장치(100)는 객체 관리 서버(200)와 통신하는 통신 모듈(210)을 더 포함하고, 프로세서(150)는 통신 모듈(210)을 통해 잘라낸 객체 영역 및 분류된 객체 종류의 카테고리를 객체 관리 서버(200)로 전송하여 객체 종류 식별을 요청하고, 객체 관리 서버(200)로부터 분류된 카테고리와 대응되는 객체 종류 추론 모델을 이용하여 판별된 객체 종류 정보를 수신할 수 있다.

또한, 프로세서(150)는 메모리(140)에 저장된 응용 프로그램을 구동하기 위하여, 도 1과 함께 살펴본 구성요소들 중 적어도 일부를 제어할 수 있다. 나 아가, 프로세서(150)는 상기 응용 프로그램의 구동을 위하여, 객체 식별 장치(100)에 포함된 구성요소들 중 적어도 둘 이상을 서로 조합하여 동작시킬 수 있다. 여기서, 프로세서(150)에 대한 상세한 설명은 후술하기로 한다.

한편, 다음으로, 객체 관리 서버(200)의 각 구성요소들의 구체적인 구성 및 동작을 설명한다.

통신 모듈(210)은 객체 관리 서버(200)와 무선 통신 장치들 사이, 또는 객체 관리 서버(200)와 객체 식별 장치(100) 사이의 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 또한, 통신 모듈(210)은 객체 관리 서버(200)를 하나 이상의 네트워크에 연결하는 하나 이상의 모듈을 포함 할 수 있다.

메모리(220)는 객체 관리 서버(200)의 다양한 기능을 지원하는 데이터를 저장할 수 있다. 메모리(220)는 객체 관리 서버(200)에서 구동되는 하나 이상의 프로그램, 다수의 응용 프로그램(application program) 또는 애플리케이션(application), 객체 관리 서버(200)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 통신망을 통해 객체 관리 서버(200)로 다운로드될 수 있다. 또한, 이러한 응용 프로그램 중 적어도 일부는, 객체 관리 서버(200)의 기본적인 기능을 위하여 존재할 수 있다. 한편, 응용 프로그램은, 메모리(220)에 저장되고, 객체 관리 서버(200) 상에 설치되어, 프로세서(230)에 의하여 객체 관리 서버(200)의 동작(또는 기능)을 수행하도록 구동될 수 있다.

프로세서(230)는 상기 응용 프로그램과 관련된 동작 외에도, 통상적으로 객체 관리 서버(200)의 전반적인 동작을 제어할 수 있다. 프로세서(230)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(220)에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.

일 실시예에서, 프로세서(230)는 메모리(220)에 저장된 객체 식별 장치(100)와 연동하여 객체 이미지에서 객체 정보를 결정하는 동작과 관련된 하나 이상의 프로그램을 실행할 수 있다. 일례로, 프로세서(230)는 잘라낸 객체 영역에 위치한 객체의 카테고리 중에서 객체 식별 장치(100)에서 분류하지 않은 나머지 카테고리를 단계적으로 분류하고, 분류된 카테고리와 대응되는 객체 종류 추론 모델을 이용하여 객체 정류 정보를 결정할 수 있다.

이상, 도 1을 참조하여, 본 발명에 따른 객체 식별 시스템(10)의 구성에 대해 상세히 설명하였다. 객체 식별 시스템(10)은 도 1에 도시된 구성요소보다 더 적은 수의 구성요소나 더 많은 구성요소를 포함할 수도 있다.

이하, 도 2 내지 도 6을 참조하여, 본 발명의 다양한 실시예들에 따른 객체 식별 방법에 대해서 설명하도록 한다.

도 2에 도시된 바와 같이, 단계 S101에서, 본 발명의 일 실시예에 따른 계층적 모델을 이용한 객체 식별 장치(100)는 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 검출된 객체 영역을 잘라낸다. 이어서, 객체 식별 장치(100)는 검출된 객체 영역을 객체 관리 서버(200)에 전송한다.

단계 S102에서, 객체 관리 서버(200)는 객체 종류 추론 모델을 기반으로 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별한다.

이와 같이, 본 발명의 일 실시예에 따른 객체 식별 장치(100)는 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 객체 관리 서버(200)는 객체 종류 추론 모델이 포함된 계층적 모델을 이용하여 계층적으로 객체를 분류한다. 이러한 계층적 객체 분류의 이점을 설명하기로 한다. 즉, 인공지능(AI) 모델을 하나의 스테이지(one-stage)로 바로 객체의 세부 클래스를 파악하지 않고, 상위 카테고리를 찾을 수 있는 모델과 상위 모델이 찾은 객체를 잘라내어 객체의 클래스를 분류하는 모델을 이용하여 시스템을 구성했을 때 이점은 아래와 같다.

일례로, 음식의 경우 모델을 학습하기 위해 음식 이미지들을 수집하게 된다. 이때, 음식의 경우 쌀밥, 배추김치, 깍두기 등이 상대적으로 훨씬 많이 출현하고, 도라지 무침, 고사리 나물, 멸치볶음 등의 음식은 낮은 빈도로 출현하게 된다. 그러면, 쌀밥, 배추김치, 깍두기, 도라지 무침, 고사리 나물, 멸치볶음 등이 포함된 음식 이미지가 있을 때, 하나의 스테이지(one-stage) 모델을 만들기 위한 학습 데이터는 모든 음식을 라벨링 해주어야 한다

하지만, 본 발명의 실시예와 같이, 음식을 찾는 모델(A)과 찾은 음식을 잘라내어 어떤 음식인지 분류하는 모델(B) 두개를 조합한 인공지능 시스템을 만들 수 있다. 본 발명의 실시예는 음식 이미지에서 모든 음식을 다 찾는다면 모델(A)은 이 음식 이미지에 대해서는 더 학습하지 않아도 된다. 따라서, 본 발명의 실시예는 음식 분류를 위한 모델(B)이 필요한 데이터(예: 고사리 나물, 멸치볶음, 도라지 무침)만 라벨링을 해주고 잘라내어 학습을 진행해도 된다.

추가적인 이점으로는, 하나의 스테이지(one-stage) 모델의 경우에 한번도 보지 못한 음식의 경우에는 전혀 인식을 못하는 경우도 발생할 수 있다.

그러나 본 발명의 실시예에 따른 객체 식별 장치(100)는 여러 음식을 '음식' 이라는 하나의 클래스로 학습한 모델을 통해 동작하기 때문에, 음식이라는 전반적인(overall) 특징을 학습한 모델을 이용하여 새로운 음식을 보았을 때도 음식이라는 것을 예측할 수 있는 장점을 가질 수 있다.

더 나아가, 본 발명의 실시예는 음식 도메인뿐만 아니라 자율주행 도메인에도 적용될 수 있다. 자동차가 인지해야 할 이동수단 대상을 카테고리로 묶고(예컨대, 자동차, 자전거, 경운기 등), 이후 세부 카테고리를 분류한다면 자동차를 충분히 잘 잡는 모델이 있을 때는 자동차를 라벨링하는 비용을 줄이고 경운기를 라벨링 하는데 더 리소스를 많이 쓸 수 있다. 따라서 효율적인 라벨링 및 빠른 모델 개발이 될 수 있다. 또한, 본 발명의 실시예가 트랙터를 처음 보는 경우에도 '이동수단'이라는 것으로 인지할 가능성을 증가시킬 수 있다.

도 3에 도시된 바와 같이, 객체 식별 장치(100)는 객체 영역 추론 모델(300)을 기본으로 객체 이미지에서 객체가 위치한 객체 영역을 검출할 수 있다.

객체 식별 장치(100)에서 실행되는 객체 영역 추론 모델(300)은 입력된 객체 이미지를 제1 인코더(310)에 넣어 제1 인코딩 동작을 수행한다. 객체 영역 추론 모델(300)은 제1 인코딩 동작을 통해 객체 이미지에 대한 특징점을 추출한다. 여기서, 객체 영역 추론 모델(300)은 복수의 제1 인코더(310)와 복수의 특징점 추출 블록(320)이 차례대로 연결되어 있는 구조를 가질 수 있다.

그리고 객체 영역 추론 모델(300)은 추출된 복수의 특징점을 이용하여 특징점 영역을 추출하고(330), 추출된 특징점 영역을 이용하여 객체 이미지에서 객체 영역을 추론한다(340).

이후, 객체 영역 추론 모델(300)은 추론된 객체 영역을 잘라내어 잘라낸 객체 영역을 출력한다.

도 4에 도시된 바와 같이, 객체 식별 장치(100)는 분류된 카테고리와 대응되는 객체 종류 추론 모델(400)을 이용하여 객체 종류 정보를 식별할 수 있다.

객체 식별 장치(100)에서 실행되는 객체 종류 추론 모델(400)은 입력된 잘라낸 객체 영역 이미지를 제2 인코더(410)에 넣어 제2 인코딩 동작을 수행한다. 객체 종류 추론 모델(400)은 제2 인코딩 동작을 통해 잘라낸 객체 영역 이미지에 대한 특징점을 추출한다(420). 여기서, 객체 종류 추론 모델(400)은 객체 영역 추론 모델(300)과 다르게 하나의 제2 인코더(410)와 특징점 디코더(430)를 포함할 수 있다.

그리고 객체 종류 추론 모델(400)은 추출된 잘라낸 객체 영역에 대한 특징점을 특징점 디코더(430)에 입력시켜 특징점 디코딩 동적을 수행한다. 이어서, 객체 종류 추론 모델(400)은 특징점 디코딩 결과를 이용하여 잘라낸 객체 영역에 위치한 객체 종류를 추론한다(440).

이후, 객체 종류 추론 모델(400)은 추론된 객체 종류를 출력한다.

한편, 일반적인 인공지능(AI) 기법에서 객체를 분석하는 경우 객체 위치 판별(예컨대, 박스 또는 픽셀) 동작과, 객체 종류 판별 동작이 하나의 모델에서 동시에 일어나게 된다.

본 발명의 일 실시예에 따른 객체 식별 장치(100)는 객체 영역 추론 모델(300)을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 객체 종류 추론 모델(400)을 기반으로 객체 종류 정보를 식별할 수 있다. 즉, 객체 식별 장치(100)는 객체 이미지에서 객체를 찾는 객체 영역 추론 모델(300)과 객체 이미지에서 찾은 객체의 종류를 분석하는 객체 종류 추론 모델(400)을 포함한다.

여기서, 객체 식별 장치(100)는 잘라낸 객체 영역에 위치한 객체 종류의 카테고리를 분류하고 객체 종류를 분석할 수 있다. 또는, 객체 식별 장치(100)는 잘라낸 객체 영역에 위치한 객체 종류의 카테고리를 분류하지 않고 객체 종류를 분석할 수 있다.

이와 같이 객체 영역 추론 모델(300)과 객체 종류 추론 모델(400)을 분리하는 경우 아래와 같은 장점을 얻게 될 수 있다.

첫째, 객체 영역 추론 모델(300)과 객체 종류 추론 모델(400)이 분리되어 있기 때문에, 각 모델에서의 학습 데이터가 분리될 수 있다. 객체 모델을 하나의 모델로 사용하는 경우, 학습 데이터를 만들기 위해 객체 이미지를 수집한다. 그리고 객체 이미지 안에 있는 신규 객체와 이전에 알고 있는 객체가 있을 때 알고 있는 객체이더라도 라벨링해주어야 한다. 만약, 라벨링을 해주지 않는 경우 객체 모델이 그 객체에 대해 망각하게 될 수 있다. 반대로, 본 발명의 일 실시예와 같이 객체 모델을 분리하는 경우는 신규 객체만 라벨링해줄 수 있다. 객체 이미지에서 객체 영역이 위치한 해당 영역만 잘라내어 학습하기 때문에, 객체 식별 장치(100)는 알고 있는 객체에 대해 라벨링하지 않아도 된다.

둘째, 객체 영역 추론 모델(300)과 객체 종류 추론 모델(400)이 분리되어 있기 때문에, 객체 이미지에 나타날 수 있는 신규 객체에 대해 인식 성능이 상승될 수 있다. 객체 모델을 하나의 모델로 사용하는 경우는 자신이 알고 있는 객체만 찾기 때문에 신규 객체를 인지하지 못할 가능성 높다. 반대로, 본 발명의 일 실시예와 같이 객체 모델을 분리하는 경우는 여러 가지 객체들을 보고 객체 이미지에서 객체이라는 특징점을 학습한 객체 모델이다. 따라서, 객체 영역 추론 모델(300)은 객체 이미지에서 처음 보는 객체가 나타난 경우에도 객체 종류를 정확히 인식하지 못해도 객체이라는 것을 인지하고 감지할 수 있다.

도 5에 도시된 바와 같이, 단계 S301에서, 본 발명의 일 실시예에 따른 계층적 모델을 이용한 객체 식별 장치(100)는 객체 영역 추출 모델을 기반으로 객체 이미지에서 적어도 하나의 객체가 위치한 객체 영역을 검출한다.

단계 S302에서, 객체 식별 장치(100)는 검출 객체 영역을 잘라내고 잘라낸 객체 영역에 위치한 객체의 카테고리를 분류한다.

단계 S303에서, 객체 식별 장치(100)는 분류된 카테고리와 대응되는 객체 종류 추론 모델을 이용하여 객체를 결정한다.

객체 식별 장치(100)는 객체 이미지에서 어떤 객체가 있는지 구별하기 위해 도 6 내지 도 9에 도시된 동작을 통해 객체 정보를 결정할 수 있다.

도 6에 도시된 바와 같이, 객체 식별 장치(100)는 객체 이미지(510)를 수신할 수 있다. 이러한 객체 이미지(510)는 객체(511)가 포함된 원본 이미지일 수 있다. 객체 이미지(510)는 객체 식별 장치(100)에 구비된 카메라릍 통해 촬영된 객체 이미지 또는 현재 카메라를 통해 객체를 촬영하여 화면에 디스플레이되고 있는 객체 이미지일 수 있다. 객체 이미지(510)에는 적어도 하나의 객체(511)가 포함될 수 있다. 객체 이미지(510)에는 식기나 식판 등에 객체(511)가 담겨있을 수 있다.

도 7에 도시된 바와 같이, 객체 식별 장치(100)는 학습된 객체 영역 추출 모델(300)을 기반으로 객체 이미지(510)에서 객체(511)가 어느 영역에 있는지 확인할 수 있다. 객체 식별 장치(100)는 객체 이미지(510)에서 객체가 있는 객체 영역(512)과 객체 이외의 다른 것이 위치한 객체 이외의 영역을 검출할 수 있다.

일례로, 객체 식별 장치(100)는 학습된 객체 영역 추출 모델(300)을 기반으로 객체 이미지(510)에서 객체(511)를 둘러싸고 있는 박스(box)를 찾을 수 있다. 객체 식별 장치(100)는 객체를 둘러싸고 있는 박스를 이용하여 객체 영역(512)을 검출할 수 있다. 객체 식별 장치(100)는 객체(511)를 둘러싸고 있는 박스 이외의 나머지 영역을 객체 이외의 영역으로 검출할 수 있다. 또는, 객체 식별 장치(100)는 객체를 둘러싸고 있는 에지(Edge)를 검출하고 검출된 에지를 연결한 영역을 객체 영역으로 검출할 수 있다.

다른예로, 객체 식별 장치(100)는 학습된 객체 영역 추출 모델(300)을 기반으로 객체 이미지(510)에서 객체(511)가 차지하고 있는 픽셀(pixel)을 찾을 수 있다. 객체 식별 장치(100)는 객체가 차지하고 있는 픽셀을 이용하여 객체 영역(512)을 검출할 수 있다. 객체 식별 장치(100)는 객체가 차지하고 있는 픽셀 이외의 나머지 영역을 객체 이외의 영역으로 검출할 수 있다.

객체 이미지(510)에서 박스 또는 픽셀에 대한 객체 영역 검출 동작을 살펴보면 다음과 같다. 객체 식별 장치(100)는 우선 객체 이미지를 입력받는다. 그리고 객체 식별 장치(100)는 객체 이미지에서 컨볼루션 신경망(convolution neural network)을 통해 객체 이미지에 대한 특징맵을 추출할 수 있다. 이어서, 객체 식별 장치(100)는 추출된 특징맵에서 객체 특징이 있는 객체 영역을 추출할 수 있다.

도 8에 도시된 바와 같이, 객체 식별 장치(100)는 도 6에서 검출된 객체 영역을 잘라내고 잘라낸 객체 영역(513)에 위치한 객체(511)의 카테고리를 분류할 수 있다. 여기서, 객체 식별 장치(100)는 도 6에서 검출된 객체 영역(512)이 포함된 박스(box)를 크롭(crop)하여 객체 영역(512)을 잘라낼 수 있다.

이때, 객체 식별 장치(100)는 잘라낸 객체 영역(513)에 포함된 객체(511)에 대해 객체의 카테고리를 최상위 카테고리부터 단계적으로 하향하여 분류할 수 있다. 일례로, 객체 식별 장치(100)는 최상위 카테고리에 해당하는 복수의 대분류 중에서 특정 대분류로 객체의 카테고리를 분류할 수 있다. 예를 들어, 객체 식별 장치(100)는 잘라낸 객체 영역에 포함된 객체가 한식인 경우 한식의 포괄적인 범위에 해당하는 카테고리로 분류할 수 있다. 객체 식별 장치(100)는 밥, 국, 덮밥, 면, 김치류, 디저트류 등의 포괄적인 범위 중에서 해당 객체의 카테고리를 찾을 수 있다. 도 8에서, 객체 식별 장치(100)는 각각의 크롭된 객체 영역에 포함된 객체가 밥 종류로 판별되어 밥의 카테고리로 분류를 진행할 수 있다. 해당 객체가 포함된 최상위 카테고리가 한식, 일식, 중식, 양식인 경우 최상위 카테고리 중에서 해당 객체 카테고리를 찾을 수 있다.

객체 카테고리는 특정 카테고리로 한정되지 않으며, 객체 식별 장치(100)는 객체를 최우선으로 포괄할 수 있는 최상위 카테고리부터 순차적으로 하향하여 분류할 수 있다. 여기서, 객체 식별 장치(100)는 객체의 최상위 카테고리가 대분류, 차상위 카테고리가 중분류, 최하위 카테고리가 소분류인 경우, 객체 식별 장치(100)는 객체 영역에 대한 대분류를 1차적으로 분류하고, 분류된 대분류 중에서 객체 영역에 대한 중분류를 2차적으로 분류하고, 분류된 중분류 중에서 객체 영역에 대한 소분류를 3차적으로 분류할 수 있다.

도 9에 도시된 바와 같이, 객체 식별 장치(100)는 객체 이미지(510)에서 객체 영역(512)에 포함된 객체 전체에 대해 우선적으로 객체(511)의 카테고리를 분류하고, 분류된 카테고리와 대응되는 객체 종류 추론 모델(400)을 이용하여 객체 정보(514)를 최종적으로 결정할 수 있다. 객체 식별 장치(100)는 객체 영역(512)의 카테고리를 밥 종류로 분류한 경우, 밥 종류에 대응되는 밥 객체 추론 모델을 이용하여 객체 정보(514)를 기장밥으로 결정할 수 있다. 예를 들면, 객체 식별 장치(100)는 밥 종류에 대응되는 밥 객체 추론 모델 즉, 밥 종류 중에서 하위 분류에 속하는 쌀밥, 흑미밥, 또는 검정콩밥인지 등을 구별해줄 수 있는 객체 모델을 이용하여 특정 밥을 결정할 수 있다. 도 8에서는 객체 식별 장치(100)는 밥 종류에 대응되는 밥 객체 추론 모델을 이용하여 객체 영역에 포함된 객체를 최종적으로 기장밥으로 결정할 수 있다.

이후, 객체 식별 장치(100)는 객체 이미지(510)에서 검출된 객체 영역에 포함된 각각의 객체에 대해 동일한 객체 식별 방법으로 객체 정보의 결정 동작을 진행을 하여 객체 이미지 내 어떤 객체가 있는지를 정확하게 판별할 수 있다. 예를 들면, 객체 식별 장치(100)는 객체 식판에 포함된 각각의 객체에 대해 기장밥, 시금치 된장국, 쇠고기 메추라기 장조림, 김치전, 깍두기, 귤 등으로 객체 정보를 최종적으로 결정할 수 있다. 이때, 객체 식별 장치(100)는 객체 카테고리를 최하위 카테고리까지 결정하고, 결정된 객체의 카테고리 중에서 객체 종류 추론 모델(400)의 종류 예컨대, 밥 객체 추론 모델, 국 객체 추론 모델, 반찬 객체 추론 모델 등을 각각 이용하여 최하위 객체 카테고리에 해당하는 객체 정보를 결정할 수 있다.

객체 이미지에서 잘라낸 객체 영역에 포함된 객체가 최상위 카테고리부터 최하위 카테고리까지 대분류, 중분류, 소분류로 구분되어 있는 경우에 객체 식별 장치(100)와 객체 관리 서버(200)와의 연동 동작을 통해 객체를 식별하는 동작이 도 7에 도시되어 있다. 여기서, 객체 카테고리는 계층적으로 특정 개수의 계층으로 한정되지 않는다. 예컨대, 객체 카테고리는 2개의 계층 즉, 대분류, 중분류로만 분류될 수 있거나, 3개의 계층 즉, 대분류, 중분류, 소분류로 분류될 수 있다. 객체 카테고리는 자연수 n개의 계층이 포함된 카테고리로 분류될 수 있어 특정 계층으로 한정되지 않는다.

이때, 객체 식별 장치(100)는 전체 카테고리 분류 동작 중에서 미리 분류해야 하는 카테고리 계층이 미리 설정될 수 있다. 또는, 객체 식별 장치(100)는 분류 시점의 실시간성이나 장치 자원 상태나 연산 부하 등을 고려하여 분류해야 하는 카테고리가 조정될 수 있다. 이와 대응하여, 객체 관리 서버(200)는 객체 식별 장치(100)에 비해 분류 성능이 높고 가용 가능한 자원이 많기 때문에, 객체 식별 장치(100)에서 시간적 또는 정확성 측면에서 효율이 낮은 동작을 수행하여 객체 식별 장치(100)에 해당 결과를 전송할 수 있다.

예컨대, 객체 이미지에서 객체 영역을 잘라내고, 잘라낸 객체 영역에 대한 대분류, 중분류, 소분류에 대한 분류 동작은 시간 또는 부하가 적게 걸리는 반면, 특정 객체 정보를 결정하는 동작은 연산량이 많이 필요하고 정확성이 낮아질 때, 객체 관리 서버(200)가 이러한 동작을 객체 식별 장치(100) 대신하여 수행할 수 있다. 이를 통해, 객체 관리 서버(200)는 객체 식별 장치(100) 혼자서 수행하기 곤란한 동작을 수행하여 식별 시간이나 식별 정확성을 향상시킬 수 있다.

도 10에 도시된 바와 같이, 단계 S301에서, 객체 식별 장치(100)는 객체 영역 추출 모델을 기반으로 객체 이미지에서 적어도 하나의 객체가 위치한 객체 영역을 검출한다.

단계 S302에서, 객체 식별 장치(100)는 검출 객체 영역을 잘라내고 잘라낸 객체 영역에 위치한 객체의 카테고리를 특정 대분류로 1차로 분류한다.

단계 S303에서, 객체 식별 장치(100)는 특정 대분류 정보를 이용하여 객체 영역 이미지의 객체 카테고리를 특정 중분류로 2차로 분류한다.

단계 S304에서, 객체 식별 장치(100)는 특정 중분류 정보를 이용하여 객체 영역 이미지의 객체 카테고리를 특정 소분류로 3차로 분류한다.

단계 S305에서, 객체 식별 장치(100)는 잘라낸 객체 영역 이미지 및 분류된 대분류, 중분류, 소분류 정보를 전송한다.

단계 S306에서, 객체 관리 서버(200)는 특정 소분류 정보와 대응되는 객체 종류 추론 모델을 이용하여 객체 영역 이미지의 객체 종류 정보를 결정한다.

단계 S307에서, 객체 관리 서버(200)는 결정된 객체 정보를 객체 식별 장치(100)에 전송한다.

단계 S308에서, 객체 식별 장치(100)는 수신된 객체 종류 정보를 이용하여 객체 이미지에 포함된 각 객체에 대해 객체 종류 정보를 확인한다.

이와 같이, 도 10의 객체 식별 동작 예시는 카테고리 분류 동작은 객체 식별 장치(100)가 수행하고, 객체 정보 결정 동작은 객체 관리 서버(200)가 수행하는 예시이다. 여기서, 각 단계를 수행하는 주체가 고정적이지 않을 수 있다. 예컨대, 객체 이미지에 포함된 객체의 개수, 객체 이미지의 크기나 용량, 객체 이미지에 포함된 객체 정보를 필요한 시간, 객체 식별 장치(100)와 객체 관리 서버(200) 간의 통신 상태, 객체 식별 장치(100)에 저장된 객체 모델의 상태 등에 따라 단계별 카테고리 분류 동작과 객체 정보 식별 동작의 주체가 달라질 수 있다.

한편, 프로세서에 의해 실행될 때, 상기 프로세서로 하여금 방법을 실행하게 하는 명령어들을 저장하기 위한 비일시적 컴퓨터 판독가능 저장 매체로서, 객체 식별 장치가 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 단계; 및 객체 관리 서버가 객체 종류 추론 모델을 기반으로 상기 객체 식별 장치에서 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 단계를 포함하는, 비일시적 컴퓨터 판독 가능한 저장 매체가 제공될 수 있다.

한편, 본 발명의 일 실시예에 따르면, 이상에서 설명된 다양한 실시예들은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media)에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 기기는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시예들에 따른 전자 장치(예: 전자 장치(A))를 포함할 수 있다. 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접, 또는 프로세서의 제어 하에 다른 구성요소들을 이용하여 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.

또한, 본 발명의 일 실시예에 따르면, 이상에서 설명된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 온라인으로 배포될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

또한, 본 발명의 일 실시예에 따르면, 이상에서 설명된 다양한 실시예들은 소프트웨어(software), 하드웨어(hardware) 또는 이들의 조합을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 일부 경우에 있어 본 명세서에서 설명되는 실시예들이 프로세서 자체로 구현될 수 있다. 소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 동작을 수행할 수 있다.

한편, 상술한 다양한 실시예들에 따른 기기의 프로세싱 동작을 수행하기 위한 컴퓨터 명령어(computer instructions)는 비일시적 컴퓨터 판독 가능 매체(non-transitory computer-readable medium)에 저장될 수 있다. 이러한 비일시적 컴퓨터 판독 가능 매체에 저장된 컴퓨터 명령어는 특정 기기의 프로세서에 의해 실행되었을 때 상술한 다양한 실시예에 따른 기기에서의 처리 동작을 특정 기기가 수행하도록 한다. 비일시적 컴퓨터 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 비일시적 컴퓨터 판독 가능 매체의 구체적인 예로는, CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등이 있을 수 있다.

또한, 상술한 다양한 실시예들에 따른 구성 요소(예: 모듈 또는 프로그램) 각각은 단수 또는 복수의 개체로 구성될 수 있으며, 전술한 해당 서브 구성 요소들 중 일부 서브 구성 요소가 생략되거나, 또는 다른 서브 구성 요소가 다양한 실시예에 더 포함될 수 있다. 대체적으로 또는 추가적으로, 일부 구성 요소들(예: 모듈 또는 프로그램)은 하나의 개체로 통합되어, 통합되기 이전의 각각의 해당 구성 요소에 의해 수행되는 기능을 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따른, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.

이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 개시에 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

[부호의 설명]

10: 객체 식별 시스템

100: 객체 식별 장치

110: 통신 모듈

120: 카메라

130: 디스플레이

140: 메모리

150: 프로세서

200: 객체 관리 서버

210: 통신 모듈

220: 메모리

230: 프로세서

Claims

객체 식별 시스템에 의해 수행되는 객체 식별 방법에 있어서,

객체 식별 장치가 학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 단계; 및

객체 관리 서버가 객체 종류 추론 모델을 기반으로 상기 객체 식별 장치에서 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 단계를 포함하는, 계층적 모델을 이용한 객체 식별 방법.
제1항에 있어서,

상기 검출된 객체 영역을 잘라내는 단계는,

상기 학습된 객체 영역 추출 모델을 기반으로 상기 객체 이미지에서 상기 객체를 둘러싸고 있는 박스(Box) 또는 상기 객체가 차지하고 있는 픽셀(Pixel)을 이용하여 객체 영역을 검출하는, 계층적 모델을 이용한 객체 식별 방법.
제1항에 있어서,

상기 검출된 객체 영역을 잘라내는 단계는,

상기 학습된 객체 영역 추출 모델의 제1 이미지 인코더를 통해 제1 특징점을 추출하고, 상기 추출된 제1 특징점으로부터 특징점 영역을 추출하여 객체 영역을 추론하는, 계층적 모델을 이용한 객체 식별 방법.
제1항에 있어서,

상기 객체 식별 장치가 상기 잘라낸 객체 영역에 위치한 객체 종류의 카테고리를 단계적으로 분류하는 단계를 더 포함하고,

상기 객체 종류 정보를 식별하는 단계는, 상기 객체 관리 서버가 상기 분류된 카테고리와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별하는, 계층적 모델을 이용한 객체 식별 방법.
제4항에 있어서,

상기 객체 종류의 카테고리를 단계적으로 분류하는 단계는,

상기 객체 식별 장치가 상기 잘라낸 객체 영역에 위치한 객체의 카테고리를 최상위 대분류부터 순차적으로 최하위 소분류까지 단계적으로 분류하는, 계층적 모델을 이용한 객체 식별 방법.
제5항에 있어서,

상기 객체 종류 정보를 식별하는 단계는,

상기 객체 관리 서버가 상기 분류된 카테고리인 최하위 소분류와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별하는, 계층적 모델을 이용한 객체 식별 방법.
제5항에 있어서,

상기 객체 종류 정보를 식별하는 단계는,

상기 객체 관리 서버가 상기 객체 종류 정보를 상기 분류된 최하위 소분류에 포함된 복수의 클래스 중에서 어느 하나의 클래스로 판별하는, 계층적 모델을 이용한 객체 식별 방법.
제4항에 있어서,

상기 객체 종류 정보를 식별하는 단계는,

상기 객체 관리 서버가 상기 분류된 카테고리와 대응되는 객체 종류 추론 모델의 제2 이미지 인코더를 통해 제2 특징점을 추출하고, 상기 추출된 제2 특징점을 특징점 디코더에 입력시켜 객체 종류 정보를 추론하는, 계층적 모델을 이용한 객체 식별 방법.
객체 식별 장치에 의해 수행되는 객체 식별 방법에 있어서,

학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 단계; 및

객체 종류 추론 모델을 기반으로 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 단계를 포함하는, 계층적 모델을 이용한 객체 식별 방법.
객체 관리 서버에 의해 수행되는 객체 식별 방법에 있어서,

학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 단계; 및

객체 종류 추론 모델을 기반으로 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 단계를 포함하는, 계층적 모델을 이용한 객체 식별 방법.
객체 식별 시스템에 있어서,

학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내는 객체 식별 장치; 및

객체 종류 추론 모델을 기반으로 상기 객체 식별 장치에서 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는 객체 관리 서버를 포함하는, 계층적 모델을 이용한 객체 식별 시스템.
제11에 있어서,

상기 객체 식별 장치는,

상기 학습된 객체 영역 추출 모델을 기반으로 상기 객체 이미지에서 상기 객체를 둘러싸고 있는 박스(Box) 또는 상기 객체가 차지하고 있는 픽셀(Pixel)을 이용하여 객체 영역을 검출하는, 계층적 모델을 이용한 객체 식별 시스템.
제11에 있어서,

상기 객체 식별 장치는,

상기 학습된 객체 영역 추출 모델의 제1 이미지 인코더를 통해 제1 특징점을 추출하고, 상기 추출된 제1 특징점으로부터 특징점 영역을 추출하여 객체 영역을 추론하는, 계층적 모델을 이용한 객체 식별 시스템.
제11에 있어서,

상기 객체 식별 장치는, 상기 객체 식별 장치가 상기 잘라낸 객체 영역에 위치한 객체 종류의 카테고리를 단계적으로 분류하고,

상기 객체 관리 서버는, 상기 분류된 카테고리와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별하는, 계층적 모델을 이용한 객체 식별 시스템.
제14항에 있어서,

상기 객체 식별 장치는,

상기 잘라낸 객체 영역에 위치한 객체의 카테고리를 최상위 대분류부터 순차적으로 최하위 소분류까지 단계적으로 분류하는, 계층적 모델을 이용한 객체 식별 시스템.
제15항에 있어서,

상기 객체 관리 서버는,

상기 분류된 카테고리인 최하위 소분류와 대응되는 객체 종류 추론 모델을 이용하여 객체 종류 정보를 식별하는, 계층적 모델을 이용한 객체 식별 시스템.
제15항에 있어서,

상기 객체 관리 서버는,

상기 객체 종류 정보를 상기 분류된 최하위 소분류에 포함된 복수의 클래스 중에서 어느 하나의 클래스로 판별하는, 계층적 모델을 이용한 객체 식별 시스템.
제14항에 있어서,

상기 객체 관리 서버는,

상기 분류된 카테고리와 대응되는 객체 종류 추론 모델의 제2 이미지 인코더를 통해 제2 특징점을 추출하고, 상기 추출된 제2 특징점을 특징점 디코더에 입력시켜 객체 종류 정보를 추론하는, 계층적 모델을 이용한 객체 식별 시스템.
객체 식별 장치에 있어서,

하나 이상의 프로그램을 저장하는 메모리; 및

상기 저장된 하나 이상의 프로그램을 실행하는 프로세서를 포함하고,

상기 프로세서는,

학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내고,

객체 종류 추론 모델을 이용하여 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는, 계층적 모델을 이용한 객체 식별 장치.
객체 관리 서버에 있어서,

하나 이상의 프로그램을 저장하는 메모리; 및

상기 저장된 하나 이상의 프로그램을 실행하는 프로세서를 포함하고,

상기 프로세서는,

학습된 객체 영역 추출 모델을 기반으로 객체 이미지에서 객체가 위치한 객체 영역을 검출하고, 상기 검출된 객체 영역을 잘라내고,

객체 종류 추론 모델을 이용하여 상기 잘라낸 객체 영역에 위치한 객체 종류 정보를 식별하는, 계층적 모델을 이용한 객체 관리 서버.