WO2024136248A1

WO2024136248A1 - 딥러닝 기반의 성별 인식 장치 및 성별 인식 방법

Info

Publication number: WO2024136248A1
Application number: PCT/KR2023/020261
Authority: WO
Inventors: 박운상; 김찬민; 이도훈; 허승회; 김정현
Original assignee: 서강대학교 산학협력단
Priority date: 2022-12-23
Filing date: 2023-12-08
Publication date: 2024-06-27

Abstract

본 발명은 딥러닝 모델을 이용한 성별 인식 장치 및 방법에 관한 것이다. 상기 성별 인식 장치는, 입력 영상에 대하여, 객체 검출 모델을 이용하여 사람 영역을 검출하는 객체 검출부; 상기 사람 영역으로부터 머리-어깨 영역 이미지를 추출하는 관심 영역 추출부; 및 입력 영상의 머리-어깨 영역 이미지를 사전 학습된 딥러닝 모델에 적용하여, 입력 영상의 사람 객체에 대한 성별 정보를 추출하여 제공하는 성별 인식부;를 구비한다. 상기 관심 영역 추출부는, 객체 검출 모델을 이용하여 사람 영역을 검출하고, 포즈 검출 모델을 이용하여 사람 영역에 대한 스켈레톤 정보를 추출하고, 상기 스켈레톤 정보로부터 머리-어깨 영역을 획득하기 위한 기준 좌표값들을 추출하고, 기준 좌표값들을 이용하여, 사람 영역으로부터 머리-어깨 영역을 특정하고, 상기 특정된 머리-어깨 영역에 대한 이미지를 추출한다. 상기 기준 좌표값은 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값이다.

Description

딥러닝 기반의 성별 인식 장치 및 성별 인식 방법

본 발명을 지원한 국가연구개발사업의 과제고유번호는 2022-0-00377로서, 과학기술정보통신부의 정보통신기획평가원에 의해 후원되었으며, 연구사업명은 "디지털역기능대응기술개발"이며, 연구과제명은 "무분별적 유해성 미디어 배포 문제 해결을 위한 지능적 분석/분류 기반 콘텐츠 등급분류 기술 개발"이며, 주관기관은 서강대학교 산학협력단이다.

본 발명은 기계 학습 기반의 성별 인식 장치 및 성별 인식 방법에 관한 것으로서, 더욱 구체적으로는 CCTV 등의 촬영 영상으로부터 사람 객체를 추출하고, 추출된 객체의 스켈레톤 정보를 이용하여 머리와 어깨 영역을 추출하고, 이를 이용하여 사전 학습된 딥러닝 모델을 통해 CCTV 영상 내의 사람에 대한 성별을 인식하는 장치 및 그 방법에 관한 것이다.

이미지에서 사람의 대표적인 특징인 성별을 인식하는 기술은 컴퓨터 비전 분야의 주요 과제로서, 현재도 연구가 활발하게 진행되고 있으며 많은 산업분야에서 요구되는 기술이다. 현재까지의 주된 연구방향은 객체 검출을 통해 얼굴 영역을 검출하고 딥러닝 모델을 통해 성별을 분류하는 방식이다.

CCTV의 경우, 사람을 촬영하지만 항상 얼굴이 보인다는 보장이 없다. 또한, 촬영 객체가 CCTV로부터 먼 위치에 존재하는 경우에는 작은 얼굴만이 캡쳐되므로, 이런 경우 성별을 분류하는 데에는 어려움이 있다. 따라서, 얼굴을 넘어서 보다 넓은 영역을 특정하고, 뒷모습에서도 성별을 분류할 수 있도록 하는 접근 방법이 필요하다.

도 1은 CCTV 영상들 중 성별 인식이 어려운 영상들을 예시적으로 나타낸 것들이다. 도 1에 도시된 바와 같이, CCTV의 영상들은 사람의 다양한 모습들을 포함하게 되며, 그 예로서 얼굴 영역이 분명하게 나타나는 앞 모습, 얼굴이 보이지 않는 뒷모습이나 옆모습 등을 포함한다. 이런 경우, CCTV 영상내의 사람에 대한 성별을 정확하게 인식해 내기가 어렵다. 또한, 원거리 영상에서는 얼굴이 작게 나타나기 때문에, 이 경우에도 사람에 대한 성별을 정확하게 인식하기가 어렵다.

또한, CCTV 영상에서 사람들이 걸어가는 등의 움직임이 있는 경우 모션블러 현상등이 발생함으로써, 사람의 성별을 정확하게 인식하기가 어렵다.

전술한 문제점을 해결하기 위하여 본 발명은 딥러닝 모델을 이용하여, 영상의 사람 객체로부터 사람의 머리-어깨 영역을 추출하여 성별을 인식할 수 있도록 구성된 성별 인식 장치 및 그 방법을 제공하는 것을 목적으로 한다.

전술한 기술적 과제를 달성하기 위한 본 발명의 제1 특징에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템은, 기계 학습을 수행하는 컴퓨팅 장치에 의해 구현된 성별 인식을 위한 딥러닝 모델 학습 시스템에 관한 것으로서, 객체 검출 모델을 이용하여, 학습 데이터의 원본 이미지들로부터 사람 영역들을 검출하는 객체 검출부; 상기 사람 영역들로부터 관심 영역을 특정하고, 상기 특정된 관심 영역에 대한 이미지들을 추출하는 관심 영역 추출부; 상기 학습 데이터의 원본 이미지들로부터 추출된 사람 객체들에 대한 관심 영역 이미지들과 각 관심 영역 이미지들에 대응하여 라벨링된 성별 정보를 이용하여, 성별 인식을 위한 딥러닝 모델을 학습시키는 딥러닝 모델 학습부; 를 구비하고, 상기 관심 영역은 머리-어깨 영역인 것을 특징으로 한다.

전술한 제1 특징에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, 상기 관심 영역 추출부는, 포즈 검출 모델을 이용하여, 상기 객체 검출부에 의해 검출된 사람 영역에 대하여, 사전 설정된 사람의 관절 위치들을 나타내는 스켈레톤 정보를 추출하여 제공하는 스켈레톤 정보 추출부; 상기 스켈레톤 정보로부터 관심 영역을 획득하기 위한 기준 좌표값들을 추출하는 기준 좌표값 추출부; 및 기준 좌표값들을 이용하여, 사람 영역으로부터 관심 영역을 특정하고, 상기 특정된 관심 영역에 대한 이미지를 추출하는 관심 영역 특정부;를 구비하여, 관심 영역 이미지를 추출하여 제공하는 것이 바람직하다.

전술한 제1 특징에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, 상기 관심 영역 특정부는, 상기 기준 좌표값들을 이용하여, 관심 영역에 대한 중심 좌표값, 높이 및 폭을 설정하고, 상기 중심 좌표값, 높이 및 폭을 이용하여 관심 영역에 대한 시작 좌표(X1,Y1)와 끝 좌표(X2,Y2)을 획득하여 관심 영역을 특정하고, 관심 영역 이미지를 추출하는 것이 바람직하다.

전술한 제1 특징에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, 상기 기준 좌표값은 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값인 것을 특징으로 하며, 상기 관심 영역 이미지는 상기 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값을 이용하여 특정된 머리-어깨 영역에 대한 이미지인 것이 바람직하다.

본 발명의 제2 특징에 따른 딥러닝 모델을 기반으로 한 성별 인식 장치는, 컴퓨팅 장치에 의해 구현되고 사전 학습된 딥러닝 모델을 기반으로 한 성별 인식 장치에 관한 것으로서, 소정의 영상이 입력되는 영상 입력부; 상기 입력 영상에 대하여, 객체 검출 모델을 이용하여 사람 영역을 검출하는 객체 검출부; 상기 검출된 사람 영역으로부터 머리-어깨 영역 이미지를 추출하는 관심 영역 추출부; 및 사전 학습된 성별 인식을 위한 딥러닝 모델을 구비하고, 상기 입력 영상의 머리-어깨 영역 이미지를 상기 딥러닝 모델에 적용하여, 입력 영상의 사람 객체에 대한 성별 정보를 추출하여 제공하는 성별 인식부;를 구비한다.

전술한 제2 특징에 따른 딥러닝 모델을 기반으로 한 성별 인식 장치에 있어서, 상기 관심 영역 추출부는, 포즈 검출 모델을 이용하여, 상기 객체 검출부에 의해 검출된 사람 영역에 대하여, 사전 설정된 사람의 관절 위치들을 나타내는 스켈레톤 정보를 추출하여 제공하는 스켈레톤 정보 추출부; 상기 스켈레톤 정보로부터 머리-어깨 영역을 획득하기 위한 기준 좌표값들을 추출하는 기준 좌표값 추출부; 및 기준 좌표값들을 이용하여, 사람 영역으로부터 머리-어깨 영역을 특정하고, 상기 특정된 머리-어깨 영역에 대한 이미지를 추출하는 관심 영역 특정부;를 구비하여, 머리-어깨 영역 이미지를 추출하여 제공하는 것이 바람직하다.

전술한 제2 특징에 따른 딥러닝 모델을 기반으로 한 성별 인식 장치에 있어서, 상기 기준 좌표값은 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값인 것이 바람직하다.

본 발명의 제3 특징에 따른 성별 인식을 위한 딥러닝 모델을 기반으로 한 성별 인식 방법은, 기계 학습을 수행하는 컴퓨팅 장치에 의해 실행되는 프로그램에 의해 구현된 딥러닝 모델을 기반으로 한 성별 인식 방법에 관한 것으로서, (a) 성별 인식을 위한 딥러닝 모델을 사전 학습시키는 단계; 및 (b) 상기 사전 학습된 성별 인식을 위한 딥러닝 모델을 이용하여, 입력 영상 내의 사람에 대한 성별을 인식하여 제공하는 단계;를 구비한다.

전술한 제3 특징에 따른 딥러닝 모델을 기반으로 한 성별 인식 방법에 있어서, 상기 (a) 단계는, (a1) 객체 검출 모델을 이용하여, 학습 데이터의 원본 이미지들로부터 사람 영역들을 검출하는 단계; (a2) 상기 사람 영역들로부터 머리-어깨 영역들을 특정하고, 머리-어깨 영역 이미지들을 추출하는 단계; (a3) 상기 학습 데이터의 원보 이미지들로부터 추출된 사람 객체들에 대한 머리-어깨 영역 이미지들과 각 머리-어깨 영역 이미지들에 대응하여 라벨링된 성별 정보를 이용하여, 성별 인식을 위한 딥러닝 모델을 학습시키는 단계;를 구비하는 것이 바람직하다.

전술한 제3 특징에 따른 딥러닝 모델을 기반으로 한 성별 인식 방법에 있어서, (a2) 단계는, 상기 검출된 사람 영역에 대하여, 포즈 검출 모델을 이용하여 사람 영역의 사람의 관절 위치를 나타내는 스켈레톤 정보를 추출하여 제공하는 단계; 상기 스켈레톤 정보로부터 기준 좌표값들을 추출하여 제공하는 단계; 및 기준 좌표값들을 이용하여, 사람 영역으로부터 머리-어깨 영역을 특정하고, 머리-어깨 영역 이미지를 추출하는 단계;를 구비하여 머리-어깨 영역 이미지를 추출하여 제공하고, 상기 기준 좌표값은 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값인 것이 바람직하다.

전술한 제3 특징에 따른 딥러닝 모델을 기반으로 한 성별 인식 방법에 있어서, 상기 (b) 단계는, (b1) 소정의 영상을 입력받는 단계; (b2) 상기 입력 영상에 대하여, 객체 검출 모델을 이용하여 사람 영역을 검출하는 단계; (b3) 상기 검출된 사람 영역으로부터 머리-어깨 영역 이미지를 추출하는 단계; 및 (b4) 상기 입력 영상의 머리-어깨 영역 이미지를 사전 학습된 상기 딥러닝 모델에 적용하여, 입력 영상의 사람 객체에 대한 성별 정보를 추출하여 제공하는 단계;를 구비하는 것이 바람직하다.

본 발명에 따른 성별 인식 장치 및 방법은 머리 영역 뿐만 아니라 어깨 영역까지 이용하여 성별을 인식함으로써, 머리부터 어깨까지의 넓은 영역을 통해 성별을 분류하므로, 먼 거리에 있는 사람에 대한 성별 인식에도 유리하다.

또한, 본 발명에 따른 성별 인식 장치 및 방법은, 포즈 검출 모델에 의해 추정된 스켈레톤 정보를 이용하여 관심 영역을 추출함으로써, CCTV에서 보이는 사람들에 대해 앞모습 뿐만 아니라 옆모습이나 뒷모습까지도 성별 인식을 가능케 한다.

한편, 본 발명에 따라 구현된 성별 인식 장치에 대하여, 715장의 데이터(남자 384명, 여자 331명, 앞모습 420명, 뒷모습 295명)를 이용하여 성별 분류 성능을 평가한 결과 95.25%의 정확도를 보여 주었다. 구체적으로는 앞모습에 대하여 95.24%, 뒷모습에 대하여 95.25%의 정확도를 보여 주었다. 이로부터, 본 발명에 따른 딥러닝 모델을 이용한 성별 인식 장치 및 방법은 분류 성능이 정확하고 우수함을 알 수 있다.

도 1은 CCTV 영상들 중 성별 인식이 어려운 영상들을 예시적으로 나타낸 것들이다.

도 2는 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템을 전체적으로 도시한 구성도이다.

도 3은 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, (a)는 원본 이미지이며, (b)는 원본 이미지로부터 추출된 머리-어깨 영역 이미지이다.

도 4는 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, 상기 관심 영역 추출부가 스켈레톤 정보를 이용하여 관심 영역을 특정하는 것을 설명하기 위하여 도시한 모식도들이다.

도 5는 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, 관심 영역 추출부에 의해 원본 이미지로부터 추출된 관심 영역 이미지들의 예시이다.

도 6은 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, 원본 이미지로부터 딥러닝 모델에 의해 성별 인식되는 전체 과정을 예시적으로 도시한 것이다.

도 7은 본 발명의 제2 태양에 따른 딥러닝 모델을 기반으로 한 성별 인식 장치의 구성을 개략적으로 도시한 구성도이다.

본 발명은 기계 학습을 수행하는 컴퓨팅 시스템에 의해 구현된 성별 인식을 위한 딥러닝 모델 학습 시스템, 상기 학습된 딥러닝 모델을 기반으로 한 성별 인식 장치 및 성별 인식 방법에 관한 것이다.

이하, 첨부된 도면을 참조하여 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 대하여 구체적으로 설명한다. 도 2는 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템을 전체적으로 도시한 구성도이다. 도 2를 참조하면, 본 발명에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템(10)은, 학습 데이터를 포함하는 데이터베이스(100), 객체 검출부(110), 관심 영역 추출부(120) 및 딥러닝 모델 학습부(130)을 구비하여, 학습 데이터로부터 관심 영역인 머리-어깨 영역에 대한 이미지를 추출하고, 이를 이용하여 딥러닝 모델을 학습시키는 것을 특징으로 한다.

상기 데이터 베이스(100)는 학습 데이터들이 저장 및 관리되며, 상기 학습 데이터는 사람 객체를 포함하는 원본 이미지들 및 각 사람 객체에 대해 라벨링된 성별 정보들을 포함한다.

상기 객체 검출부(110)는 객체 검출 모델을 이용하여, 학습 데이터의 원본 이미지들로부터 사람 영역들을 검출한다. 객체 검출 모델은 이미 공지된 기술로서, 사람 검출이 가능한 모델이라면 무엇이라도 사용가능하다. 본 발명에서는 YOLOv7 모델을 사용하여 구현하였다.

상기 관심 영역 추출부(120)는 스켈레톤 정보 추출부(121), 기준 좌표값 추출부(122), 관심 영역 특정부(123)를 구비하여, 상기 객체 검출부에 의해 검출된 사람 영역들로부터 관심 영역인 머리-어깨 영역에 대한 이미지들을 추출한다.

상기 스켈레톤 정보 추출부(121)는, 포즈 검출 모델을 이용하여, 상기 객체 검출부에 의해 검출된 사람 영역에 대하여, 사람의 관절 위치들을 나타내는 스켈레톤 정보를 추출하여 제공한다. 본 발명에 따른 시스템은 오픈 소스인 MMPose를 이용해 HRNet-w32 모델을 사용하여 구현하였다.

상기 기준 좌표값 특정부(122)는, 상기 스켈레톤 정보로부터 관심 영역을 획득하기 위한 기준 좌표값들을 추출한다. 상기 기준 좌표값은 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값을 사용함으로써, 머리 및 어깨 영역을 보다 정확하게 특정할 수 있게 된다.

상기 관심 영역 특정부(123)는 기준 좌표값들을 이용하여, 사람 영역으로부터 관심 영역을 특정하고, 상기 특정된 관심 영역에 대한 이미지를 추출하여 제공한다.

본 발명에 따른 시스템은 원본 이미지로부터 추출된 상기 머리-어깨 영역 이미지의 크기를 사전 설정된 크기로 재조정하는 크기 재조정부(124)를 더 구비하는 것이 바람직하다.

전술한 구성을 갖는 딥러닝 모델 학습 시스템은 객체 검출부 및 관심 영역 추출부를 통해, 원본 이미지로부터 관심 영역인 머리-어깨 영역의 이미지를 추출한다. 도 3은 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, (a)는 원본 이미지이며, (b)는 원본 이미지로부터 추출된 머리-어깨 영역 이미지이다.

도 4는 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, 상기 관심 영역 추출부가 스켈레톤 정보를 이용하여 관심 영역을 특정하는 것을 설명하기 위하여 도시한 모식도들이다. 도 4를 참조하여, 본 발명에서 사람 영역으로부터 관심 영역인 머리-어깨 영역을 특정하고 머리-어깨 영역 이미지를 추출하는 과정을 구체적으로 설명한다.

먼저, 도 4의 (a)를 참조하면, 스켈레톤 정보로부터 원본 이미지의 기준 좌표값, 즉 양쪽 눈의 좌표값 및 양쪽 어깨의 좌표값을 획득하고, 이를 이용하여 1차적으로 x1, y1, x2, y2, 높이(h), 폭(w)을 계산한다. 원본 이미지의 왼쪽 상단을 좌표의 영점(0,0)으로 설정하고, x 좌표는 아래 방향으로 증가하고 y 좌표는 오른쪽 방향으로 증가하는 것으로 설정한다. 도 3의 (a)에 있어서, x1, y1, x2, y2, 높이(h), 폭(w)는 아래와 같이 설정된다.

x1 = min (왼쪽 어깨의 X 좌표, 오른쪽 어깨의 X 좌표)

y1 = min (왼쪽 눈의 Y 좌표, 오른쪽 눈의 Y 좌표)

x2 = max (왼쪽 어깨의 X 좌표, 오른쪽 어깨의 X 좌표)

y2 = max (왼쪽 어깨의 Y 좌표, 오른쪽 어깨의 Y 좌표)

w = x2 - x1

h = y2 - y1

다음, 도 4의 (b)를 참조하면, y1과 높이(h)를 적절하게 보정한 후, 관심 영역의 중심 좌표값(center_x, center_y)을 아래와 같이 설정한다.

y1 = max (0, y1-h/2 )

h = y2 - y1

center_x = x1 + w/2

cwnter_y = y1 + h/2

다음, 도 4의 (c)를 참조하면, 관심 영역은 (X1,Y1)과 (X2,Y2)에 의해 설정되는 영역으로 특정되고, 해당 영역이 관심 영역 이미지로 추출된다. R, X1,Y1,X2,Y2 는 아래와 같이 설정된다. 여기서, β는 관심 영역에서 머리와 어깨 영역의 비율을 적절하게 조정하기 위한 비례 상수로서, 1~2 의 범위의 값으로 설정하는 것이 바람직하며, 본 발명에서는 β = 1.3 으로 예시적으로 설정하여 계산한다.

R = max (w,h) * β

X1 = center_x - R/2

Y1 = center_y - R/2

X2 = center_x + R/2

Y2 = center_y + R/2

전술한 과정에 의하여, 도 3의 (b)에 도시된 바와 같은 머리 및 어깨 영역을 포함한 관심 영역 이미지를 추출하게 된다.

한편, 포즈 검출 모델은 뒷모습 또는 옆모습에 대한 이미지로부터도 어깨뿐만 아니라 눈에 대한 대략적인 좌표값을 제공하게 된다. 따라서, 본 발명에 따른 관심 영역 추출부는, 앞모습에 대한 이미지 뿐만 아니라, 뒷모습, 옆모습에 대한 이미지들로부터도 머리-어깨 영역을 포함한 관심 영역 이미지를 특정하여 제공하게 된다. 도 5는 본 발명의 제1 태양에 따른 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서, 관심 영역 추출부에 의해 원본 이미지로부터 추출된 관심 영역 이미지들의 예시이다. 도 5에 도시된 바와 같이, 본 발명에 따른 관심 영역 추출부는 사람의 뒷모습에 대한 머리-어깨 영역을 포함하는 머리-어깨 영역 이미지를 확대 및 추출하여 제공하게 된다.

상기 딥러닝 모델 학습부(130)는 상기 학습 데이터인 원본 이미지들로부터 추출된 사람 객체들에 대한 머리-어깨 영역 이미지들과 각 머리-어깨 영역 이미지들에 대응하여 라벨링된 성별 정보를 이용하여, 성별 인식을 위한 딥러닝 모델을 훈련시킴으로써 모델링한다.

상기 딥러닝 모델은 입력 이미지로부터 특징(feature)를 추출하기 위해 여러 개의 CNN으로 이루어진 EfficientNet-B0와 1개의 Fully Connected Layer(Linear)로 구성된다.

상기 딥러닝 모델의 입력 데이터는 객체 검출부에 의해 얻어진 사람 한 명에 대해 특정한 머리-어깨 영역을 사전 설정된 크기(예컨대 224*224)로 재조정하여 얻은 머리-어깨 영역 이미지이다. 특히, 본 발명에 따른 시스템은, 예시적으로 머리-어깨 영역 이미지는 RGB 채널을 이용하였으므로, 최종적인 형태는 224*224*3 이 될 수 있다. 한편, 본 발명에 따른 시스템을 구현하기 위하여, 학습간 입력 이미지에는 HorizontalFlip, GridDistortion, Lambda 증강 기법을 적용하였으며, 해당 증강 방법들은 외부 라이브러리인 Albumentations을 이용하였으며 파라미터는 기본값을 적용하였다.

본 발명에 따른 딥러닝 모델을 통과하면, 입력된 이미지에 포함된 사람의 성별을 판단하여 성별 정보를 제공한다. 예를 들어, 출력값이 0인 경우 남성이며, 1인 경우 여성임을 나타낼 수 있다.

이하, 본 발명의 제2 태양에 따른 딥러닝 모델을 기반으로 한 성별 인식 장치에 대하여 구체적으로 설명한다. 본 발명에 따른 성별 인식 장치는, 컴퓨팅 장치에 의해 구현된 장치로서, 전술한 딥러닝 모델 학습 시스템에 의해 학습된 딥러닝 모델을 기반으로 한 것을 특징으로 한다.

도 7은 본 발명의 제2 태양에 따른 딥러닝 모델을 기반으로 한 성별 인식 장치의 구성을 개략적으로 도시한 구성도이다. 도 7을 참조하면, 본 발명에 따른 딥러닝 모델을 기반으로 한 성별 인식 장치(40)는, 영상 입력부(42), 객체 검출부(44), 관심 영역 추출부(46) 및 성별 인식부(48)를 구비한다.

상기 영상 입력부(42)는 성별 인식하고자 하는 영상이 입력된다.

상기 객체 검출부(44)는 상기 영상 입력부로 입력된 영상에 대하여, 객체 검출 모델을 이용하여 사람 영역을 검출한다. 상기 관심 영역 추출부(46)는 스켈레톤 정보 추출부, 기준 좌표값 추출부, 관심 영역 특정부 및 크기 재조정부를 구비하여, 상기 객체 검출부에 의해 검출된 사람 영역으로부터 관심 영역인 머리-어깨 영역을 특정하고, 머리-어깨 영역 이미지를 추출한 후, 머리-어깨 영역 이미지의 크기를 조정하여 출력한다. 상기 객체 검출부 및 상기 관심 영역 추출부는 전술한 딥러닝 모델 학습 시스템의 객체 검출부(110) 및 관심 영역 추출부(120)와 각각 동일하게 구성되어 동작된다.

상기 성별 인식부(48)는 전술한 딥러닝 모델 학습 시스템에 의해 사전 학습된 성별 인식을 위한 딥러닝 모델을 구비하고, 상기 입력 영상으로부터 추출된 머리-어깨 영역 이미지를 상기 딥러닝 모델에 적용하여, 입력 영상의 사람 객체에 대한 성별 정보를 추출하여 제공한다.

이하, 본 발명의 제3 태양에 따른 딥러닝 모델을 기반으로 한 성별 인식 방법에 대하여 구체적으로 설명한다. 본 발명에 따른 성별 인식 방법은, 기계 학습을 수행하는 컴퓨팅 장치에 의해 실행되는 프로그램에 의해 구현된다.

본 발명에 따른 딥러닝 모델을 기반으로 한 성별 인식 방법은, 성별 인식을 위한 딥러닝 모델을 사전 학습시키는 단계, 및 상기 사전 학습된 성별 인식을 위한 딥러닝 모델을 이용하여, 입력 영상 내의 사람에 대한 성별을 인식하여 제공하는 단계를 구비한다.

상기 성별 인식을 위한 딥러닝 모델을 사전 학습시키는 단계는, 객체 검출 모델을 이용하여, 학습 데이터의 원본 이미지들로부터 사람 영역들을 검출하는 단계, 포즈 검출 모델을 이용하여, 상기 검출된 사람 영역에 대하여, 사람 영역의 사람의 관절 위치를 나타내는 스켈레톤 정보를 추출하여 제공하는 단계, 상기 스켈레톤 정보로부터 양쪽 눈의 좌표값 및 양쪽 어깨의 좌표값을 포함한 기준 좌표값들을 추출하여 제공하는 단계, 기준 좌표값들을 이용하여, 사람 영역으로부터 머리-어깨 영역을 특정하고, 머리-어깨 영역 이미지를 추출하는 단계, 상기 학습 데이터의 원본 이미지들로부터 추출된 사람 객체들에 대한 머리-어깨 영역 이미지들과 각 머리-어깨 영역 이미지들에 대응하여 라벨링된 성별 정보를 이용하여, 성별 인식을 위한 딥러닝 모델을 학습시키는 단계를 구비한다.

상기 딥러닝 모델을 이용하여 입력 영상 내의 사람에 대한 성별을 인식하여 제공하는 단계는, 소정의 영상을 입력받는 단계, 상기 입력 영상에 대하여, 객체 검출 모델을 이용하여 사람 영역을 검출하는 단계, 상기 검출된 사람 영역으로부터 스켈레톤 정보를 추출하는 단계, 상기 스켈레톤 정보로부터 양쪽 눈의 좌표값 및 양쪽 어깨의 좌표값을 포함한 기준 좌표값들을 추출하는 단계, 기준 좌표값들을 이용하여, 사람 영역으로부터 머리-어깨 영역을 특정하고, 머리-어깨 영역 이미지를 추출하는 단계, 및 상기 입력 영상의 머리-어깨 영역 이미지를 사전 학습된 상기 딥러닝 모델에 적용하여, 입력 영상의 사람 객체에 대한 성별 정보를 추출하여 제공하는 단계를 구비한다.

이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

기계 학습을 수행하는 컴퓨팅 장치에 의해 구현된 성별 인식을 위한 딥러닝 모델 학습 시스템에 있어서,

객체 검출 모델을 이용하여, 학습 데이터의 원본 이미지들로부터 사람 영역들을 검출하는 객체 검출부;

상기 사람 영역들로부터 관심 영역을 특정하고, 상기 특정된 관심 영역에 대한 이미지들을 추출하는 관심 영역 추출부;

상기 학습 데이터의 원본 이미지들로부터 추출된 사람 객체들에 대한 관심 영역 이미지들과 각 관심 영역 이미지들에 대응하여 라벨링된 성별 정보를 이용하여, 성별 인식을 위한 딥러닝 모델을 학습시키는 딥러닝 모델 학습부;

를 구비하고, 상기 관심 영역은 머리-어깨 영역인 것을 특징으로 하는 성별 인식을 위한 딥러닝 모델 학습 시스템.
제1항에 있어서, 상기 관심 영역 추출부는,

포즈 검출 모델을 이용하여, 상기 객체 검출부에 의해 검출된 사람 영역에 대하여, 사전 설정된 사람의 관절 위치들을 나타내는 스켈레톤 정보를 추출하여 제공하는 스켈레톤 정보 추출부;

상기 스켈레톤 정보로부터 관심 영역을 획득하기 위한 기준 좌표값들을 추출하는 기준 좌표값 추출부; 및

기준 좌표값들을 이용하여, 사람 영역으로부터 관심 영역을 특정하고, 상기 특정된 관심 영역에 대한 이미지를 추출하는 관심 영역 특정부;

를 구비하여, 관심 영역 이미지를 추출하여 제공하는 것을 특징으로 하는 성별 인식을 위한 딥러닝 모델 학습 시스템.
제2항에 있어서, 상기 관심 영역 특정부는,

상기 기준 좌표값들을 이용하여, 관심 영역에 대한 중심 좌표값, 높이 및 폭을 설정하고, 상기 중심 좌표값, 높이 및 폭을 이용하여 관심 영역에 대한 시작 좌표(X1,Y1)와 끝 좌표(X2,Y2)을 획득하여 관심 영역을 특정하고, 관심 영역 이미지를 추출하는 것을 특징으로 하는 성별 인식을 위한 딥러닝 모델 학습 시스템.
제2항에 있어서, 상기 기준 좌표값은 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값인 것을 특징으로 하며,

상기 관심 영역 이미지는 상기 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값을 이용하여 특정된 머리-어깨 영역에 대한 이미지인 것을 특징으로 하는 성별 인식을 위한 딥러닝 모델 학습 시스템.
컴퓨팅 장치에 의해 구현되고 사전 학습된 딥러닝 모델을 기반으로 한 성별 인식 장치에 있어서,

소정의 영상이 입력되는 영상 입력부;

상기 입력 영상에 대하여, 객체 검출 모델을 이용하여 사람 영역을 검출하는 객체 검출부;

상기 검출된 사람 영역으로부터 머리-어깨 영역 이미지를 추출하는 관심 영역 추출부; 및

사전 학습된 성별 인식을 위한 딥러닝 모델을 구비하고, 상기 입력 영상의 머리-어깨 영역 이미지를 상기 딥러닝 모델에 적용하여, 입력 영상의 사람 객체에 대한 성별 정보를 추출하여 제공하는 성별 인식부;

를 구비하는 것을 특징으로 하는 딥러닝 모델을 기반으로 한 성별 인식 장치.
제5항에 있어서, 상기 관심 영역 추출부는,

포즈 검출 모델을 이용하여, 상기 객체 검출부에 의해 검출된 사람 영역에 대하여, 사전 설정된 사람의 관절 위치들을 나타내는 스켈레톤 정보를 추출하여 제공하는 스켈레톤 정보 추출부;

상기 스켈레톤 정보로부터 머리-어깨 영역을 획득하기 위한 기준 좌표값들을 추출하는 기준 좌표값 추출부; 및

기준 좌표값들을 이용하여, 사람 영역으로부터 머리-어깨 영역을 특정하고, 상기 특정된 머리-어깨 영역에 대한 이미지를 추출하는 관심 영역 특정부;

를 구비하여, 머리-어깨 영역 이미지를 추출하여 제공하는 것을 특징으로 하는 성별 인식을 위한 딥러닝 모델을 기반으로 한 성별 인식 장치.
제6항에 있어서, 상기 기준 좌표값은 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값인 것을 특징으로 하는 성별 인식을 위한 딥러닝 모델을 기반으로 한 성별 인식 장치.
기계 학습을 수행하는 컴퓨팅 장치에 의해 실행되는 프로그램에 의해 구현된 딥러닝 모델을 기반으로 한 성별 인식 방법에 있어서,

(a) 성별 인식을 위한 딥러닝 모델을 사전 학습시키는 단계; 및

(b) 상기 사전 학습된 성별 인식을 위한 딥러닝 모델을 이용하여, 입력 영상 내의 사람에 대한 성별을 인식하여 제공하는 단계;를 구비하고,

상기 (a) 단계는,

(a1) 객체 검출 모델을 이용하여, 학습 데이터의 원본 이미지들로부터 사람 영역들을 검출하는 단계;

(a2) 상기 사람 영역들로부터 머리-어깨 영역들을 특정하고, 머리-어깨 영역 이미지들을 추출하는 단계;

(a3) 상기 학습 데이터의 원본 이미지들로부터 추출된 사람 객체들에 대한 머리-어깨 영역 이미지들과 각 머리-어깨 영역 이미지들에 대응하여 라벨링된 성별 정보를 이용하여, 성별 인식을 위한 딥러닝 모델을 학습시키는 단계;

를 구비하는 딥러닝 모델을 기반으로 한 성별 인식 방법.
제7항에 있어서, (a2) 단계는,

상기 검출된 사람 영역에 대하여, 포즈 검출 모델을 이용하여 사람 영역의 사람의 관절 위치를 나타내는 스켈레톤 정보를 추출하여 제공하는 단계;

상기 스켈레톤 정보로부터 기준 좌표값들을 추출하여 제공하는 단계; 및

기준 좌표값들을 이용하여, 사람 영역으로부터 머리-어깨 영역을 특정하고, 머리-어깨 영역 이미지를 추출하는 단계;

를 구비하여 머리-어깨 영역 이미지를 추출하여 제공하고,

상기 기준 좌표값은 양쪽 눈의 좌표값과 양쪽 어깨의 좌표값인 것을 특징으로 하는 딥러닝 모델을 기반으로 한 성별 인식 방법.
제7항에 있어서, 상기 (b) 단계는,

(b1) 소정의 영상을 입력받는 단계;

(b2) 상기 입력 영상에 대하여, 객체 검출 모델을 이용하여 사람 영역을 검출하는 단계;

(b3) 상기 검출된 사람 영역으로부터 머리-어깨 영역 이미지를 추출하는 단계; 및

(b4) 상기 입력 영상의 머리-어깨 영역 이미지를 사전 학습된 상기 딥러닝 모델에 적용하여, 입력 영상의 사람 객체에 대한 성별 정보를 추출하여 제공하는 단계;

를 구비하는 것을 특징으로 하는 딥러닝 모델을 기반으로 한 성별 인식 방법.