KR102410564B1

KR102410564B1 - 딥 러닝 기반 사람 인식 장치 및 방법

Info

Publication number: KR102410564B1
Application number: KR1020200122578A
Authority: KR
Inventors: 박강령; 구자형
Original assignee: (주) 아하
Priority date: 2020-09-22
Filing date: 2020-09-22
Publication date: 2022-06-20
Also published as: KR20220039463A; KR20220088653A; WO2022065649A1

Abstract

본 발명은 딥 러닝 기반 사람 인식 장치 및 방법에 관한 것이다. 본 발명의 일 실시 예에 따르면, 딥 러닝 기반 사람 인식 장치 및 방법은 실내 환경에서 움직이는 사람 인식할 때 발생하는 흐림(blur)으로 인한 사람 인식 저하 문제를 해결할 수 있다.

Description

딥 러닝 기반 사람 인식 장치 및 방법 {DEVICE AND METHOD FOR HUMAN RECOGNITION BASED ON DEEP LEARNING}

본 발명은 딥 러닝 기반 사람 인식 장치 및 방법에 관한 것으로, 보다 상세하게는 가시광선 카메라를 이용한 획득한 사람이 움직이는 영상에서 특징을 추출하여 사람을 인식하는 딥 러닝 기반 사람 인식 장치 및 방법에 관한 것이다.

현재 사람을 인식하는 방법은 다양하며, 얼굴, 홍채, 지문, 손가락정맥, 몸 등이 있다. 그러나 실내외환경에서의 원거리 사람 인식 방법은 제한된다. 사람 인식 방법은 크게 사람의 얼굴과 몸 그리고 홍채로 구분할 수 있다. 하지만 사람의 얼굴과 홍채로 인식하는 방법은 문제점이 존재한다. 그것은 바로 원거리에서 사람의 얼굴이나 홍채 정보 취득 시, 대상이 움직이면서 생기는 동작 흐림(motion blur)과 카메라가 대상을 찍으면서 생기는 광학 흐림(optical blur)으로 인해 원본 영상의 손상이 발생할 수 있다. 이러한 손상으로 인해 사람을 인식하게 되면 현저히 성능의 저하가 존재한다. 이러한 문제점을 해결하기 위해 실내외환경에서 원거리 사람인식은 사람 몸이 주 인식대상이 된다.

하지만 인식 대상을 사람 몸으로 변경해도 흐림(blur)이 존재하긴 하지만 사람의 얼굴과 홍채에 영향을 미치는 것보다 영향력이 작다. 몸 기반 인식에는 2가지 방법으로 분류할 수 있다. 사람의 걸음걸이 기반인 보행 인식(Gait recognition)과 사람 몸을 정지영상을 이용한 texture and shaped based body recognition이 있다. 보행 인식(Gait recognition)의 경우 흐림(blur) 문제에 자유로울 수 있지만 연속 이미지를 얻어야 한다는 점에서 데이터셋(dataset) 구성에 많은 시간이 소요된다는 단점이 있다.

사람 몸을 정지영상을 이용한 사람 인식의 경우 인식할 대상의 옷 색깔이 인식 성능에 많은 영향을 끼치는 문제점이 있다. 또한 흐림(blur)가 존재하는 영상은 인식율이 크게 떨어지므로 흐림(blur)를 제거(deBlur)하여 영상을 복구(restoration)하는 연구도 필요하다.

본 발명의 배경기술은 대한민국 등록특허 제 10-1515214 호에 게시되어 있다.

본 발명은 실내 환경에서 움직임이 있는 사람의 영상으로 사람 인식이 가능한 딥 러닝 기반 사람 인식 장치 및 방법을 제공한다.

본 발명은 영상의 정도에 따라 흐림(blur)를 제거하고 영상을 복원한 후 사람 인식을 수행하여 인식율이 높은 딥 러닝 기반 사람 인식 장치 및 방법을 제공한다.

본 발명은 얼굴과 몸을 구분하고 각각 인식하는 멀티모달(multimodal) 생체인식 방식으로 각각 이미지를 복원하여 판별하는 딥 러닝 기반 사람 인식 장치 및 방법을 제공한다.

본 발명의 일 측면에 따르면, 딥 러닝 기반 사람 인식 장치를 제공한다.

본 발명의 일 실시예에 따른 딥 러닝 기반 사람 인식 장치는 획득한 영상에서 얼굴 영역과 몸 영역을 구분하는 영역 분리부, 상기 영상의 흐림(blur)정도를 판단하기 위해 초점 점수를 산출하는 초점 점수부, 상기 얼굴 영역에 얼굴 영역 특징과 상기 몸 영역에서 몸 영역 특징을 추출하는 특징 추출부, 상기 얼굴 영역 특징에서 얼굴 매칭 거리를 산출하고, 상기 몸 영역 특징에서 몸 영역 매칭 거리를 산출하는 거리 산출부 및 사람 일치 및 불 일치 여부를 판단하는 판단부를 포함할 수 있다.

본 발명의 다른 일 측면에 따르면, 딥 러닝 기반 사람 인식 방법 및 이를 실행하는 컴퓨터 프로그램이 기록된 컴퓨터가 판독 가능한 기록매체를 제공한다.

본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 방법 및 이를 실행하는 컴퓨터 프로그램이 저장된 기록매체는 획득한 영상에서 얼굴 영역 영상과 몸 영역 영상을 추출하는 단계, 영상의 흐림(blur)정도를 판단하기 위해 초점 점수(focus score)를 산출하는 단계, 얼굴 영역 영상에서 얼굴 영역 특징을 추출하고, 몸 영역 영상에서 몸 영역 특징을 추출하는 단계, 얼굴 영역 특징을 이용해 얼굴 매칭 거리를 산출하고, 몸 영역 특징을 이용해 몸 매칭 거리를 산출하는 단계 및 사람 일치 여부를 판단하는 단계를 포함할 수 있다.

본 발명의 일 실시 예에 따르면, 딥 러닝 기반 사람 인식 장치 및 방법은 실내 환경에서 움직이는 사람 인식할 때 발생하는 흐림(blur)으로 인한 사람 인식 저하 문제를 해결할 수 있다.

본 발명의 일 실시 예에 따르면, 딥 러닝 기반 사람 인식 장치 및 방법은 얼굴 특징과 몸 특징을 따로 추출하여 이용하므로 움직이는 사람 인식의 정확도를 높일 수 있다.

도 1 내지 도9는 본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 장치를 설명하기 위한 도면들.
도 10 및 도 11은 본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 장치가 활용하는 딥 러닝 구조의 예시들.
도12는 본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 방법을 설명한 도면.
도 13 내지15는 본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 장치를 설명하기 위한 실험 결과들.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서 및 청구항에서 사용되는 단수 표현은, 달리 언급하지 않는 한 일반적으로 "하나 이상"을 의미하는 것으로 해석되어야 한다.

이하, 본 발명의 바람직한 실시 예를 첨부도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.

도 1 내지 도9는 본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 장치를 설명하기 위한 도면들이다.

도 1을 참조하면, 딥 러닝 기반 사람 인식 장치(10)는 영역 분리부(100), 초점 점수부(200), 복원부(300), 특징 추출부(400), 거리 산출부(500) 및 판단부(600)를 포함한다.

영역 분리부(100)는 딥 러닝 기반 가시광선 카메라를 이용한 사람 인식 장치(10)가 획득한 영상에서 얼굴 영역과 몸 영역을 구분한다.

도 2를 참조하면, 영역 관리부(100)는 얼굴 영역부(110) 및 몸 영역부(120)를 포함한다.

영역 분리부(100)는 획득한 영상에서 얼굴 영역만을 분리한다. 예를 들면 영역 분리부(100)는 획득 영상에서 얼굴 영역을 찾아내기 위해 얼굴 취득 프로그램 중 Adaboost와 D-lib를 통해 얼굴의 특징 점(feature point)를 포착한다. 영역 관리부(100)는 포착한 특징 점을 기준으로 얼굴 영역을 재설정하여 얼굴 영역부(110)를 생성한다.

영역 분리부(100) 획득한 영상에서 얼굴 영역부(110)를 제외한 나머지 부분을 몸 영역부(120)로 생성한다.

다시 도1을 참조하면, 초점 점수부(200)는 영상의 흐림(blur)정도를 판단하기 위해 초점 점수(focus score)를 산출한다. 초점 점수부(200)는 얼굴 영역부(120)의 영상의 흐림(blur)정도를 판단하기 위해 초점 점수(focus score)를 산출한다.

초점 점수부(200)는 초점 점수가 이미 설정된 임계 값보다 적은 경우 흐림(blur)가 있다고 판단하고 큰 경우 흐림(blur)가 없다고 판단한다.

도 3을 참조하면, 초점 점수에 따라 도3(a)는 흐림(blur)가 있는 얼굴 영역부(110)이고 도 3(b)는 흐림(blur)가 없는 얼굴 영역부(110)이다.

복원부(300)는 초점 점수가 임계 값보다 적어서 흐림(blur)가 있다고 판단된 얼굴 영역부(110)와 얼굴 영역부(110)외 나머지 몸 영역부(120)를 복원한다. 예를 들면 복원부(300)는 생산적 적대 신경망(GAN, Generative adversarial networks) 중 흐림 제거 생산적 적대 신경망(deblurGAN)을 이용해 얼굴 영역부(110)와 몸 영역부(120)를 각각 복원한다.

도 4 및 도 5를 참조하면, 흐림 제거 생산적 적대 신경망(deblurGAN)은 생성자(Generator) 및 식별자(Discriminator)를 포함한다. 도 4(a) 및 도 5(a)는 흐림 제거 생산적 적대 신경망(deblurGAN)의 생성자(Generator)를 표현한 것이고, 도 4(b) 및 도 5(b)는 흐림 제거 생산적 적대 신경망(deblurGAN)의 식별자(Discriminator)를 표현한 것이다. 생성자(Generator)의 역할은 Gaussian random noise를 input으로 하여 실제 이미지(real image)와 유사한 가짜 이미지(fake image)를 생성하는 것이 목표이며, 식별자(Discriminator)은 생성자(Generator)에서 생성된 가짜 이미지(fake image)와 실제 이미지(real image)를 구별하여 가짜 이미지(fake image)를 찾는 것이 목표이다. 따라서 식별자(discriminator)는 실제 이미지(real image)와 가짜 이미지(fake image)를 쉽게 구분할 수 있는 방향으로 학습을 진행하며, 생성자(Generator)의 경우 가짜 이미지(fake image)가 실제 이미지(real image)에 근접할 수 있도록 학습한다.

도 4(a) 및 도 5(a)를 자세히 설명하면, 흐림 제거 생산적 적대 신경망(deblurGAN)의 생성자(Generator)의 구조는 2개의 합성곱 블록(convolution blocks), 9개의 잔여 블록(residual blocks) 및 2개의 전치 합성곱 블록(transposed convolution blocks)을 포함한다.

도 4(b) 및 도 5(b)를 자세히 설명하면, 식별자(discriminator)는 흐림이 있는 입력 영상(input image)을 목적 영상(target image)과 합친 후 합성곱 층을 통하여 결과 영상(output image)을 추출한다.

도 6을 참조하면, 복원부(300)는 흐림(blur)이 있는 영상을 흐림 제거 생산적 적대 신경망(DeblurGAN)을 통해 복원한 후의 이미지로 바뀌는 것을 나타낸다.

도 6(a)는 초점 점수가 임계 값보다 적어서 복원이 필요한 흐림(blur)이 있는 영상(input image)이고, 도6(b)는 복원부(300)가 흐림(blur)가 있는 영상을 복원할 때 이용되는 목적 영상(target image)이고, 도 6(c)는 도 6(a)가 복원부(300)를 통해 복원된 영상(output image)의 결과이다.

복원부(300)는 얼굴 영역부(110)와 몸 영역부(120)를 흐림 제거 생산적 적대 신경망(deblurGAN)을 이용해 각각 복원한다.

다시 도 1을 참조하면, 특징 추출부(400)는 얼굴 영역부(110) 및 몸 영역부(120)의 특징을 각각 추출합니다.

도7을 참조하면, 특징 추출부(400)는 얼굴 특징 추출부(410) 및 몸 특징 추출부(420)을 포함한다.

얼굴 특징 추출부(410)는 복원부(300)에서 복원한 얼굴 영역부(110)와 흐림이 없다고 판단된 얼굴 영역부(110)를 합쳐서 얼굴 영역의 특징을 추출한다. 예를 들면 특징 추출부(400)는 VGG(Visual Geometry Group) face Net-16을 통하여 얼굴 영역부(110)의 특징을 추출할 수 있다.

도 8 및 도 9는 얼굴 특징 추출부(410)에 해당하는 딥 러닝 구조의 예시이다.

도 8 및 도 9를 참조하면, 얼굴 특징 추출부(410)는13개의 합성곱 층(convolutional layers), 5개의 pooling layers(풀링 층) 및 3 개의 전체 연결 층(Fully connected layers)을 포함한다.

또한 몸 특징 추출부(420)는 복원부(300)에서 복원한 몸 영역부(120)와 흐림이 없다고 판단된 몸 영역부(120)를 합쳐서 몸 영역의 특징을 추출한다. 예를 들면 특징 추출부(400)는 ResNet(Residual Networks)-50을 통해서 몸 영역부(120)의 특징을 추출할 수 있다.

도 10 및 도 11은 본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 장치가 활용하는 딥 러닝 구조의 예시들이다.

도 10 및 도 11을 참조하면. 특징 추출부(410)는13개의 합성곱 층(convolutional layers), 5개의 풀링 층(pooling layers) 및 3 개의 전연결 층(Fully connected layers)을 포함한다.

다시 도 1을 참조하면, 거리 산출부(500)는 얼굴 특징 산출부(410)와 몸 특징 산출부(420)에서 추출한 각각의 특징을 통해 유클리디안 거리를 통해 얼굴 매칭 거리 및 몸 매칭 거리를 산출한다. 거리 산출부(500)는 산출된 얼굴 매칭 거리 및 몸 매칭 거리를 점수 단위 결합(score-level fusion)방식을 이용하여 결합 거리를 산출한다. 예를 들면, 거리 산출부(300)는 점수 단위 결합(score-level fusion) 방식에 가중치를 사용하여 판단한다.

판단부(600)는 산출된 결합 거리를 이용해 본인 일치 및 타인 여부를 판단한다.

판단부(400)는 결합 거리가 짧으며 본인으로, 먼 경우 타인으로 판단한다.

도12는 본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 방법을 설명한 도면이다. 이하 설명하는 각 과정은 딥 러닝 기반 사람 인식 장치를 구성하는 각 기능부가 수행하는 과정이나, 본 발명의 간결하고 명확한 설명을 위해 각 단계의 주체를 딥 러닝 기반 사람 인식 장치로 통칭하도록 한다.

도 12를 참조하면, 단계 S1201에서 딥 러닝 기반 사람 인식 장치(10)는 사람 인식을 위해 실내 환경에서의 걸어다니는 사람의 영상을 취득하여 입력한다.

단계 S1202에서 딥 러닝 기반 사람 인식 장치(10)는 취득한 영상에서 얼굴 영역과 몸 영역을 구분한다. 딥 러닝 기반 사람 인식 장치(10)는 입력된 영상에서 얼굴에 해당하는 얼굴 영역을 추출한다. 딥 러닝 기반 사람 인식 장치(10)는 획득 영상에서 얼굴 영역을 찾아내기 위해 얼굴 취득 프로그램 중 Adaboost와 D-lib를 통해 얼굴의 특징 점(feature point)를 포착한다. 딥 러닝 기반 사람 인식 장치(10)는 포착한 특징 점을 기준으로 얼굴 영역을 재설정하여 얼굴 영역을 추출한다. 딥 러닝 기반 사람 인식 장치(10)는 얼굴 영역을 제외한 나머지 부분을 몸 영역으로 생성한다.

단계 S1203에서 딥 러닝 기반 사람 인식 장치(10)는 영상의 흐림 (blur) 정도를 판단하기 위해 초점 점수(focus score)를 산출한다. 예를 들면, 딥 러닝 기반 사람 인식 장치(10)는 얼굴 영역이 초점 점수를 산출한다.

단계 S1204에서 딥 러닝 기반 사람 인식 장치(10)는 얼굴 영역의 초점 점수가 미리 설정된 임계 값보다 크면 추출한 얼굴 영역 영상에 흐림(blur)이 있다고 판단하고 단계 S1205에서 딥 러닝 기반 사람 인식 장치(10)는 얼굴 영역 및 몸 영역을 추출한 영상에서 각각 흐림(blur)를 제거하고 복원을 수행한다. 예를 들면, 딥 러닝 기반 사람 인식 장치(10)는 생산적 적대 신경망(GAN, Generative adversarial networks) 중 흐림 제거 생산적 적대 신경망(deblurGAN)을 이용해 얼굴 영역 및 몸 영역을 각각 복원한다. 딥 러닝 기반 사람 인식 장치(10)는 얼굴 영역의 초점 점수가 미리 설정된 임계 값보다 적으면 추출한 얼굴 영역 영상에 흐림(blur)이 없다고 판단하고 복원과정을 거치지 않는다.

단계 S1206에서 딥 러닝 기반 사람 인식 장치(10)는 단계 S1205에서 복원한 얼굴 영역 영상 및 몸 영역 영상과 흐림(blur)가 없다고 판단한 영상을 합친다.

단계 S1207에서 딥 러닝 기반 사람 인식 장치(10)는 얼굴 영역 영상에 얼굴 영역 특징을 추출하고, 몸 영역 영상에서 몸 영역 특징을 추출한다. 예를 들면, 딥 러닝 기반 사람 인식 장치(10)는 VGG face Net-16을 통하여 얼굴 영역 영상에서 특징을 추출할 수 있다. 또한 딥 러닝 기반 사람 인식 장치(10)는 ResNet-50을 통해서 몸 영역 영상에서 특징을 추출할 수 있다.

단계 S1208에서 딥 러닝 기반 사람 인식 장치(10)는 얼굴 영역 특징과 몸 영역 특징을 통해 유클리디안 거리를 산출한다. 딥 러닝 기반 사람 인식 장치(10)는 산출한 각각의 유클리디안 거리를 통해 얼굴 매칭 거리 및 몸 매칭 거리를 산출한다.

단계 S1209에서 딥 러닝 기반 사람 인식 장치(10)는 산출된 얼굴 매칭 거리 및 몸 매칭 거리를 점수 단위 결합(score-level fusion) 방식으로 결합 거리(fusion distance)를 산출한다. 예를 들면 단계 S1308에서 딥 러닝 기반 사람 인식 장치(10)는 점수 단위 결합 중 가중 합계(weighted sum)과 가중 제품(weighted product)과 같은 가중치를 이용해 얼굴 매칭 거리와 몸 매칭 거리를 결합하여 결합 거리(fusion distance)를 산출한다.

단계 S1210에서 딥 러닝 기반 사람 인식 장치(10)는 결합 거리(fusion distance)를 이용해 사람을 인식한다.

도 13 내지15는 본 발명의 일 실시 예에 따른 딥 러닝 기반 사람 인식 장치의 성능 실험 결과들이다.

도 13을 참조하면, 딥 러닝 기반 사람 인식 장치(10)는 흐림 제거 생산적 적대 신경망(DeblurGAN) 사용 후 인식 성능이 사용 전 보다 더 좋은 것을 확인할 수 있다.

도 13(a) 및 도 14(a)를 자세히 설명하면 얼굴 인식율과 몸 인식율의 동일 오류율(ERR)을 추출한 결과 흐림 제거 생산적 적대 신경망(DeblurGAN)을 거친 것의 동일 오류율이 더 낮은 것을 확인할 수 있다. FAR은 오인식률(False acceptance rate, 타인 수락률)은 타인을 본인으로 인식하는 경우이고, GAR은 정인식율(Genuine Acceptance Rate)로 본인으로 제대로 인식하는 경우이다.

도 13(b) 및 도 14(b)를 자세히 설명하면, 산출한 점수 단위 결합을 이용해 산출한 결합 점수의 동일 오류율(ERR)의 결과값이다. 결합 거리를 이용하여도 흐림 제거 생산적 적대 신경망(DeblurGAN)을 거친 것의 동일 오류율이 더 낮은 것을 확인할 수 있다. 오류율이 낮다는 것은 판단 정확도가 높다는 것이다.

도 15를 참조하면, 딥 러닝 기반 사람 인식 장치(10)가 점수 단위 결합하여 결합 거리를 산출할 때 가중치를 가중 제품(weighted product)으로 적용하였을 때 가중 합계(weighted sum) 보다는 조금 더 우수하는 것을 보여준다. 딥 러닝 기반 사람 인식 장치(10)는 몸 영역 특징이 비슷하다 하더라도 얼굴 영역 특징으로 인식할 수 있고, 또는 얼굴 영역이 흐릿한 경우에는 몸 영역 특징에 따라 사람 인식이 가능하다.

상술한 딥 러닝 기반 사람 인식 방법은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.

이상에서, 본 발명의 실시 예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시 예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.

도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시 예 들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.

이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

10: 딥 러닝 기반 사람 인식 장치
100: 영역 분리부
110: 얼굴 영역부
120: 몸 영역부
200: 초점 점수부
300: 복원부
400: 특징 추출부
410: 얼굴 특징 추출부
420: 몸 특징 추출부
500: 거리 산출부
600: 판단부

Claims

딥 러닝 기반 사람 인식 장치에 있어서,
획득한 영상에서 얼굴 영역과 몸 영역을 구분하는 영역 분리부;
상기 영상의 흐림(blur)정도를 판단하기 위해 상기 얼굴 영역의 초점 점수를 산출하는 초점 점수부;
상기 초점 점수에 따라 흐림을 제거하고 영상을 복원하는 복원부;
상기 얼굴 영역에 얼굴 영역 특징과 상기 몸 영역에서 몸 영역 특징을 추출하는 특징 추출부;
상기 얼굴 영역 특징에서 얼굴 매칭 거리를 산출하고, 상기 몸 영역 특징에서 몸 영역 매칭 거리를 산출하는 거리 산출부; 및
사람 일치 및 불 일치 여부를 판단하는 판단부;를 포함하고,
상기 초점 점수부는,
상기 초점 점수가 이미 설정된 임계 값보다 적은 경우 흐름(blur)이 있다고 판단하고, 큰 경우 흐림(blur)이 없다고 판단하며,
상기 복원부는,
생산적 적대 신경망(GAN, Generative adversarial networks) 중 흐림 제거 생산적 적대 신경망(deblurGAN)을 이용해 상기 초점 점수가 임계 값보다 적어서 흐림(blur)이 있다고 판단된 얼굴 영역부와 얼굴 영역부 외 나머지 몸 영역부를 복원하고,
상기 특징추출부는
VGG(Visual Geometry Group) face Net-16을 사용하여, 상기 복원부에서 복원한 얼굴 영역부와 흐림이 없다고 판단된 얼굴 영역부를 합쳐서 얼굴 영역의 특징을 추출하는 얼굴 특징 추출부; 및
ResNet(Residual Networks)-50을 사용하여, 상기 복원부에서 복원한 몸 영역부와 흐림이 없다고 판단된 몸 영역부를 합쳐서 몸 영역의 특징을 추출하는 몸 특징 추출부;
를 포함하는 딥 러닝 기반 사람 인식 장치.
삭제
제1 항에 있어서,
상기 거리 산출부는
상기 얼굴 매칭 거리와 몸 매칭 거리를 이용해 결합 거리를 산출하는 딥 러닝 기반 사람 인식 장치.
삭제
딥 러닝 기반 사람 인식 장치가 딥 러닝 기반 사람 인식 방법에 있어서,
획득한 영상에서 얼굴 영역 영상과 몸 영역 영상을 추출하는 단계;
상기 영상의 흐림(blur)정도를 판단하기 위해 상기 얼굴 영역의 초점 점수(focus score)를 산출하는 단계;
상기 초점 점수에 따라 흐림을 제거하고 영상을 복원하는 단계;
상기 얼굴 영역 영상에서 얼굴 영역 특징을 추출하고, 상기 몸 영역 영상에서 몸 영역 특징을 추출하는 단계;
상기 얼굴 영역 특징을 이용해 얼굴 매칭 거리를 산출하고, 상기 몸 영역 특징을 이용해 몸 매칭 거리를 산출하는 단계; 및
사람 일치 여부를 판단하는 단계;를 포함하고,
상기 초점 점수를 산출하는 단계는,
상기 초점 점수가 이미 설정된 임계 값보다 적은 경우 흐름(blur)이 있다고 판단하고, 큰 경우 흐림(blur)이 없다고 판단하며,
상기 복원하는 단계는,
생산적 적대 신경망(GAN, Generative adversarial networks) 중 흐림 제거 생산적 적대 신경망(deblurGAN)을 이용해 상기 초점 점수가 임계 값보다 적어서 흐림(blur)이 있다고 판단된 얼굴 영역부와 얼굴 영역부 외 나머지 몸 영역부를 복원하고,
상기 추출하는 단계는,
VGG(Visual Geometry Group) face Net-16을 사용하여, 상기 복원하는 단계에서 복원한 얼굴 영역부와 흐림이 없다고 판단된 얼굴 영역부를 합쳐서 얼굴 영역의 특징을 추출하고,
ResNet(Residual Networks)-50을 사용하여, 상기 복원하는 단계에서 복원한 몸 영역부와 흐림이 없다고 판단된 몸 영역부를 합쳐서 몸 영역의 특징을 추출하는 딥 러닝 기반 사람 인식 방법.
삭제
제5항에 있어서,
상기 얼굴 매칭 거리와 상기 몸 매칭 거리를 이용해 결합 거리를 산출하는 단계를 더 포함하는 딥 러닝 기반 사람 인식 방법.
삭제
제5항 또는 제7항의 딥 러닝 기반 사람 인식 방법을 실행하는 컴퓨터가 판독 가능한 기록매체에 기록된 컴퓨터 프로그램.