KR20210148134A

KR20210148134A - 대상 카운트 방법, 장치, 전자 기기, 저장 매체 및 프로그램

Info

Publication number: KR20210148134A
Application number: KR1020217030685A
Authority: KR
Inventors: 펭쳉 시아; 쿤린 양; 준 호우; 슈아이 이
Original assignee: 베이징 센스타임 테크놀로지 디벨롭먼트 컴퍼니 리미티드
Priority date: 2020-05-28
Filing date: 2020-12-03
Publication date: 2021-12-07
Also published as: CN111652107B; JP2022537865A; TWI779449B; TW202145064A; WO2021238135A1; CN111652107A

Abstract

본 발명은 대상 카운트 방법, 장치, 전자 기기, 저장 매체 및 프로그램에 관한 것이고; 상기 대상 카운트 방법은, 처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득하는 단계; 상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하는 단계; 및 상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계를 포함한다. 본 발명의 실시예는 대상 카운트 및 위치 결정의 정밀도의 향상을 구현할 수 있다.

Description

대상 카운트 방법, 장치, 전자 기기, 저장 매체 및 프로그램

본 발명은 출원 번호가 CN202010469232.7이고, 출원일이 2020년 5월 28일인 중국 특허 출원에 기반하여 제출하였고, 상기 중특 특허 출원의 우선권을 주장하며, 상기 중국 특허 출원의 모든 내용은 참조로서 본 발명에 인용된다.

본 발명은 컴퓨터 기술 분야에 관한 것이고, 특히 대상 카운트 방법, 장치, 전자 기기, 저장 매체 및 프로그램에 관한 것이다.

비디오 모니터링이 생활에서의 광범한 사용에 따라, 비디오 중의 군중 카운트 및 위치 결정은 사회 공공 안전 등 방면에서 대체할 수 없는 작용을 한다. 관련 기술에 있어서, 비디오 중 군중 카운트 및 위치 결정은 컴퓨터 비전 알고리즘을 통해 비디오 화면 중의 실시 인원수, 사람의 분포 상황 및 군중의 밀도 등을 평가한 것이므로 군중이 쉐이딩 또는 인터렉션의 현상이 나타나 판단 오류가 발생하기 쉽고, 나아가 결정된 군중 카운트 및 위치 결정의 정확성이 저하된다.

본 발명은 대상 카운트의 기술 방안을 제공한다.

본 발명의 실시예는 대상 카운트 방법을 제공하고,

처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득하는 단계;

상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하는 단계; 및

상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계를 포함한다. 이로써, 처리될 이미지에 대해 특징 추출을 수행하여 획득한 헤드부 키포인트 및 헤드부 영역을 통해, 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 처리될 이미지 중 대상의 개수 및 위치를 결정하므로, 대상 카운트 및 위치 결정의 정밀도를 향상할 수 있다.

하나의 가능한 구현 방식에 있어서, 상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계는,

각 상기 헤드부 키포인트와 각 상기 헤드부 영역의 중심점 사이의 유사도를 결정하는 단계;

상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 상기 헤드부 키포인트와 병합하여, 병합 정보를 획득하는 단계; 및

상기 병합 정보, 병합하지 않은 헤드부 키포인트 및 병합하지 않은 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계를 포함한다. 이로써, 병합 정보, 병합하지 않은 헤드부 키포인트 및 병합하지 않은 헤드부 영역에 기반하여, 처리될 이미지 중 대상의 개수 및 위치를 빠르고 정확하게 결정한다.

하나의 가능한 구현 방식에 있어서, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 상기 헤드부 키포인트와 병합하여, 병합 정보를 획득하는 단계는,

상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 삭제하는 단계; 및

상기 헤드부 키포인트 및 상기 헤드부 영역의 사이즈에 따라, 병합 후의 헤드부 영역을 획득하고, 상기 병합 정보가 상기 헤드부 키포인트 및 상기 병합 후의 헤드부 영역을 포함하는 단계를 포함한다. 이로써, 임계 값 조건을 만족하는 헤드부 영역에 대해 삭제를 수행하고, 헤드부 키포인트 및 헤드부 영역의 사이즈에 따라 헤드부 영역을 결정하므로, 헤드부 영역의 결정의 정확성을 향상한다.

상기 헤드부 키포인트를 신뢰도에 따라 순서 배정을 수행하는 단계; 및

상기 헤드부 키포인트의 신뢰도가 작아지는 순서에 따라, 상기 헤드부 키포인트를 상기 헤드부 영역과 병합하여, 상기 병합 정보를 획득하는 단계를 포함한다. 이로써, 신뢰도를 통해 헤드부 키포인트에 대해 순서 배정을 수행하고, 신뢰도가 작아지는 순서에 따라 헤드부 키포인트 및 헤드부 영역에 대해 병합하므로, 결정된 병합 정보의 정확성이 향상하도록 한다.

하나의 가능한 구현 방식에 있어서, 상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트를 획득하는 단계는,

상기 초기 특징 맵에 대해 다운 샘플링 처리를 수행하여, 상이한 스케일의 복수 개의 다운 샘플링 특징 맵을 획득하는 단계;

복수 개의 상기 다운 샘플링 특징 맵에서의 중간 스케일의 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 업 샘플링 특징 맵을 획득하는 단계 - 상기 업 샘플링 특징 맵은 상기 초기 특징 맵과 스케일이 일치함 -; 및

상기 업 샘플링 특징 맵에 따라 헤드부 키포인트 인식을 수행하여, 상기 처리될 이미지에서의 헤드부 키포인트를 획득하는 단계를 포함한다. 이로써, 복수 개의 다운 샘플링 특징 맵에서 중간 스케일의 다운 샘플링 특징 맵을 선택하여 업 샘플링 처리를 수행하여, 초기 특징 맵 스케일과 일치하는 업 샘플링 특징 맵을 획득하고, 상기 업 샘플링 특징 맵에 따라 헤드부 키포인트 인식을 수행하므로, 획득된 처리될 이미지에서의 헤드부 키포인트가 더욱 정확하도록 한다.

하나의 가능한 구현 방식에 있어서, 상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 영역을 획득하는 단계는,

각각 복수 개의 상기 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여, 각 상기 다운 샘플링 특징 맵에 대응되는 헤드부 영역를 획득하는 단계; 및

각 상기 다운 샘플링 특징 맵에 대응되는 헤드부 영역에 대해 병합 처리를 수행하여, 상기 처리될 이미지에 대응되는 헤드부 영역을 획득하는 단계를 포함한다. 이로써, 각각 복수 개의 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하므로, 복수 개의 헤드부 영역을 획득하고, 복수 개의 헤드부 영역에 대해 병합 처리를 수행하여, 획득한 처리될 이미지에서의 헤드부 영역이 더욱 정확하도록 한다.

하나의 가능한 구현 방식에 있어서, 네트워크를 위치 결정하는 것을 통해 상기 처리될 이미지에 대한 특징 추출을 구현하여, 상기 처리될 이미지의 초기 특징 맵을 획득하고; 상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하는 단계는 또한,

기설정된 훈련 세트를 통해 상기 위치 결정 네트워크를 훈련하고, 상기 훈련 세트는 복수 개의 샘플 그룹을 포함하는 단계 - 상기 샘플 그룹에는 샘플 이미지, 샘플 이미지에 대응되는 태그 헤드부 키포인트 및 태그 헤드부 영역을 포함함 - 를 포함한다. 이로써, 기설정된 훈련 세트를 통해 위치 결정 네트워크를 훈련하고, 상기 위치 결정 네트워크를 통해 처리될 이미지에 대해 특징 추출을 수행하여 초기 특징 맵을 획득하며, 상기 초기 특징 맵에 따라, 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 더욱 정확하게 획득한다.

하나의 가능한 구현 방식에 있어서, 상기 위치 결정 네트워크는 특징 추출 네트워크, 헤드부 키포인트 위치 결정 네트워크, 헤드부 영역 위치 결정 네트워크를 포함하고, 상기 기설정된 훈련 세트를 통해 상기 위치 결정 네트워크를 훈련하는 단계는,

상기 특징 추출 네트워크를 통해 상기 샘플 이미지에 대해 특징 추출을 수행하여, 상기 샘플 이미지의 초기 특징 맵을 획득하는 단계;

상기 샘플 이미지의 초기 특징 맵에 대해 다운 샘플링 처리를 수행하여, 상이한 사이즈의 복수 개의 샘플 다운 샘플링 특징 맵을 획득하는 단계;

상기 헤드부 키포인트 위치 결정 네트워크를 통해 복수 개의 상기 샘플 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 샘플 업 샘플링 특징 맵을 획득하는 단계 - 상기 샘플 업 샘플링 특징 맵은 상기 샘플 이미지의 초기 특징 맵과 사이즈가 일치함 -;

상기 헤드부 키포인트 위치 결정 네트워크를 통해 상기 샘플 업 샘플링 특징에 대해 헤드부 키포인트 인식을 수행하여, 상기 샘플 이미지에 대응되는 헤드부 키포인트를 획득하는 단계; 및

상기 샘플 이미지에 대응되는 헤드부 키포인트 및 상기 태그 헤드부 키포인트에 따라, 상기 헤드부 키포인트 위치 결정 네트워크를 훈련하는 단계를 포함한다. 이로써, 특징 추출 네트워크, 헤드부 키포인트 위치 결정 네트워크 및 헤드부 영역 위치 결정 네트워크를 통해, 샘플 이미지에 대해 관련 특징 추출을 수행하여, 헤드부 키포인트 위치 결정 네트워크를 훈련하므로, 훈련된 헤드부 키포인트 위치 결정 네트워크의 성능을 향상시킨다.

하나의 가능한 구현 방식에 있어서, 상기 기설정된 훈련 세트를 통해 상기 위치 결정 네트워크를 훈련하는 단계는,

상기 헤드부 영역 위치 결정 네트워크를 통해 각각 복수 개의 상기 샘플 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여, 각 상기 샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역을 획득하는 단계; 및

상기 샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역 및 상기 태그 헤드부 영역에 따라, 상기 헤드부 영역 위치 결정 네트워크를 훈련하는 단계를 포함한다, 이로써, 샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역 및 태그 헤드부 영역을 통해, 헤드부 영역 위치 결정 네트워크를 훈련하므로, 훈련된 헤드부 영역 위치 결정 네트워크의 성능을 향상시킨다.

상기 처리될 이미지 중 각 헤드부 영역의 위치 정보를 결정하는 단계;

각 상기 헤드부 영역의 위치 정보, 및 헤드부 영역의 사이즈와 상기 헤드부 영역의 위치 정보의 관련 관계에 따라, 상기 헤드부 영역의 사이즈를 결정하는 단계; 및

상기 헤드부 영역의 위치 정보 및 상기 헤드부 영역의 사이즈에 따라, 상기 헤드부 영역을 획득하는 단계를 포함한다. 이로써, 처리될 이미지에서의 각 헤드부 영역의 위치 정보, 헤드부 영역의 사이즈를 통해 획득한 헤드부 영역의 정확성이 더욱 높다.

아래의 장치, 전자 기기 등의 효과 설명은 상기 방법의 설명을 참조하면 되고, 여기서 더이상 반복하여 설명하지 않는다.

본 발명의 실시예는 대상 카운트 장치를 제공하고,

처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득하기 위한 특징 추출 모듈;

상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하기 위한 처리 모듈; 및

상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하기 위한 카운트 모듈을 포함한다.

하나의 가능한 구현 방식에 있어서, 상기 카운트 모듈은 또한,

각 상기 헤드부 키포인트와 각 상기 헤드부 영역의 중심점 사이의 유사도를 결정하고;

상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 상기 헤드부 키포인트와 병합하여, 병합 정보를 획득하며; 및

상기 병합 정보, 병합하지 않은 헤드부 키포인트 및 병합하지 않은 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하기 위한 것이다.

상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 삭제하고; 및

상기 헤드부 키포인트 및 상기 헤드부 영역의 사이즈에 따라, 병합 후의 헤드부 영역을 획득하고, 상기 병합 정보가 상기 헤드부 키포인트 및 상기 병합 후의 헤드부 영역을 포함하기 위한 것이다.

상기 헤드부 키포인트를 신뢰도에 따라 순서 배정을 수행하고; 및

상기 헤드부 키포인트의 신뢰도가 작아지는 순서에 따라, 상기 헤드부 키포인트를 상기 헤드부 영역과 병합하여, 병합 정보를 획득하기 위한 것이다.

하나의 가능한 구현 방식에 있어서, 상기 처리 모듈은 또한,

상기 초기 특징 맵에 대해 다운 샘플링 처리를 수행하여, 상이한 스케일의 복수 개의 다운 샘플링 특징 맵을 획득하고;

복수 개의 상기 다운 샘플링 특징 맵에서의 중간 스케일의 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 업 샘플링 특징 맵을 획득하며 - 상기 업 샘플링 특징 맵은 상기 초기 특징 맵과 스케일이 일치함 -;

상기 업 샘플링 특징 맵에 따라 헤드부 키포인트 인식을 수행하여, 상기 처리될 이미지에서의 헤드부 키포인트를 획득하기 위한 것이다.

하나의 가능한 구현 방식에 있어서, 상기 처리 모듈은 또한,

각각 복수 개의 상기 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여, 각 상기 다운 샘플링 특징 맵에 대응되는 헤드부 영역를 획득하고; 및

각 상기 다운 샘플링 특징 맵에 대응되는 헤드부 영역에 대해 병합 처리를 수행하여, 상기 처리될 이미지에 대응되는 헤드부 영역을 획득하기 위한 것이다.

하나의 가능한 구현방식에 있어서, 상기 특징 추출 모듈 및 상기 처리 모듈이 상기 위치 결정 네트워크를 통해 구현되고, 상기 대상 카운트 장치는,

기설정된 훈련 세트를 통해 상기 위치 결정 네트워크를 훈련하고, 상기 훈련 세트는 복수 개의 샘플 그룹을 포함 - 상기 샘플 그룹에는 샘플 이미지, 샘플 이미지에 대응되는 태그 헤드부 키포인트 및 태그 헤드부 영역을 포함함 -하기 위한 훈련 모듈을 포함한다.

하나의 가능한 구현 방식에 있어서, 상기 위치 결정 네트워크는 특징 추출 네트워크, 헤드부 키포인트 위치 결정 네트워크, 헤드부 영역 위치 결정 네트워크를 포함하고, 상기 훈련 모듈은 또한,

상기 특징 추출 네트워크를 통해 상기 샘플 이미지에 대해 특징 추출을 수행하여, 상기 샘플 이미지의 초기 특징 맵을 획득하고;

상기 샘플 이미지의 초기 특징 맵에 대해 다운 샘플링 처리를 수행하여, 상이한 사이즈의 복수 개의 샘플 다운 샘플링 특징 맵을 획득하며;

상기 헤드부 키포인트 위치 결정 네트워크를 통해 복수 개의 상기 샘플 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 샘플 업 샘플링 특징 맵을 획득하고 - 상기 샘플 업 샘플링 특징 맵은 상기 샘플 이미지의 초기 특징 맵과 사이즈가 일치함 -;

상기 헤드부 키포인트 위치 결정 네트워크를 통해 상기 샘플 업 샘플링 특징에 대해 헤드부 키포인트 인식을 수행하여, 상기 샘플 이미지에 대응되는 헤드부 키포인트를 획득하며; 및

상기 샘플 이미지에 대응되는 헤드부 키포인트 및 상기 태그 헤드부 키포인트에 따라, 상기 헤드부 키포인트 위치 결정 네트워크를 훈련하기 위한 것이다.

하나의 가능한 구현 방식에 있어서, 상기 훈련 모듈은 또한,

상기 헤드부 영역 위치 결정 네트워크를 통해 각각 복수 개의 상기 샘플 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여, 각 상기 샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역을 획득하고; 및

상기 샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역 및 상기 태그 헤드부 영역에 따라, 상기 헤드부 영역 위치 결정 네트워크를 훈련하기 위한 것이다.

하나의 가능한 구현 방식에 있어서, 상기 처리 모듈은 또한,

상기 처리될 이미지 중 각 헤드부 영역의 위치 정보를 결정하고;

각 상기 헤드부 영역의 위치 정보, 및 헤드부 영역의 사이즈와 상기 헤드부 영역의 위치 정보의 관련 관계에 따라, 상기 헤드부 영역의 사이즈를 결정하며; 및

상기 헤드부 영역의 위치 정보 및 상기 헤드부 영역의 사이즈에 따라, 상기 헤드부 영역을 획득하기 위한 것이다.

본 발명의 실시예는 전자 기기를 제공하고, 프로세서; 및 프로세서가 실행 가능한 명령어를 저장하기 위한 메모리를 포함하며; 여기서, 상기 프로세서는 상기 메모리에 저장된 명령어를 호출하여, 상기 방법을 실행하도록 구성된다.

본 발명 실시예는 컴퓨터 프로그램 명령어가 저장된 컴퓨터 판독 가능 저장 매체를 제공하고, 상기 컴퓨터 프로그램 명령어는 프로세서에 의해 실행될 때 상기 방법을 구현한다.

본 발명의 실시예는 컴퓨터 판독 가능한 코드를 포함하는 컴퓨터 프로그램을 제공하고, 컴퓨터 판독 가능한 코드가 컴퓨터에서 작동될 경우, 상기 컴퓨터가 전술한 어느 한 대상 카운트 방법을 구현하도록 한다.

이렇게 되면, 처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득할 수 있고, 상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득할 수 있으며, 상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정할 수 있다. 본 발명의 실시예에서 제공한 대상 카운트 방법, 장치, 전자 기기, 저장 매체 및 프로그램에 따라, 헤드부 키포인트 및 헤드부 영역을 이용하여 대상 카운트 및 위치 결정을 수행하고, 헤드부 키포인트 및 헤드부 영역의 상호 보충을 통해, 처리될 이미지 중 상이한 스케일의 헤드부가 상이한 식별자 형식을 구비하도록 할 수 있고, 대상 카운트 및 위치 결정의 정밀도를 향상할 수 있다.

이해해야 할 것은, 이상의 일반적인 설명 및 하기의 상세한 설명은 다만 예시적이고 해석적인 것이며, 본 발명을 한정하려는 것은 아니다. 아래에 첨부 도면에 따라 예시적 실시예를 상세하게 설명하므로, 본 발명의 다른 특징 및 측면이 더욱 명확해질 것이다.

본 명세서에 포함되고 본 명세서의 일부를 구성하는 도면은 본 발명과 일치하는 실시예를 도시하고, 본 명세서와 함께 본 발명의 기술방안을 설명하는데 사용된다.
도 1은 본 발명의 실시예에 따라 도시된 대상 카운트 방법의 흐름도이다.
도 2는 본 발명의 실시예에서 제공한 대상 카운트의 네트워크 아키텍처 예시도이다.
도 3은 본 발명의 실시예의 상이한 스케일의 다운 샘플링 특징 맵의 예시도이다.
도 4a 내지 4d는 본 발명의 실시예에서 대상 카운트 방법에 기반하여 처리될 이미지를 처리하는 각 단계의 예시도이다.
도 5는 본 발명의 실시예에 따른 대상 카운트 장치(500)의 블록도이다.
도 6은 본 발명의 실시예에 따른 전자 기기(600)의 블록도이다.
도 7은 본 발명의 실시예에 따른 전자 기기(700)의 블록도이다.

이하, 도면을 참조하여 본 발명의 다양한 예시적인 실시예, 특징 및 측면을 상세하게 설명한다. 도면에서 동일한 도면 부호는 동일하거나 유사한 기능을 갖는 요소를 표시한다. 실시예의 다양한 측면이 도면에 도시되어 있지만, 구체적으로 언급되지 않는 한, 도면은 반드시 비례대로 도시될 필요없다.

여기서 "예시적"이라는 특정한 단어는 "예, 실시예 또는 설명적인 것으로 사용됨"을 의미한다. 여기서 "예시적"으로 설명된 임의의 실시예는 다른 예보다 뛰어나거나 좋은 것으로 해석될 필요는 없다.

본문 중의 용어 “및/또는”은 다만 연관 대상의 연관 관계를 설명하기 위한 것이며, 세 가지 관계가 존재할 수 있음을 의미하는데, 예를 들어, “A 및/또는 B”는, A가 단독적으로 존재하거나, A와 B가 동시에 존재하거나, B가 단독적으로 존재하는 세 가지 경우를 의미한다. 또한, 본 문에서 용어 "적어도 하나"는 복수의 어느 하나 또는 복수의 둘 중 어느 하나의 조합을 의미하고, 예를 들어, A, B, C 중 적어도 하나를 포함하여, A, B 및 C로 구성된 조합에서 선택된 어느 하나 또는 복수 개의 요소를 나타낼 수 있다.

또한, 본 발명을 더 잘 설명하기 위해, 아래의 구체적인 실시형태에서 다수의 구체적인 세부 사항을 제공한다. 본 분야의 기술자는 일부 구체적인 세부 사항이 없이도, 본 발명이 마찬가지로 실시될 수 있음을 이해해야 한다. 일부 예에 있어서, 본 분야에게 널리 알려진 방법, 수단, 구성 요소 및 회로는 본 발명의 요지를 강조하기 위해, 상세히 설명되지 않는다.

도 1은 본 발명의 실시예에 따라 도시된 대상 카운트 방법의 흐름도이고, 한 가지 가능한 구현 방식에 있어서, 상기 대상 카운트 방법은 단말 기기에 의해 실행될 수 있고, 단말 기기는 사용자 기기(User Equipment, UE), 모바일 기기, 사용자 단말, 단말, 셀룰러 폰, 무선 전화, 개인용 정보 단말기(Personal Digital Assistant, PDA), 핸드 헬드 기기, 컴퓨팅 기기, 차량용 기기, 웨어러블 기기 등일 수 있으며, 상기 방법은 프로세서에 의해 메모리에 저장된 컴퓨터 판독 가능한 명령어가 호출되는 방식으로 구현될 수 있다. 또는, 서버를 통해 상기 방법을 실행할 수 있다.

도 1에 도시된 바와 같이, 상기 대상 카운트 방법은 단계 S11 내지 S13을 포함한다.

단계 S11에 있어서, 처리될 이미지에 대해 특징 추출을 수행하여, 처리될 이미지의 초기 특징 맵을 획득한다.

단계 S12에 있어서, 초기 특징 맵에 따라, 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득한다.

예를 들어, 처리될 이미지에서의 이미지 특징을 추출하여, 처리될 이미지의 초기 특징 맵을 획득할 수 있다. 초기 특징 맵에 대해 인식하여, 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하고, 여기서 헤드부 키포인트는 대상 헤드부에 대응되는 키포인트이고, 헤드부 영역은 대상의 헤드부에 대응되는 블록도이다.

예시적으로, 미리 훈련된 특징 추출 네트워크를 통해 처리될 이미지에 대해 특징 추출을 수행하여, 처리될 이미지의 초기 특징 맵을 획득하고, 미리 훈련된 위치 결정 네트워크를 통해 초기 특징 맵에 대해 인식하여, 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득할 수 있다.

단계 S13에 있어서, 헤드부 키포인트 및 헤드부 영역에 따라, 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 처리될 이미지 중 대상의 개수 및 위치를 결정한다.

도 2는 본 발명의 실시예에서 제공한 대상 카운트의 네트워크 아키텍처 예시도이이고; 도 2에 도시된 바와 같이, 상기 네트워크 아키텍처에는, 이미지 획득 단말(201), 네트워크(202) 및 대상 카운트 단말(203)을 포함한다. 하나의 예시적 응용의 지지를 구현하기 위해, 이미지 획득 단말(201) 및 대상 카운트 단말(203)은 네트워크(202)를 통해 통신 연결을 설정하고, 이미지 획득 단말(201)은 네트워크(202)를 통해 대상 카운트 단말(203)에 처리될 이미지를 보고하며, 대상 카운트 단말(203)은 수신된 처리될 이미지에 응답하고, 처리될 이미지에 대해 특징 추출을 수행하여, 처리될 이미지의 초기 특징 맵을 획득하며; 초기 특징 맵에 따라, 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하고; 헤드부 키포인트 및 헤드부 영역에 따라, 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 처리될 이미지 중 대상의 개수 및 위치를 결정한다. 마지막으로, 대상 카운트 단말(203)은 상기 대상의 개수 및 위치 정보를 네트워크(202)에 업로드하고, 네트워크(202)를 통해 이미지 획득 단말(201)에 송신한다.

예를 들어, 헤드부 키포인트 및 헤드부 영역을 결합하여, 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행할 수 있고, 예를 들어, 동일한 사람에 대응되는 헤드부 키포인트 및 헤드부 영역을 병합한 후, 병합 조작을 수행하지 않는 헤드부 키포인트 및 헤드부 영역과 함께, 처리될 이미지에 대해 카운트 및 위치 결정을 수행하여, 처리될 이미지 중 대상의 개수 및 위치를 획득한다.

이렇게 되면, 처리될 이미지에 대해 특징 추출을 수행하여, 처리될 이미지의 초기 특징 맵을 획득할 수 있고, 초기 특징 맵에 따라, 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득할 수 있으며, 헤드부 키포인트 및 헤드부 영역에 따라, 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 처리될 이미지 중 대상의 개수 및 위치를 결정할 수 있다. 본 발명의 실시예에서 제공한 대상 카운트 방법에 따라, 헤드부 키포인트 및 헤드부 영역을 이용하여 대상 카운트 및 위치 결정을 수행하고, 헤드부 키포인트 및 헤드부 영역의 상호 보충을 통해, 처리될 이미지 중 상이한 스케일의 헤드부가 상이한 식별자 형식을 구비하도록 할 수 있고, 대상 카운트 및 위치 결정의 정밀도를 향상할 수 있다.

하나의 가능한 구현 방식에 있어서, 헤드부 키포인트 및 상기 헤드부 영역에 따라, 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계는,

각 헤드부 키포인트와 각 헤드부 영역의 중심점 사이의 유사도를 결정하는 단계;

헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역과 헤드부 키포인트를 병합하여, 병합 정보를 획득하는 단계; 및

병합 정보, 병합하지 않은 헤드부 키포인트 및 병합하지 않은 헤드부 영역에 따라, 처리될 이미지에 대해 카운트 및 위치 결정을 수행하여, 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계를 포함한다.

예를 들어, 헤드부 영역은 중심점을 포함할 수 있고, 각 헤드부 영역의 중심점의 좌표와 각 헤드부 키포인트의 좌표 사이의 거리를 결정할 수 있으며, 상기 거리에 따라 헤드부 키포인트와 헤드부 영역의 중심점 사이의 유사도를 결정한다. 예시적으로, 처리될 이미지 중 헤드부 키포인트와 헤드부 영역의 중심점 사이의 유사도는 거리 및 처리될 이미지에서의 멀거나 가까운 정도와 관련되고, 먼 곳의 헤드부 키포인트와 헤드부 영역의 중심점의 거리 측정 유사도는 가까운 곳의 헤드부 키포인트와 헤드부 영역의 중심점의 거리 측정 유사도의 표준과 상이하므로, 측정 가중치와 각 헤드부 영역의 중심점의 좌표와 각 헤드부 키포인트의 좌표 사이의 거리를 통해, 헤드부 키포인트와 헤드부 영역의 중심점 사이의 유사도를 결정할 수 있으며, 여기서 측정 가중치는 헤드부 키포인트와 헤드부 영역이 처리될 이미지에서의 멀거나 가까운 정도를 표시하기 위한 것이다.

예시적으로, 헤드부 키포인트는 포인트 집합 P를 조성할 수 있고, 포인트 집합 P에서의 제a 개의 헤드부 키포인트는 (xa, ya)로 표시할 수 있으며, 여기서 (xa, ya)는 제a 개의 헤드부 키포인트의 좌표이다. 헤드부 영역은 영역 집합 B를 조성할 수 있고, 영역 집합 B에서의 제j 개의 헤드부 영역은 (xb, yb, wb, hb)로 표시할 수 있으며, 여기서 (xb, yb)는 제b 개의 헤드부 영역의 중심점의 좌표이고, (wb, hb)는 각각 제b 개의 헤드부 영역의 너비 및 높이이다. 포인트 집합 P에서의 임의의 하나의 헤드부 키포인트와 영역 집합 B에서의 임의의 하나의 헤드부 영역의 중심점의 유사도를 계산할 수 있다.

예를 들어, 헤드부 영역의 중심점과 헤드부 키포인트의 유사도가 유사도 임계 값(유사도 임계 값은 기설정된 값임)보다 클 경우, 상기 헤드부 영역의 중심점과 상기 헤드부 키포인트의 유사도가 임계 값 조건을 만족함을 결정할 수 있고, 즉 상기 헤드부 키포인트와 상기 헤드부 영역이 동일한 대상에 대응된다고 볼 수 있다. 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역과 헤드부 키포인트를 병합하여, 병합 정보를 획득하며, 예를 들어, 헤드부 키포인트 및 신뢰도가 비교적 낮은 헤드부 영역을 삭제하고, 신뢰도가 비교적 높은 헤드부 영역을 보류하며, 또는 전부 헤드부 영역을 삭제하고, 헤드부 키포인트를 보류한다.

병합을 완성한 후, 병합 정보에 따라, 병합하지 않은 헤드부 키포인트 (상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역이 존재하지 않거나, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역이 삭제 됨)및 병합하지 않은 헤드부 영역 (상기 헤드부 영역과의 유사도가 임계 값 조건을 만족하는 헤드부 키포인트가 존재하지 않거나, 상기 헤드부 영역과의 유사도가 임계 값 조건을 만족하는 헤드부 키포인트가 삭제 됨), 처리될 이미지에 대해 카운트 및 위치 결정을 수행할 수 있다. 예시적으로, 처리될 이미지 중 헤드부 키포인트 1, 헤드부 키포인트 2, 헤드부 키포인트 3, 헤드부 영역 1, 헤드부 영역 2, 헤드부 영역 3이 존재 되고, 여기서 헤드부 키포인트 2 및 헤드부 영역 1이 병합된 후, 헤드부 영역 1을 삭제하며, 즉 헤드부 키포인트 1, 헤드부 키포인트 2, 헤드부 키포인트 3, 헤드부 영역 2, 헤드부 영역 3에 따라 대상에 대해 카운트 및 위치 결정을 수행하여, 획득한 처리될 이미지에서의 대상의 개수는 5이고, 각 헤드부 키포인트 및 헤드부 영역의 위치가 즉 대응되는 대상의 위치이다.

하나의 가능한 구현 방식에 있어서, 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역과 헤드부 키포인트를 병합하여, 병합 정보를 획득하는 단계는,

헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 삭제하는 단계; 및

헤드부 키포인트 및 헤드부 영역의 사이즈에 따라, 병합 후의 헤드부 영역을 획득하고, 병합 정보가 헤드부 키포인트 및 병합 후의 헤드부 영역을 포함하는 단계를 포함한다.

예를 들어, 헤드부 영역의 중심점과 헤드부 키포인트의 유사도가 임계 값 조건을 만족할 경우, 헤드부 영역을 삭제하고, 헤드부 키포인트를 보류하여 병합 정보로 할 수 있다. 예를 들어, 헤드부 영역 1, 헤드부 영역 2, 헤드부 영역 3과 헤드부 키포인트 4의 유사도는 모두 임계 값 조건을 만족하고, 헤드부 영역1, 헤드부 영역 2, 헤드부 영역 3을 삭제하고, 헤드부 키포인트 4만을 보류하여 병합 정보로 할 수 있다.

헤드부 키포인트를 병합 후의 헤드부 영역 중심점으로 하고, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역 중, 신뢰도가 가장 높은 헤드부 영역의 사이즈를 병합 후의 헤드부 영역의 사이즈로 하여, 병합 후의 헤드부 영역을 획득할 수 있다.

헤드부 키포인트를 신뢰도에 따라 순서 배정을 수행하는 단계; 및

헤드부 키포인트의 신뢰도가 작아지는 순서에 따라, 헤드부 키포인트를 헤드부 영역과 병합하여, 상기 병합 정보를 획득하는 단계를 포함한다.

예를 들어, 헤드부 키포인트 및 헤드부 영역을 인식 할 경우, 대응되는 인식 결과는 헤드부 키포인트 및 헤드부 키포인트에 대응되는 신뢰도, 헤드부 영역 및 헤드부 영역에 대응되는 신뢰도를 포함할 수 있다. 헤드부 키포인트를 대응되는 신뢰도의 사이즈에 따라 순서 배정을 수행할 수 있고, 예를 들어 작아지는 순서로 배정하거나, 커지는 순서로 배정할 수 있다. 순서 배정 후, 헤드부 키포인트가 작아지는 순서에 따라, 헤드부 키포인트와 헤드부 영역을 병합하여, 병합 정보를 획득할 수 있다. 예시적으로, 헤드부 키포인트의 신뢰도가 작아지는 순서의 배정은, 헤드부 키포인트 1, 헤드부 키포인트 2, 헤드부 키포인트 3, 헤드부 키포인트 4이고, 여기서, 헤드부 영역 1과 헤드부 키포인트 1 및 헤드부 키포인트 4의 유사도가 모두 임계 값 조건을 만족할 경우, 먼저 헤드부 키포인트 1과 헤드부 영역 1에 대해 병합 조작을 수행하고, 헤드부 영역 1을 삭제하며, 헤드부 키포인트 1를 보류하였으므로, 헤드부 키포인트 4를 실행할 경우, 헤드부 영역 1과 헤드부 키포인트 4의 병합 조작을 더이상 실행하지 않으므로, 카운트 및 위치 결정의 정확성을 향상할 수 있다.

하나의 가능한 구현 방식에 있어서, 초기 특징 맵에 따라, 처리될 이미지에서의 헤드부 키포인트 를 획득하는 단계는,

초기 특징 맵에 대해 다운 샘플링 처리를 수행하여, 상이한 스케일의 복수 개의 다운 샘플링 특징 맵을 획득하는 단계;

복수 개의 다운 샘플링 특징 맵에서의 중간 스케일의 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 업 샘플링 특징 맵을 획득하는 단계 - 업 샘플링 특징 맵은 초기 특징 맵과 스케일이 일치함 -; 및

업 샘플링 특징 맵에 따라 헤드부 키포인트 인식을 수행하여, 처리될 이미지에서의 헤드부 키포인트를 획득하는 단계를 포함한다.

예를 들어, 최대 풀링 레이어(maxpooling)를 통해 끊임없이 초기 특징 맵에 대해 다운 샘플링 처리를 수행하여, 상이한 사이즈의 복수 개의 다운 샘플링 특징 맵을 획득하고; 예를 들어, 초기 특징 맵 C0에 대해 여러 번의 다운 샘플링 처리를 수행하여, 상이한 스케일의 다운 샘플링 특징 맵 C1, C2, C3, C4, C5, C6을 획득하고, 여기서, 제i 개의 다운 샘플링 특징 맵의 길이와 너비는 초기 특징 맵 C0의 길이와 너비의 1/2i이며, 즉 C1의 길이와 너비는 C0의 길이와 너비의 1/2이며, C2의 길이와 너비는 C0의 길이와 너비의 1/4이고, C3의 길이와 너비는 C0의 길이와 너비의 1/8이며, C4의 길이와 너비는 C0의 길이와 너비의 1/16이고, C5의 길이와 너비는 C0의 길이와 너비의 1/32이며, C6의 길이와 너비는 C0의 길이와 너비의 1/64이다. 예시적으로, 도 3을 참조하면, 본 발명의 실시예의 상이한 스케일의 다운 샘플링 특징 맵의 예시도이고; 여기서, 도 3에서의 301은 160, 80 및 40 세가지의 상이한 길이와 너비의 다운 샘플링 특징 맵를 제공하고, 도 3에서의 302는 20, 10 및 5 세가지의 상이한 길이와 너비의 다운 샘플링 특징 맵을 제공한다.

상기 복수 개의 다운 샘플링 특징 맵에서 중간 스케일의 다운 샘플링 특징 맵 C3을 선택하여 획득한 업 샘플링 특징 맵이 초기 특징 맵의 스케일과 일치할 때까지 끊임없이 업 샘플링 처리를 수행한다. 예를 들어, 다운 샘플링 특징 맵 C3에 대해 연속된 여러 번의 업 샘플링 처리를 수행하고, 스케일과 초기 특징 맵의 스케일이 일치할 때까지 매번마다 전번 처리의 결과의 스케일을 2배로 확대하여, 업 샘플링 특징 맵을 획득한다.

업 샘플링 특징 맵에 대해 헤드부 키포인트 인식을 수행하여(미리 훈련된 헤드부 키포인트 인식을 위한 네트워크를 사용하여 인식할 수 있음), 처리될 이미지에서의 헤드부 키포인트를 획득할 수 있다.

하나의 가능한 구현 방식에 있어서, 초기 특징 맵에 따라, 처리될 이미지에서의 헤드부 영역을 획득하는 단계는,

각각 복수 개의 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여, 각 다운 샘플링 특징 맵에 대응되는 헤드부 영역를 획득하는 단계; 및

각 다운 샘플링 특징 맵에 대응되는 헤드부 영역에 대해 병합 처리를 수행하여, 처리될 이미지에 대응되는 헤드부 영역을 획득하는 단계를 포함한다.

복수 개의 다운 샘플링 특징 맵을 획득한 후, 각각 복수 개의 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여 (미리 훈련된 헤드부 키포인트 인식을 위한 네트워크를 사용하여 인식할 수 있음), 각 다운 샘플링 특징 맵에 대응되는 헤드부 영역을 획득하고, 각 헤드부 영역을 병합 처리할 수 있다. 예시적으로, 헤드부 영역은 (xb, yb, wb, hb)로 표시할 수 있으므로, 각 헤드부 영역을 헤드부 영역 집합으로 병합하고, 동일한 헤드부 영역을 상기 헤드부 영역 집합에서 하나로 병합하며, 피복 중합도가 중합도 임계 값(기설정된 값)보다 큰 복수 개의 헤드부 영역을 병합하고, 여기서 신뢰도가 가장 높은 헤드부 영역을 보류하며, 상기 복수 개의 헤드부 영역 중 다른 헤드부 영역을 삭제한다.

하나의 가능한 구현 방식에 있어서, 네트워크를 위치 결정하는 것을 통해 처리될 이미지에 대한 특징 추출을 구현하여, 처리될 이미지의 초기 특징 맵을 획득하고; 초기 특징 맵에 따라, 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하는 단계는 또한,

기설정된 훈련 세트를 통해 위치 결정 네트워크를 훈련하고, 훈련 세트는 복수 개의 샘플 그룹을 포함하는 단계 - 샘플 그룹에는 샘플 이미지, 샘플 이미지에 대응되는 태그 헤드부 키포인트 및 태그 헤드부 영역을 포함함 - 를 포함한다.

예를 들어, 기설정된 훈련 세트를 통해 위치 결정 네트워크를 훈련할 수 있고, 상기 위치 결정 네트워크는 특징 추출 네트워크, 헤드부 키포인트 위치 결정 네트워크, 헤드부 영역 위치 결정 네트워크를 포함할 수 있으며, 즉 샘플 이미지 및 샘플 이미지에 대응되는 태그 헤드부 키포인트 현수 특징을 통해 네트워크 및 헤드부 키포인트 위치 결정 네트워크를 추출할 수 있고, 샘플 이미지 및 샘플 이미지에 대응되는 태그 헤드부 영역을 통해 헤드부 영역 위치 결정 네트워크를 훈련할 수 있다.

처리될 이미지가 위치 결정 네트워크를 입력한 후, 특징 추출 네트워크가 상기 처리될 이미지에 대해 특징 추출을 수행하여, 초기 특징 맵을 획득하고, 상기 샘플 이미지의 초기 특징 맵에 대해 여러 번의 다운 샘플링 처리를 수행하여, 대응되는 상이한 스케일의 다운 샘플링 특징 맵을 획득하며, 헤드부 키포인트 위치 결정 네트워크가 다운 샘플링 특징 맵에서의 중간 스케일의 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행한 후, 초기 특징 맵의 스케일과 일치한 업 샘플링 특징 맵을 획득하고, 상기 업 샘플링 특징 맵에 대해 인식하여, 처리될 이미지의 헤드부 키포인트를 획득한다. 헤드부 영역 위치 결정 네트워크는 각 다운 샘플링 특징 맵에 대해 인식하여, 각 다운 샘플링 특징 맵에 대응되는 헤드부 영역을 획득하고, 상기 복수 개의 헤드부 영역에 대해 병합하여, 처리될 이미지에서의 헤드부 영역을 획득하며, 마지막으로 헤드부 영역과 헤드부 키포인트를 병합하여, 처리될 이미지 중 대상의 개수 및 위치를 획득할 수 있고, 예시적으로, 도 4a 내지 4d를 참조하면, 본 발명의 실시예에서 대상 카운트 방법에 기반하여 처리될 이미지를 처리하는 각 단계의 예시도이며; 여기서, 도 4a는 처리될 이미지이고, 도 4b는 처리될 이미지의 초기 특징 맵이며, 도 4c는 초기 특징 맵에 따라 획득한 처리될 이미지에서의 헤드부 영역 및 키포인트의 생성 결과도이고, 도 4d는 처리될 이미지의 카운트 및 위치 결정 결과이고; 여기서, 도 4a에서의 401은 처리될 이미지의 테스트 대상이고, 도 4c에서의 402는 처리될 이미지 중 테스트 대상의 헤드부 키포인트 및 헤드부 영역을 표시하며, 도 4d에서의 403은 도4c 에서 402에 대응되는 테스트 대상의 위치 결정 정보이다.

하나의 가능한 구현 방식에 있어서, 위치 결정 네트워크는 특징 추출 네트워크, 헤드부 키포인트 위치 결정 네트워크, 헤드부 영역 위치 결정 네트워크를 포함하고, 기설정된 훈련 세트를 통해 위치 결정 네트워크를 훈련하는 단계는,

특징 추출 네트워크를 통해 샘플 이미지에 대해 특징 추출을 수행하여, 샘플 이미지의 초기 특징을 획득하는 단계;

샘플 이미지의 초기 특징에 대해 다운 샘플링 처리를 수행하여, 상이한 사이즈의 복수 개의 샘플 다운 샘플링 특징 맵을 획득하는 단계;

상기 헤드부 키포인트 위치 결정 네트워크를 통해 복수 개의 샘플 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 샘플 업 샘플링 특징 맵을 획득하는 단계 - 샘플 업 샘플링 특징 맵은 상기 샘플 이미지의 초기 특징 맵과 사이즈가 일치함 -;

헤드부 키포인트 위치 결정 네트워크를 통해 샘플 업 샘플링 특징에 대해 맵 헤드부 포인트 좌표 인식을 수행하여, 샘플 이미지에 대응되는 헤드부 포인트 좌표를 획득하는 단계; 및

샘플 이미지에 대응되는 헤드부 포인트 좌표 정보 및 태그 헤드부 키포인트에 따라, 헤드부 키포인트 위치 결정 네트워크를 훈련하는 단계를 포함한다.

예를 들어, 샘플 이미지를 위치 결정 네트워크에 입력한 후, 특징 추출 네트워크가 상기 샘플 이미지의 특징을 추출하여, 샘플 이미지에 대응되는 초기 특징 맵을 획득하고, 상기 샘플 이미지의 초기 특징 맵에 대해 여러 번의 다운 샘플링 처리를 수행하여, 대응되는 상이한 스케일의 다운 샘플링 특징 맵을 획득하며, 헤드부 키포인트 위치 결정 네트워크가 다운 샘플링 특징 맵에서의 복수 개의 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행한 후, 초기 특징 맵의 스케일과 일치한 업 샘플링 특징 맵을 획득하고, 상기 업 샘플링 특징 맵에 대해 인식하여, 샘플 이미지의 헤드부 키포인트를 획득한다. 샘플 이미지의 헤드부 키포인트 및 샘플 이미지에 대응되는 태그 헤드부 키포인트에 따라, 제1 인식 손실 (예를 들어, 제1 인식 손실을 결정하기 위해 2류 교차 엔트로피 손실 함수를 사용할 수 있으나 이에 한정되지 않음)을 결정하고, 제1 인식 손실이 훈련 요구 (예를 들어, 제1 인식 손실이 손실 임계 값보다 작고, 상기 손실 임계 값은 기설정된 값임)에 만족할 때까지 제1 인식 손실에 따라 특징 추출 네트워크 및 헤드부 키포인트 위치 결정 네트워크의 네트워크 파라미터를 조절한다.

하나의 가능한 구현 방식에 있어서, 기설정된 훈련 세트를 통해 위치 결정 네트워크를 훈련하는 단계는,

헤드부 영역 위치 결정 네트워크를 통해 각각 복수 개의 샘플 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여, 각 샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역을 획득하는 단계; 및

샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역 및 태그 헤드부 영역에 따라, 헤드부 영역 위치 결정 네트워크를 훈련하는 단계를 포함한다.

예를 들어, 상이한 스케일의 다운 샘플링 특징 맵을 획득한 후, 헤드부 영역 위치 결정 네트워크가 각각 다운 샘플링 특징 맵에 때해 인식하여, 각 다운 샘플링 특징 맵에 대응되는 헤드부 영역을 획득하고, 각 헤드부 영역에 때해 병합하여, 샘플 이미지에 대응되는 헤드부 영역을 획득한다. 샘플 이미지의 헤드부 영역 및 샘플 이미지에 대응되는 태그 헤드부 영역에 따라, 제2 인식 손실(예를 들어, 제2 인식 손실을 결정하기 위해 2류 교차 엔트로피 손실 함수와 smooth-L1 손실 함수를 사용할 수 있으나 이에 한정되지 않음)을 결정하고, 제2 인식 손실이 훈련 요구(예를 들어, 제2 인식 손실이 손실 임계 값보다 작고, 상기 손실 임계 값은 기설정된 값임)에 만족할 때까지 제2 인식 손실에 따라 헤드부 영역 위치 결정 네트워크의 네트워크 파라미터를 조절한다.

하나의 가능한 구현 방식에 있어서, 초기 특징 맵에 따라, 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하는 단계는,

처리될 이미지 중 각 헤드부 영역의 위치 정보를 결정하는 단계;

각 헤드부 영역의 위치 정보, 및 헤드부 영역의 사이즈와 헤드부 영역의 위치 정보의 관련 관계에 따라, 헤드부 영역의 사이즈를 결정하는 단계; 및

헤드부 영역의 위치 정보 및 헤드부 영역의 사이즈에 따라, 헤드부 영역을 획득하는 단계를 포함한다.

예를 들어, 샘플 이미지가 단지 태그 헤드부 키포인트를 구비할 경우, 상기 태그 헤드부 키포인트에 따라 상기 대상의 헤드부 영역의 사이즈를 결정할 수 있다. 헤드부 키포인트를 통해 군중 밀도도를 결정할 수 있고, 군중 밀도도에서 각 헤드부 영역에 포함된 밀도의 합이 1이며, K의 근접 위치의 밀도의 평균 값을 계산하여, 샘플 이미지 중 제i 개의 대상에 대응되는 위치의 밀도 d_i를 획득하고, 나아가 헤드부 영역의 사이즈를 획득한다. 예시적으로, 아래의 공식 (1) 및 공식 (2)를 통해 헤드부 영역의 사이즈를 결정할 수 있다.

공식 (1);

공식 (2);

여기서,

는 제i 개의 대상이 군중 밀도도에서의 밀도를 표식하기 위한 것이고, j는 제i 개의 대상의

개의 근접 중의 제j 개의 대상을 표식하기 위한 것이며,

는 제j 개의 대상의 밀도를 표식하기 위한 것이고,

는 제i 개의 대상의 헤드부 영역의 사이즈를 표식하기 위한 것이다.

각 샘플 이미지에 대응되는 헤드부 영역의 사이즈를 획득한 후, 샘플 이미지의 헤드부 키포인트를 헤드부 영역의 위치 정보로 하여, 통계 분석하여 샘플 이미지의 헤드부 영역 사이즈와 헤드부 영역의 위치 정보의 관련 관계를 얻을 수 있다.

미리 훈련된 처리될 이미지 중 각 헤드부 영역을 인식하기 위한 위치 정보의 네트워크를 통해, 처리될 이미지 중 각 헤드부 영역의 위치 정보를 인식하여, 나아가 헤드부 영역의 위치 정보와 헤드부 영역의 사이즈의 관련 관계에 따라, 헤드부 영역의 사이즈를 결정하고, 나아가 헤드부 영역의 위치 정보 및 헤드부 영역의 사이즈에 따라, 헤드부 영역을 획득한다.

이해할 수 있는 것은, 본 발명에서 언급된 상기 각 방법 실시예는, 원리 논리를 벗어나지 않는 조건 하에, 모두 서로 결합되어 결합후의 실시예를 구성할 수 있고, 편폭의 제한으로, 본 발명에서는 더이상 설명하지 않는다. 본 분야의 기술자는 구체적인 실시형태의 상기 방법에서, 각 단계의 구체적인 실행 순서는 그 기능 및 가능한 내부 논리에 의해 결정된다.

또한, 본 발명은 대상 카운트 장치, 전자 기기, 컴퓨터 판독 가능한 저장 매체, 프로그램을 더 제공하고, 상기 분배 장치, 전자 기기, 컴퓨터 판독 가능한 저장 매체, 프로그램은 모두 본 발명에서 제공한 어느 하나의 대상 카운트 방법을 구현하는데 사용될 수 있으며, 상응하는 기술방안 및 설명 및 참조 방법 부분의 상응하는 기재는, 여기서 더이상 반복하여 설명하지 않는다.

도 5는 본 발명의 실시예에 따른 대상 카운트 장치(500)의 블록도이고, 도 5에 도시된 바와 같이, 상기 장치(500)는,

처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득하기 위한 특징 추출 모듈(501);

상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하기 위한 처리 모듈(502); 및

상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하기 위한 카운트 모듈(503)을 포함한다.

이렇게 되면, 처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득할 수 있고, 상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득할 수 있으며, 상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정할 수 있다. 본 발명의 실시예에서 제공한 대상 카운트 장치에 따라, 헤드부 키포인트 및 헤드부 영역을 이용하여 대상 카운트 및 위치 결정을 수행하고, 헤드부 키포인트 및 헤드부 영역의 상호 보충을 통해, 처리될 이미지 중 상이한 스케일의 헤드부가 상이한 식별자 형식을 구비하도록 할 수 있고, 대상 카운트 및 위치 결정의 정밀도를 향상할 수 있다.

하나의 가능한 구현 방식에 있어서, 상기 카운트 모듈(503)은 또한,

각 상기 헤드부 키포인트와 각 상기 헤드부 영역의 중심점 사이의 유사도를 결정하고

상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 상기 헤드부 키포인트와 병합하여, 병합 정보를 획득하며 및

상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 삭제하고 및

상기 헤드부 키포인트를 신뢰도에 따라 순서 배정을 수행하고 및

하나의 가능한 구현 방식에 있어서, 상기 처리 모듈(502)은 또한,

복수 개의 상기 다운 샘플링 특징 맵에서의 중간 스케일의 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 업 샘플링 특징 맵을 획득하며 - 상기 업 샘플링 특징 맵은 상기 초기 특징 맵과 스케일이 일치함 - ; 및

하나의 가능한 구현방식에 있어서, 상기 특징 추출 모듈(501) 및 상기 처리 모듈(502)이 상기 위치 결정 네트워크를 통해 구현되고, 상기 대상 카운트 장치(500)는,

기설정된 훈련 세트를 통해 상기 위치 결정 네트워크를 훈련하고, 상기 훈련 세트는 복수 개의 샘플 그룹을 포함 - 상기 샘플 그룹에는 샘플 이미지, 샘플 이미지에 대응되는 태그 헤드부 키포인트 및 태그 헤드부 영역을 포함함 -하기 위한 훈련 모듈(504)을 포함한다.

하나의 가능한 구현 방식에 있어서, 상기 위치 결정 네트워크는 특징 추출 네트워크, 헤드부 키포인트 위치 결정 네트워크, 헤드부 영역 위치 결정 네트워크를 포함하고, 상기 훈련 모듈(504)은 또한,

하나의 가능한 구현 방식에 있어서, 상기 훈련 모듈(504)은 또한,

각 상기 헤드부 영역의 위치 정보, 및 헤드부 영역의 사이즈와 상기 헤드부 영역의 위치 정보의 관련 관계에 따라, 상기 헤드부 영역의 사이즈를 결정하며 및

일부 실시예에 있어서, 본 발명의 실시예에서 제공한 대상 카운트 장치(500)가 갖고 있는 기능 또는 포함하는 모듈은 전술한 방법 실시예에서 설명한 방법을 실행하는데 사용될 수 있고, 그 구체적인 구현은 전술한 방법 실시예의 설명을 참조할 수 있으며, 간결함을 위해, 여기서 더이상 반복하여 설명하지 않는다.

본 발명 실시예는 또한 컴퓨터 프로그램 명령어가 저장된 컴퓨터 판독 가능 저장 매체를 제공하며, 상기 컴퓨터 프로그램 명령어는 프로세서에 의해 실행될 때 상기 방법을 구현한다. 컴퓨터 판독 가능 저장 매체는 비휘발성 컴퓨터 판독 가능 저장 매체일 수 있다.

본 발명의 실시예는 또한 전자 기기를 제공하고, 프로세서; 및 프로세서가 실행 가능한 명령어를 저장하기 위한 메모리를 포함하며; 여기서, 상기 프로세서는 상기 메모리에 저장된 명령어를 호출하여, 상기 방법을 실행하도록 구성된다.

본 발명의 실시예는 또한 컴퓨터 판독 가능한 코드를 포함하는 컴퓨터 프로그램 제품을 제공하고, 컴퓨터 판독 가능한 코드가 기기에서 작동될 경우, 기기에서의 프로세서는 전술한 어느 한 실시예에서 제공한 대상 카운트 방법을 구현하기 위한 명령어를 실행한다.

본 발명의 실시예는 또한 컴퓨터 판독 가능한 코드를 저장하기 위한 다른 컴퓨터 프로그램 제품을 제공하고, 컴퓨터 판독 가능한 코드가 전자 기기에서 작동될 경우, 전자 기기의 프로세서는 전술한 어느 한 실시예에서 제공한 대상 기술 방법을 구현한다.

전자 기기는 단말, 서버 또는 다른 형태의 기기로 제공될 수 있다.

도 6은 본 발명의 실시예에 따른 전자 기기(600)의 블록도이다. 예를 들어, 전자 기기(600)는 휴대폰, 컴퓨터, 디지털 방송 단말, 메시징 기기, 게임 콘솔, 태블릿 기기, 의료 기기, 피트니스 기기, 개인 휴대용 단말 등 단말일 수 있다.

도 6를 참조하면, 전자 기기(600)는 처리 컴포넌트(602), 메모리(604), 전원 컴포넌트(606), 멀티미디어 컴포넌트(608), 오디오 컴포넌트(610), 입력/출력(Input/Output，I/O) 인터페이스(612), 센서 컴포넌트(614) 및 통신 컴포넌트(616) 중 하나 또는 복수 개의 컴포넌트를 포함할 수 있다.

처리 컴포넌트(602)는 일반적으로 디스플레이, 전화 통화, 데이터 통신, 카메라 동작 및 기록 동작과 관련된 동작과 같은 전자 기기(600)의 전체적인 동작을 제어한다. 처리 컴포넌트(602)는 상기 방법 단계의 전부 또는 일부를 구현하기 위한 명령어를 실행하기 위한 하나 또는 복수 개의 프로세서(620)를 포함할 수 있다. 또한, 처리 컴포넌트(602)는 처리 컴포넌트(602) 및 다른 컴포넌트 사이의 인터랙션을 용이하게 하기 위한 하나 또는 복수 개의 모듈을 포함할 수 있다. 예를 들어, 처리 컴포넌트(602)는 멀티미디어 컴포넌트(608) 및 처리 컴포넌트(602) 사이의 인터랙션을 용이하게 하기 위한 멀티미디어 모듈을 포함할 수 있다.

메모리(604)는 전자 기기(600)의 동작을 지원하기 위해 다양한 타입의 데이터를 저장하도록 구성된다. 이러한 데이터의 예는 전자 기기(600)에서 동작하는 임의의 애플리케이션 프로그램 또는 방법의 명령어, 연락인 데이터, 전화번호부 데이터, 메시지, 사진, 비디오 등을 포함한다. 메모리(604)는, 정적 랜덤 액세스 메모리(Static Random-Access Memory, SRAM), 전기적 소거 가능한 프로그래머블 판독 전용 메모리(Electrically Erasable Programmable Read Only Memory, EEPROM), 소거 가능한 프로그래머블 판독 전용 메모리(Electrical Programmable Read Only Memory, EPROM), 프로그래머블 판독 전용 메모리(Programmable Read-Only Memory, PROM), 판독 전용 메모리(Read-Only Memory, ROM), 자기 메모리, 플래쉬 메모리, 자기 디스크 또는 광 디스크와 같은 임의의 타입의 휘발성 또는 비휘발성 저장 기기 또는 이들의 조합에 의해 구현될 수 있다.

전원 컴포넌트(606)는 전자 기기(600)의 다양한 컴포넌트에 전력을 공급한다. 전원 컴포넌트(606)는 전력 관리 시스템, 하나 또는 복수 개의 전력 및 전자 기기(600)를 위해 전력을 생성, 관리 및 분배하는 것과 관련된 다른 컴포넌트를 포함할 수 있다.

멀티미디어 컴포넌트(608)는 상기 전자 기기(600) 및 사용자 사이의 하나의 출력 인터페이스를 제공하는 스크린을 포함한다. 일부 실시에에 있어서, 스크린은 액정 디스플레이(Liquid Crystal Display，LCD) 및 터치 패널(Touch Panel，TP)을 포함할 수 있다. 스크린이 터치 패널을 포함하는 경우, 사용자로부터의 입력 신호를 수신하기 위해 스크린은 터치 스크린으로서 구현될 수 있다. 터치 패널은 터치, 슬라이드 및 터치 패널 상의 제스처를 감지하기 위한 하나 또는 복수 개의 터치 센서를 포함한다. 상기 터치 센서는 터치 또는 슬라이드 동작의 경계를 감지할 수 있을 뿐만 아니라, 상기 터치나 슬라이드 동작과 관련된 지속 시간 및 압력을 검출할 수도 있다. 일부 실시에에 있어서, 멀티미디어 컴포넌트(608)는 하나의 전방 카메라 및 하나의 후방 카메라 중 적어도 하나를 포함한다. 전자 기기(600)가 촬영 모드 또는 비디오 모드와 같은 동작 모드인 경우, 전방 카메라 및 후방 카메라 중 적어도 하나는 외부의 멀티미디어 데이터를 수신할 수 있다. 전방 카메라 및 후방 카메라는 각각 하나의 고정된 광학 렌즈 시스템이거나 초점 거리 및 광학 줌 기능을 가질 수 있다.

오디오 컴포넌트(610)는 오디오 신호를 출력 및/또는 입력하도록 구성된다. 예를 들어, 오디오 컴포넌트(610)는 하나의 마이크(Microphone，MIC)를 포함하고, 전자 기기(600)가 통화 모드, 녹음 모드 및 음성 인식과 같은 동작 모드에 있을 때 외부 오디오 신호를 수신하도록 구성된다. 수신된 오디오 신호는 메모리(604)에 추가로 저장되거나 통신 컴포넌트(616)에 의해 송신될 수 있다. 일부 실시에에 있어서, 오디오 컴포넌트(610)는 오디오 신호를 출력하기 위한 스피커를 더 포함한다.

I/ O 인터페이스(612)는 처리 컴포넌트(602)와 외부 인터페이스 모듈 사이에서 인터페이스를 제공하고, 상기 외부 인터페이스 모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈 버튼, 볼륨 버튼, 시작 버튼 및 잠금 버튼을 포함할 수 있지만 이에 한정되지 않는다.

센서 컴포넌트(614)는 전자 기기(600)에 대해 다양한 측면의 상태 평가를 제공하기 위한 하나 또는 복수 개의 센서를 포함한다. 예를 들어, 센서 컴포넌트(614)는 전자 기기(600)의 온/오프 상태, 상기 컴포넌트가 전자 기기(600)에 대한 디스플레이 및 키패드와 같은 컴포넌트의 상대적 위치를 검출할 수 있으며, 센서 컴포넌트(614)는 또한, 전자 기기(600) 또는 전자 기기(600)의 하나의 컴포넌트의 위치 변화, 사용자가 전자 기기(600)와의 접촉의 존재 또는 부재, 전자 기기(600) 방향 또는 가속/감속 및 전자 기기(600)의 온도 변화를 검출할 수 있다. 센서 컴포넌트(614)는 그 어떤 물리적 접촉이 없이 근처의 물체의 존재를 검출하도록 구성된 근접 센서를 포함할 수 있다. 센서 컴포넌트(614)는 상보성 금속 산화막 반도체(Complementary Metal-Oxide Semiconductor, CMOS) 또는 전하 결합 소자(Charge Coupled Device, CCD) 이미지 센서와 같은 광센서를 더 포함할 수 있고, 이미징 애플리케이션에 사용되기 위한 것이다. 일부 실시에에 있어서, 상기 센서 컴포넌트(614)는 가속도 센서, 자이로스코프 센서, 자기 센서, 압력 센서 또는 온도 센서를 더 포함할 수 있다.

통신 컴포넌트(616)는 전자 기기(600) 및 다른 기기 사이의 유선 또는 무선 방식의 통신이 용이하도록 구성된다. 전자 기기(600)는 WiFi, 2G 또는 3G 또는 이들의 조합과 같은 통신 기준에 기반한 무선 인터넷에 액세스할 수 있다. 일 예시적 실시예에서, 통신 컴포넌트(616)는 방송 채널을 통해 외부 방송 관리 시스템으로부터의 방송 신호 또는 방송 관련 정보를 수신한다. 하나의 예시적 실시예에 있어서, 상기 통신 부재(816)는 근거리 통신을 추진하는 근거리 무선 통신(Near Field Communication, NFC) 모듈을 더 포함한다. 예를 들어, NFC 모듈은 무선 주파수 식별자(Radio Frequency Identification, RFID) 기술, 적외선 통신 규격(Infrared Data Association, IrDA) 기술, 초광대역(Ultra Wide Band, UWB) 기술, 블루투스(Blue Tooth, BT) 기술 및 다른 기술에 기반하여 구현될 수 있다.

예시적 실시예에 있어서, 전자 기기(600)는 하나 또는 복수 개의 주문형 집적 회로(Application Specific Integrated Circuit，ASIC), 디지털 신호 프로세서(Digital Signal Processing，DSP), 디지털 신호 처리 장치(Digital Signal Processor Device，DSPD), 프로그래머블 논리 장치(Programmable Logic Device，PLD), 필드 프로그래머블 게이트 어레이(Field-Programmable Gate Array，FPGA), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 다른 전자 부품에 의해 구현되며, 전자 기기(600)는 상기 이미지 클러스터링 방법을 실행하기 위한 것이다.

예시적 실시예에 있어서, 컴퓨터 프로그램 명령어를 포함하는 메모리(604)와 같은 비휘발성 컴퓨터 판독 가능한 저장 매체를 제공하며, 상기 컴퓨터 프로그램 명령어는 상기 방법을 완료하도록 전자 기기(600)의 프로세서(620)에 의해 실행된다.

도 7은 본 발명의 실시예에 따른 전자 기기(700)의 블록도이다. 예를 들어, 전자 기기(700)는 하나의 서버로 제공될 수 있다. 도 7을 참조하면, 전자 기기(700)는 하나 또는 복수 개의 프로세서를 더 포함하는 처리 컴포넌트(722), 및 처리 컴포넌트(722)에 의해 실행되는 명령어를 저장하기 위한 메모리(732)로 대표되는 메모리 자원을 포함한다. 메모리(732)에 저장된 애플리케이션은 하나 또는 하나 이상의 한 세트의 명령어에 각각 대응되는 모듈을 포함할 수 있다. 또한, 처리 컴포넌트(722)는 상기 방법을 실행하기 위해 명령어를 실행하도록 구성된다.

전자 기기(700)는 전자 기기(700)의 전원 관리를 실행하도록 구성된 하나의 전원 컴포넌트(726), 전자 기기(700)를 네트워크에 연결하도록 구성된 하나의 유선 또는 무선 네트워크 인터페이스(750) 및 하나의 입력 출력(I/O) 인터페이스(758)를 더 포함할 수 있다. 전자 기기(700)는 예를 들어 Windows ServerTM, Mac OS XTM, UnixTM, LinuxTM, FreeBSDTM 또는 유사한 것 등과 같은 메모리(732)에 저장된 것에 기반한 운영 시스템을 조작할 수 있다.

예시적 실시예에 있어서, 컴퓨터 프로그램 명령어를 포함하는 메모리(732)와 같은 비휘발성 컴퓨터 판독 가능한 저장 매체를 제공하며, 상기 컴퓨터 프로그램 명령어는 상기 방법을 완료하도록 전자 기기(700)의 처리 컴포넌트(722)에 의해 실행된다.

본 발명은 시스템, 방법 및 컴퓨터 프로그램 제품 중 적어도 하나일 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독 가능한 저장 매체를 포함할 수 있고, 컴퓨터 판독 가능한 저장 매체에는 프로세서가 본 발명의 각 측면을 구현하도록 하는 컴퓨터 판독 가능한 프로그램 명령어가 존재한다.

컴퓨터 판독 가능한 저장 매체는 명령어 실행 기기에 의해 사용되는 명령어를 유지 및 저장할 수 있는 형태가 존재하는 기기일 수 있다. 컴퓨터 판독 가능한 저장 매체는 예를 들어 축전 기기, 자기 저장 기기, 광 저장 기기, 전자기 저장 기기, 반도체 저장 기기 또는 전술한 축전 기기, 자기 저장 기기, 광 저장 기기, 전자기 저장 기기, 반도체 저장 기기의 임의의 적절한 조합일 수 있지만 이에 한정되지 않는다. 컴퓨터 판독 가능 저장 매체의 보다 구체적인 예(수없이 많은 리스트)는, 휴대용 컴퓨터 디스켓, 하드 디스크, 랜덤 액세스 메모리(Random Access Memory, RAM), ROM、EPROM 또는 플래시 메모리, SRAM, 컴팩트 디스크 판독 전용 메모리(Compact Disk Read-Only Memory, CD-ROM), 디지털 다기능 디스크(Digital Versatile Disc, DVD), 메모리 스틱, 플로피 디스크, 명령어가 저장된 펀치 카드 또는 그루브의 융기 구조와 같은 기계적으로 인코딩된 기기, 및 상기 임의의 적절한 조합을 포함한다. 본문에서 사용된 컴퓨터 판독 가능 저장 매체는 전파 또는 다른 자유 전파 전자기파, 도파관 또는 다른 전송 매체를 통해 전파되는 전자기파(예를 들어, 광섬유 케이블을 통과하는 광 펄스), 또는 전선을 통해 전송되는 전자 신호와 같은 일시적인 신호로 해석되어서는 안된다.

본문에서 설명된 컴퓨터 판독 가능프로그램 명령어는 컴퓨터 판독 가능 저장 매체로부터 각각의 컴퓨팅/처리 기기로 다운로드 될 수 있거나, 인터넷, 근거리 통신망(LAN), 광역 통신망(WAN) 및 무선 네트워크 중 적어도 하나와 같은 네트워크를 통해, 외부 컴퓨터 또는 외부 저장 기기로 다운로드될 수 있다. 네트워크는 구리 전송 케이블, 광 섬유 전송, 무선 전송, 라우터, 방화벽, 스위치, 게이트웨이 컴퓨터 및 에지 서버 중 적어도 하나를 포함할 수있다. 각 계산/처리 기기 기기 중의 네트워크 어댑터 카드 또는 네트워크 인터페이스는 네트워크로부터 컴퓨터 판독 가능 프로그램 명령어를 수신하고, 각 계산/처리 기기 중의 컴퓨터 판독 가능 저장 매체에 저장하기 위한 상기 컴퓨터 판독 가능 프로그램 명령어를 전달한다.

본 발명의 동작을 실행하기 위한 컴퓨터 프로그램 명령어는 어셈블리 명령어, 명령어 세트 아키텍처(Instruction Set Architecture, ISA) 명령어, 머신 명령어, 머신 관련 명령어, 마이크로 코드, 펌웨어 명령어, 상태 설정 데이터, 또는 하나 또는 하나 이상의 프로그래밍 언어의 임의의 조합으로 작성된 소스 코드 또는 객체 코드일 수 있고, 상기 프로그래밍 언어에는 스몰 토크, C++ 등과 같은 객체 지향 프로그래밍 언어 및 "C" 언어 또는 유사한 프로그래밍 언어와 같은 기존 프로그래밍 언어가 포함된다. 컴퓨터 판독 가능한 프로그램 명령어는 사용자 컴퓨터에서 완전히 또는 부분적으로 실행될수 있고, 독립형 소프트웨어 패키지로 실행되며, 부분적으로 사용자 컴퓨터에서, 부분적으로 원격 컴퓨터에서 또는 완전히 원격 컴퓨터 또는 서버에서 실행될 수 있다. 원격 컴퓨터와 관련된 상황에서 원격 컴퓨터는 근거리 통신망(Local Area Network, LAN) 또는 광대역 통신망(Wide Area Network, WAN)을 포함하는 모든 타입의 네트워크를 통해 사용자 컴퓨터에 연결되거나 외부 컴퓨터에 연결(예를 들어 인터넷 서비스 제공 업체를 사용하여 인터넷을 통해 연결)될 수 있다. 일부 실시에에 있어서, 컴퓨터 판독 가능 프로그램 명령어의 상태 정보를 이용하여 프로그램 가능 논리 회로, FPGA 또는 프로그램 가능 논리 어레이(Programmable Logic Array, PLA)와 같은 전자 회로를 맞춤 제작함으로써, 상기 전자 회로는 컴퓨터 판독 가능 프로그램 명령어를 실행할 수 있으므로, 본 발명의 각 측면을 구현한다.

본 발명은 본 발명의 실시예의 방법, 기기(시스템), 및 컴퓨터 프로그램 제품에 따른 흐름도 및 블록도 중 적어도 하나를 참조하여 설명된다. 이해해야 할 것은, 흐름도 및/또는 블록도의 각 블록 및 흐름도 및/또는 블록도의 각 블록의 조합은, 모두 컴퓨터 판독 가능 프로그램 명령어에 의해 구현될 수 있다.

이러한 컴퓨터 판독 가능한 프로그램 명령어는 범용 컴퓨터, 특수 목적 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세서에 제공 될 수 있음으로써, 이에 의해 이러한 명령어가 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세서에 의해 실행되도록 하는 기계가 생성되고, 흐름도 및 블록도 중 적어도 하나에서 하나 또는 복수 개의 블록에 지정된 기능/동작을 구현하는 장치가 생성된다. 이러한 컴퓨터 판독 가능한 프로그램 명령어를 컴퓨터 판독 가능한 저장 매체에 저장할 수도 있으며, 이러한 명령어는 컴퓨터, 프로그램 가능한 데이터 처리 장치 및 다른 기기가 특정한 방식으로 작동될 수 있도록 함으로써, 명령어가 저장되어 있는 컴퓨터 판독 가능한 매체는 제조품을 포함하며, 상기 제조품은 흐름도 및 블록도 중 적어도 하나에서 하나 또는 복수 개의 블록에 지정된 기능/동작을 구현하는 명령어를 포함한다.

컴퓨터 판독 가능한 프로그램 명령어는 또한 컴퓨터, 다른 프로그램 가능한 데이터 처리 장치 또는 다른 기기에 로딩될 수 있어, 컴퓨터로 구현되는 과정을 생성하기 위해, 일련의 동작 단계가 컴퓨터, 다른 프로그램 가능한 데이터 처리 장치 또는 다른 기기에서 수행되도록 함으로써, 컴퓨터, 다른 프로그램 가능한 데이터 처리 장치 또는 다른 기기에서 실행되는 명령어는 흐름도 및 블록도 중 적어도 하나에서 하나 또는 복수 개의 블록에 지정된 기능/동작을 구현한다.

도면의 흐름도 및 블록도는 본 발명의 다양한 실시예에 따른 시스템, 방법 및 컴퓨터 프로그램 제품의 구현 가능한 체계 아키텍처, 기능 및 동작을 디스플레이한다. 이와 관련하여, 흐름도 또는 블록도의 각 블록은 모듈, 프로그램 세그먼트 또는 명령어의 일부를 나타낼 수 있고, 상기 모듈, 프로그램 세그먼트 또는 명령어의 일부는 하나 또는 복수 개의 지정된 논리적 기능을 구현하기 위한 실행 가능한 명령어를 포함한다. 일부 대안적인 구현에서, 블록에 표시된 기능은 도면에 표시된 것과 다른 순서로 발생될 수도 있다. 예를 들어, 두 개의 연속적인 블록은 실제로 병렬로 실행될 수 있으며, 때로는 관련 기능에 따라 역순으로 실행될 수도 있으며, 이는 관련된 기능에 의해 결정된다. 또한 유의해야 할 것은, 블록도 및 흐름도 중 적어도 하나의 각 블록, 및 블록도 및 흐름도 중 적어도 하나의 블록의 조합은, 규정된 기능 또는 동작을 실행하는 전용 하드웨어 기반 시스템에 의해 구현될 수 있으며, 또는 전용 하드웨어와 컴퓨터 명령어의 조합으로 구현될 수 있다.

상기 컴퓨터 프로그램 제품은 구체적으로 하드웨어, 소프트웨어 또는 이들의 조합을 통해 구현될 수 있다. 하나의 선택 가능한 실시예에 있어서,상기 컴퓨터 프로그램 제품은 구체적으로 컴퓨터 저장 매체로 구현되며, 다른 하나의 선택적인 예에서, 상기 컴퓨터 프로그램 제품은 구체적으로 소프트웨어 개발 키트(Software Development Kit, SDK) 등과 같은 소프트웨어 제품으로 구현된다.

이상 본 발명의 각 실시예를 설명하였고, 상기 설명은 예시적이고, 비철저하며, 개시된 각 실시예에 한정되지도 않는다. 설명된 각 실시예의 범위 및 사상을 벗어나지 않는 한, 많은 수정 및 변경은 본 기술분야의 통상의 기술자에게는 명백한 것이다. 본 명세서에서 사용된 용어의 선택은 각 실시예의 원리, 실제 응용 또는 시장에서의 기술에 대한 개선을 가장 잘 해석하거나, 당업자가 본 명세서에 개시된 각 실시예를 이해할 수 있도록 의도된다.

[산업상 이용 가능성]

본 발명은 대상 카운트 방법, 장치, 전자 기기, 저장 매체 및 프로그램을 제공하고 여기서, 처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득하고 상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하며 및 상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정한다.

Claims

대상 카운트 방법으로서,
처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득하는 단계;
상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하는 단계; 및
상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제1항에 있어서,
상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계는,
각 상기 헤드부 키포인트와 각 상기 헤드부 영역의 중심점 사이의 유사도를 결정하는 단계;
상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 상기 헤드부 키포인트와 병합하여, 병합 정보를 획득하는 단계; 및
상기 병합 정보, 병합하지 않은 헤드부 키포인트 및 병합하지 않은 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제2항에 있어서,
상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 상기 헤드부 키포인트와 병합하여, 병합 정보를 획득하는 단계는,
상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 삭제하는 단계; 및
상기 헤드부 키포인트 및 상기 헤드부 영역의 사이즈에 따라, 병합 후의 헤드부 영역을 획득하고, 상기 병합 정보가 상기 헤드부 키포인트 및 상기 병합 후의 헤드부 영역을 포함하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제3항에 있어서,
상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 결정하고, 상기 헤드부 키포인트와의 유사도가 임계 값 조건을 만족하는 헤드부 영역을 상기 헤드부 키포인트와 병합하여, 병합 정보를 획득하는 단계는,
상기 헤드부 키포인트를 신뢰도에 따라 순서 배정을 수행하는 단계; 및
상기 헤드부 키포인트의 신뢰도가 작아지는 순서에 따라, 상기 헤드부 키포인트를 상기 헤드부 영역과 병합하여, 상기 병합 정보를 획득하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트를 획득하는 단계는,
상기 초기 특징 맵에 대해 다운 샘플링 처리를 수행하여, 상이한 스케일의 복수 개의 다운 샘플링 특징 맵을 획득하는 단계;
복수 개의 상기 다운 샘플링 특징 맵에서의 중간 스케일의 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 업 샘플링 특징 맵을 획득하는 단계 - 상기 업 샘플링 특징 맵은 상기 초기 특징 맵과 스케일이 일치함 -; 및
상기 업 샘플링 특징 맵에 따라 헤드부 키포인트 인식을 수행하여, 상기 처리될 이미지에서의 헤드부 키포인트를 획득하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제5항에 있어서,
상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 영역을 획득하는 단계는 또한,
각각 복수 개의 상기 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여, 각 상기 다운 샘플링 특징 맵에 대응되는 헤드부 영역를 획득하는 단계; 및
각 상기 다운 샘플링 특징 맵에 대응되는 헤드부 영역에 대해 병합 처리를 수행하여, 상기 처리될 이미지에 대응되는 헤드부 영역을 획득하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제1항 내지 제6항 중 어느 한 항에 있어서,
네트워크를 위치 결정하는 것을 통해 상기 처리될 이미지에 대한 특징 추출을 구현하여, 상기 처리될 이미지의 초기 특징 맵을 획득하고; 상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하며,
대상 카운트 방법은 또한,
기설정된 훈련 세트를 통해 상기 위치 결정 네트워크를 훈련하고, 상기 훈련 세트는 복수 개의 샘플 그룹을 포함하는 단계 - 상기 샘플 그룹에는 샘플 이미지, 샘플 이미지에 대응되는 태그 헤드부 키포인트 및 태그 헤드부 영역을 포함함 - 를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제7항에 있어서,
상기 위치 결정 네트워크는 특징 추출 네트워크, 헤드부 키포인트 위치 결정 네트워크, 헤드부 영역 위치 결정 네트워크를 포함하고, 상기 기설정된 훈련 세트를 통해 상기 위치 결정 네트워크를 훈련하는 단계는,
상기 특징 추출 네트워크를 통해 상기 샘플 이미지에 대해 특징 추출을 수행하여, 상기 샘플 이미지의 초기 특징 맵을 획득하는 단계;
상기 샘플 이미지의 초기 특징 맵에 대해 다운 샘플링 처리를 수행하여, 상이한 사이즈의 복수 개의 샘플 다운 샘플링 특징 맵을 획득하는 단계;
상기 헤드부 키포인트 위치 결정 네트워크를 통해 복수 개의 상기 샘플 다운 샘플링 특징 맵에 대해 업 샘플링 처리를 수행하여, 샘플 업 샘플링 특징 맵을 획득하는 단계 - 상기 샘플 업 샘플링 특징 맵은 상기 샘플 이미지의 초기 특징 맵과 사이즈가 일치함 -;
상기 헤드부 키포인트 위치 결정 네트워크를 통해 상기 샘플 업 샘플링 특징에 대해 헤드부 키포인트 인식을 수행하여, 상기 샘플 이미지에 대응되는 헤드부 키포인트를 획득하는 단계; 및
상기 샘플 이미지에 대응되는 헤드부 키포인트 및 상기 태그 헤드부 키포인트에 따라, 상기 헤드부 키포인트 위치 결정 네트워크를 훈련하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제8항에 있어서,
상기 기설정된 훈련 세트를 통해 상기 위치 결정 네트워크를 훈련하는 단계는 또한,
상기 헤드부 영역 위치 결정 네트워크를 통해 각각 복수 개의 상기 샘플 다운 샘플링 특징 맵에 대해 헤드부 영역 인식을 수행하여, 각 상기 샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역을 획득하는 단계; 및
상기 샘플 다운 샘플링 특징 맵에 대응되는 헤드부 영역 및 상기 태그 헤드부 영역에 따라, 상기 헤드부 영역 위치 결정 네트워크를 훈련하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
제1항 내지 제8항 중 어느 한 항에 있어서,
상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 영역을 획득하는 단계는,
상기 처리될 이미지 중 각 헤드부 영역의 위치 정보를 결정하는 단계;
각 상기 헤드부 영역의 위치 정보, 및 헤드부 영역의 사이즈와 상기 헤드부 영역의 위치 정보의 관련 관계에 따라, 상기 헤드부 영역의 사이즈를 결정하는 단계; 및
상기 헤드부 영역의 위치 정보 및 상기 헤드부 영역의 사이즈에 따라, 상기 헤드부 영역을 획득하는 단계를 포함하는 것을 특징으로 하는 대상 카운트 방법.
대상 카운트 장치로서,
처리될 이미지에 대해 특징 추출을 수행하여, 상기 처리될 이미지의 초기 특징 맵을 획득하기 위한 특징 추출 모듈;
상기 초기 특징 맵에 따라, 상기 처리될 이미지에서의 헤드부 키포인트 및 헤드부 영역을 획득하기 위한 처리 모듈; 및
상기 헤드부 키포인트 및 상기 헤드부 영역에 따라, 상기 처리될 이미지에 대해 대상 카운트 및 위치 결정을 수행하여, 상기 처리될 이미지 중 대상의 개수 및 위치를 결정하기 위한 카운트 모듈을 포함하는 것을 특징으로 하는 대상 카운트 장치.
전자 기기로서,
프로세서;
프로세서가 실행 가능한 명령어를 저장하기 위한 메모리를 포함하고,
상기 프로세서는, 상기 메모리에 저장된 명령어를 호출하여, 제1항 내지 제10항 중 어느 한 항에 따른 대상 카운트 방법을 실행하도록 구성된 것을 특징으로 하는 전자 기기.
컴퓨터 프로그램 명령어가 저장되어 있는 컴퓨터 판독 가능한 저장 매체로서,
상기 컴퓨터 프로그램 명령어는 프로세서에 의해 실행될 경우 제1항 내지 제10항 중 어느 한 항에 따른 대상 카운트 방법을 구현하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체.
컴퓨터 판독 가능 코드를 포함하는 컴퓨터 프로그램으로서,
상기 컴퓨터 판독 가능 코드가 전자 기기에서 작동될 때, 상기 전자 기기의 프로세서는 제1항 내지 제10항 중 어느 한 항에 따른 대상 카운트 방법을 실행하기 위한 것을 특징으로 하는 컴퓨터 프로그램.