KR20200094651A - 사람의 상태 인식을 기반으로 신체 부위 길이 및 얼굴 정보를 사용하여 승객의 키 및 몸무게를 예측하는 방법 및 장치 - Google Patents

사람의 상태 인식을 기반으로 신체 부위 길이 및 얼굴 정보를 사용하여 승객의 키 및 몸무게를 예측하는 방법 및 장치 Download PDF

Info

Publication number
KR20200094651A
KR20200094651A KR1020200004511A KR20200004511A KR20200094651A KR 20200094651 A KR20200094651 A KR 20200094651A KR 1020200004511 A KR1020200004511 A KR 1020200004511A KR 20200004511 A KR20200004511 A KR 20200004511A KR 20200094651 A KR20200094651 A KR 20200094651A
Authority
KR
South Korea
Prior art keywords
passenger
learning
feature
keypoint
specific
Prior art date
Application number
KR1020200004511A
Other languages
English (en)
Other versions
KR102338757B1 (ko
Inventor
김계현
김용중
김학경
남운현
부석훈
성명철
신동수
여동훈
유우주
이명춘
이형수
장태웅
정경중
제홍모
조호진
Original Assignee
주식회사 스트라드비젼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 스트라드비젼 filed Critical 주식회사 스트라드비젼
Publication of KR20200094651A publication Critical patent/KR20200094651A/ko
Application granted granted Critical
Publication of KR102338757B1 publication Critical patent/KR102338757B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06K9/00369
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/107Measuring physical dimensions, e.g. size of the entire body or parts thereof
    • A61B5/1072Measuring physical dimensions, e.g. size of the entire body or parts thereof measuring distances on the body, e.g. measuring length, height or thickness
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/107Measuring physical dimensions, e.g. size of the entire body or parts thereof
    • A61B5/1079Measuring physical dimensions, e.g. size of the entire body or parts thereof using optical or photographic means
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01GWEIGHING
    • G01G19/00Weighing apparatus or methods adapted for special purposes not provided for in the preceding groups
    • G01G19/44Weighing apparatus or methods adapted for special purposes not provided for in the preceding groups for weighing persons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06K9/00221
    • G06K9/46
    • G06K9/6267
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/593Recognising seat occupancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30268Vehicle interior
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Geometry (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Dentistry (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Evolutionary Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

본 발명은 사람의 상태 인식을 기반으로 자동차의 한 명 이상의 승객에 대한 신체 정보를 검출하는 방법에 있어서, (a) 상기 자동차 실내의 적어도 하나의 실내 이미지가 획득되면, 승객 신체 정보 검출 장치가, (i) 상기 실내 이미지를 얼굴 인식 네트워크로 입력함으로써, 상기 얼굴 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객들 각각의 얼굴 각각을 검출하도록 하고, 상기 검출된 얼굴 각각에 대응하는 다수의 승객 특징 정보들을 출력하도록 하고, (ii) 상기 실내 이미지를 신체 인식 네트워크로 입력함으로써, 상기 신체 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객 각각의 신체 각각을 검출하도록 하며, 상기 검출된 신체 각각의 신체 부위 길이 정보들을 출력하도록 하는 단계; 및 (b) 상기 승객 신체 정보 검출 장치가, 키 맵핑 테이블로부터 특정 승객에 대한 특정 승객 특징 정보에 대응하는 특정 키 맵핑 정보를 검색하고, 상기 특정 승객의 특정 신체 부위 길이 정보를 참조하여 상기 특정 키 맵핑 정보로부터 상기 특정 승객의 특정 키를 획득하며, 몸무게 맵핑 테이블로부터 상기 특정 승객 특징 정보에 대응하는 특정 몸무게 맵핑 정보를 검색하고, 상기 특정 승객의 상기 특정 키를 참조하여 상기 특정 몸무게 맵핑 정보로부터 상기 특정 승객의 몸무게를 획득하는 단계를 포함하되, 상기 키 맵핑 테이블은 사람 그룹별 키 각각에 대한 상기 사람 그룹 각각의 하나 이상의 세그멘트 신체 부분의 하나 이상의 기설정된 비율을 나타내는 키 맵핑 정보를 저장하고, 상기 몸무게 맵핑 테이블은 상기 사람 그룹 각각의 키 각각과 몸무게 각각 사이의 기설정된 상관 관계를 나타내는 다수의 몸무게 맵핑 정보를 저장하는 것을 특징으로 하는 방법에 관한 것이다.

Description

사람의 상태 인식을 기반으로 신체 부위 길이 및 얼굴 정보를 사용하여 승객의 키 및 몸무게를 예측하는 방법 및 장치{METHOD AND DEVICE FOR ESTIMATING HEIGHT AND WEIGHT OF PASSENGERS USING BODY PART LENGTH AND FACE INFORMATION BASED ON HUMANS' STATUS RECOGNITION}
본 발명은 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 승객들의 키와 몸무게를 검출하는 방법 및 장치에 관한 것으로, 보다 상세하게는, 카메라로부터 획득된 실내 이미지로부터 승객들의 신체 부위 길이들을 검출하고, 상기 실내 이미지를 이용하여 상기 승객들의 얼굴 정보들로부터 상기 승객들에 대한 특징 정보들을 검출하며, 상기 각각의 승객들에 대응되는 상기 신체 부위 길이 및 상기 특징 정보들을 참조하여 상기 승객들의 키와 몸무게를 검출하는 방법 및 장치에 관한 것이다.
일반적으로 자동차의 차실에는 승객이 착석할 수 있는 좌석들이 구비되어 있다. 운전석이나 조수석에 구비된 좌석에는 승객이 착석하면 승객의 유형을 식별하고 승객의 존재 유무를 판단하고, 좌석 벨트의 착용 여부를 알려주는 기능 등을 할 수 있는 다양한 승객검출장치가 관련되어 있다.
그 중 패턴인식시스템, 압력인식시스템, 중량인식시스템이 가장 널리 사용되고 있다. 패턴인식시스템은 자동차의 좌석에 센서 매트가 구비되어 있고, 센서 매트 상에 매트릭스 형태로 압력센서가 배열되어 있어 좌석에 착석한 승객의 몸무게 및 골반 패턴을 인식함으로써 승객을 검출하고 식별한다.
압력인식시스템은 얇은 블레이더 및 압력 센서를 좌석 쿠션 하측에 배열하여 좌석에 승객이 착석하면 블레이더에서 유출된 액체를 압력 센서가 센싱하여 승객을 검출하고 식별한다.
중량인식시스템은 좌석의 내부에 구비된 좌석 프레임이 마운팅되는 위치에 스트레인게이지 센서를 배열한다. 그런 다음, 승객의 몸무게가 감지되어 승객을 검출하고 식별한다.
그러나 상기와 같이 다양한 승객검출장치가 제공되더라도 다양한 검출 오류가 발생한다. 예를 들어, 승객이 좌석의 한 쪽에 앉거나 제대로 앉지 않은 경우 승객검출장치는 승객이 앉지 않은 것으로 판단하거나, 저체중의 성인이 앉을 경우 승객검출장치는 승객을 어린이 승객으로 식별할 수 있다.
이와 같은 오류로 인해 성인 승객이 어린이 승객으로 잘못 식별된 경우, 자동차의 사고가 발생하면 에어백이 전개될 때 에어백이 어린이 승객의 체형에 대응되도록 전개되어 성인인 승객을 안전하게 보호하지 못해 에어백으로 인한 2차 상해를 입는 등의 문제점이 발생한다.
또한, 좌석에 승객이 착석하지 않은 것으로 식별하게 되면, 에어백이 전개되지 않아 승객이 큰 상해를 입을 수 있는 등 승객 식별의 오류로 인한 많은 문제점이 발생한다.
이에 더하여, 자동차 좌석마다 센서를 부착하여야 하므로 비용이 증가할 뿐만 아니라, 처리해야 할 정보가 증가되므로 처리속도가 감소되는 단점이 있다.
또한, 자동차의 운행 중 자동차의 방향을 바꾸거나 흔들리는 상황에서는 승객들의 몸무게가 잘못 측정될 수도 있다.
따라서, 본 발명에서는 종래에 비하여 저비용으로 승객들의 키와 몸무게를 검출하는 방안을 제안하고자 한다.
본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.
본 발명은 비용의 증가 없이 자동차의 적어도 하나의 승객들의 적어도 하나의 키와 적어도 하나의 몸무게를 검출할 수 있도록 하는 것을 다른 목적으로 한다.
또한, 본 발명은 주행 환경에 영향을 받지 않고 승객들의 키와 몸무게를 검출할 수 있도록 하는 것을 또 다른 목적으로 한다.
또한, 본 발명은 처리해야 할 정보를 최소화하여 승객들의 키와 몸무게를 검출할 수 있도록 하는 것을 또 다른 목적으로 한다.
상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한, 본 발명의 특징적인 구성은 하기와 같다.
본 발명의 일 태양에 따르면, 사람의 상태 인식을 기반으로 자동차의 한 명 이상의 승객에 대한 신체 정보를 검출하는 방법에 있어서, (a) 상기 자동차 실내의 적어도 하나의 실내 이미지가 획득되면, 승객 신체 정보 검출 장치가, (i) 상기 실내 이미지를 얼굴 인식 네트워크로 입력함으로써, 상기 얼굴 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객들 각각의 얼굴 각각을 검출하도록 하고, 상기 검출된 얼굴 각각에 대응하는 다수의 승객 특징 정보들을 출력하도록 하고, (ii) 상기 실내 이미지를 신체 인식 네트워크로 입력함으로써, 상기 신체 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객 각각의 신체 각각을 검출하도록 하며, 상기 검출된 신체 각각의 신체 부위 길이 정보들을 출력하도록 하는 단계; 및 (b) 상기 승객 신체 정보 검출 장치가, 키 맵핑 테이블로부터 특정 승객에 대한 특정 승객 특징 정보에 대응하는 특정 키 맵핑 정보를 검색하고, 상기 특정 승객의 특정 신체 부위 길이 정보를 참조하여 상기 특정 키 맵핑 정보로부터 상기 특정 승객의 특정 키를 획득하며, 몸무게 맵핑 테이블로부터 상기 특정 승객 특징 정보에 대응하는 특정 몸무게 맵핑 정보를 검색하고, 상기 특정 승객의 상기 특정 키를 참조하여 상기 특정 몸무게 맵핑 정보로부터 상기 특정 승객의 몸무게를 획득하는 단계를 포함하되, 상기 키 맵핑 테이블은 사람 그룹별 키 각각에 대한 상기 사람 그룹 각각의 하나 이상의 세그멘트 신체 부분의 하나 이상의 기설정된 비율을 나타내는 키 맵핑 정보를 저장하고, 상기 몸무게 맵핑 테이블은 상기 사람 그룹 각각의 키 각각과 몸무게 각각 사이의 기설정된 상관 관계를 나타내는 다수의 몸무게 맵핑 정보를 저장하는 것을 특징으로 하는 방법이 제공된다.
일 실시예에서, 상기 (a) 단계에서, 상기 승객 신체 정보 검출 장치는, 상기 실내 이미지를 상기 신체 인식 네트워크로 입력함으로써 상기 신체 인식 네트워크로 하여금, (i) 특징 추출 네트워크를 통해 상기 실내 이미지에 대응하는 하나 이상의 채널을 가지는 하나 이상의 특징 텐서를 출력하도록 하고, (ii) 키포인트 히트맵 & 파트 어피니티 필드 추출기(keypoint heatmap & part affinity field extractor)를 통해 상기 특징 텐서 각각에 대응하는 하나 이상의 채널을 가지는 하나 이상의 키포인트 히트맵 및 파트 어피니티 필드를 생성하도록 하며, (iii) 키포인트 검출기를 통해 상기 키포인트 히트맵에서 키포인트들을 추출함으로써 상기 파트 어피니티 필드를 참조하여 상기 추출된 키포인트들을 그룹핑하여 상기 승객별 신체 부위들을 생성하도록 하며, 그 결과, 상기 신체 인식 네트워크로 하여금 상기 승객별 신체 부위들을 참조함으로써 상기 승객들 각각에 대한 상기 신체 부위 길이 정보들을 출력하도록 하는 것을 특징으로 하는 방법이 제공된다.
일 실시예에서, 상기 특징 추출 네트워크는 적어도 하나의 컨볼루션 레이어를 포함하고, 적어도 하나의 컨벌루션 연산을 상기 실내 이미지에 적용하여 상기 특징 텐서를 출력하는 것을 특징으로 하는 방법이 제공된다.
일 실시예에서, 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기는 풀리 컨볼루션 네트워크 및 1x1 컨볼루션 레이어 중 하나를 포함하며, 풀리 컨볼루션 연산 또는 1x1 컨볼루션 연산을 상기 특징 텐서에 적용함으로써 상기 키포인트 히트맵 및 상기 파트 어피니티 필드를 생성하는 것을 특징으로 하는 방법이 제공된다.
일 실시예에서, 상기 키포인트 검출기는 상기 파트 어피니티 필드를 참조하여 상기 추출된 키포인트들 중 상호 연결될 확률이 가장 높은 각각의 쌍들을 연결함으로써 상기 추출된 키포인트들을 그룹핑하는 것을 특징으로 하는 방법이 제공된다.
일 실시예에서, 상기 특징 추출 네트워크와 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기는 학습 장치에 의해 학습된 상태로서, 상기 학습 장치에 의해, (i) 상기 특징 추출 네트워크에 하나 이상의 학습용 객체를 포함하는 적어도 하나의 학습 이미지를 입력함으로써 상기 특징 추출 네트워크로 하여금 상기 학습 이미지에 적어도 한번의 컨볼루션 연산을 적용함으로써 하나 이상의 채널을 가지는 하나 이상의 학습용 특징 텐서를 생성하도록 하고, (ii) 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기에 상기 학습용 특징 텐서를 입력함으로써 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기로 하여금 상기 학습용 특징 텐서 각각에 대한 하나 이상의 채널을 가지는 하나 이상의 학습용 키포인트 히트맵 및 하나 이상의 학습용 파트 어피니티 필드를 생성하도록 하며, (iii) 상기 학습용 키포인트 히트맵 및 상기 학습용 파트 어피니티 필드를 상기 키포인트 검출기로 입력함으로써 상기 키포인트 검출기로 하여금 상기 학습용 키포인트 히트맵 각각으로부터 학습용 키포인트들을 추출하도록 하고, 상기 학습용 파트 어피니티 필드 각각을 참조하여 상기 추출된 학습용 키포인트들을 그룹핑함으로써 상기 학습용 객체 각각마다 키포인트들을 검출하도록 하며, (iv) 로스 레이어로 하여금 상기 학습용 객체별 상기 키포인트들과 이에 대응되는 GT(ground truth)를 참조하여 하나 이상의 로스를 계산함으로써 상기 로스를 이용한 백프로퍼게이션에 의해 상기 로스가 최소화되도록 상기 특징 추출 네트워크 및 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기의 하나 이상의 파라미터를 조정하는 것을 특징으로 하는 방법이 제공된다.
일 실시예에서, 상기 (a) 단계에서, 상기 승객 신체 정보 검출 장치는, 상기 얼굴 인식 네트워크에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크로 하여금, 얼굴 검출기를 통해 상기 실내 이미지에 위치하는 승객들 각각의 얼굴 각각을 검출하도록 하고, 얼굴 특징 분류기를 통해 얼굴 이미지들 각각에 대한 다수의 승객 특징 정보들을 출력하도록 하는 것을 특징으로 하는 방법이 제공된다.
일 실시예에서, 상기 (a) 단계에서, 상기 승객 신체 정보 검출 장치는, 상기 얼굴 인식 네트워크에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크로 하여금, (i) 적어도 하나의 컨볼루션 레이어를 통해 상기 실내 이미지에 적어도 하나의 컨벌루션 연산을 적용하고 상기 실내 이미지에 대응하는 적어도 하나의 특징 맵을 출력하도록 하며, (ii) 영역 프로포잘 네트워크(Region Proposal Network)를 통해 상기 특징 맵 상에서 상기 승객들이 위치되는 것으로 예측되는 하나 이상의 프로포잘 박스들을 출력하도록 하고, (iii) 풀링 레이어를 통해 상기 특징 맵 상의 상기 프로포잘 박스에 대응하는 하나 이상의 영역에 풀링 연산을 적용하여 적어도 하나의 특징 벡터를 출력하도록 하며, (iv) 풀리 커넥티드 레이어를 통해 상기 특징 벡터에 풀리 커텍티드 연산을 적용하여 상기 프로포잘 박스들 각각에 대응하는 상기 승객들의 얼굴 각각에 대응하는 상기 다수의 승객 특징 정보들을 출력하도록 하는 것을 특징으로 하는 방법이 제공된다.
일 실시예에서, 상기 다수의 승객 특징 정보들은 상기 승객들 각각에 대응하는 나이, 성별, 및 인종 각각을 포함하는 것을 특징으로 하는 방법이 제공된다.
본 발명의 다른 태양에 따르면, 사람의 상태 인식을 기반으로 자동차의 한 명 이상의 승객에 대한 신체 정보를 검출하는 장치에 있어서, 적어도 하나의 인스트럭션들을 저장하는 적어도 하나의 메모리; 및 상기 인스트럭션들을 수행하도록 설정된 적어도 하나의 프로세서를 포함하되, 상기 프로세서는, (I) 상기 자동차 실내의 적어도 하나의 실내 이미지가 획득되면, (i) 상기 실내 이미지를 얼굴 인식 네트워크로 입력함으로써, 상기 얼굴 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객들 각각의 얼굴 각각을 검출하도록 하고, 상기 검출된 얼굴 각각에 대응하는 다수의 승객 특징 정보들을 출력하도록 하고, (ii) 상기 실내 이미지를 신체 인식 네트워크로 입력함으로써, 상기 신체 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객 각각의 신체 각각을 검출하도록 하며, 상기 검출된 신체 각각의 신체 부위 길이 정보들을 출력하도록 하는 프로세스; 및 (II) 키 맵핑 테이블로부터 특정 승객에 대한 특정 승객 특징 정보에 대응하는 특정 키 맵핑 정보를 검색하고, 상기 특정 승객의 특정 신체 부위 길이 정보를 참조하여 상기 특정 키 맵핑 정보로부터 상기 특정 승객의 특정 키를 획득하며, 몸무게 맵핑 테이블로부터 상기 특정 승객 특징 정보에 대응하는 특정 몸무게 맵핑 정보를 검색하고, 상기 특정 승객의 상기 특정 키를 참조하여 상기 특정 몸무게 맵핑 정보로부터 상기 특정 승객의 몸무게를 획득하는 프로세스를 수행하되, 상기 키 맵핑 테이블은 사람 그룹별 키 각각에 대한 상기 사람 그룹 각각의 하나 이상의 세그멘트 신체 부분의 하나 이상의 기설정된 비율을 나타내는 키 맵핑 정보를 저장하고, 상기 몸무게 맵핑 테이블은 상기 사람 그룹 각각의 키 각각과 몸무게 각각 사이의 기설정된 상관 관계를 나타내는 다수의 몸무게 맵핑 정보를 저장하는 것을 특징으로 하는 장치가 제공된다.
일 실시예에서, 상기 (I) 프로세스는, 상기 프로세서가, 상기 실내 이미지를 상기 신체 인식 네트워크로 입력함으로써 상기 신체 인식 네트워크로 하여금, (i) 특징 추출 네트워크를 통해 상기 실내 이미지에 대응하는 하나 이상의 채널을 가지는 하나 이상의 특징 텐서를 출력하도록 하고, (ii) 키포인트 히트맵 & 파트 어피니티 필드 추출기(keypoint heatmap & part affinity field extractor)를 통해 상기 특징 텐서 각각에 대응하는 하나 이상의 채널을 가지는 하나 이상의 키포인트 히트맵 및 파트 어피니티 필드를 생성하도록 하며, (iii) 키포인트 검출기를 통해 상기 키포인트 히트맵에서 키포인트들을 추출함으로써 상기 파트 어피니티 필드를 참조하여 상기 추출된 키포인트들을 그룹핑하여 상기 승객별 신체 부위들을 생성하도록 하며, 그 결과, 상기 신체 인식 네트워크로 하여금 상기 승객별 신체 부위들을 참조함으로써 상기 승객들 각각에 대한 상기 신체 부위 길이 정보들을 출력하도록 하는 것을 특징으로 하는 장치가 제공된다.
일 실시예에서, 상기 특징 추출 네트워크는 적어도 하나의 컨볼루션 레이어를 포함하고, 적어도 하나의 컨벌루션 연산을 상기 실내 이미지에 적용하여 상기 특징 텐서를 출력하는 것을 특징으로 하는 장치가 제공된다.
일 실시예에서, 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기는 풀리 컨볼루션 네트워크 및 1x1 컨볼루션 레이어 중 하나를 포함하며, 풀리 컨볼루션 연산 또는 1x1 컨볼루션 연산을 상기 특징 텐서에 적용함으로써 상기 키포인트 히트맵 및 상기 파트 어피니티 필드를 생성하는 것을 특징으로 하는 장치가 제공된다.
일 실시예에서, 상기 키포인트 검출기는 상기 파트 어피니티 필드를 참조하여 상기 추출된 키포인트들 중 상호 연결될 확률이 가장 높은 각각의 쌍들을 연결함으로써 상기 추출된 키포인트들을 그룹핑하는 것을 특징으로 하는 장치가 제공된다.
일 실시예에서, 상기 특징 추출 네트워크와 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기는 학습 장치에 의해 학습된 상태로서, 상기 학습 장치에 의해, (i) 상기 특징 추출 네트워크에 하나 이상의 학습용 객체를 포함하는 적어도 하나의 학습 이미지를 입력함으로써 상기 특징 추출 네트워크로 하여금 상기 학습 이미지에 적어도 한번의 컨볼루션 연산을 적용함으로써 하나 이상의 채널을 가지는 하나 이상의 학습용 특징 텐서를 생성하도록 하고, (ii) 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기에 상기 학습용 특징 텐서를 입력함으로써 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기로 하여금 상기 학습용 특징 텐서 각각에 대한 하나 이상의 채널을 가지는 하나 이상의 학습용 키포인트 히트맵 및 하나 이상의 학습용 파트 어피니티 필드를 생성하도록 하며, (iii) 상기 학습용 키포인트 히트맵 및 상기 학습용 파트 어피니티 필드를 상기 키포인트 검출기로 입력함으로써 상기 키포인트 검출기로 하여금 상기 학습용 키포인트 히트맵 각각으로부터 학습용 키포인트들을 추출하도록 하고, 상기 학습용 파트 어피니티 필드 각각을 참조하여 상기 추출된 학습용 키포인트들을 그룹핑함으로써 상기 학습용 객체 각각마다 키포인트들을 검출하도록 하며, (iv) 로스 레이어로 하여금 상기 학습용 객체별 상기 키포인트들과 이에 대응되는 GT(ground truth)를 참조하여 하나 이상의 로스를 계산함으로써 상기 로스를 이용한 백프로퍼게이션에 의해 상기 로스가 최소화되도록 상기 특징 추출 네트워크 및 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기의 하나 이상의 파라미터를 조정하는 것을 특징으로 하는 장치가 제공된다.
일 실시예에서, 상기 (I) 프로세스는, 상기 프로세서가, 상기 얼굴 인식 네트워크에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크로 하여금, 얼굴 검출기를 통해 상기 실내 이미지에 위치하는 승객들 각각의 얼굴 각각을 검출하도록 하고, 얼굴 특징 분류기를 통해 얼굴 이미지들 각각에 대한 다수의 승객 특징 정보들을 출력하도록 하는 것을 특징으로 하는 장치가 제공된다.
일 실시예에서, 상기 (I) 프로세스는, 상기 프로세서가, 상기 얼굴 인식 네트워크에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크로 하여금, (i) 적어도 하나의 컨볼루션 레이어를 통해 상기 실내 이미지에 적어도 하나의 컨벌루션 연산을 적용하고 상기 실내 이미지에 대응하는 적어도 하나의 특징 맵을 출력하도록 하며, (ii) 영역 프로포잘 네트워크(Region Proposal Network)를 통해 상기 특징 맵 상에서 상기 승객들이 위치되는 것으로 예측되는 하나 이상의 프로포잘 박스들을 출력하도록 하고, (iii) 풀링 레이어를 통해 상기 특징 맵 상의 상기 프로포잘 박스에 대응하는 하나 이상의 영역에 풀링 연산을 적용하여 적어도 하나의 특징 벡터를 출력하도록 하며, (iv) 풀리 커넥티드 레이어를 통해 상기 특징 벡터에 풀리 커텍티드 연산을 적용하여 상기 프로포잘 박스들 각각에 대응하는 상기 승객들의 얼굴 각각에 대응하는 상기 다수의 승객 특징 정보들을 출력하도록 하는 것을 특징으로 하는 장치가 제공된다.
일 실시예에서, 상기 다수의 승객 특징 정보들은 상기 승객들 각각에 대응하는 나이, 성별, 및 인종 각각을 포함하는 것을 특징으로 하는 장치가 제공된다.
이 외에도, 본 발명의 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
본 발명은 카메라로 촬영된 자동차의 실내 이미지를 분석하여 승객들의 키와 몸무게를 검출하므로 종래 센서 방식에 비하여 비용을 감소시킬 수 있다.
또한, 본 발명은 카메라로 촬영된 자동차의 실내 이미지를 분석하여 승객들의 키와 몸무게를 검출하므로 자동차의 주변 환경에 영향을 받지 않고 승객들의 키와 몸무게를 검출할 수 있게 된다.
또한, 본 발명은 카메라로 촬영된 자동차의 실내 이미지를 분석하여 승객들의 키와 몸무게를 검출하므로 종래 센서 방식에 비하여 처리해야 할 정보가 적으므로 처리 속도를 향상시킬 수 있게 된다.
본 발명의 실시예의 설명에 이용되기 위하여 첨부된 아래 도면들은 본 발명의 실시예들 중 단지 일부일 뿐이며, 본 발명이 속한 기술분야에서 통상의 지식을 가진 자(이하 "통상의 기술자")에게 있어서는 발명적 작업이 이루어짐 없이 이 도면들에 기초하여 다른 도면들이 얻어질 수 있다.
도 1은 본 발명의 일 실시예에 따라 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 하나 이상의 승객들에 대한 신체 정보를 검출하기 위한 승객 신체 정보 검출 장치를 개략적으로 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따라 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 하나 이상의 승객들에 대한 신체 정보를 검출하기 위한 방법을 개략적으로 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따라 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 하나 이상의 승객들에 대한 신체 정보를 검출하기 위한 방법에서 승객들의 하나 이상의 키포인트를 검출하는 프로세스를 개략적으로 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따라 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 하나 이상의 승객들에 대한 신체 정보를 검출하기 위한 방법에서 승객들의 신체 부위 길이를 검출하는 프로세스를 개략적으로 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따라 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 하나 이상의 승객들에 대한 신체 정보를 검출하기 위한 방법에서 사용되는 키 매핑 테이블을 개략적으로 도시한 도면이다.
도 6은 본 발명의 일 실시예에 따라 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 하나 이상의 승객들에 대한 신체 정보를 검출하기 위한 방법에서 승객의 키포인트를 자동차의 하나 이상의 좌석을 매칭하는 프로세스를 개략적으로 도시한 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
또한, 본 발명의 상세한 설명 및 청구항들에 걸쳐, "포함하다"라는 단어 및 그것의 변형은 다른 기술적 특징들, 부가물들, 구성요소들 또는 단계들을 제외하는 것으로 의도된 것이 아니다. 통상의 기술자에게 본 발명의 다른 목적들, 장점들 및 특성들이 일부는 본 설명서로부터, 그리고 일부는 본 발명의 실시로부터 드러날 것이다. 아래의 예시 및 도면은 실례로서 제공되며, 본 발명을 한정하는 것으로 의도된 것이 아니다.
본 발명에서 언급하는 각종 이미지는 포장 또는 비포장 도로 관련 이미지를 포함할 수 있으며, 이 경우 도로 환경에서 등장할 수 있는 물체(가령, 자동차, 사람, 동물, 식물, 물건, 건물, 비행기나 드론과 같은 비행체, 기타 장애물)를 상정할 수 있을 것이나, 반드시 이에 한정되는 것은 아니며, 본 발명에서 언급하는 각종 이미지는 도로와 상관 없는 이미지(가령, 비포장도로, 골목길, 공터, 바다, 호수, 강, 산, 숲, 사막, 하늘, 실내와 관련된 이미지)일 수도 있으며, 이 경우, 비포장도로, 골목길, 공터, 바다, 호수, 강, 산, 숲, 사막, 하늘, 실내 환경에서 등장할 수 있는 물체(가령, 자동차, 사람, 동물, 식물, 물건, 건물, 비행기나 드론과 같은 비행체, 기타 장애물)를 상정할 수 있을 것이나, 반드시 이에 한정되는 것은 아니다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따라 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 하나 이상의 승객들에 대한 신체 정보를 검출하기 위한 승객 신체 정보 검출 장치를 개략적으로 도시한 도면이다. 도 1을 참조하면, 승객 신체 정보 검출 장치(100)는 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 승객들에 대한 신체 정보를 검출하기 위한 인스트럭션들을 저장하는 메모리(110)와 메모리(110)에 저장된 인스트럭션들에 대응하여 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 자동차의 승객들에 대한 신체 정보를 검출하는 프로세스를 수행하는 프로세서(120)를 포함할 수 있다.
구체적으로, 승객 신체 정보 검출 장치(100)는 전형적으로 적어도 하나의 컴퓨팅 장치(컴퓨터 프로세서, 메모리, 스토리지, 입력 장치, 출력 장치, 기타 기존의 컴퓨팅 장치의 구성요소들을 포함할 수 있는 장치, 라우터 또는 스위치 등과 같은 전자 통신 장치, 네트워크 부착 스토리지(NAS) 및 스토리지 영역 네트워크(SAN)와 같은 전자 정보 스토리지 시스템)와 적어도 하나의 컴퓨터 소프트웨어(컴퓨팅 장치로 하여금 특정의 방식으로 기능하게 하는 인스트럭션들)의 조합을 이용하여 원하는 시스템 성능을 달성하는 것일 수 있다.
또한, 컴퓨팅 장치의 프로세서는 MPU(Micro Processing Unit) 또는 CPU(Central Processing Unit), 캐쉬 메모리(Cache Memory), 데이터 버스(Data Bus) 등의 하드웨어 구성을 포함할 수 있다. 또한, 컴퓨팅 장치는 운영체제, 특정 목적을 수행하는 애플리케이션의 소프트웨어 구성을 더 포함할 수도 있다.
그러나, 이와 같이 컴퓨팅 장치가 묘사되었다고 하여, 컴퓨팅 장치가 본 발명을 실시하기 위한 미디엄, 프로세서 및 메모리가 통합된 형태인 통합 프로세서를 포함하는 경우를 배제하는 것은 아니다.
이와 같이 구성된 본 발명의 일 실시예에 따른 승객 신체 정보 검출 장치(100)를 이용하여 사람의 상태 인식을 기반으로 자동차의 승객들의 신체 부위 길이 및 얼굴 인식을 이용하여 승객들에 대한 신체 정보를 검출하는 방법을 도 2를 참조하여 설명하면 다음과 같다.
먼저, 상기 자동차 실내의 적어도 하나의 실내 이미지가 획득되면, 승객 신체 정보 검출 장치(100)가, 상기 실내 이미지를 얼굴 인식 네트워크(150)로 입력함으로써, 상기 얼굴 인식 네트워크(150)로 하여금 상기 실내 이미지로부터 상기 승객들 각각의 얼굴 각각을 검출하도록 하고, 상기 검출된 얼굴 각각에 대응하는 다수의 승객 특징 정보들을 출력하도록 한다. 여기서, 다수의 승객 특징 정보들은 승객 각각에 대응하는 나이, 성별, 및 인종 각각을 포함할 수 있다.
한편, 얼굴 인식 네트워크(150)는 다양한 알고리즘으로 구현될 수 있다.
일 예로, 얼굴 인식 네트워크(150)는 얼굴 검출기와 얼굴 특징 분류기로 구성될 수 있다.
여기서, 승객 신체 정보 검출 장치(100)는 상기 얼굴 인식 네트워크(150)에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크(150)로 하여금, 얼굴 검출기를 통해 상기 실내 이미지에 위치하는 승객들 각각의 얼굴 각각을 검출하도록 하고, 얼굴 특징 분류기를 통해 얼굴 이미지들 각각에 대한 다수의 승객 특징 정보들을 출력하도록 할 수 있다.
다른 예로, 얼굴 인식 네트워크(150)는 R-CNN 기반으로 구현될 수 있다.
여기서, 승객 신체 정보 검출 장치(100)는 상기 얼굴 인식 네트워크(150)에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크(150)로 하여금, (i) 적어도 하나의 컨볼루션 레이어를 통해 상기 실내 이미지에 적어도 하나의 컨벌루션 연산을 적용하고 상기 실내 이미지에 대응하는 적어도 하나의 특징 맵을 출력하도록 하며, (ii) 영역 프로포잘 네트워크(Region Proposal Network)를 통해 상기 특징 맵 상에서 상기 승객들이 위치되는 것으로 예측되는 하나 이상의 프로포잘 박스들을 출력하도록 하고, (iii) 풀링 레이어를 통해 상기 특징 맵 상의 상기 프로포잘 박스에 대응하는 하나 이상의 영역에 풀링 연산을 적용하여 적어도 하나의 특징 벡터를 출력하도록 하며, (iv) 풀리 커넥티드 레이어를 통해 상기 특징 벡터에 풀리 커텍티드 연산을 적용하여 상기 프로포잘 박스들 각각에 대응하는 상기 승객들의 얼굴 각각에 대응하는 상기 다수의 승객 특징 정보들을 출력하도록 할 수 있다.
이외에도, 얼굴 인식 네트워크(150)는 다양한 알고리즘을 채택한 다양한 뉴럴 네트워크로 구현될 수 있으며, 각각의 뉴럴 네트워크는 미리 학습된 상태일 수 있다.
또한, 승객 신체 정보 검출 장치(100)는 상기 실내 이미지를 신체 인식 네트워크(160)로 입력함으로써, 상기 신체 인식 네트워크(160)로 하여금 상기 실내 이미지로부터 상기 승객 각각의 신체 각각을 검출하도록 하며, 상기 검출된 신체 각각의 신체 부위 길이 정보들을 출력하도록 할 수 있다. 여기서, 신체 인식 네트워크(160)는 오픈-포즈 검출기(open-pose detector)를 포함할 수 있다.
일 예로, 도 3을 참조하면, 상기 신체 인식 네트워크(160)는 특징 추출 네트워크(161)로 하여금 상기 실내 이미지(즉, 입력 이미지)에 대응하는 하나 이상의 채널을 가지는 하나 이상의 특징 텐서를 출력하도록 한다. 여기서, 특징 추출 네트워크(161)는 적어도 하나의 컨볼루션 레이어를 포함하고, 적어도 하나의 컨벌루션 연산을 상기 실내 이미지에 적용하여 상기 특징 텐서를 생성할 수 있다.
그리고, 신체 인식 네트워크(160)는 특징 텐서를 키포인트 히트맵 & 파트 어피니티 필드 추출기(keypoint heatmap & part affinity field extractor)에 입력함으로써, 키포인트 히트맵 & 파트 어피니티 필드 추출기(162)로 하여금 상기 특징 텐서 각각에 대응하는 하나 이상의 채널을 가지는 하나 이상의 키포인트 히트맵 및 하나 이상의 채널을 가지는 하나 이상의 파트 어피니티 필드를 생성하도록 할 수 있다. 또한, 키포인트 히트맵 & 파트 어피니티 필드 추출기(162)는 이분 매칭(bipartite matching)을 이용하여 키포인트들 사이의 관계를 검출함으로써 파트 어피니티 필드를 생성할 수 있다. 즉, 키포인트들이 각각 어떤 승객의 것인지, 키포인트들의 관계가 어떠한 것인지를 이분 매칭에 의해 확인할 수 있다.
여기서, 키포인트 히트맵은 열을 뜻하는 히트(heat)와 지도를 뜻하는 맵(map)을 결합시킨 것으로, 색상으로 표현할 수 있는 다양한 정보를 소정의 이미지 위에 열분포 형태의 비주얼한 그래픽으로 생성한 것일 수 있다. 그리고, 파트 어피니티 필드는 키포인트들 사이의 관계를 표현하는 일종의 벡터 맵일 수 있다. 즉, 파트 어피니티 필드는 특정 키포인트와 다른 키포인트들의 연결을 나타내는 맵일 수 있으며, 각각의 키포인트 히트맵 쌍에 포함된 각각의 키포인트들이 서로 연결될 확률을 나타내는 맵일 수 있다.
그리고, 키포인트 히트맵 & 파트 어피니티 필드 추출기(162)는 풀리 컨볼루션 네트워크 및 1 x 1 컨볼루션 레이어들을 포함할 수 있고, 특징 텐서에 풀리 컨볼루션 연산 또는 1 x 1 컨볼루션 연산을 적용함으로써 키포인트 히트맵 및 파트 어피니티 필드를 생성할 수 있다.
다음으로, 신체 인식 네트워크(160)는 키포인트 히트맵 및 파트 어피니티 필드를 키포인트 검출기(163)로 입력함으로써 키포인트 검출기(163)로 하여금 키포인트 히트맵의 채널 각각으로부터 키포인트들을 추출할 수 있도록 하며, 파트 어피니티 필드를 참조하여 추출된 키포인트들을 그룹핑하도록 할 수 있다. 즉, 연결 확률을 참조하여 가장 높은 확률을 가지는 두 개의 키포인트들이 쌍을 이룰 수 있다. 여기서, 키포인트 검출기는 각각의 채널에 대응하는 각각의 키포인트 히트맵에서 가장 높은 포인트 각각, 즉, 키포인트 히트맵 각각에 대응하는 각 키포인트로서 가장 높은 히트값을 가지는 포인트 각각을 추출할 수 있으며, 추출된 키포인트들 중 각각에 대해 서로 연결될 확률이 가장 높은 키포인트들을 각각 페어링함으로써, 파트 어피니티 필드를 참조로 하여 추출된 키포인트들을 그룹핑할 수 있는데, 이때 그룹화된 키포인트들은 승객 각각의 신체 부분일 수 있다. 일 예로, 추출된 키포인트 중에서 제2 키포인트가 제1 키포인트에 연결될 가능성이 가장 높은 것으로 결정되는 경우, 추출된 키포인트 중 제1 키포인트 및 추출된 키포인트 중 제2 키포인트를 쌍으로서 연결하는 과정이 수행될 수 있다. 여기서, 이러한 프로세스는 추출된 모든 키포인트에 대하여 수행될 수 있다. 결과적으로, 추출된 키포인트는 하나 이상의 그룹으로 분류될 수 있다. 여기서, 그룹의 수는 실내 이미지에서 승객의 수에 따라 결정될 수 있다.
그리고, 도 4를 참조하면, 신체 인식 네트워크(160)는 상기 승객 각각의 신체 각각을 검출하도록 하며, 상기 검출된 신체 각각의 신체 부위 길이 정보들을 출력하게 된다. 일 예로, 신체 부위 길이 정보는 승객들의 어깨 너비, 팔 길이 등을 포함할 수 있다.
한편, 신체 인식 네트워크(160)의 특징 추출 네트워크(161) 및 키포인트 히트맵 & 파트 어피니티 필드 추출기(162)는 학습 장치에 의해 미리 학습된 상태일 수 있다.
일 예로, 하나 이상의 학습용 객체를 포함하는 적어도 하나의 학습 이미지가 획득되면, 학습 장치는, 상기 특징 추출 네트워크(161)로 하여금 상기 학습 이미지에 적어도 한번의 컨볼루션 연산을 적용함으로써 하나 이상의 채널을 가지는 하나 이상의 학습용 특징 텐서를 생성하도록 한다. 또한, 학습 장치는 (i) 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기(162)에 상기 학습용 특징 텐서를 입력함으로써 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기(162)로 하여금 상기 학습용 특징 텐서에 대한 하나 이상의 채널을 가지는 하나 이상의 학습용 키포인트 히트맵 및 하나 이상의 채널을 가지는 하나 이상의 학습용 파트 어피니티 필드를 생성하도록 하고, (ii) 상기 학습용 키포인트 히트맵 및 상기 학습용 파트 어피니티 필드를 상기 키포인트 검출기(163)로 입력함으로써 상기 키포인트 검출기(163)로 하여금 상기 학습용 키포인트 히트맵 각각으로부터 학습용 키포인트들을 추출하도록 하고, 상기 학습용 파트 어피니티 필드 각각을 참조하여 상기 추출된 학습용 키포인트들을 그룹핑함으로써 상기 학습용 객체 각각마다 키포인트들을 검출하도록 한다. 이후, 학습 장치는 로스 레이어로 하여금 상기 학습용 객체별 상기 키포인트들과 이에 대응되는 GT(ground truth)를 참조하여 하나 이상의 로스를 계산함으로써 상기 로스를 이용한 백프로퍼게이션에 의해 상기 로스가 최소화되도록 상기 특징 추출 네트워크(161) 및 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기(162)의 하나 이상의 파라미터를 조정함으로써 특징 추출 네트워크(161) 및 키포인트 히트맵 & 파트 어피니티 필드 추출기(162)를 학습시킨다.
다음으로, 다시 도 2를 참조하면, 승객 신체 정보 검출 장치(100)는 키 맵핑 테이블(180)을 참조하여 검출된 승객들에 각각 대한 나이/성별/인종 정보들에 대응되는 검출된 승객에 대한 키 맵핑 정보들을 획득할 수 있다.
여기서, 도 5를 참조하면, 키 맵핑 테이블(180)은 (i) 인간 그룹 각각의 하나 이상의 세그멘트 신체 포션의 (ii) 인간 그룹 각각 별 키 각각에 대한 하나 이상 미리 결정된 비율의 그래픽 표현을 포함하는 키 맵핑 정보를 포함할 수 있다. 여기서, 인간 그룹은 나이/성별/인종으로 그룹화된 것일 수 있다. 그리고, 키 맵핑 테이블은 논문 'The comparisons of anthropometric characteristics among four peoples in East Asia, applied ergonomics 2004'에서처럼 통계적으로 연령별/성별/인종별 키와 신체 부위 길이 사이의 상관 관계를 분석한 데이터를 이용할 수 있다.
그리고, 승객 신체 정보 검출 장치(100)는 승객들 각각에 대응되는 키 맵핑 정보 및 신체 부위 길이 정보를 참조하여 키 예측을 수행함으로써 승객 각각의 키 각각을 검출한다.
즉, 승객 신체 정보 검출 장치(100)는 키 맵핑 테이블(180)로부터 특정 승객에 대한 특정 승객 특징 정보에 대응하는 특정 키 맵핑 정보를 획득할 수 있고, 특정 승객에 대한 특정 신체 부위 길이 정보를 참조하여 특정 키 맵핑 정보로부터 특정 승객의 특정 키를 획득할 수 있다.
다음으로, 승객 신체 정보 검출 장치(100)는 몸무게 맵핑 테이블(190)을 참조하여 검출된 승객들에 각각 대한 나이/성별/인종 정보들에 대응되는 승객들에 대한 몸무게 맵핑 정보들을 획득할 수 있다. 이때, 몸무게 맵핑 테이블(190)은 통계적으로 인종별/성별/연령별 키와 몸무게 사이의 상관 관계를 분석한 데이터를 이용할 수 있다.
이후, 승객 신체 정보 검출 장치(100)는 승객들 각각에 대응되는 다수의 몸무게 맵핑 정보 및 키에 대한 정보를 참조하여 몸무게 예측을 수행함으로써 승객 각각의 몸무게 각각을 검출한다.
즉, 승객 신체 정보 검출 장치(100)는 몸무게 맵핑 테이블(190)로부터 특정 승객 특징 정보에 대응하는 특정 몸무게 맵핑 정보를 획득할 수 있고, 특정 승객의 특정 키를 참조로 하여 특정 몸무게 맵핑 정보로부터 특정 승객의 특정 몸무게를 획득할 수 있다.
따라서, 승객 신체 정보 검출 장치(100)에 의해 검출된 승객의 키 및 몸무게를 참조로 하여, 하나 이상의 에어백의 전개 여부, 그리고 에어백을 전개할 경우 전개 방향과 강도를 승객 각각에 맞게 결정할 수 있게 된다. 또한, 에어백의 전개 이외에도, 검출된 승객들의 키 및 몸무게를 참조하여 자동차의 다양한 안전 장치 및 편의 장치들을 동작시킬 수 있게 된다.
또한, 승객 신체 정보 검출 장치(100)는 키포인트 각각과 좌석을 매칭함으로써 자동차의 각각의 좌석에 대한 점유율을 검출한다.
일 예로, 도 6을 참조하면, 승객 신체 정보 검출 장치(100)는 승객들 별 키포인트들, 즉, 키포인트상의 좌표 정보를 좌석 점유 매칭기(200)로 입력하거나, 타 장치로 하여금 승객별 키포인트상의 좌표 정보를 좌석 점유 매칭기(200)로 입력하도록 지원할 수 있다.
그러면, 좌석 점유 매칭기(200)는 키포인트들의 각각의 평균 및 각각의 분산을 계산할 수 있다. 일 예로, 승객 각각에 대응하는 머리 및 신체의 키포인트들의 평균 및 분산을 연산한다.
그리고, 좌석 점유 매칭기(200)는 좌석 각각에 대한 기설정된 ROI 각각에 대하여, (i) 승객 각각에 대응하는 각각의 평균 및 (ii) 승객 각각에 대응하는 각각의 분산을 참조로 하여, 각각의 좌석과 각각의 승객을 매칭시킬 수 있다.
즉, 승객 각각의 키포인트가 승객 각각의 키포인트 그룹 각각에 속한다고 할 경우, 특정 좌석에 대응하는 기설정된 특정 ROI에 대하여, 특정 승객에 대응하는 특정 키포인트 그룹의 특정 평균 포인트가 특정 ROI 내에 위치하는 지를 확인한다. 여기서, 특정 평균 포인트가 특정 ROI 내에 위치하지 않을 경우에는 특정 승객이 특정 좌석에 매칭되지 않는 것으로 판단할 수 있다.
또한, 특정 키포인트 그룹의 특정 분산이 기설정된 제1 임계치 이하인지를 확인한다. 여기서, 기설정된 제1 임계치는 오검출된 키포인트들을 제외하기 위해 사용될 수 있고, 특정 분산이 설정된 제1 임계치 초과일 경우에는 특정 승객이 특정 좌석에 매칭되지 않는 것으로 판단할 수 있다.
그리고, 특정 ROI 내에 위치하는 특정 키포인트 그룹의 특정 키포인트들의 수가 기설정된 제2 임계치 이상인지를 확인한다. 여기서, 기설정된 제2 임계치는 오검출된 키포인트들을 제외하기 위해 사용될 수 있고, 특정 ROI 내에 위치하는 특정 키포인트 그룹의 특정 키포인트들의 수가 기설정된 제2 임계치 미만일 경우에는 특정 승객이 특정 좌석에 매칭되지 않는 것으로 판단할 수 있다.
따라서, 특정 평균 포인트가 특정 ROI 내에 위치하며, 특정 분산이 기설정된 제1 임계치 이하이고, 특정 ROI 에서 특정 키포인트 그룹의 특정 키포인트의 수가 기설정된 제2 임계치 이상인 경우, 좌석 점유 매칭기(200)는 특정 승객이 특정 좌석에 매칭되는 것으로 판단할 수 있다.
결과적으로, 자동차의 에어백 전개시, 상기에서 검출된 승객들의 키, 몸무게 및 좌석을 참조로 하여 정확한 에어백의 전개가 가능하도록 할 수 있다.
상기에서 설명한 바와 같이, 본 발명은 사람의 상태 인식을 기반으로 카메라로부터 획득된 자동차의 실내 이미지를 이용하여 승객들의 얼굴 정보들로부터 승객들 각각의 나이/성별/인종을 예측하고, 사람 인식을 사용하여 승객들의 신체 부위 길이를 측정하고, 이들의 정보를 참조하여 승객들의 키 및 몸무게를 검출한다. 또한, 본 발명은 종래의 센서 방식에 비하여 비용을 감소시키고, 자동차의 주변 환경에 영향을 받지 않으며, 정보 처리 속도를 향상시킬 수 있다.
또한, 이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims (18)

  1. 사람의 상태 인식을 기반으로 자동차의 한 명 이상의 승객에 대한 신체 정보를 검출하는 방법에 있어서,
    (a) 상기 자동차 실내의 적어도 하나의 실내 이미지가 획득되면, 승객 신체 정보 검출 장치가, (i) 상기 실내 이미지를 얼굴 인식 네트워크로 입력함으로써, 상기 얼굴 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객들 각각의 얼굴 각각을 검출하도록 하고, 상기 검출된 얼굴 각각에 대응하는 다수의 승객 특징 정보들을 출력하도록 하고, (ii) 상기 실내 이미지를 신체 인식 네트워크로 입력함으로써, 상기 신체 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객 각각의 신체 각각을 검출하도록 하며, 상기 검출된 신체 각각의 신체 부위 길이 정보들을 출력하도록 하는 단계; 및
    (b) 상기 승객 신체 정보 검출 장치가, 키 맵핑 테이블로부터 특정 승객에 대한 특정 승객 특징 정보에 대응하는 특정 키 맵핑 정보를 검색하고, 상기 특정 승객의 특정 신체 부위 길이 정보를 참조하여 상기 특정 키 맵핑 정보로부터 상기 특정 승객의 특정 키를 획득하며, 몸무게 맵핑 테이블로부터 상기 특정 승객 특징 정보에 대응하는 특정 몸무게 맵핑 정보를 검색하고, 상기 특정 승객의 상기 특정 키를 참조하여 상기 특정 몸무게 맵핑 정보로부터 상기 특정 승객의 몸무게를 획득하는 단계를 포함하되, 상기 키 맵핑 테이블은 사람 그룹별 키 각각에 대한 상기 사람 그룹 각각의 하나 이상의 세그멘트 신체 부분의 하나 이상의 기설정된 비율을 나타내는 키 맵핑 정보를 저장하고, 상기 몸무게 맵핑 테이블은 상기 사람 그룹 각각의 키 각각과 몸무게 각각 사이의 기설정된 상관 관계를 나타내는 다수의 몸무게 맵핑 정보를 저장하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 (a) 단계에서,
    상기 승객 신체 정보 검출 장치는, 상기 실내 이미지를 상기 신체 인식 네트워크로 입력함으로써 상기 신체 인식 네트워크로 하여금, (i) 특징 추출 네트워크를 통해 상기 실내 이미지에 대응하는 하나 이상의 채널을 가지는 하나 이상의 특징 텐서를 출력하도록 하고, (ii) 키포인트 히트맵 & 파트 어피니티 필드 추출기(keypoint heatmap & part affinity field extractor)를 통해 상기 특징 텐서 각각에 대응하는 하나 이상의 채널을 가지는 하나 이상의 키포인트 히트맵 및 파트 어피니티 필드를 생성하도록 하며, (iii) 키포인트 검출기를 통해 상기 키포인트 히트맵에서 키포인트들을 추출함으로써 상기 파트 어피니티 필드를 참조하여 상기 추출된 키포인트들을 그룹핑하여 상기 승객별 신체 부위들을 생성하도록 하며, 그 결과, 상기 신체 인식 네트워크로 하여금 상기 승객별 신체 부위들을 참조함으로써 상기 승객들 각각에 대한 상기 신체 부위 길이 정보들을 출력하도록 하는 것을 특징으로 하는 방법.
  3. 제2항에 있어서,
    상기 특징 추출 네트워크는 적어도 하나의 컨볼루션 레이어를 포함하고, 적어도 하나의 컨벌루션 연산을 상기 실내 이미지에 적용하여 상기 특징 텐서를 출력하는 것을 특징으로 하는 방법.
  4. 제2항에 있어서,
    상기 키포인트 히트맵 & 파트 어피니티 필드 추출기는 풀리 컨볼루션 네트워크 및 1x1 컨볼루션 레이어 중 하나를 포함하며, 풀리 컨볼루션 연산 또는 1x1 컨볼루션 연산을 상기 특징 텐서에 적용함으로써 상기 키포인트 히트맵 및 상기 파트 어피니티 필드를 생성하는 것을 특징으로 하는 방법.
  5. 제2항에 있어서,
    상기 키포인트 검출기는 상기 파트 어피니티 필드를 참조하여 상기 추출된 키포인트들 중 상호 연결될 확률이 가장 높은 각각의 쌍들을 연결함으로써 상기 추출된 키포인트들을 그룹핑하는 것을 특징으로 하는 방법.
  6. 제2항에 있어서,
    상기 특징 추출 네트워크와 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기는 학습 장치에 의해 학습된 상태로서,
    상기 학습 장치에 의해, (i) 상기 특징 추출 네트워크에 하나 이상의 학습용 객체를 포함하는 적어도 하나의 학습 이미지를 입력함으로써 상기 특징 추출 네트워크로 하여금 상기 학습 이미지에 적어도 한번의 컨볼루션 연산을 적용함으로써 하나 이상의 채널을 가지는 하나 이상의 학습용 특징 텐서를 생성하도록 하고, (ii) 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기에 상기 학습용 특징 텐서를 입력함으로써 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기로 하여금 상기 학습용 특징 텐서 각각에 대한 하나 이상의 채널을 가지는 하나 이상의 학습용 키포인트 히트맵 및 하나 이상의 학습용 파트 어피니티 필드를 생성하도록 하며, (iii) 상기 학습용 키포인트 히트맵 및 상기 학습용 파트 어피니티 필드를 상기 키포인트 검출기로 입력함으로써 상기 키포인트 검출기로 하여금 상기 학습용 키포인트 히트맵 각각으로부터 학습용 키포인트들을 추출하도록 하고, 상기 학습용 파트 어피니티 필드 각각을 참조하여 상기 추출된 학습용 키포인트들을 그룹핑함으로써 상기 학습용 객체 각각마다 키포인트들을 검출하도록 하며, (iv) 로스 레이어로 하여금 상기 학습용 객체별 상기 키포인트들과 이에 대응되는 GT(ground truth)를 참조하여 하나 이상의 로스를 계산함으로써 상기 로스를 이용한 백프로퍼게이션에 의해 상기 로스가 최소화되도록 상기 특징 추출 네트워크 및 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기의 하나 이상의 파라미터를 조정하는 것을 특징으로 하는 방법.
  7. 제1항에 있어서,
    상기 (a) 단계에서,
    상기 승객 신체 정보 검출 장치는, 상기 얼굴 인식 네트워크에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크로 하여금, 얼굴 검출기를 통해 상기 실내 이미지에 위치하는 승객들 각각의 얼굴 각각을 검출하도록 하고, 얼굴 특징 분류기를 통해 얼굴 이미지들 각각에 대한 다수의 승객 특징 정보들을 출력하도록 하는 것을 특징으로 하는 방법.
  8. 제1항에 있어서,
    상기 (a) 단계에서,
    상기 승객 신체 정보 검출 장치는, 상기 얼굴 인식 네트워크에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크로 하여금, (i) 적어도 하나의 컨볼루션 레이어를 통해 상기 실내 이미지에 적어도 하나의 컨벌루션 연산을 적용하고 상기 실내 이미지에 대응하는 적어도 하나의 특징 맵을 출력하도록 하며, (ii) 영역 프로포잘 네트워크(Region Proposal Network)를 통해 상기 특징 맵 상에서 상기 승객들이 위치되는 것으로 예측되는 하나 이상의 프로포잘 박스들을 출력하도록 하고, (iii) 풀링 레이어를 통해 상기 특징 맵 상의 상기 프로포잘 박스에 대응하는 하나 이상의 영역에 풀링 연산을 적용하여 적어도 하나의 특징 벡터를 출력하도록 하며, (iv) 풀리 커넥티드 레이어를 통해 상기 특징 벡터에 풀리 커텍티드 연산을 적용하여 상기 프로포잘 박스들 각각에 대응하는 상기 승객들의 얼굴 각각에 대응하는 상기 다수의 승객 특징 정보들을 출력하도록 하는 것을 특징으로 하는 방법.
  9. 제1항에 있어서,
    상기 다수의 승객 특징 정보들은 상기 승객들 각각에 대응하는 나이, 성별, 및 인종 각각을 포함하는 것을 특징으로 하는 방법.
  10. 사람의 상태 인식을 기반으로 자동차의 한 명 이상의 승객에 대한 신체 정보를 검출하는 장치에 있어서,
    적어도 하나의 인스트럭션들을 저장하는 적어도 하나의 메모리; 및
    상기 인스트럭션들을 수행하도록 설정된 적어도 하나의 프로세서를 포함하되, 상기 프로세서는, (I) 상기 자동차 실내의 적어도 하나의 실내 이미지가 획득되면, (i) 상기 실내 이미지를 얼굴 인식 네트워크로 입력함으로써, 상기 얼굴 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객들 각각의 얼굴 각각을 검출하도록 하고, 상기 검출된 얼굴 각각에 대응하는 다수의 승객 특징 정보들을 출력하도록 하고, (ii) 상기 실내 이미지를 신체 인식 네트워크로 입력함으로써, 상기 신체 인식 네트워크로 하여금 상기 실내 이미지로부터 상기 승객 각각의 신체 각각을 검출하도록 하며, 상기 검출된 신체 각각의 신체 부위 길이 정보들을 출력하도록 하는 프로세스; 및 (II) 키 맵핑 테이블로부터 특정 승객에 대한 특정 승객 특징 정보에 대응하는 특정 키 맵핑 정보를 검색하고, 상기 특정 승객의 특정 신체 부위 길이 정보를 참조하여 상기 특정 키 맵핑 정보로부터 상기 특정 승객의 특정 키를 획득하며, 몸무게 맵핑 테이블로부터 상기 특정 승객 특징 정보에 대응하는 특정 몸무게 맵핑 정보를 검색하고, 상기 특정 승객의 상기 특정 키를 참조하여 상기 특정 몸무게 맵핑 정보로부터 상기 특정 승객의 몸무게를 획득하는 프로세스를 수행하되, 상기 키 맵핑 테이블은 사람 그룹별 키 각각에 대한 상기 사람 그룹 각각의 하나 이상의 세그멘트 신체 부분의 하나 이상의 기설정된 비율을 나타내는 키 맵핑 정보를 저장하고, 상기 몸무게 맵핑 테이블은 상기 사람 그룹 각각의 키 각각과 몸무게 각각 사이의 기설정된 상관 관계를 나타내는 다수의 몸무게 맵핑 정보를 저장하는 것을 특징으로 하는 장치.
  11. 제10항에 있어서,
    상기 (I) 프로세스는,
    상기 프로세서가, 상기 실내 이미지를 상기 신체 인식 네트워크로 입력함으로써 상기 신체 인식 네트워크로 하여금, (i) 특징 추출 네트워크를 통해 상기 실내 이미지에 대응하는 하나 이상의 채널을 가지는 하나 이상의 특징 텐서를 출력하도록 하고, (ii) 키포인트 히트맵 & 파트 어피니티 필드 추출기(keypoint heatmap & part affinity field extractor)를 통해 상기 특징 텐서 각각에 대응하는 하나 이상의 채널을 가지는 하나 이상의 키포인트 히트맵 및 파트 어피니티 필드를 생성하도록 하며, (iii) 키포인트 검출기를 통해 상기 키포인트 히트맵에서 키포인트들을 추출함으로써 상기 파트 어피니티 필드를 참조하여 상기 추출된 키포인트들을 그룹핑하여 상기 승객별 신체 부위들을 생성하도록 하며, 그 결과, 상기 신체 인식 네트워크로 하여금 상기 승객별 신체 부위들을 참조함으로써 상기 승객들 각각에 대한 상기 신체 부위 길이 정보들을 출력하도록 하는 것을 특징으로 하는 장치.
  12. 제11항에 있어서,
    상기 특징 추출 네트워크는 적어도 하나의 컨볼루션 레이어를 포함하고, 적어도 하나의 컨벌루션 연산을 상기 실내 이미지에 적용하여 상기 특징 텐서를 출력하는 것을 특징으로 하는 장치.
  13. 제11항에 있어서,
    상기 키포인트 히트맵 & 파트 어피니티 필드 추출기는 풀리 컨볼루션 네트워크 및 1x1 컨볼루션 레이어 중 하나를 포함하며, 풀리 컨볼루션 연산 또는 1x1 컨볼루션 연산을 상기 특징 텐서에 적용함으로써 상기 키포인트 히트맵 및 상기 파트 어피니티 필드를 생성하는 것을 특징으로 하는 장치.
  14. 제11항에 있어서,
    상기 키포인트 검출기는 상기 파트 어피니티 필드를 참조하여 상기 추출된 키포인트들 중 상호 연결될 확률이 가장 높은 각각의 쌍들을 연결함으로써 상기 추출된 키포인트들을 그룹핑하는 것을 특징으로 하는 장치.
  15. 제11항에 있어서,
    상기 특징 추출 네트워크와 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기는 학습 장치에 의해 학습된 상태로서, 상기 학습 장치에 의해, (i) 상기 특징 추출 네트워크에 하나 이상의 학습용 객체를 포함하는 적어도 하나의 학습 이미지를 입력함으로써 상기 특징 추출 네트워크로 하여금 상기 학습 이미지에 적어도 한번의 컨볼루션 연산을 적용함으로써 하나 이상의 채널을 가지는 하나 이상의 학습용 특징 텐서를 생성하도록 하고, (ii) 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기에 상기 학습용 특징 텐서를 입력함으로써 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기로 하여금 상기 학습용 특징 텐서 각각에 대한 하나 이상의 채널을 가지는 하나 이상의 학습용 키포인트 히트맵 및 하나 이상의 학습용 파트 어피니티 필드를 생성하도록 하며, (iii) 상기 학습용 키포인트 히트맵 및 상기 학습용 파트 어피니티 필드를 상기 키포인트 검출기로 입력함으로써 상기 키포인트 검출기로 하여금 상기 학습용 키포인트 히트맵 각각으로부터 학습용 키포인트들을 추출하도록 하고, 상기 학습용 파트 어피니티 필드 각각을 참조하여 상기 추출된 학습용 키포인트들을 그룹핑함으로써 상기 학습용 객체 각각마다 키포인트들을 검출하도록 하며, (iv) 로스 레이어로 하여금 상기 학습용 객체별 상기 키포인트들과 이에 대응되는 GT(ground truth)를 참조하여 하나 이상의 로스를 계산함으로써 상기 로스를 이용한 백프로퍼게이션에 의해 상기 로스가 최소화되도록 상기 특징 추출 네트워크 및 상기 키포인트 히트맵 & 파트 어피니티 필드 추출기의 하나 이상의 파라미터를 조정하는 것을 특징으로 하는 장치.
  16. 제10항에 있어서,
    상기 (I) 프로세스는,
    상기 프로세서가, 상기 얼굴 인식 네트워크에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크로 하여금, 얼굴 검출기를 통해 상기 실내 이미지에 위치하는 승객들 각각의 얼굴 각각을 검출하도록 하고, 얼굴 특징 분류기를 통해 얼굴 이미지들 각각에 대한 다수의 승객 특징 정보들을 출력하도록 하는 것을 특징으로 하는 장치.
  17. 제10항에 있어서,
    상기 (I) 프로세스는,
    상기 프로세서가, 상기 얼굴 인식 네트워크에 상기 실내 이미지를 입력함으로써 상기 얼굴 인식 네트워크로 하여금, (i) 적어도 하나의 컨볼루션 레이어를 통해 상기 실내 이미지에 적어도 하나의 컨벌루션 연산을 적용하고 상기 실내 이미지에 대응하는 적어도 하나의 특징 맵을 출력하도록 하며, (ii) 영역 프로포잘 네트워크(Region Proposal Network)를 통해 상기 특징 맵 상에서 상기 승객들이 위치되는 것으로 예측되는 하나 이상의 프로포잘 박스들을 출력하도록 하고, (iii) 풀링 레이어를 통해 상기 특징 맵 상의 상기 프로포잘 박스에 대응하는 하나 이상의 영역에 풀링 연산을 적용하여 적어도 하나의 특징 벡터를 출력하도록 하며, (iv) 풀리 커넥티드 레이어를 통해 상기 특징 벡터에 풀리 커텍티드 연산을 적용하여 상기 프로포잘 박스들 각각에 대응하는 상기 승객들의 얼굴 각각에 대응하는 상기 다수의 승객 특징 정보들을 출력하도록 하는 것을 특징으로 하는 장치.
  18. 제10항에 있어서,
    상기 다수의 승객 특징 정보들은 상기 승객들 각각에 대응하는 나이, 성별, 및 인종 각각을 포함하는 것을 특징으로 하는 장치.
KR1020200004511A 2019-01-30 2020-01-13 사람의 상태 인식을 기반으로 신체 부위 길이 및 얼굴 정보를 사용하여 승객의 키 및 몸무게를 예측하는 방법 및 장치 KR102338757B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962798575P 2019-01-30 2019-01-30
US62/798,575 2019-01-30
US16/731,073 US10643085B1 (en) 2019-01-30 2019-12-31 Method and device for estimating height and weight of passengers using body part length and face information based on human's status recognition
US16/731,073 2019-12-31

Publications (2)

Publication Number Publication Date
KR20200094651A true KR20200094651A (ko) 2020-08-07
KR102338757B1 KR102338757B1 (ko) 2021-12-15

Family

ID=70461267

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200004511A KR102338757B1 (ko) 2019-01-30 2020-01-13 사람의 상태 인식을 기반으로 신체 부위 길이 및 얼굴 정보를 사용하여 승객의 키 및 몸무게를 예측하는 방법 및 장치

Country Status (5)

Country Link
US (1) US10643085B1 (ko)
EP (1) EP3690720B1 (ko)
JP (1) JP6865366B2 (ko)
KR (1) KR102338757B1 (ko)
CN (1) CN111507174B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230030251A (ko) * 2021-08-25 2023-03-06 연세대학교 산학협력단 안면 정보 익명화 및 재식별 기능 기반 개인 정보 보호 기능을 제공하는 감시 또는 관찰 시스템

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7073880B2 (ja) * 2018-04-19 2022-05-24 トヨタ自動車株式会社 進路決定装置
CN110163080A (zh) * 2019-04-02 2019-08-23 腾讯科技(深圳)有限公司 人脸关键点检测方法及装置、存储介质和电子设备
US11068701B2 (en) * 2019-06-13 2021-07-20 XMotors.ai Inc. Apparatus and method for vehicle driver recognition and applications of same
CN111783882B (zh) * 2020-06-30 2022-09-09 北京市商汤科技开发有限公司 关键点检测方法、装置、电子设备及存储介质
CN111898642B (zh) * 2020-06-30 2021-08-13 北京市商汤科技开发有限公司 关键点检测方法、装置、电子设备及存储介质
US11807181B2 (en) * 2020-10-27 2023-11-07 GM Global Technology Operations LLC Vision-based airbag enablement
CN112381003B (zh) * 2020-11-16 2023-08-22 网易(杭州)网络有限公司 动作捕捉方法、装置、设备及存储介质
WO2022131396A1 (ko) * 2020-12-16 2022-06-23 주식회사 모빌린트 운전석을 포함한 차량의 실내 장치를 자동으로 조절하기 위한 방법 및 이를 위한 장치
KR102232646B1 (ko) * 2020-12-16 2021-03-30 주식회사 모빌린트 운전석을 포함한 차량의 실내 장치를 자동으로 조절하기 위한 방법 및 이를 위한 장치
GB2605754A (en) * 2021-02-19 2022-10-19 Mercedes Benz Group Ag A method for estimating the height of a person inside of a motor vehicle by a height estimation device
WO2022216973A1 (en) * 2021-04-08 2022-10-13 Universal City Studios Llc Guest measurement systems and methods
US11708714B2 (en) * 2021-08-05 2023-07-25 Ford Global Technologies, Llc Vehicle having door with obstacle avoidance
CN113421185B (zh) * 2021-08-23 2021-11-05 武汉轻度科技有限公司 一种基于StyleGAN的移动端人脸年龄编辑方法
CN113762168A (zh) * 2021-09-09 2021-12-07 南京领行科技股份有限公司 一种安全告警方法、装置、电子设备及存储介质
US12001520B2 (en) * 2021-09-27 2024-06-04 Adobe Inc. Generating simulated images that enhance socio-demographic diversity
CN114581627B (zh) * 2022-03-04 2024-04-16 合众新能源汽车股份有限公司 基于arhud的成像方法和系统
EP4303821A1 (en) 2022-07-07 2024-01-10 Aptiv Technologies Limited Seated passenger height estimation
CN117442190B (zh) * 2023-12-21 2024-04-02 山东第一医科大学附属省立医院(山东省立医院) 一种基于目标检测的创面自动测量方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146471A (ja) * 2008-12-22 2010-07-01 Denso Corp 行動推定装置、プログラム
JP2017041218A (ja) * 2015-08-20 2017-02-23 仁一 石▲崎▼ 顔画像から体重を推定するシステム
JP2017215861A (ja) * 2016-06-01 2017-12-07 トヨタ自動車株式会社 行動認識装置,学習装置,並びに方法およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7243945B2 (en) * 1992-05-05 2007-07-17 Automotive Technologies International, Inc. Weight measuring systems and methods for vehicles
US9290146B2 (en) * 1992-05-05 2016-03-22 Intelligent Technologies International, Inc. Optical monitoring of vehicle interiors
US5983147A (en) * 1997-02-06 1999-11-09 Sandia Corporation Video occupant detection and classification
DE102016113933A1 (de) * 2015-08-17 2017-02-23 Ford Global Technologies, Llc System und Verfahren für Insassengrösse
US9446730B1 (en) * 2015-11-08 2016-09-20 Thunder Power Hong Kong Ltd. Automatic passenger airbag switch
US20180074494A1 (en) * 2016-09-13 2018-03-15 Ford Global Technologies, Llc Passenger tracking systems and methods
KR101955506B1 (ko) * 2016-12-12 2019-03-11 주식회사 피엘케이 테크놀로지 대향 카메라를 이용한 대형 차량의 측면 안전 보조 장치 및 방법
US11026634B2 (en) * 2017-04-05 2021-06-08 doc.ai incorporated Image-based system and method for predicting physiological parameters

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146471A (ja) * 2008-12-22 2010-07-01 Denso Corp 行動推定装置、プログラム
JP2017041218A (ja) * 2015-08-20 2017-02-23 仁一 石▲崎▼ 顔画像から体重を推定するシステム
JP2017215861A (ja) * 2016-06-01 2017-12-07 トヨタ自動車株式会社 行動認識装置,学習装置,並びに方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230030251A (ko) * 2021-08-25 2023-03-06 연세대학교 산학협력단 안면 정보 익명화 및 재식별 기능 기반 개인 정보 보호 기능을 제공하는 감시 또는 관찰 시스템

Also Published As

Publication number Publication date
KR102338757B1 (ko) 2021-12-15
CN111507174B (zh) 2023-08-22
EP3690720B1 (en) 2024-06-12
CN111507174A (zh) 2020-08-07
JP6865366B2 (ja) 2021-04-28
US10643085B1 (en) 2020-05-05
JP2020123352A (ja) 2020-08-13
EP3690720A1 (en) 2020-08-05

Similar Documents

Publication Publication Date Title
KR20200094651A (ko) 사람의 상태 인식을 기반으로 신체 부위 길이 및 얼굴 정보를 사용하여 승객의 키 및 몸무게를 예측하는 방법 및 장치
JP6815613B2 (ja) 人の状態識別のためのイメージ分析により検出された乗客のポイントを利用して車両占有を検出する方法及び装置
US20190050711A1 (en) Method, storage medium and electronic device for detecting vehicle crashes
US7715591B2 (en) High-performance sensor fusion architecture
US7483866B2 (en) Subclass partitioning in a pattern recognition classifier for controlling deployment of an occupant restraint system
US10474930B1 (en) Learning method and testing method for monitoring blind spot of vehicle, and learning device and testing device using the same
CN107451524A (zh) 行为识别装置、学习装置、行为识别方法、学习方法及计算机可读的记录介质
SE523753C2 (sv) Metod för att utveckla ett system för att identi fiera ett objekts närvaro och position i ett fordon
CN104680124A (zh) 检测行人的影像处理装置及其方法
CN110889318A (zh) 利用cnn的车道检测方法和装置
CN110879961A (zh) 利用车道模型的车道检测方法和装置
KR20200095384A (ko) 운전자 상태에 따라 맞춤형의 캘리브레이션을 위해 운전자 보조 장치를 자동으로 조정하는 방법 및 장치
CN110472470A (zh) 用于确定车辆的周围环境状态的方法和系统
Reyna et al. Head detection inside vehicles with a modified SVM for safer airbags
Jaworek-Korjakowska et al. SafeSO: interpretable and explainable deep learning approach for seat occupancy classification in vehicle interior
Firdaus et al. Tourist attractions classification using ResNet
US10984262B2 (en) Learning method and testing method for monitoring blind spot of vehicle, and learning device and testing device using the same
KR20220073412A (ko) 승객 모니터링 시스템 및 방법, 그리고 이를 이용한 승하차 인식 방법
CN111382678B (zh) 基于改进型cnn网络的旅游观光车客流统计算法
GB2606753A (en) In-cabin monitoring method and related pose pattern categorization method

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right