KR20180012638A - 누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치 - Google Patents

누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치 Download PDF

Info

Publication number
KR20180012638A
KR20180012638A KR1020160095733A KR20160095733A KR20180012638A KR 20180012638 A KR20180012638 A KR 20180012638A KR 1020160095733 A KR1020160095733 A KR 1020160095733A KR 20160095733 A KR20160095733 A KR 20160095733A KR 20180012638 A KR20180012638 A KR 20180012638A
Authority
KR
South Korea
Prior art keywords
image
error
basic
images
obtaining
Prior art date
Application number
KR1020160095733A
Other languages
English (en)
Inventor
마수드
박미룡
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020160095733A priority Critical patent/KR20180012638A/ko
Publication of KR20180012638A publication Critical patent/KR20180012638A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • G06V40/25Recognition of walking or running movements, e.g. gait recognition
    • G06K9/00348
    • G06K9/4609
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치가 제공된다. ACF(Aggregate Channel Features) 기법을 토대로 영상에서 객체를 검출하는 경우, 원본 영상에 대하여 대칭 에러 영상 필터를 포함하는 미리 설정된 다수의 필터들을 적용시켜 특징 정보를 포함하는 특징 영상을 획득하고, 특징 영상들을 토대로 적분 영상을 획득한다. 그리고 적분 영상에 대하여 다수의 분류기를 적용시켜 상기 원본 영상이 목표물에 대응하는지를 검출한다. 대칭 에러 영상 필터는, 좌우 대칭적 특징을 가지는 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 수평적으로 플립(flip)시켜 획득한 영상들을 토대로 생성된다.

Description

누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치{Method and apparatus for detecting object in vision recognition with aggregate channel features}
본 발명은 영상 인식에 관한 것으로, 더욱 상세하게 말하자면, 누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치에 관한 것이다.
현재 컴퓨터를 사용하여 인간의 시각적인 인식 능력 일반을 재현하는 분야인 컴퓨터 비전(computer vision)을 이용하여 보행자를 검출하는 기술들이 개발되고 있으며, 영상 인식을 통해 보행자를 찾을 때 빠르고 높은 정확도와 성능을 목표로 연구 개발을 진행하고 있다.
하지만, 정확도와 성능 사이에 상호 트레이드-오프(trade-off)가 발생한다. 정확도는 원래 포함된 것에서 얼마나 많은 발견을 하는가(있어야 하는데 있다고 찾는 것)와. 찾지 말아야 하는데 오류로 찾는 것을 줄이는 것이 관건이고, 성능은 초당 얼마나 빨리 목표물을 탐지하는가가 관건이다. 성능을 개선하기 위하여 결정 트리(Decision Tree)나 이들이 조합된 결정 숲(Decision Forest) 방법을 이용하여 판단을 하게 되고, 결국 LUV, 그레디언트(gradient) 크기 벡터, 바이너리 그레디언트 채널 등의 조합을 통한 10여개의 필터를 계층으로 사용해서 로컬 상호관계를 만들어 오류률을 줄인다. 약한 분류기들을 조합해서 학습을 시킨 후 고속 정확도를 얻는 아다부스트(ada-boost) 기법들은 누적 채널 특징점(ACF, Aggregate Channel Features) 기법이며, AFC 기법은 여러 채널에 걸쳐 특징을 뽑아서 블록 형태로 값을 합치는 방식이다.
그러나 기존의 ACF 기법은 여전히 오류율이 높다. 일반적인 ACF 기반의 인식 알고리즘은 오류율이 약 25%정도 나타나며, 이러한 오류율을 줄여나가기 위한 다양한 방법들이 제시되었다. 컴퓨터들을 인터넷으로 연결하거나 혹은 고성능 컴퓨터들을 병렬로 사용할 수 있게 되면서, CNN(Convolutional Neural Network)과 같은 딥러닝(deep learning) 기술들은 정확도 개선에 기여하고 있지만, 이를 이용하기 위해서는 고성능의 컴퓨팅 환경이 필요하다.
자동차용 비전 알고리즘은 임베디드 상에서 동작되기를 원하는 상황이라, 고성능 칩을 적용하여 자동차용 비전 알고리즘을 구현하기가 쉽지 않다.
본 발명이 해결하고자 하는 과제는 영상 인식에서 보행자 등의 객체(object)를 찾을 때 검출 오류율을 감소시킬 수 있는 영상 인식에서의 객체 검출 방법 및 장치를 제공하는 것이다.
또한, 본 발명의 해결하고자 하는 과제는 ACF(Aggregate Channel Features) 기법을 사용하여 영상 인식에서 객체를 찾을 때, 검출 오류율을 감소시킬 수 있는 방법 및 장치를 제공하는 것이다.
본 발명의 특징에 따른 객체 검출 방법은, ACF(Aggregate Channel Features) 기법을 토대로 영상에서 객체를 검출하는 방법에서, 원본 영상에 대하여 대칭 에러 영상 필터를 포함하는 미리 설정된 다수의 필터들을 적용시켜 특징 정보를 포함하는 특징 영상을 획득하는 단계; 상기 특징 영상들을 토대로 적분 영상을 획득하는 단계; 및 상기 적분 영상에 대하여 다수의 분류기를 적용시켜 상기 원본 영상이 목표물에 대응하는지를 검출하는 단계를 포함하며, 상기 대칭 에러 영상 필터는, 좌우 대칭적 특징을 가지는 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 수평적으로 플립(flip)시켜 획득한 영상들을 토대로 생성된다.
상기 대칭 에러 영상 필터는 좌우 대칭적 특징을 가지는 다수의 기본 영상의 에러 영상들을 학습한 결과로부터 획득되는 패턴을 토대로 생성될 수 있으며, 상기 좌우 대칭적 특징을 가지는 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 수평적으로 플립시켜 획득한 영상들을 토대로 할 수 있다.
상기 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상에 해당하는 에러 영상과, 상기 기본 영상의 좌측면의 영상에 해당하는 에러 영상을 포함할 수 있다. 이 경우, 상기 우측면의 영상에 해당하는 에러 영상은, 상기 기본 영상의 좌측면의 영상에서 상기 우측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 획득될 수 있으며, 상기 좌측면의 영상에 해당하는 에러 영상은 상기 기본 영상의 우측면의 영상에서 상기 좌측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 획득될 수 있다.
상기 우측면의 영상에 해당하는 에러 영상과 상기 좌측면의 영상에 해당하는 에러 영상은 절대값으로 이루어질 수 있다.
상기 기본 영상의 에러 영상은 상기 기본 영상의 좌측면의 영상을 수평적으로 플립시켜 획득한 영상과, 상기 기본 영상의 좌측면의 영상을 합하여 획득될 수 있다.
상기 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상을 수평적으로 플립시켜 획득한 영상과, 상기 기본 영상의 우측면의 영상을 합하여 획득될 수 있다.
상기 기본 영상의 에러 영상은, 상기 기본 영상을 4등분 한 경우, 상기 기본 영상의 좌측 상측면에 대응하는 영상을 수평적으로 플립시켜 획득한 영상, 상기 좌측 상측면에 대응하는 영상, 상기 기본 영상의 우측 하측면에 대응하는 영상을 수평적으로 플립시켜 획득한 영상, 그리고 상기 기본 영상의 우측 하측면에 대응하는 영상을 합하여 획득될 수 있다.
상기 기본 영상의 에러 영상은, 상기 기본 영상을 4등분 한 경우, 상기 기본 영상의 좌측 하측면에 대응하는 영상을 수평적으로 플립시켜 획득한 영상, 상기 좌측 하측면에 대응하는 영상, 상기 기본 영상의 우측 상측면에 대응하는 영상을 수평적으로 플립시켜 획득한 영상, 그리고 상기 기본 영상의 우측 상측면에 대응하는 영상을 합하여 획득될 수 있다.
본 발명의 다른 특징에 따른 필터 생성 방법은, 영상에서 객체를 검출하기 위한 ACF(Aggregate Channel Features) 기법에 사용되는 필터를 생성하는 방법에서, 좌우 대칭적인 특징을 가지는 기본 영상에 대하여 우측면의 에러 영상과 좌측면의 에러 영상 중 적어도 하나를 획득하는 단계; 상기 우측면의 에러 영상과 좌측면의 에러 영상 중 적어도 하나를 토대로 상기 기본 영상의 에러 영상을 획득하는 단계; 및 다수의 기본 영상들의 에러 영상들을 토대로 획득된 패턴에 따라 대칭 영상 에러 필터를 생성하는 단계를 포함한다.
상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상의 우측면의 영상과 좌측면의 영상을 각각 수평적으로 플립시켜 상기 우측면의 에러 영상과 상기 좌측면의 에러 영상을 획득할 수 있다.
상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상의 좌측면의 영상에서 상기 우측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 상기 우측면의 에러 영상을 획득하는 단계; 및 상기 원본 영상의 우측면의 영상에서 상기 좌측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 상기 좌측면의 에러 영상을 획득하는 단계를 포함할 수 있다.
상기 우측면의 에러 영상과 상기 좌측면의 에러 영상은 절대값으로 이루어질 수 있다. 상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 우측면의 에러 영상과 상기 좌측면의 에러 영상을 합하여 상기 기본 영상의 에러 영상을 획득할 수 있다.
상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상의 좌측면의 영상을 수평적으로 플립시켜 상기 좌측면의 에러 영상을 획득할 수 있으며, 상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 기본 영상의 좌측면의 영상과 상기 좌측면의 에러 영상을 합하여 상기 기본 영상의 에러 영상을 획득할 수 있다.
상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상의 우측면의 영상을 수평적으로 플립시켜 상기 우측면의 에러 영상을 획득할 수 있다. 이 때, 상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 우측면의 에러 영상과 상기 기본 영상의 우측면의 영상을 합하여 상기 기본 영상의 에러 영상을 획득할 수 있다.
상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상을 4등분 한 경우, 상기 기본 영상의 좌측 상측면에 대응하는 영상을 수평적으로 플립시켜 제1 에러 영상을 획득하는 단계; 및 상기 기본 영상의 우측 하측면에 대응하는 영상을 수평적으로 플립시켜 제2 에러 영상을 획득하는 단계를 포함할 수 있다. 이 때, 상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 기본 영상의 좌측 상측면에 대응하는 영상과, 상기 제1 에러 영상과, 상기 제2 에러 영상과 상기 기본 영상의 우측 하측면에 대응하는 영상을 합하여, 상기 기본 영상의 에러 영상을 획득할 수 있다.
상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상을 4등분 한 경우, 상기 기본 영상의 좌측 하측면에 대응하는 영상을 수평적으로 플립시켜 제1 에러 영상을 획득하는 단계; 및 상기 기본 영상의 우측 상측면에 대응하는 영상을 수평적으로 플립시켜 제2 에러 영상을 획득하는 단계를 포함할 수 있다. 이 때, 상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 제2 에러 영상과 상기 기본 영상의 우측 상측면에 대응하는 영상과, 상기 기본 영상의 좌측 하측면에 대응하는 영상과 상기 제1 에러 영상을 합하여, 상기 기본 영상의 에러 영상을 획득할 수 있다.
본 발명의 또 다른 특징에 따른 객체 검출 장치는, ACF(Aggregate Channel Features) 기법을 토대로 영상에서 객체를 검출하는 장치에서, 영상을 입력받도록 구성되는 입출력부; 그리고 상기 입출력부와 연결되고, 객체 검출 처리를 수행하는 프로세서를 포함하며, 상기 프로세서는, 원본 영상에 대하여 적어도 하나의 대칭 에러 영상 필터를 포함하는 미리 설정된 다수의 필터들을 적용시켜 특징 정보를 포함하는 특징 영상을 획득하도록 구성되는 필터링부; 상기 특징 영상들을 토대로 하는 적분 영상을 획득하도록 구성되는 적분 영상 획득 처리부; 및 상기 적분 영상에 대하여 다수의 분류기를 적용시켜 상기 원본 영상이 목표물에 대응하는지를 검출하도록 구성되는 검출 처리부를 포함하며, 상기 대칭 에러 영상 필터는, 좌우 대칭적 특징을 가지는 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 각각 수평적으로 플립시켜 획득한 영상들을 토대로 생성된다.
상기 대칭 에러 영상 필터는 좌우 대칭적 특징을 가지는 다수의 기본 영상의 에러 영상들을 학습한 결과로부터 획득되는 패턴을 토대로 생성될 수 있으며, 상기 좌우 대칭적 특징을 가지는 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 수평적으로 플립시켜 획득한 영상들을 토대로 할 수 있다.
상기 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상에 해당하는 에러 영상과, 상기 기본 영상의 좌측면의 영상에 해당하는 에러 영상을 포함할 수 있으며, 상기 우측면의 영상에 해당하는 에러 영상은 상기 원본 영상의 좌측면의 영상에서 상기 우측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 획득될 수 있다. 그리고 상기 좌측면의 영상에 해당하는 에러 영상은 상기 원본 영상의 우측면의 영상에서 상기 좌측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 획득될 수 있다.
상기 프로세서는, 다수의 원본 영상의 우측면과 좌측면 각각에 대응하는 에러 영상들을 학습한 결과로부터 획득되는 패턴을 토대로 상기 대칭 에러 영상 필터를 생성하는 필터 생성 처리부를 더 포함할 수 있다.
본 발명의 실시 예에 따르면, 영상을 이용하여 보행자나 차량 등의 객체를 인식하는 경우, ACF 기법에 추가적으로 대칭적인 에러 영상 필터를 추가함으로 영상 인식율을 개선할 수 있으며, 오류율을 감소시킬 수 있다.
따라서, CNN(Convolutional Neural Network)과 같이 고성능 컴퓨터들을 사용하지 않아도 객체 인식에서의 인식율을 개선할 수 있으며, 임베디드 장치에서 효과적으로 보행자와 차량 등의 객체를 인식할 수 있는 인식 알고리즘을 동작시킬 수 있다.
도 1은 본 발명의 실시 예에 따른 ACF(Aggregate Channel Features) 기법을 토대로 하는 객체 검출 과정을 개략적으로 나타낸 도이다.
도 2는 ACF 기반의 영상 처리에 따라 획득된 목표물에 대응하는 값들을 이용하여 목표물 검색을 수행한 결과를 나타낸 예이다.
도 3은 AFC 기반의 목표물 검색에 따른 오류 성능을 예시적으로 나타낸 그래프이다.
도 4는 본 발명의 실시 예에 따른 좌우 대칭 영상을 나타낸 예시도이다.
도 5는 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 생성을 위한 학습 과정을 나타낸 예시도이다.
도 6은 본 발명의 실시 예에 따른 에러 영상 계산 과정을 나타낸 도이다.
도 7은 본 발명의 실시 예에 따른 다른 에러 영상 계산 과정을 나타낸 도이다.
도 8은 본 발명의 실시 예에 따른 객체 검출 방법의 흐름도이다.
도 9는 본 발명의 실시 예에 따른 객체 검출을 위한 대칭 에러 영상 필터를 생성하는 방법의 흐름도이다.
도 10은 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 사용한 AFC 기반의 영상 처리에 따라 획득된 목표물에 대응하는 값들을 이용하여 목표물 검색을 수행한 결과를 나타낸 예이다.
도 11은 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 사용한 AFC 기반의 목표물 검색에 따른 오류 성능을 예시적으로 나타낸 그래프이다.
도 12는 본 발명의 실시 예에 따른 객체 검출 장치의 구조도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이하, 도면을 참조하여 본 발명의 실시 예에 따른 영상 인식에서의 객체 검출 방법 및 장치에 대하여 설명한다.
도 1은 본 발명의 실시 예에 따른 ACF(Aggregate Channel Features) 기법을 토대로 하는 객체 검출 과정을 개략적으로 나타낸 도이다.
ACF(Aggregate Channel Features) 기법을 이용하여, 차량이나 보행자 등의 객체를 검출한다. ACF를 이용한 영상 처리시, 우선적으로 특성맵(Feature Map)을 찾기 위한 과정을 수행하여 영상에서의 학습을 시킨다.
영상에 대응하는 처리가능한 형태의 신호를 설명의 편의상 원본 영상이라고 할 경우, 원본 영상에 대하여 특징 정보를 추출한다. 영상은 영상 센싱 장치에 의해 생성되는 원본 실사 영상(photograph)과, 시뮬레이션 결과에 의해 생성되는 사실적인 영상(photorealistic image)을 포함할 수 있다.
영상의 특징 정보는 예를 들어, 색상(RGB, YCbCr, LUV 등), 밝기 값으로 나타낸 그레이(gray) 스케일, 밝기 값의 기울기 방향과 증가율을 나타내는 그래디언트(gradients), 질감을 나타내는 텍스쳐(texture), 각 파라미터의 수와 양을 히스토그램화한 히스토그램 등이 있으며, 또한, 다수의 영상에서 얻을 수 있는 영상 특징으로는 프레임 간 변화를 나타내는 차영상(difference image), 시간에 따른 움직임 변화를 나타내는 모션(motion) 등이 있다. 이들 각각을 영상의 채널 특징(channel feature)이라고 정의할 수 있다. 특징 정보를 획득하는 과정을 반복 수행하고, 이러한 반복 수행에 따른 학습 과정에 의해 획득되는 특징 정보들을 토대로 특성맵을 형성한다. 학습과정을 통해 특성맵을 추출하게 되는데, 이때 3개의 LUV 영상 채널, 1개의 크기(Magnitude) 채널, 그리고 6가지의 히스토그램 채널들을 만들어 낸다. 채널 특징 자체가 물체를 분류하는데 특징으로 사용될 수 있으나, 단일 특징만으로 특정 물체를 기술하기에는 정확도가 떨어지므로, 다양한 채널 특징을 조합하여 부스팅 알고리즘을 통해 선택된 유용한 특정 채널의 특정 영역의 특징값을 사용하여 정확도를 높일 수 있다.
구체적으로, 도 1에서와 같이, 원본 영상이 입력되면(S10), 원본 영상에 대하여 영상 처리를 위하여, 원본 영상의 주변 영상을 포함하는 확대된 영역(extended region)을 가지는 영상 즉, 패디드 영상(padded image)을 획득한다(S11). 다음, 패디드 영상에 대해 설정된 필터들(예를 들어, LUV, 그레디언트 크기 벡터, 바이너리 그레디언트 채널 등의 조합을 통한 10여개의 적분 영상 필터 등)을 이용한 특징 정보 획득을 위한 필터링 처리를 수행하여(S12), 각 필터에 의한 처리 결과에 대응하는 매트릭스들로 이루어진 매트릭스 뱅크(bank)를 획득한다(S13). 각 매트릭스는 예를 들어, 5x5 픽셀로 이루어지며, 40개 매트릭스로 형성된 매트릭스 뱅크가 형성된다. 설정된 필터들을 이용한 필터링 처리에 의해 채널 특징들이 계산(computation)되고 샘플링되어 매트릭스 뱅크가 획득된다.
이러한 특징 계산 이후에, 분류기를 이용한 학습 과정이 수행되며, 아다부스트를 사용하여 학습하는 복수의 분류기(예를 들어, 약분류기(weak classifier))들을 이용하여 목표물인 객체 검출을 수행한다(S14, S15). 캐스케이드(cascade) 구조의 복수의 분류기를 통하여 획득되는 값들을 합산하여, 목표물에 대응하는 계산값이 획득된다.
이와 같이 ACF 기반으로 영상을 처리하여 목표물에 근접한 계산값을 획득할 수 있다. 획득한 계산값들을 토대로 영상을 검색하여 목표물을 검색한 결과는 예를 들어, 도 2와 같을 수 있다.
도 2는 ACF 기반의 영상 처리에 따라 획득된 목표물에 대응하는 값들을 이용하여 목표물 검색을 수행한 결과를 나타낸 예이다. 도 3은 AFC 기반의 목표물 검색에 따른 오류 성능을 예시적으로 나타낸 그래프이다.
이와 같이 ACF 기반으로 영상을 처리하여 목표물에 근접한 계산값을 획득하고, 이러한 계산값들을 토대로 영상을 검색하면 도 2에 예시된 바와 같이, 검색 결과들을 획득할 수 있으며, 도 2에서 목표물로 검색된 객체를 별도의 마크로 표시하였다. 이러한 객체 검출의 성능을, 영상 1장 당 평균 오검출 개수를 나타내는 FPPI(False Positive per-image)에 따라 평가하면 도 3과 같다. 오류율(miss rate)이 약 24.82% 정도이다.
본 발명의 실시 예에서는 이러한 AFC 기반의 객체 검출 처리에서 오류율을 감소시키기 위하여, 적분영상 필터 이외에도 좌우 영상의 에러 영상 필터를 사용하여 영상에서 보행자 등의 객체를 추출한다. 이를 위하여, ACF에서 별도로 좌우 대칭 영상을 토대로 계산되는 에러 영상을 필터로 사용한다.
도 4는 본 발명의 실시 예에 따른 좌우 대칭 영상을 나타낸 예시도이다.
본 발명의 실시 예에서는 검출하고자 하는 객체 예를 들어, 보행자인 사람이 좌우 대칭적이란 개념을 기본으로 하여, 에러 영상을 계산한다. 원본 영상이 좌우 대칭인 경우, 도 4에서와 같이, 기준선을 중심으로 해서 좌우 대칭적이게 된다.
도 5는 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 생성을 위한 학습 과정을 나타낸 예시도이고, 도 6은 본 발명의 실시 예에 따른 에러 영상 계산 과정을 나타낸 도이다.
원본 영상이 도 4와 같이 좌우 대칭적인 특징을 가진다는 것을 토대로, 원본 영상의 기준선을 토대로 우측에 해당하는 부분을 "우측면"이라고 하고, 기준선을 토대로 왼쪽에 해당하는 부분을 "좌측면"이라고 명명한다.
첨부한 도 5에서와 같이, 원본 영상의 우측면과 좌측면을 수평적(horixontally)으로 플립(flip)시켜 각각의 에러 영상을 찾는다. 구체적으로, 원본 영상(I1)의 우측면에 대한 에러 영상을 찾기 위하여, 우측면을 좌측으로 플립시켜 플립된 영상를 획득하는데, 원본 영상(I1)의 우측면의 영상(I2)을 Y축을 기준으로 좌우 반전시켜 플립된 영상(I21)를 획득할 수 있다. 그 다음에, 도 6에서와 같이, 원본 영상(I1)의 좌측면의 영상(I3)에서 플립된 영상(I21)를 감산시켜 에러 영상(I22)을 획득한다. 에러 영상(I22)은 좌측면의 영상(I3)에서 플립된 영상(I21)을 감산한 값들의 절대값들로 이루어질 수 있으며, 절대값으로 표시된 에러 영상(I22)은 도 5에서, 에러 영상(I22')일 수 있다.
또한, 원본 영상(I1)의 좌측면에 대한 에러 영상을 찾기 위하여, 좌측면을 우측으로 플립시켜 즉, 원본 영상(I1)의 좌측면의 영상을 Y축을 기준으로 좌우 반전시켜 플립된 영상을 획득한다. 그 다음에, 원본 영상(I1)의 우측면의 영상에서 플립된 영상을 감산시켜 좌측면에 대한 에러 영상을 획득한다. 좌측면에 대한 에러 영상도 우측면의 영상에서 플립된 영상를 감산한 값들의 절대값들로 이루어질 수 있다.
이러한 과정을 통하여, 원본 영상의 우측면과 좌측면 각각에 대응하는 에러 영상들을 획득한다. 우측면과 좌측면 각각에 대응하는 에러 영상들을 합하여 도 5에서와 같이, 에러 영상(I4)을 획득할 수 있다. 에러 영상(I4)은 절대값으로 표시된 영상이며, 이 에러 영상(I4)의 원본 에러 영상은 도 5에서 영상(I5)과 같다.
도 7은 본 발명의 실시 예에 따른 다른 에러 영상 계산 과정을 나타낸 도이다.
위에 기술된 대칭 에러 영상 필터를 생성을 위한 에러 영상 계산 과정과는 달리, 도 7의 과정을 토대로, 다양한 형태의 대칭 영상인 에러 영상을 획득할 수도 있다.
구체적으로, 첨부한 도 7의 (a)에 도시된 바와 같은 원본 영상의 좌측면의 영상(IL)을 수평적으로 플립시켜 플립된 영상 즉, 제1 플립된 영상(IL')을 획득하고, 원본 영상의 좌측면의 영상(IL)과 제1 플립된 영상(IL')을 합하여 도 7의 (b)에 도시된 바와 같은 에러 영상 1을 생성할 수 있다.
또한, 첨부한 도 7의 (c)에 도시된 바와 같이, 원본 영상의 우측면의 영상(IR)을 수평적으로 플립시켜 플립된 영상 즉, 제2 플립된 영상(IR')을 획득하고, 제2 플립된 영상(IR')과 원본 영상의 우측면의 영상(IR)을 합하여 에러 영상 2를 생성할 수 있다.
또한, 첨부한 도 7의 (d)에 도시된 바와 같이, 원본 영상을 4등분 한 경우, 좌상 우하를 기반으로 대칭 영상인 에러 영상을 생성할 수 있다. 구체적으로, 원본 영상을 4등분한 경우, 원본 영상의 좌측 상측면에 대응하는 영상(IL1)을 수평적으로 플립시켜 제3-1 플립된 영상(IL1')을 획득하고, 또한 원본 영상의 우측 하측면에 대응하는 영상(IR2)을 수평적으로 플립시켜 제3-2 플립된 영상(IR2')을 획득한다. 그리고 원본 영상의 좌측 상측면에 대응하는 영상(IL1)과 제3-1 플립된 영상(IL1')을 합하고, 제3-2 플립된 영상(IR2')과 원본 영상의 우측 하측면에 대응하는 영상(IR2)을 합하여 에러 영상 3을 생성할 수 있다.
또한, 첨부한 도 7의 (e)에 도시된 바와 같이, 원본 영상을 4등분 한 경우, 좌하 우상을 기반으로 대칭 영상인 에러 영상을 생성할 수 있다. 구체적으로, 원본 영상을 4등분 한 경우, 원본 영상의 좌측 하측면에 대응하는 영상(IL2)을 수평적으로 플립시켜 제4-1 플립된 영상(IL2')을 획득하고, 또한 원본 영상의 우측 상측면에 대응하는 영상(IR1)을 수평적으로 플립시켜 제4-2 플립된 영상(IR1')을 획득한다. 그리고 원본 영상의 좌측 하측면에 대응하는 영상(IL2)과 제4-1 플립된 영상(IL2')을 합하고, 제4-2 플립된 영상(IR1')과 원본 영상의 우측 상측면에 대응하는 영상(IR1)을 합하여 에러 영상 4를 생성할 수 있다.
이와 같이 찾아진 에러 영상은 임의 패턴을 보유하게 된다. 사람의 경우, 다량의 데이터베이스를 이용한 학습을 수행하면 에러 영상의 패턴에 따라 필터를 생성할 수 있다. 본 발명의 실시 예에서는 검출하고자 하는 객체에 대한 원본 영상의 우측면과 좌측면의 에러 영상들을 학습을 통하여 다량 획득한 후에, 획득된 다량의 에러 영상에 포함되는 패턴들을 토대로 대칭 에러 영상 필터를 생성한다. 본 발명의 실시 예에 따르면, 도 5 및 도 6과 같이 생성되는 에러 영상을 토대로 하는 대칭 에러 영상 필터, 도 7에 도시된 에러 영상들을 토대로 하는 대칭 에러 영상 필터들을 포함하여, 예를 들어, 5가지의 대칭 에러 영상 필터들을 생성할 수 있다.
대칭 에러 영상 필터를 이용하여 입력되는 영상으로부터 빠른 시간에 검출하고자 하는 객체 예를 들어, 사람인지 아닌지를 판단할 수 있도록, 본 발명의 실시 예에서는 ACF 필터에 대칭 에러 영상 필터를 추가한다. 본 발명의 실시 예에 따라 생성 가능한 다수의 대칭 에러 영상 필터들은 선택적으로 사용될 수 있으며, 모든 대칭 에러 영상 필터들이 ACF 필터에 추가될 수도 있다.
사람이나 차량처럼 좌우 대칭형 특징을 가지는 객체를 찾고자 할 때, 좌우 대칭의 에러 영상을 찾아서 이를 대칭 에러 영상 필터에 적용한다. 이에 따라 좌우 대칭형 유사패턴을 찾을 수 있고, 이를 통해 좌우 대칭의 영상이 영상 영역 내부에서 사람일 확률이 더 높아질 수 있다.
도 8은 본 발명의 실시 예에 따른 객체 검출 방법의 흐름도이다.
첨부한 도 8에 예시된 바와 같이, 원본 영상으로부터 객체를 검출하고자 하는 영역을 포함하는 영상을 획득한다. 객체를 검출하고자 하는 영역을 포함하는 영상은 원본 영상 그 자체이거나, 원본 영상을 확대하여 주변 영상을 포함하는 패디드 영상이거나, 원본 영상을 축소한 영상 등일 수 있다(S100).
검출하고자 하는 영역을 포함하는 영상(설명의 편의상, 원본 영상이라고 총칭함)에 대하여, 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 포함하는 미리 설정된 필터들을 적용시켜 특징 정보를 포함하는 특징 영상을 획득한다(S110). 여기서, 미리 설정된 필터는 특징 정보 획득을 위한 설정 개수의 필터들(예를 들어, LUV 3 채널, 그래디언트 값, 방향벡터 채널 6종 등의 필터들)을 포함하며, 특히, 위에 기술된 바와 같이, 좌우 대칭적 특징을 가지는 가지는 객체의 영상을 토대로 생성된 대칭 에러 영상 필터를 포함한다.
특징 영상들을 토대로 적분 영상을 획득하고, 적분 영상에 대하여 다수의 분류기를 적용시켜 보행자 등의 목표물에 대응하는지를 판단하여, 목표물을 검출한다(S120). 각 분류기는 적분 영상이 목표물에 대응하는지를 판단한 값을 출력하며, 각 분류기의 출력 값들을 합산한 값을 토대로 해당 영상이 목표물에 대응하는지를 최종 판단할 수 있다.
도 9는 본 발명의 실시 예에 따른 객체 검출을 위한 대칭 에러 영상 필터를 생성하는 방법의 흐름도이다.
첨부한 도 8에 예시된 바와 같이, 좌우 대칭적 특징을 가지는 원본 영상의 우측면의 영상을 수평적으로 플립시켜 우측면의 플립된 영상을 획득한다(S300). 원본 영상의 좌측면의 영상에서 우측면의 플립된 영상을 감산시켜 우측면의 에러 영상을 획득한다(S310).
또한, 원본 영상의 좌측면의 영상을 수평적으로 플립시켜 좌측면의 플립된 영상을 획득한다(S320). 원본 영상의 우측면의 영상에서 좌측면의 플립된 영상을 감산시켜 좌측면의 에러 영상을 획득한다(S330). 우측면의 에러 영상과 좌측면의 에러 영상은 절대값들로 이루어질 수 있다. 한편, 위의 단계(S300~S330)에서, 우측면의 에러 영상과 좌측면의 에러 영상이 획득되는 순서가 위에 기술된 것에 한정되지 않는다.
우측면의 에러 영상과 좌측면의 에러 영상을 합하여 해당 원본 영상의 에러 영상을 획득한다(S340).
위와 같은 단계(S300~S340)를 다른 원본 영상에 대하여 반복적으로 수행하여, 다수의 원본 영상들에 대한 에러 영상들을 획득한다(S350). 그리고 다수의 원본 영상들의 에러 영상으로부터 획득되는 패턴을 토대로 대칭 에러 영상 필터를 생성한다(S360).
한편, 도 7에 도시된 다양한 형태의 에러 영상을 생성하는 방법은 당업자라면 위의 설명을 토대로 구현할 수 있으므로, 여기서는 상세한 설명을 생략한다.
도 10은 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 사용한 AFC 기반의 영상 처리에 따라 획득된 목표물에 대응하는 값들을 이용하여 목표물 검색을 수행한 결과를 나타낸 예이다. 도 11은 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 사용한 AFC 기반의 목표물 검색에 따른 오류 성능을 예시적으로 나타낸 그래프이다.
첨부한 도 10에서, 영상에 별도로 표시되는 사각형 형태의 제1 마크(연한색 선)는 기존 AFC 기반의 영상 처리에 의해 목표물로 검색된 객체를 나타내며, 사각형 형태의 제2 마크(진한 선)는 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 사용한 AFC 기반의 영상 처리에 의해 목표물로 검색된 객체를 나타낸다.
이러한 객체 검출의 성능을 FPPI에 따라 평가하면, 기존 AFC 기반의 영상 처리에 의한 객체 검출의 오류율은 도 11의 (a)에서와 같이, 약 24.82%인데 반하여, 본 발명의 실시 예에 따른 대칭 에러 영상 필터를 사용한 AFC 기반의 영상 처리에 의한 객체 검출의 오류율은 도 11의 (b)에서와 같이, 약 24.97% 정도이다. 기존 ACF 필터를 활용할 경우 FPPI가 나타나는 영역이, 대칭 에러 영상 필터를 사용할 경우 특정 구간에서 FPPI가 사라짐을 알 수 있다.
도 12는 본 발명의 실시 예에 따른 객체 검출 장치의 구조도이다.
첨부한 도 12에 도시되어 있듯이, 본 발명의 실시 예에 따른 객체 검출 장치(1)는, 프로세서(11), 메모리(12) 및 입출력부(13)를 포함한다. 프로세서(11)는 위의 도 1, 도 4 내지 도 9를 토대로 설명한 방법들을 구현하도록 구성될 수 있다.
이를 위하여, 프로세서(11)는 필터 생성 처리부(110), 필터링부(120), 적분 영상 획득 처리부(130) 및 검출 처리부(140)를 포함한다.
필터 생성 처리부(110)는 좌우 대칭적 특징을 가지는 영상의 우측면의 영상과 좌측면의 영상을 각각 수평적으로 플립시켜 획득한 영상들을 토대로, 대칭 에러 영상 필터를 생성하도록 구성된다. 필터 생성 처리부(110)는 도 5 내지 도 7에 도시된 바와 같이 다양한 에러 영상을 토대로 다양한 대칭 에러 영상 필터를 생성할 수 있으며, 여기서는 상세한 설명을 생략한다.
필터링부(120)는 영상에 대하여 ACF 기법을 적용시켜 특징 정보를 획득하도록 구성되며, 구체적으로, 대칭 에러 필터 생성 처리부(110)에 의해 생성된 대칭 에러 영상 필터를 포함하는 다수의 미리 설정된 필터들을 영상에 적용시켜 특징 정보를 획득하도록 구성된다.
적분 영상 획득부(130)는 필터링부(120)의 필터링에 따라 획득되는 특징 정보를 토대로 한 특징 영상들로부터 적분 영상을 획득하도록 구성된다.
검출 처리부(140)는 다수의 분류기를 적분 영상 획득부(130)로부터 제공되는 적분 영상에 대하여 적용시켜, 해당 적분 영상이 목표물 예를 들어, 사람과 같은 객체인지를 최종적으로 판단하도록 구성된다.
메모리(12)는 프로세서(11)와 연결되고 프로세서(11)의 동작과 관련한 다양한 정보를 저장한다. 메모리(12)는 프로세서(11)에서 수행하기 위한 명령어(instructions)를 저장하고 있거나 저장 장치(도시하지 않음)로부터 명령어를 로드하여 일시 저장할 수 있다. 프로세서(11)는 메모리(12)에 저장되어 있거나 로드된 명령어를 실행할 수 있다. 프로세서(11)와 메모리(12)는 버스(도시하지 않음)를 통해 서로 연결되어 있으며, 버스에는 입출력 인터페이스(도시하지 않음)도 연결되어 있을 수 있다.
입출력부(13)는 영상을 프로세서(11)로 제공하도록 구성되며, 또는 프로세서(11)의 처리 결과를 출력하도록 구성된다. 영상 인식에서의 객체 검출시 영상을 획득하는 과정은 공지된 기술임으로 여기서는 상세한 설명을 생략한다.
본 발명의 실시 예는 이상에서 설명한 장치 및/또는 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하기 위한 프로그램, 그 프로그램이 기록된 기록 매체 등을 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다.
이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (20)

  1. ACF(Aggregate Channel Features) 기법을 토대로 영상에서 객체를 검출하는 방법에서,
    원본 영상에 대하여 대칭 에러 영상 필터를 포함하는 미리 설정된 다수의 필터들을 적용시켜 특징 정보를 포함하는 특징 영상을 획득하는 단계;
    상기 특징 영상들을 토대로 적분 영상을 획득하는 단계; 및
    상기 적분 영상에 대하여 다수의 분류기를 적용시켜 상기 원본 영상이 목표물에 대응하는지를 검출하는 단계
    를 포함하며,
    상기 대칭 에러 영상 필터는, 좌우 대칭적 특징을 가지는 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 수평적으로 플립(flip)시켜 획득한 영상들을 토대로 생성되는, 객체 검출 방법.
  2. 제1항에 있어서,
    상기 대칭 에러 영상 필터는 좌우 대칭적 특징을 가지는 다수의 기본 영상의 에러 영상들을 학습한 결과로부터 획득되는 패턴을 토대로 생성되며, 상기 좌우 대칭적 특징을 가지는 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 수평적으로 플립시켜 획득한 영상들을 토대로 하는, 객체 검출 방법.
  3. 제2항에 있어서,
    상기 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상에 해당하는 에러 영상과, 상기 기본 영상의 좌측면의 영상에 해당하는 에러 영상을 포함하며,
    상기 우측면의 영상에 해당하는 에러 영상은, 상기 기본 영상의 좌측면의 영상에서 상기 우측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 획득되며,
    상기 좌측면의 영상에 해당하는 에러 영상은 상기 기본 영상의 우측면의 영상에서 상기 좌측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 획득되는, 객체 검출 방법.
  4. 제3항에 있어서,
    상기 우측면의 영상에 해당하는 에러 영상과 상기 좌측면의 영상에 해당하는 에러 영상은 절대값으로 이루어지는, 객체 검출 방법.
  5. 제2항에 있어서,
    상기 기본 영상의 에러 영상은 상기 기본 영상의 좌측면의 영상을 수평적으로 플립시켜 획득한 영상과, 상기 기본 영상의 좌측면의 영상을 합하여 획득되는, 객체 검출 방법.
  6. 제2항에 있어서,
    상기 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상을 수평적으로 플립시켜 획득한 영상과, 상기 기본 영상의 우측면의 영상을 합하여 획득되는, 객체 검출 방법.
  7. 제2항에 있어서,
    상기 기본 영상의 에러 영상은, 상기 기본 영상을 4등분 한 경우, 상기 기본 영상의 좌측 상측면에 대응하는 영상을 수평적으로 플립시켜 획득한 영상, 상기 좌측 상측면에 대응하는 영상, 상기 기본 영상의 우측 하측면에 대응하는 영상을 수평적으로 플립시켜 획득한 영상, 그리고 상기 기본 영상의 우측 하측면에 대응하는 영상을 합하여 획득되는, 객체 검출 방법.
  8. 제2항에 있어서,
    상기 기본 영상의 에러 영상은, 상기 기본 영상을 4등분 한 경우, 상기 기본 영상의 좌측 하측면에 대응하는 영상을 수평적으로 플립시켜 획득한 영상, 상기 좌측 하측면에 대응하는 영상, 상기 기본 영상의 우측 상측면에 대응하는 영상을 수평적으로 플립시켜 획득한 영상, 그리고 상기 기본 영상의 우측 상측면에 대응하는 영상을 합하여 획득되는, 객체 검출 방법.
  9. 영상에서 객체를 검출하기 위한 ACF(Aggregate Channel Features) 기법에 사용되는 필터를 생성하는 방법에서,
    좌우 대칭적인 특징을 가지는 기본 영상에 대하여 우측면의 에러 영상과 좌측면의 에러 영상 중 적어도 하나를 획득하는 단계;
    상기 우측면의 에러 영상과 좌측면의 에러 영상 중 적어도 하나를 토대로 상기 기본 영상의 에러 영상을 획득하는 단계; 및
    다수의 기본 영상들의 에러 영상들을 토대로 획득된 패턴에 따라 대칭 영상 에러 필터를 생성하는 단계
    를 포함하는, 필터 생성 방법.
  10. 제9항에 있어서,
    상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상의 우측면의 영상과 좌측면의 영상을 각각 수평적으로 플립시켜 상기 우측면의 에러 영상과 상기 좌측면의 에러 영상을 획득하는, 필터 생성 방법.
  11. 제10항에 있어서,
    상기 에러 영상 중 적어도 하나를 획득하는 단계는,
    상기 기본 영상의 좌측면의 영상에서 상기 우측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 상기 우측면의 에러 영상을 획득하는 단계; 및
    상기 원본 영상의 우측면의 영상에서 상기 좌측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 상기 좌측면의 에러 영상을 획득하는 단계
    를 포함하는, 필터 생성 방법.
  12. 제11항에 있어서,
    상기 우측면의 에러 영상과 상기 좌측면의 에러 영상은 절대값으로 이루어지며,
    상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 우측면의 에러 영상과 상기 좌측면의 에러 영상을 합하여 상기 기본 영상의 에러 영상을 획득하는, 필터 생성 방법.
  13. 제9항에 있어서,
    상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상의 좌측면의 영상을 수평적으로 플립시켜 상기 좌측면의 에러 영상을 획득하고,
    상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 기본 영상의 좌측면의 영상과 상기 좌측면의 에러 영상을 합하여 상기 기본 영상의 에러 영상을 획득하는, 필터 생성 방법.
  14. 제9항에 있어서,
    상기 에러 영상 중 적어도 하나를 획득하는 단계는, 상기 기본 영상의 우측면의 영상을 수평적으로 플립시켜 상기 우측면의 에러 영상을 획득하고,
    상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 우측면의 에러 영상과 상기 기본 영상의 우측면의 영상을 합하여 상기 기본 영상의 에러 영상을 획득하는, 필터 생성 방법.
  15. 제9항에 있어서,
    상기 에러 영상 중 적어도 하나를 획득하는 단계는,
    상기 기본 영상을 4등분 한 경우, 상기 기본 영상의 좌측 상측면에 대응하는 영상을 수평적으로 플립시켜 제1 에러 영상을 획득하는 단계; 및
    상기 기본 영상의 우측 하측면에 대응하는 영상을 수평적으로 플립시켜 제2 에러 영상을 획득하는 단계
    를 포함하고,
    상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 기본 영상의 좌측 상측면에 대응하는 영상과, 상기 제1 에러 영상과, 상기 제2 에러 영상과 상기 기본 영상의 우측 하측면에 대응하는 영상을 합하여, 상기 기본 영상의 에러 영상을 획득하는, 필터 생성 방법.
  16. 제9항에 있어서,
    상기 에러 영상 중 적어도 하나를 획득하는 단계는,
    상기 기본 영상을 4등분 한 경우, 상기 기본 영상의 좌측 하측면에 대응하는 영상을 수평적으로 플립시켜 제1 에러 영상을 획득하는 단계; 및
    상기 기본 영상의 우측 상측면에 대응하는 영상을 수평적으로 플립시켜 제2 에러 영상을 획득하는 단계
    를 포함하고,
    상기 기본 영상의 에러 영상을 획득하는 단계는, 상기 제2 에러 영상과 상기 기본 영상의 우측 상측면에 대응하는 영상과, 상기 기본 영상의 좌측 하측면에 대응하는 영상과 상기 제1 에러 영상을 합하여, 상기 기본 영상의 에러 영상을 획득하는, 필터 생성 방법.
  17. ACF(Aggregate Channel Features) 기법을 토대로 영상에서 객체를 검출하는 장치에서,
    영상을 입력받도록 구성되는 입출력부; 그리고
    상기 입출력부와 연결되고, 객체 검출 처리를 수행하는 프로세서를 포함하며,
    상기 프로세서는,
    원본 영상에 대하여 적어도 하나의 대칭 에러 영상 필터를 포함하는 미리 설정된 다수의 필터들을 적용시켜 특징 정보를 포함하는 특징 영상을 획득하도록 구성되는 필터링부;
    상기 특징 영상들을 토대로 하는 적분 영상을 획득하도록 구성되는 적분 영상 획득 처리부; 및
    상기 적분 영상에 대하여 다수의 분류기를 적용시켜 상기 원본 영상이 목표물에 대응하는지를 검출하도록 구성되는 검출 처리부
    를 포함하며,
    상기 대칭 에러 영상 필터는, 좌우 대칭적 특징을 가지는 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 각각 수평적으로 플립시켜 획득한 영상들을 토대로 생성되는, 객체 검출 장치.
  18. 제17항에 있어서,
    상기 대칭 에러 영상 필터는 좌우 대칭적 특징을 가지는 다수의 기본 영상의 에러 영상들을 학습한 결과로부터 획득되는 패턴을 토대로 생성되며, 상기 좌우 대칭적 특징을 가지는 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상과 좌측면의 영상 중 적어도 하나를 수평적으로 플립시켜 획득한 영상들을 토대로 하는, 객체 검출 장치.
  19. 제17항에 있어서,
    상기 기본 영상의 에러 영상은 상기 기본 영상의 우측면의 영상에 해당하는 에러 영상과, 상기 기본 영상의 좌측면의 영상에 해당하는 에러 영상을 포함하며,
    상기 우측면의 영상에 해당하는 에러 영상은 상기 원본 영상의 좌측면의 영상에서 상기 우측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 획득되고,
    상기 좌측면의 영상에 해당하는 에러 영상은 상기 원본 영상의 우측면의 영상에서 상기 좌측면의 영상을 수평적으로 플립시켜 획득한 영상을 감산하여 획득되는, 객체 검출 장치.
  20. 제17항에 있어서,
    상기 프로세서는,
    다수의 원본 영상의 우측면과 좌측면 각각에 대응하는 에러 영상들을 학습한 결과로부터 획득되는 패턴을 토대로 상기 대칭 에러 영상 필터를 생성하는 필터 생성 처리부
    를 더 포함하는, 객체 검출 장치.
KR1020160095733A 2016-07-27 2016-07-27 누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치 KR20180012638A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160095733A KR20180012638A (ko) 2016-07-27 2016-07-27 누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160095733A KR20180012638A (ko) 2016-07-27 2016-07-27 누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20180012638A true KR20180012638A (ko) 2018-02-06

Family

ID=61228176

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160095733A KR20180012638A (ko) 2016-07-27 2016-07-27 누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20180012638A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108389226A (zh) * 2018-02-12 2018-08-10 北京工业大学 一种基于卷积神经网络和双目视差的无监督深度预测方法
CN109784186A (zh) * 2018-12-18 2019-05-21 深圳云天励飞技术有限公司 一种行人重识别方法、装置、电子设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108389226A (zh) * 2018-02-12 2018-08-10 北京工业大学 一种基于卷积神经网络和双目视差的无监督深度预测方法
CN109784186A (zh) * 2018-12-18 2019-05-21 深圳云天励飞技术有限公司 一种行人重识别方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109508681B (zh) 生成人体关键点检测模型的方法和装置
US10872262B2 (en) Information processing apparatus and information processing method for detecting position of object
CN109960742B (zh) 局部信息的搜索方法及装置
CN109902548B (zh) 一种对象属性识别方法、装置、计算设备及系统
Kumar et al. A novel method of edge detection using cellular automata
CN110765860A (zh) 摔倒判定方法、装置、计算机设备及存储介质
US20180114092A1 (en) Devices, systems, and methods for anomaly detection
CN108986152B (zh) 一种基于差分图像的异物检测方法及装置
Türkyılmaz et al. License plate recognition system using artificial neural networks
WO2023082784A1 (zh) 一种基于局部特征注意力的行人重识别方法和装置
WO2018082308A1 (zh) 一种图像处理方法及终端
CN111340077B (zh) 基于注意力机制的视差图获取方法和装置
CN112287868B (zh) 一种人体动作识别方法及装置
CN110879982A (zh) 一种人群计数系统及方法
CN114972976B (zh) 基于频域自注意力机制的夜间目标检测、训练方法及装置
CN110222572A (zh) 跟踪方法、装置、电子设备及存储介质
CN115375917B (zh) 一种目标边缘特征提取方法、装置、终端及存储介质
WO2017113692A1 (zh) 一种图像匹配方法及装置
CN116883588A (zh) 一种大场景下的三维点云快速稠密重建方法及系统
KR20180012638A (ko) 누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치
JP6202938B2 (ja) 画像認識装置および画像認識方法
CN112668532A (zh) 基于多阶段混合注意网络的人群计数方法
WO2019230965A1 (ja) 物体らしさ推定装置、方法、およびプログラム
CN116091998A (zh) 图像处理方法、装置、计算机设备和存储介质
CN115731442A (zh) 图像处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application