WO2023277219A1

WO2023277219A1 - 환경 변화 적응형 특징 생성기를 적용한 차량용 경량 딥러닝 처리 장치 및 방법

Info

Publication number: WO2023277219A1
Application number: PCT/KR2021/008285
Authority: WO
Inventors: 이상설; 장성준; 박종희
Original assignee: 한국전자기술연구원
Priority date: 2021-06-30
Filing date: 2021-06-30
Publication date: 2023-01-05
Also published as: KR20230003953A

Abstract

환경 변화 적응형 특징 생성기를 적용한 차량용 경량 딥러닝 처리 장치 및 방법이 제공된다. 본 발명의 실시예에 따른 객체 검출 방법은, 제1 타입의 제1 영상, 제2 타입의 제2 영상, 제3 타입의 제3 영상을 입력받고, 제1 영상, 제2 영상 및 제3 영상을 융합하여 하나의 Feature Map을 생성하며, 생성한 Feature Map을 분석하여 객체를 검출하고, 하나의 Feature Map을 생성하는 과정에서 생성되는 특징점들의 분포를 기초로 제1 영상, 제2 영상 및 제3 영상의 생성 과정을 제어한다. 이에 의해, 경량의 임베디드향 딥러닝 네트워크로 차량에 설치된 다중 센서들로부터 생성되는 영상들로부터 객체를 검출/분류하는 것에서 나아가, 기존의 Rule-base로 처리되고 있는 조명 등의 제어까지 커버할 수 있게 된다.

Description

환경 변화 적응형 특징 생성기를 적용한 차량용 경량 딥러닝 처리 장치 및 방법

본 발명은 인공지능 기술을 활용한 영상 처리 및 SoC(System on Chip) 기술에 관한 것으로, 더욱 상세하게는 차량 내부에서 다중 센서로부터 영상들을 입력받아 딥러닝으로 처리하는 장치 및 방법에 관한 것이다.

카메라 등을 통해 생성한 영상 데이터를 이용하여 딥러닝 연산을 수행하여 사용자 인식, 객체 검출, 차선 검출, 도로 검출 등 수 많은 연구가 진행 중에 있다.

특히, 차량 내부에 적용하기 위하여 RGB 카메라, 스테레오 카메라, ToF 센서, Lidar, 조명 등을 연동하여 딥러닝 엔진을 동작시켜 높은 정확도를 유지하기 위하여 고성능의 하드웨어 플랫폼을 요구한다.

현재까지 차량 내부 카메라 시스템은 운전자 상태 검출, 전방 주시 태만 경고 등 영상 기반의 다양한 센서 활용을 연구 중인 상태이다. 하지만, RGB 영상 센서와 함께 RGB/IR 및 외부 환경의 변화에 능동적 변화가 가능한 다기능 센서 신호 처리 전용 딥러닝 엔진에 대한 개발이 미흡한 상태이다.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 기존의 Rule-base로 처리되고 있는 조명 등의 컨트롤까지 포함하는 퓨전 딥러닝 네트워크 구조를 적용한 다중 센서 기반 차량 내부 객체 인지를 위한 경량 임베디드 하드웨어를 제공함에 있다.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 객체 검출 방법은, 제1 타입의 제1 영상을 입력받는 제1 입력단계; 제2 타입의 제2 영상을 입력받는 제2 입력단계; 제3 타입의 제3 영상을 입력받는 제3 입력단계; 제1 영상, 제2 영상 및 제3 영상을 융합하여, 하나의 Feature Map을 생성하는 단계; 생성한 Feature Map을 분석하여, 객체를 검출하는 단계; 하나의 Feature Map을 생성하는 과정에서 생성되는 특징점들의 분포를 기초로, 제1 영상, 제2 영상 및 제3 영상의 생성 과정을 제어하는 단계;를 포함한다.

본 발명의 일 실시예에 따른, 객체 검출 방법은, 조도를 추정하는 단계;를 더 포함하고, 생성 단계는, 추정된 조도를 기초로 제1 영상, 제2 영상 및 제3 영상을 각기 다르게 융합하여, 하나의 Feature Map을 생성할 수 있다.

생성 단계는, 추정된 조도를 기초로 제1 영상, 제2 영상 및 제3 영상 중 하나를 선택하고, 선택된 영상의 Feature Map을 생성할 수 있다.

추정 단계는, 픽셀 별로 조도를 추정하고, 생성 단계는, 픽셀 별 조도를 기초로, 픽셀 별 마다 제1 영상, 제2 영상 및 제3 영상 중 어느 하나를 선택하여, 하나의 Feature Map을 생성할 수 있다.

추정 단계는, 제1 영상을 이용하여, 조도를 추정할 수 있다.

제1 영상은, RGB 영상이고, 제2 영상은, IR 영상이며, 제3 영상은, RGB 영상과 IR 영상을 융합한 영상일 수 있다.

제3 영상은, 조도 정보를 기초로, RGB 영상과 IR 영상이 융합된 것일 수 있다.

한편, 본 발명의 다른 실시예에 따른, 객체 검출 장치는, 제1 타입의 제1 영상, 제2 타입의 제2 영상 및 제3 타입의 제3 영상을 융합하여, 하나의 Feature Map을 생성하는 융합기; 생성한 Feature Map을 분석하여, 객체를 검출하는 검출기; 융합기에 마련되며, 하나의 Feature Map을 생성하는 과정에서 생성되는 특징점들을 기초로, 제1 영상, 제2 영상 및 제3 영상의 생성 과정을 제어하는 제어기;를 포함한다.

이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 경량의 임베디드향 딥러닝 네트워크로 차량에 설치된 다중 센서들로부터 생성되는 영상들로부터 객체를 검출/분류하는 것에서 나아가, 기존의 Rule-base로 처리되고 있는 조명 등의 제어까지 커버할 수 있게 된다.

또한, 본 발명의 실시예들에 따르면, 이종의 센서와 더불어 이종의 시스템에 적용가능한 구조를 통해 유연한 딥러닝 장치, 신종 센서 입력, 환경 변화에 유연하게 대응할 수 있는 장점이 있다.

도 1은 본 발명의 일 실시예에 따른 차량용 경량 딥러닝 처리 장치의 블럭도,

도 2는 차량용 경량 딥러닝 처리 장치의 설치 상태를 도시한 도면,

도 3은, 도 1에 도시된 영상 융합기의 상세 블럭도,

도 4는 RGB 영상 생성 과정의 설명에 제공되는 도면,

도 5는 IR 영상 생성 과정의 설명에 제공되는 도면,

도 6은 RGB/IR 영상 생성 과정의 설명에 제공되는 도면,

도 7은 환경/카메라 위치/인원에 따른 차량 내부 데이터셋의 구분,

도 8은 4채널 데이터 셋 객체 검출 결과 예시,

도 9는 3채널 데이터 셋 객체 검출 결과 예시, 그리고,

도 10은 본 발명의 다른 실시예에 따른 차량 내부 객체 검출/분류 방법의 설명에 제공되는 흐름도이다.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.

본 발명의 실시예에서는 환경 변화 적응형 특징 생성기를 적용한 차량용 경량 딥러닝 처리 장치를 제시한다.

본 발명의 실시예를 통해 제시하는 딥러닝 네트워크는 다중 센서로 생성한 영상들인 RGB 영상과 IR 영상을 입력으로 하여 차량 내부의 객체를 검출/분류하는데, 이 과정에서 딥러닝 네트워크의 중간 연산 결과를 이용하여 외부 환경 적응형 제어까지 수행할 수 있다.

도 1은 본 발명의 일 실시예에 따른 차량용 경량 딥러닝 처리 장치의 블럭도이다. 본 발명의 실시예에 따른 차량용 경량 딥러닝 처리 장치(100)는, 이종 센서들로부터 생성된 영상들에 대해 다중 특징 추출 기법을 적용한 후에, 차량 내부의 객체 검출/분류를 수행한다. 이를 위해, 본 발명의 실시예에 따른 차량용 경량 딥러닝 처리 장치(100)는, 도 2에 도시된 바와 같이, 차량 내부에 설치된다.

이와 같은 기능을 수행하는 본 발명의 실시예에 따른 차량용 경량 딥러닝 처리 장치는, 도 2에 도시된 바와 같이, 조도 추정기(110), 영상 융합기(120) 및 객체 검출/분류기(130)를 포함하여 구성된다.

조도 추정기(110)는 차량 내부의 RGB 영상으로부터 차량 내부의 조도를 추정한다. 조도 추정기(110)는 RGB 영상의 픽셀 별로 조도 정보를 추정하고, 추정된 조도 정보의 평균을 차량 내부의 조도로 추정할 수 있다. 조도 추정기(110)에 의해 추정된 조도 정보는 영상 융합기(120)로 전달된다.

영상 융합기(120)는 RGB 영상, IR 영상, RGB/IR 영상을 융합(Selection 및 Concatenation)하여, 하나의 Feature Map을 생성한다. 영상 융합은 조도 정보에 따라 각기 다른 방식으로 이루어진다.

도 3은 영상 융합기(120)의 상세 블럭도이다. 영상 융합기(120)는 도시된 바와 같이, 다중 스펙트럼 특징 생성기(121), 형상 기반 특징 생성기(122), 융합 코스트 계산기(123) 및 제어 신호 생성기(124)를 포함하여 구성된다.

다중 스펙트럼 특징 생성기(121)는 조도를 기초로 RGB 영상, IR 영상, RGB/IR 영상 중 하나를 선택하고 선택한 영상으로부터 특징점들을 추출한다. 조도가 높은 경우에는 RGB 영상을 선택하고, 조도가 낮은 경우에는 IR 영상을 선택하며, 조도가 중간인 경우에는 RGB/IR 영상을 선택하는 것으로 구현가능하지만, 다른 선택 방식을 적용할 수도 있음은 물론이다.

RGB/IR 영상은 RGB 영상과 IR 영상을 융합하여 생성한 영상이다. 조도 정보를 참조하여 융합하는데, RGB/IR 영상 생성 방법에 대해서는 상세히 후술한다.

위 선택 방식에서는 영상 단위로 선택이 이루어졌다. 하지만, 다른 방식으로 대체 가능한데, 이를 테면, 픽셀 단위로 선택이 이루어지도록 구현할 수 있다.

구체적으로, 다중 스펙트럼 특징 생성기(121)는 픽셀 별 조도를 기초로, 픽셀 별 마다 제1 영상, 제2 영상 및 제3 영상 중 어느 하나를 선택하여, 특징점들을 추출할 수도 있다.

이를 테면, 조도가 높은 픽셀에 대해서는 RGB 영상의 픽셀을 선택하고, 조도가 낮은 픽셀에 대해서는 IR 영상의 픽셀을 선택하며, 조도가 중간인 픽셀에 대해서는 RGB/IR 영상의 픽셀을 선택하는 것이다. 물론, 다른 선택 방식을 적용할 수도 있다.

이와 같이, 다중 스펙트럼 특징 생성기(121)는 다중 영상들로부터 특징점들을 융합하는 다중 특징 생성기로 기능하는 딥러닝 네트워크이다.

형상 기반 특징 생성기(122)는 다중 스펙트럼 특징 생성기(121)에서 생성된 특징점들을 기초로 상관 관계를 고려하여 형상 기반 특징점들을 생성하여 하나의 Feature Map로 출력하는 딥러닝 네트워크이다.

융합 코스트 계산기(123)는 융합을 위한 연산 수행 과정에 따라 코스트를 계산하여 피드백하여 줌으로써, 보다 보다 정확한 결과를 얻을 수 있도록 하기 위한 구성이다.

제어 신호 생성기(124)는 다중 스펙트럼 특징 생성기(121)에서 생성한 특징점들의 분포가 GT 데이터와 큰 차이가 발생하는 경우에 RGB 영상에 대한 Noise filter, Exposure, ISO, WDR을 제어하기 위한 제어 신호를 생성하고, IR 조명의 강도를 제어하기 위한 제어 신호를 생성한다.

또한, 제어 신호 생성기(124)는 조도 추정기(110)에 의해 추정된 차량의 내부 조도를 기초로 차량 내부가 역광 상황 또는 저조도 상황으로 판단한 경우에 강인한 영상을 획득하기 위해 제어 신호를 생성할 수도 있다.

다시, 도 1을 참조하여 설명한다.

객체 검출/분류기(130)는 영상 융합기(120)에서 생성된 Feature Map을 분석하여, 차량 내부에 있는 객체들을 검출하고 검출된 객체를 분류한다. 객체 검출/분류기(130)는 Feature Map을 입력받아 객체 검출/분류 결과를 출력하는 딥러닝 네트워크로 구현할 수 있다.

이하에서는, RGB 영상, IR 영상, RGB/IR 영상이 생성되는 과정에 대해 상세히 설명한다. 영상들을 생성함에 있어서는 조도 추정기(110)에 의해 추정된 조도 정보가 참조되며, 제어 신호 생성기(124)에 의한 제어가 수행될 수도 있다.

도 4는 RGB 영상 생성 과정의 설명에 제공되는 도면이다. 도시된 바와 같이, RGB 센서(11)에 의해 생성된 RGB 영상은 RGB 영상 처리기(12)에 의해 신호처리되는데, 제어 신호 생성기(124)는 조도 정보를 기초로 RGB 영상 처리기(12)의 잡읍 제거 필터(Noise filter)와 WDR(Wide Dynamic Range), ISO, Exposure를 제어한다. 이에 의해, 역광 상황에 대한 능동적인 대처가 가능하다. 또한, 제어 신호 생성기(124)는 다중 스펙트럼 특징 생성기(121)에서 생성한 특징점들의 분포를 기초로 RGB 영상 처리기(12)의 잡읍 제거 필터(Noise filter)와 WDR(Wide Dynamic Range), ISO, Exposure를 제어할 수도 있다.

도 5는 IR 영상 생성 과정의 설명에 제공되는 도면이다. 도시된 바와 같이, IR 센서(21)에 의해 생성된 IR 영상은 IR 영상 처리기(22)에 의해 신호처리되는데, 제어 신호 생성기(124)는 조도 정보를 기초로 IR 조명(24)의 강도를 제어한다. 이에 의해, 저조도 상황에서 능동적인 대처가 가능하다. 또한, 제어 신호 생성기(124)는 다중 스펙트럼 특징 생성기(121)에서 생성한 특징점들의 분포를 기초로 IR 조명(24)의 강도를 제어할 수도 있다.

도 6은 RGB/IR 영상 생성 과정의 설명에 제공되는 도면이다. 도시된 바와 같이, RGB/IR 영상 생성기(41)는 RGB 센서(11)에 의해 생성된 RGB 영상과 IR 센서(21)에 의해 생성된 IR 영상을 융합하여 RGB/IR 영상을 생성하는데, 이 과정에서 조도 정보가 참조된다.

구체적으로, 조도가 기준 이상인 픽셀에 대해서는 RGB 영상의 픽셀을 선택하고, 조도가 기준 미만인 픽셀에 대해서는 IR 영상의 픽셀을 선택하여, 융합함으로써 RGB/IR 영상을 생성할 수 있다.

본 발명의 실시예에 따른 차량용 경량 딥러닝 처리 장치의 성능을 확인하기 위해, 차량 내부 환경을 도 7에 나타낸 바와 같이 다양한 환경으로 모사하여 실영상을 생성하여 학습 및 성능 측정을 수행하였다.

측정 결과 도 8과 도 9에 나타낸 바와 같이 Saturation 되었거나, 특정 스펙트럼에서 데이터가 손실되었을 경우에도 다수의 객체가 높은 정확도로 인식됨을 확인할 수 있었으며, 조명 제어 신호를 통하여 보다 높은 정확도를 얻을 수 있었다.

도 8은 2종의 4채널 데이터 셋과 3채널 데이터 셋에서 검출 정확도가 향상됨을 확인한 결과이고, 도 9는 4채널 데이터 셋에서 RGB/IR 영상을 이용한 융합 방식이 단일 스펙트럽 방식에 비해 성능이 개선되었음을 확인할 결과이다.

도시된 바와 같이, 먼저, 차량 내부의 RGB 영상을 생성하고(S210), 차량 내부의 IR 영상을 생성하며(S220), RGB 영상과 IR 영상을 융합하여 RGB/IR 영상을 생성한다(S230),

다음, 조도 추정기(110)는 S210단계에서 생성된 RGB 영상을 이용하여, 차량 내부의 조도를 추정한다(S240).

그러면, 영상 융합기(120)는 S240단계에서 추정된 조도 정보를 참조하여, RGB 영상, IR 영상, RGB/IR 영상을 융합하여, 하나의 Feature Map을 생성한다(S250).

이후, 객체 검출/분류기(130)는 S250단계에서 생성된 Feature Map을 분석하여, 차량 내부에 있는 객체들을 검출하고 검출된 객체를 분류한다(S260).

지금까지, 환경 변화 적응형 특징 생성기를 적용한 차량용 경량 딥러닝 처리 장치 및 방법에 대해 바람직한 실시예들을 들어 상세히 설명하였다.

본 발명의 실시예에서는, 기존의 Rule-base로 처리되고 있는 조명 등의 컨트롤까지 포함하는 퓨전 딥러닝 네트워크 구조를 적용하여 경량 임베디드 하드웨어를 설계하였다. 이종의 센서와 더불어 이종의 시스템에 적용가능한 구조로, 유연한 딥러닝 장치, 신종 센서 입력, 환경변화에도 유지보수가 가능한 모델이다.

본 발명의 실시예에 의해, 단일 센서 기반의 처리와 더불어 이종의 센서 간의 딥러닝 처리를 위한 융합 기술의 적용으로 다양한 외부 센서 인터페이스에 적용이 가능하며, 다양한 센서 및 환경의 변화에도 적용 가능한 수준의 딥러닝 구현이 가능하다.

한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims

제1 타입의 제1 영상을 입력받는 제1 입력단계;

제2 타입의 제2 영상을 입력받는 제2 입력단계;

제3 타입의 제3 영상을 입력받는 제3 입력단계;

제1 영상, 제2 영상 및 제3 영상을 융합하여, 하나의 Feature Map을 생성하는 단계;

생성한 Feature Map을 분석하여, 객체를 검출하는 단계;

하나의 Feature Map을 생성하는 과정에서 생성되는 특징점들의 분포를 기초로, 제1 영상, 제2 영상 및 제3 영상의 생성 과정을 제어하는 단계;를 포함하는 것을 특징으로 하는 객체 검출 방법.
청구항 1에 있어서,

조도를 추정하는 단계;를 더 포함하고,

생성 단계는,

추정된 조도를 기초로 제1 영상, 제2 영상 및 제3 영상을 각기 다르게 융합하여, 하나의 Feature Map을 생성하는 것을 특징으로 하는 객체 검출 방법.
청구항 1에 있어서,

생성 단계는,

추정된 조도를 기초로 제1 영상, 제2 영상 및 제3 영상 중 하나를 선택하고, 선택된 영상의 Feature Map을 생성하는 것을 특징으로 하는 객체 검출 방법.
청구항 1에 있어서,

추정 단계는,

픽셀 별로 조도를 추정하고,

생성 단계는,

픽셀 별 조도를 기초로, 픽셀 별 마다 제1 영상, 제2 영상 및 제3 영상 중 어느 하나를 선택하여, 하나의 Feature Map을 생성하는 것을 특징으로 하는 객체 검출 방법.
청구항 1에 있어서,

추정 단계는,

제1 영상을 이용하여, 조도를 추정하는 것을 특징으로 하는 객체 검출 방법.
청구항 1에 있어서,

제1 영상은,

RGB 영상이고,

제2 영상은,

IR 영상이며,

제3 영상은,

RGB 영상과 IR 영상을 융합한 영상인 것을 특징으로 하는 객체 검출 방법.
청구항 6에 있어서,

제3 영상은,

조도 정보를 기초로, RGB 영상과 IR 영상이 융합된 것을 특징으로 하는 객체 검출 방법.
제1 타입의 제1 영상, 제2 타입의 제2 영상 및 제3 타입의 제3 영상을 융합하여, 하나의 Feature Map을 생성하는 융합기;

생성한 Feature Map을 분석하여, 객체를 검출하는 검출기;

융합기에 마련되며, 하나의 Feature Map을 생성하는 과정에서 생성되는 특징점들을 기초로, 제1 영상, 제2 영상 및 제3 영상의 생성 과정을 제어하는 제어기;를 포함하는 것을 특징으로 하는 객체 검출 장치.