WO2022164165A1

WO2022164165A1 - 카메라 영상을 이용한 딥러닝 기술 기반 전방 보행자의 자세 예측 및 이를 활용한 충돌 위험도 추정 기술

Info

Publication number: WO2022164165A1
Application number: PCT/KR2022/001274
Authority: WO
Inventors: 최준원; 김병도
Original assignee: 한양대학교 산학협력단
Priority date: 2021-01-26
Filing date: 2022-01-25
Publication date: 2022-08-04

Abstract

카메라 영상을 이용한 딥러닝 기술 기반 전방 보행자의 자세 예측 및 이를 활용한 충돌 위험도 추정 기술이 개시된다. 일 실시예에 따른 자세 예측 및 충돌 위험도 추정 시스템에 의해 수행되는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법은, 일정시간 동안 수집된 영상 정보의 각각으로부터 보행자를 검출하는 단계; 상기 검출된 보행자를 포함하는 영상 정보를 이용하여 매 프레임에 대해 보행자의 스켈레톤 사이의 연결 관계에 따라 일정시간 동안의 보행자의 자세 정보를 추정하는 단계; 상기 추정된 일정시간 동안의 보행자의 자세 정보의 시계열 분석을 통해 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계; 및 차량의 주행 속도 및 방향을 기반으로 상기 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 이용하여 충돌 가능성을 판단하는 단계를 포함할 수 있다.

Description

카메라 영상을 이용한 딥러닝 기술 기반 전방 보행자의 자세 예측 및 이를 활용한 충돌 위험도 추정 기술

아래의 설명은 카메라 영상을 이용한 딥러닝 기술 기반 전방 보행자의 자세 예측 및 이를 활용한 충돌 위험도 추정 기술에 관한 것이다.

차량의 충돌방지를 위한 종래기술로는 차량의 센서 정보를 이용하여 주행 방향의 보행자를 감지하고 현재 위치를 바탕으로 충돌 위험을 판단하거나 다른 특정 요인들을 바탕으로 보행자의 미래 위치를 추정하여 충돌을 예측하고 제어하는 기술이 있다.

보행자의 현재 위치를 감지하는 종래기술로는 차량의 카메라 센서를 통해 영상에서 보행자의 위치를 검출하는 기술과 차량과 보행자 사이의 통신을 바탕으로 현재 위치 정보를 주고받아 현재 위치를 파악하고 충돌 위험을 판단하는 기술이 있고 보행자의 미래 위치를 추정하는 기술로는 차량의 센서 정보로 보행자의 위치를 인지하고 평균 속도를 계산하여 미래의 위치를 계산하여 충돌 여부를 판단하는 기술과 보행자의 순간적인 시선이나 발의 방향을 바탕으로 이동 방향을 예측하여 충돌 위험을 판단하는 기술이 있다.

종래기술들은 1) 현재 위치를 바탕으로 충돌 위험을 판단하거나, 2) 보행자의 평균 이동 속도나 혹은 3) 보행자의 시선이나 발의 방향 등 단순한 특성을 바탕으로 위치를 예측하여 충돌 위험을 판단한다.

1)의 경우 충돌 위험이 판단된다는 것은 보행자가 이미 충돌구간에 돌입했다는 의미이고 이는 고속으로 움직이는 차량의 특성상 충돌을 방지하기 위한 충분한 제어시간을 확보하기 어렵다는 문제가 있다. 2)와 3)의 경우 보행자의 이동 예측을 통하여 제어시간을 확보할 수는 있지만 단순한 특성만을 사용하여 예측하기 때문에 예측시간이 길어질수록 신뢰도가 매우 낮아지고 신뢰할만한 예측시간이 짧아지는 것은 제어시간 확보가 어려운 문제로 이어진다.

차량에 장착된 카메라 센서를 이용하여 일정 시간 취득한 영상 정보를 바탕으로 딥러닝 기술을 이용하여 보행자의 순차적인 자세 정보를 추출하고, 추출된 보행자의 순차적인 자세 정보로부터 보행자의 미래 자세 데이터를 예측하는 방법 및 시스템을 제공할 수 있다.

보행자의 미래 자세 데이터로부터 보행자 미래 위치 데이터를 예측하고, 보행자의 미래 자세 데이터 및 보행자의 미래 위치 데이터를 기반으로 차량과의 충돌 위험도를 판단하여 충돌 회피에 사용하는 방법 및 시스템을 제공할 수 있다.

신경망 구조를 이용하여 보행자의 미래 자세 및 위치를 예측하여 높은 신뢰성으로 보다 긴 시간을 예측할 수 있도록 함으로써 충돌을 방지하기 위한 충분한 제어 시간을 확보하는 방법 및 시스템을 제공할 수 있다.

자세 예측 및 충돌 위험도 추정 시스템에 의해 수행되는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법은, 일정시간 동안 수집된 영상 정보의 각각으로부터 보행자를 검출하는 단계; 상기 검출된 보행자를 포함하는 영상 정보를 이용하여 매 프레임에 대해 보행자의 스켈레톤 사이의 연결 관계에 따라 일정시간 동안의 보행자의 자세 정보를 추정하는 단계; 상기 추정된 일정시간 동안의 보행자의 자세 정보의 시계열 분석을 통해 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계; 및 차량의 주행 속도 및 방향을 기반으로 상기 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 이용하여 충돌 가능성을 판단하는 단계를 포함할 수 있다.

상기 보행자의 자세 정보를 추정하는 단계는, 상기 검출된 보행자를 포함하는 영상 정보를 통해 신경망 기반의 스켈레톤 위치 추정 기법을 이용하여 보행자 신체의 스켈레톤 정보를 추출하는 단계를 포함할 수 있다.

상기 보행자의 자세 정보를 추정하는 단계는, 상기 추출된 보행자 신체의 스켈레톤 정보에 기초하여 매 프레임에 대해 스켈레톤 위치를 점으로 나타내고, 상기 점으로 나타낸 스켈레톤 위치 사이를 연결하여 보행자의 자세 정보를 표현하는 단계를 포함할 수 있다.

상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는, 상기 보행자의 자세 정보를 추정하기 위해 추출된 보행자의 스켈레톤 정보와 상기 수집된 영상 정보를 보행자 자세 및 위치 예측을 위한 신경망 구조에 입력하고, 상기 보행자 자세 및 위치 예측을 위한 신경망 구조를 이용한 시계열 분석을 통해 상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계를 포함할 수 있다.

상기 신경망 구조는, 인코더와 디코더로 구성되고, 상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는, 상기 인코더를 통해 상기 추출된 보행자의 스켈레톤 정보의 현재까지의 시간적 움직임 정보와 상기 수집된 영상 정보에 포함된 주변의 환경 문맥 정보들을 분석하여 시간적 상관관계에 대한 특징값을 추출하는 단계를 포함할 수 있다.

상기 신경망 구조는, 상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는, 상기 디코더를 통해 상기 추출된 특징값을 이용하여 미래 시간의 보행자의 미래 자세값과 위치값을 추정하는 단계를 포함할 수 있다.

상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는, 상기 추출된 보행자의 스켈레톤 정보가 그래프 구조로 정리되고, 상기 그래프 구조로 정리된 스켈레톤 정보에 대하여 그래프 구조를 처리하는 딥러닝 구조를 이용하여 스켈레톤 정보 특징값을 추출하고, 상기 수집된 영상 정보를 이미지 정보를 처리하는 딥러닝 구조를 통해 이미지 정보 특징값을 추출하는 단계를 포함할 수 있다.

상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는, 상기 수집된 영상 정보에 기초하여 보행자의 위치 박스 및 스켈레톤 이미지 마스크를 생성하고, 상기 생성된 보행자의 위치 박스 및 스켈레톤 이미지 마스크를 이미지 정보를 처리하는 딥러닝 구조에 제공하고, 상기 이미지 정보를 처리하는 딥러닝 구조에서 상기 수집된 영상 정보에서 보행자에 해당되는 영역을 마스크에 기초하여 학습하고, 상기 주변의 환경 문맥 정보들을 상기 수집된 영상 정보에 기초하여 학습하는 단계를 포함할 수 있다.

상기 충돌 가능성을 판단하는 단계는, 차량의 주행 계획에 기초하여 차량이 미래에 점유하게 될 미래 점유 공간을 산출하는 단계를 포함할 수 있다.

상기 충돌 가능성을 판단하는 단계는, 상기 예측된 보행자의 미래 자세 데이터 및 미래 위치 데이터를 통해 상기 산출된 미래 점유 공간과 중첩되는지 여부를 확인하는 단계를 포함할 수 있다.

상기 충돌 가능성을 판단하는 단계는, 상기 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 기초하여 각 위치에 대한 충돌 위험도를 계산하고, 상기 계산된 충돌 위험도를 순위화하는 단계를 포함할 수 있다.

상기 충돌 가능성을 판단하는 단계는, 상기 계산된 충돌 위험도가 임계값 이상으로 증가할 경우, 제동과 관련된 충돌방지를 위한 제어 명령을 통해 상기 차량을 제어하는 단계를 포함할 수 있다.

상기 보행자를 검출하는 단계는, 차량에 장착된 카메라를 이용하여 일정시간 수집된 비디오 영상 정보 각각에 대해 보행자 검출 신경망을 이용하여 보행자를 검출하는 단계를 포함할 수 있다.

딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법을 상기 자세 예측 및 충돌 위험도 추정 시스템에 실행시키기 위해 비-일시적인 컴퓨터 판독가능한 기록 매체에 저장되는 컴퓨터 프로그램을 포함할 수 있다.

자세 예측 및 충돌 위험도 추정 시스템은, 일정시간 동안 수집된 영상 정보의 각각으로부터 보행자를 검출하는 보행자 검출부; 상기 검출된 보행자를 포함하는 영상 정보를 이용하여 매 프레임에 대해 보행자의 스켈레톤 사이의 연결 관계에 따라 일정시간 동안의 보행자의 자세 정보를 추정하는 자세 추정부; 상기 추정된 일정시간 동안의 보행자의 자세 정보의 시계열 분석을 통해 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 미래 자세 및 위치 예측부; 및 차량의 주행 속도 및 방향을 기반으로 상기 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 이용하여 충돌 가능성을 판단하는 충돌 판단부를 포함할 수 있다.

보행자의 과거부터 현재까지의 영상 정보를 기반으로 보행자의 순차적인 자세 정보를 추출하고, 추출된 보행자의 자세 정보에 대하여 인공신경망 구조를 이용하여 보행자의 미래 자세 데이터를 예측하여 보행자의 미래 위치 데이터를 예측함으로써 보행자의 특정한 행동을 사전에 감지하여 빠른 인지와 판단을 통해 사전에 차량과의 충돌 위험에 대응할 수 있다.

영상 정보 내 각 스켈레톤의 위치 정보를 사용하여 보행자의 미래 자세 및 위치를 예측할 때 보행자의 과거 행위를 바탕으로 의도를 파악하여 구체적인 움직임을 예측하기 때문에 보행자가 어떤 행위를 하는지 어떤 의도로 움직이는지 파악하여, 보다 먼 미래까지 보행자의 미래 위치를 정확하게 예측할 수 있다.

보행자의 주변 영상 정보를 통해서 주변 환경 정보를 분석하기 때문에 보행자의 이동 방향을 제한하거나 보다 높은 확률을 특정할 수 있어 충돌 위험도를 판단하는 정확도를 높일 수 있다.

도 1은 일 실시예에 있어서, 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 동작을 설명하기 위한 도면이다.

도 2는 일 실시예에 따른 자세 예측 및 충돌 위험도 추정 시스템의 구성을 설명하기 위한 블록도이다.

도 3은 일 실시예에 따른 자세 예측 및 충돌 위험도 추정 시스템에서 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법을 설명하기 위한 흐름도이다.

도 4는 일 실시예에 있어서, 영상 정보 처리 동작을 설명하기 위한 도면이다.

도 5는 일 실시예에 있어서, 보행자 자세 추정 동작을 설명하기 위한 도면이다.

도 6은 일 실시예에 있어서, 보행자 미래 자세 및 위치 예측 동작을 설명하기 위한 도면이다.

도 7은 일 실시예에 있어서, 충돌 위험도 판단 및 제어 동작을 설명하기 위한 도면이다.

이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.

실시예에서는 차량과 보행자 간 충돌 여부를 판단할 때, 보행자의 과거부터 현재까지의 영상 정보를 기반으로 보행자의 순차적인 자세 정보를 추출하고, 추출된 보행자의 자세 정보를 RNN(Recurrent Neural Network)과 같은 인공신경망 구조를 이용하여 미래 자세 정보를 예측하여 T 초 후의 이동을 예측하고, 예측된 결과를 통해 추정된 차량과 보행자와의 충돌 위험도에 기초하여 충돌을 회피하기 위한 차량 제어를 수행하여 충돌 위험을 감소시키는 동작에 대하여 설명하기로 한다.

자세 예측 및 충돌 위험도 추정 시스템(100)은 카메라 영상을 이용한 딥러닝 기술 기반 전방 보행자의 자세 예측 및 이를 활용한 충돌 위험도 추정하기 위한 것으로, 영상정보 처리(110), 보행자 자세 추정(120), 보행자 미래 자세 및 위치 예측(130) 및 충돌 위험도 판단 및 제어(140) 동작을 수행할 수 있다.

영상정보 처리(110) 과정에서, 자세 예측 및 충돌 위험도 추정 시스템(100)은 일정시간 동안 수집된 영상 정보의 각각으로부터 보행자를 검출할 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 차량 내부 또는 차량 외부에 설치된 카메라를 통해 촬영되는 영상 정보를 수집할 수 있다. 더욱 상세하게는, 차량에 적어도 하나 이상의 카메라 (센서)가 설치되어 차량의 전방을 촬영하도록 구성될 수 있으며, 자세 예측 및 충돌 위험도 추정 시스템(100)은 차량에 설치된 적어도 하나 이상의 카메라 (센서)를 이용하여 촬영된 영상 정보를 수집할 수 있다.

도 4를 참고하면, 영상정보 처리 동작을 설명하기 위한 것으로, 자세 예측 및 충돌 위험도 추정 시스템(100)은 차량에 장착된 카메라(401)를 이용하여 일정시간 수집된 비디오 영상 정보 각각에 대해 보행자 검출 신경망을 이용하여 보행자를 검출할 수 있다. 이때, 블랙박스에 존재하는 카메라, 스마트 기기(예를 들면, 스마트 폰)에 존재하는 카메라, 적외선 카메라, 열화상 카메라, 일반 카메라 등 다양한 종류의 카메라(401)를 포함할 수 있으며, 일반적으로 차량의 전방을 촬영하는 촬영 기기를 의미할 수 있다. 또는, 카메라를 포함하는 다른 센서들과의 결합 또는, 카메라 이외의 다른 센서들의 결합을 통해 영상 정보가 획득될 수도 있다. 예를 들면, 자세 예측 및 충돌 위험도 추정 시스템(100)은 최근 s초 동안의 영상 정보를 수집할 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 수집된 영상 정보의 각각으로부터 보행자를 검출할 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 보행자 검출 신경망을 이용하여 보행자를 검출할 수 있다. 이때, 보행자 검출 신경망은 딥러닝 기반으로 물체를 검출하기 위하여 신경망 구조로 구성된 것으로, 사전에 보행자를 검출하기 위한 데이터 셋을 이용하여 학습된 것일 수 있다. 이에, 자세 예측 및 충돌 위험도 추정 시스템(100)은 보행자 검출 신경망을 이용하여 수집된 영상 정보 각각으로부터 차량 전방의 보행자를 검출할 수 있다.

보행자 자세 추정(120) 과정에서, 자세 예측 및 충돌 위험도 추정 시스템(100)은 검출된 보행자를 포함하는 영상 정보를 이용하여 매 프레임에 대해 보행자의 스켈레톤 사이의 연결 관계에 따라 일정시간 동안의 보행자의 자세 정보를 추정할 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 검출된 보행자를 포함하는 영상 정보를 통해 신경망 기반의 스켈레톤 위치 추정 기법을 이용하여 보행자 신체의 스켈레톤 정보를 추출할 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 OpenPose, AlphaPose 등의 스켈레톤 위치 추정 기법을 이용하여 영상(이미지) 정보로부터 보행자의 스켈레톤 정보를 추출할 수 있다. 이때, 자세 예측 및 충돌 위험도 추정 시스템(100)은 이미지 시퀀스로부터 추출한 보행자의 스켈레톤 정보 시퀀스를 그래프 구조로 정리할 수 있다.

도 5를 참고하면, 자세 예측 및 충돌 위험도 추정 시스템(100)은 보행자 자세 추정 동작을 설명하기 위한 것으로, 보행자 자세 추정 신경망을 이용하여 보행자 신체의 스켈레톤 정보를 추출할 수 있다. 이때, 보행자 자세 추정 신경망은 CNN(Convolutional neural network) 기반의 구조로 구성된 것으로, 사전에 보행자의 스켈레톤의 위치를 추정하기 위한 데이터 셋을 이용하여 학습된 것일 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 추출된 보행자 신체의 스켈레톤 정보에 기초하여 매 프레임에 대해 스켈레톤 위치를 점으로 나타내고, 점으로 나타낸 스켈레톤 위치 사이를 연결하여 보행자의 자세 정보를 표현할 수 있다. 다시 말해서, 보행자의 자세는 보행자 신체의 스켈레톤(관절) 위치를 나타내는 점과 스켈레톤 사이의 연결 관계를 이용하여 표현될 수 있다.

보행자 미래 자세 및 위치 예측(130) 과정에서, 자세 예측 및 충돌 위험도 추정 시스템(100)은 추정된 일정시간 동안의 보행자의 자세 정보의 시계열 데이터의 분석을 통해 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측할 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 이전 과정에서 추정한 최근 s 초 동안의 보행자의 자세 정보들의 시간적, 순차적인 상태를 분석하여 보행자의 미래 자세 데이터와 보행자의 미래 위치 데이터를 예측할 수 있다. 이를 위해 시퀀스 정보를 분석하기 위하여 RNN 또는 LSTM과 같은 신경망 구조가 사용될 수 있다. 이러한 신경망 구조는 인코더-디코더 구조로 구성될 수 있다. 인코더에는 최근 s초 동안 추정된 보행자의 자세 정보(영상 정보에서의 스켈레톤의 위치 데이터와 연결 정보)와 보행자의 자세 정보로부터 추출된 특징값이 입력 데이터로 제공될 수 있다. 인코더는 각 스켈레톤의 현재까지의 이동 방향, 속도, 특성 등의 시간적 움직임 정보와 주변의 환경 문맥 정보들을 분석하여 시간적 상관관계에 대한 특징값을 추출하게 된다. 디코더에서는 특징값을 입력 데이터로 하여 미래 T초간 보행자의 미래 자세값과 위치값을 추정할 수 있다. 이를 통해 미래 T초 후의 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측할 수 있다.

도 6을 참고하면, 보행자 미래 자세 및 위치 예측 동작을 설명하기 위한 것이다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 추정된 보행자의 자세 정보를 보행자 자세 및 위치 예측 신경망을 이용하여 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측할 수 있다. 보행자 자세 및 위치 예측 신경망은 딥러닝 기반으로 보행자 자세 및 위치를 예측하기 위하여 신경망 구조로 구성된 것으로, 사전에 보행자의 자세 및 위치를 예측하기 위한 데이터 셋을 이용하여 학습된 것일 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 보행자 자세 및 위치 예측 신경망을 이용하여 보행자의 자세 시퀀스를 입력하여 각 스켈레톤의 움직임의 시간적 상관관계 및 스켈레톤 간의 상관관계를 분석하여 보행자의 스켈레톤들에 대한 미래 위치 데이터를 예측하여 보행자의 미래 자세 데이터를 예측할 수 있다.

상세하게는, 자세 예측 및 충돌 위험도 추정 시스템(100)은 보행자의 스켈레톤 정보와 영상 정보를 동시에 입력 데이터로 사용하여 보행자 자세 및 위치 예측 신경망을 통해 보행자의 미래 자세 데이터 및 미래 위치 데이터를 예측할 수 있다. 스켈레톤 정보 시퀀스는 그래프 구조를 처리하는 딥러닝 구조를 통해 스켈레톤 정보 특징값을 추출하고, 이미지 시퀀스는 이미지 정보를 처리하는 딥러닝 구조를 통해 이미지 정보 특징값을 추출할 수 있다. 이때, 영상 정보를 바탕으로 보행자의 위치 박스 및 스켈레톤 이미지 마스크를 생성하여 영상 정보를 처리하는 딥러닝 구조에 함께 제공될 수 있다. 딥러닝 구조는 영상 정보에서 보행자에 해당하는 부분은 마스크를 바탕으로 학습하고 주변 문맥 정보는 원본 이미지를 바탕으로 학습하여 보행자 정보와 주변 문맥 정보를 모두 학습하도록 한다. 이와 같이 추출된 두 특징값을 결합하여 보행자의 미래 위치 데이터를 예측하기 위한 딥러닝 구조를 이용하여 보행자의 미래 위치 데이터를 예측하고, 보행자의 미래 자세 데이터를 예측하기 위한 딥러닝 구조를 이용하여 각 위치에서의 보행자의 미래 자세 데이터를 예측할 수 있다.

충돌 위험도 판단 및 제어(140) 과정에서, 자세 예측 및 충돌 위험도 추정 시스템(100)은 차량의 주행 속도 및 이동 방향을 기반으로 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 이용하여 충돌 가능성(위험도)을 판단할 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 차량의 등속도 모델을 사용하여 T 초 후의 차량의 위치를 가늠해 볼 수 있으며 계산된 차량의 위치 데이터와 예측한 보행자 간의 거리를 계산하여 충돌 위험도를 계산할 수 있다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 계산한 충돌 위험도가 임계값 이상으로 증가할 경우 제동 등의 차량에 대한 충돌방지 제어를 수행할 수 있다. 이때, 임계값은 사용자 또는 컴퓨터에 의해 설정된 값일 수 있다.

도 7을 참고하면, 충돌 위험도 판단 및 제어 동작을 설명하기 위한 도면이다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 현재 차량의 주행 계획을 바탕으로 차량이 미래에 점유하는 공간을 산출하고 예측한 보행자의 미래 위치 및 자세를 통해 산출한 보행자가 미래에 점유하는 공간과 중첩되는지 여부를 확인할 수 있다. 이때, 차량의 주행 계획은 Path Planning 알고리즘이나 등가속도운동 등 차량의 미래 위치를 예측하기 가장 적합한 방법으로 선정될 수 이다. 자세 예측 및 충돌 위험도 추정 시스템(100)은 보행자의 미래 위치 데이터를 여러 위치로 예측한다면 각 위치에 대한 확률이나 랭크를 고려하여 충돌 위험도를 계산할 수 있다.

정확한 위치 및 자세 예측은 충돌 위험도 판단 정확도에 중요한 요소로 스켈레톤 정보를 사용하여 위치 및 자세 예측 정확도를 향상시키는 것은 충돌 위험도 판단 성능 향상에 중요한 영향을 미친다. 'Long-term Human Motion Prediction with Scene Context' 논문의 내용에 따르면, 스켈레톤 정보만 사용한 경우, 영상 정보만 사용한 경우, 두 가지 정보를 모두 사용한 경우에 대하여 예측 성능을 비교한 경우 320mm, 314mm, 297mm로 약 7% 정도의 성능 향상을 보인다는 결론이 도출된 바 있다. 이에, 실시예에서는 스켈레톤 정보와 영상 정보를 모두 사용하여 전방의 보행자와의 충동 위험도를 도출하는 정확도를 향상시킬 수 있다.

자율주행 차량에서 센서 정보를 기반으로 인지, 판단, 제어를 하고 이는 단순히 목적지까지 이동하는 것뿐 아니라 안전에 하게 이동하는 것 또한 필요로 한다. 이를 위해 주변 차량과 사람의 움직임을 인지하고 앞으로의 움직임을 예측하는 것은 자율주행의 안전성에 있어 매우 중요한 기술 중 하나이다. 실시예에 따르면, 보행자의 미래 자세를 예측하는 방법으로 사람이 어느 위치에 어느 자세로 행동하게 될 지를 예측한다. 이를 통해 자율주행 차량은 미래의 충돌 여부를 판단할 수 있으며 판단을 바탕으로 사전에 충돌을 회피하도록 정지 등의 제어를 할 수 있다.

방범, 의료 및 산업 안전 분야에서 각 분야는 영상 정보로부터 사람의 특정한 행동을 검출하는 것을 필요로 한다. 실시예에서는 기본적으로는 보행자의 자세를 예측하는 방법이지만 예측한 미래의 자세를 바탕으로 검출 기법을 함께 적용하여 검출하고자 하는 특정한 행동을 사전에 감지할 수 있으며 해당 행동은 대부분 안전과 밀접한 관련이 있어 빠른 인지와 판단을 통해 사전적으로 대응할 수 있도록 한다.

도 2는 일 실시예에 따른 자세 예측 및 충돌 위험도 추정 시스템의 구성을 설명하기 위한 블록도이고, 도 3은 일 실시예에 따른 자세 예측 및 충돌 위험도 추정 시스템에서 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법을 설명하기 위한 흐름도이다.

자세 예측 및 충돌 위험도 추정 시스템(100)의 프로세서는 보행자 검출부(210), 자세 추정부(220), 미래 자세 및 위치 예측부(230) 및 충돌 판단부(240)를 포함할 수 있다. 이러한 프로세서의 구성요소들은 자세 예측 및 충돌 위험도 추정 시스템에 저장된 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 프로세서 및 프로세서의 구성요소들은 도 3의 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법이 포함하는 단계들(310 내지 340)을 수행하도록 자세 예측 및 충돌 위험도 추정 시스템을 제어할 수 있다. 이때, 프로세서 및 프로세서의 구성요소들은 메모리가 포함하는 운영체제의 코드와 적어도 하나의 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다.

프로세서는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법을 위한 프로그램의 파일에 저장된 프로그램 코드를 메모리에 로딩할 수 있다. 예를 들면, 자세 예측 및 충돌 위험도 추정 시스템에서 프로그램이 실행되면, 프로세서는 운영체제의 제어에 따라 프로그램의 파일로부터 프로그램 코드를 메모리에 로딩하도록 자세 예측 및 충돌 위험도 추정 시스템을 제어할 수 있다. 이때, 보행자 검출부(210), 자세 추정부(220), 미래 자세 및 위치 예측부(230) 및 충돌 판단부(240) 각각은 메모리에 로딩된 프로그램 코드 중 대응하는 부분의 명령을 실행하여 이후 단계들(310 내지 340)을 실행하기 위한 프로세서의 서로 다른 기능적 표현들일 수 있다.

단계(310)에서 보행자 검출부(210)는 일정시간 동안 수집된 영상 정보의 각각으로부터 보행자를 검출할 수 있다. 보행자 검출부(210)는 차량에 장착된 카메라를 이용하여 일정시간 수집된 비디오 영상 정보 각각에 대해 보행자 검출 신경망을 이용하여 보행자를 검출할 수 있다.

단계(320)에서 자세 추정부(220)는 검출된 보행자를 포함하는 영상 정보를 이용하여 매 프레임에 대해 보행자의 스켈레톤 사이의 연결 관계에 따라 일정시간 동안의 보행자의 자세 정보를 추정할 수 있다. 자세 추정부(220)는 검출된 보행자를 포함하는 영상 정보를 통해 보행자 신경망 기반의 스켈레톤 위치 추정 기법을 이용하여 보행자 신체의 스켈레톤 정보를 추출할 수 있다. 자세 추정부(220)는 추출된 보행자 신체의 스켈레톤 정보에 기초하여 매 프레임에 대해 스켈레톤 위치를 점으로 나타내고, 점으로 나타낸 스켈레톤 위치 사이를 연결하여 보행자의 자세 정보를 표현할 수 있다.

단계(330)에서 미래 자세 및 위치 예측부(230)는 추정된 일정시간 동안의 보행자의 자세 정보의 시계열 분석을 통해 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측할 수 있다. 미래 자세 및 위치 예측부(230)는 보행자의 자세 정보를 추정하기 위해 추출된 보행자의 스켈레톤 정보와 수집된 영상 정보를 보행자 자세 및 위치 예측을 위한 신경망 구조에 입력하고, 보행자 자세 및 위치 예측을 위한 신경망 구조를 이용한 시계열 분석을 통해 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측할 수 있다. 미래 자세 및 위치 예측부(230)는 신경망 구조에 구성된 인코더를 통해 출된 보행자의 스켈레톤 정보의 현재까지의 시간적 움직임 정보와 수집된 영상 정보에 포함된 주변의 환경 문맥 정보들을 분석하여 시간적 상관관계에 대한 특징값을 추출할 수 있다. 미래 자세 및 위치 예측부(230)는 신경망 구조에 구성된 디코더를 통해 추출된 특징값을 이용하여 미래 시간의 보행자의 미래 자세값과 위치값을 추정할 수 있다. 미래 자세 및 위치 예측부(230)는 추출된 보행자의 스켈레톤 정보가 그래프 구조로 정리되고, 그래프 구조로 정리된 스켈레톤 정보에 대하여 그래프 구조를 처리하는 딥러닝 구조를 이용하여 스켈레톤 정보 특징값을 추출하고, 수집된 영상 정보를 이미지 정보를 처리하는 딥러닝 구조를 통해 이미지 정보 특징값을 추출할 수 있다. 미래 자세 및 위치 예측부(230)는 수집된 영상 정보에 기초하여 보행자의 위치 박스 및 스켈레톤 이미지 마스크를 생성하고, 생성된 보행자의 위치 박스 및 스켈레톤 이미지 마스크를 이미지 정보를 처리하는 딥러닝 구조에 제공하고, 이미지 정보를 처리하는 딥러닝 구조에서 상기 수집된 영상 정보에서 보행자에 해당되는 영역을 마스크에 기초하여 학습하고, 주변의 환경 문맥 정보들을 상기 수집된 영상 정보에 기초하여 학습할 수 있다.

단계(340)에서 충돌 판단부(240)는 차량의 주행 속도 및 방향을 기반으로 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 이용하여 충돌 가능성을 판단할 수 있다. 충돌 판단부(240)는 차량의 주행 계획에 기초하여 차량이 미래에 점유하게 될 미래 점유 공간을 산출할 수 있다. 예를 들면, 차량의 주행 계획은 사전에 출발지 및 도착지가 입력됨에 따라 출발지와 도착지를 연결하는 경로가 생성될 수 있고, 생성된 경로가 차량의 주행 계획에 포함될 수 있다. 또한, 출발지 및 도착지 이외에도 차량이 방문하고자 하는 방문 위치들이 추가될 수 있고, 추가된 방문 위치들도 함께 주행 계획에 반영될 수 있다. 또한, 차량의 주행 계획에는 차량이 이동할 또는 이동하는 속도 정보, 방향 정보, 시간 정보 등이 포함될 수 있다. 충돌 판단부(240)는 예측된 보행자의 미래 자세 데이터 및 미래 위치 데이터를 통해 산출된 미래 점유 공간과 중첩되는지 여부를 확인할 수 있다. 예를 들면, 차량의 주행 계획에 기초하여 산출된 미래 점유 공간에 보행자와 중첩하게 되는 시간 데이터 및 위치 데이터(예를 들면, 좌표 정보)가 도출될 수 있다. 충돌 판단부(240)는 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 기초하여 각 위치에 대한 충돌 위험도를 계산하고, 계산된 충돌 위험도를 순위화할 수 있다. 예를 들면, 충돌 판단부(220)는 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 기초하여 중첩되는 각 위치에 대한 충돌 위험도를 계산할 수 있다. 이때, 충돌 위험도는 정량적인 값으로 도축될 수 있다. 충돌 판단부(220)는 계산된 충돌 위험도가 임계값 이상으로 증가할 경우, 제동과 관련된 충돌 방지를 위한 제어 명령을 통해 차량을 제어할 수 있다. 예를 들면, 충돌 판단부(220)는 충돌 위험도의 정도에 따라 차량의 제어 명령을 다르게 전달할 수 있다. 만약, 충돌 위험도가 0~25%인 경우 주의, 충돌 위험도가 25~50%인 경우 위험, 충돌 위험도가 50~75%인 경우 경고, 충돌 위험도가 75~100%인 경우 매우 경고 등 충돌 위험도 범위가 구분될 수 있다. 이와 같이, 구분된 충돌 위험도에 따라 차량 제어 명령을 다르게 전달하여 충돌을 방지하도록 한다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

자세 예측 및 충돌 위험도 추정 시스템에 의해 수행되는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법에 있어서,

일정시간 동안 수집된 영상 정보의 각각으로부터 보행자를 검출하는 단계;

상기 검출된 보행자를 포함하는 영상 정보를 이용하여 매 프레임에 대해 보행자의 스켈레톤 사이의 연결 관계에 따라 일정시간 동안의 보행자의 자세 정보를 추정하는 단계;

상기 추정된 일정시간 동안의 보행자의 자세 정보의 시계열 분석을 통해 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계; 및

차량의 주행 속도 및 방향을 기반으로 상기 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 이용하여 충돌 가능성을 판단하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제1항에 있어서,

상기 보행자의 자세 정보를 추정하는 단계는,

상기 검출된 보행자를 포함하는 영상 정보를 통해 보행자 신경망 기반의 스켈레톤 위치 추정 기법을 이용하여 보행자 신체의 스켈레톤 정보를 추출하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제2항에 있어서,

상기 보행자의 자세 정보를 추정하는 단계는,

상기 추출된 보행자 신체의 스켈레톤 정보에 기초하여 매 프레임에 대해 스켈레톤 위치를 점으로 나타내고, 상기 점으로 나타낸 스켈레톤 위치 사이를 연결하여 보행자의 자세 정보를 표현하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제1항에 있어서,

상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는,

상기 보행자의 자세 정보를 추정하기 위해 추출된 보행자의 스켈레톤 정보와 상기 수집된 영상 정보를 보행자 자세 및 위치 예측을 위한 신경망 구조에 입력하고, 상기 보행자 자세 및 위치 예측을 위한 신경망 구조를 이용한 시계열 분석을 통해 상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제4항에 있어서,

상기 신경망 구조는, 인코더와 디코더로 구성되고,

상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는,

상기 인코더를 통해 상기 추출된 보행자의 스켈레톤 정보의 현재까지의 시간적 움직임 정보와 상기 수집된 영상 정보에 포함된 주변의 환경 문맥 정보들을 분석하여 시간적 상관관계에 대한 특징값을 추출하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제5항에 있어서,

상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는,

상기 디코더를 통해 상기 추출된 특징값을 이용하여 미래 시간의 보행자의 미래 자세값과 위치값을 추정하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제5항에 있어서,

상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는,

상기 추출된 보행자의 스켈레톤 정보가 그래프 구조로 정리되고, 상기 그래프 구조로 정리된 스켈레톤 정보에 대하여 그래프 구조를 처리하는 딥러닝 구조를 이용하여 스켈레톤 정보 특징값을 추출하고, 상기 수집된 영상 정보를 이미지 정보를 처리하는 딥러닝 구조를 통해 영상 정보 특징값을 추출하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제5항에 있어서,

상기 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 단계는,

상기 수집된 영상 정보에 기초하여 보행자의 위치 박스 및 스켈레톤 이미지 마스크를 생성하고, 상기 생성된 보행자의 위치 박스 및 스켈레톤 이미지 마스크를 이미지 정보를 처리하는 딥러닝 구조에 제공하고, 상기 이미지 정보를 처리하는 딥러닝 구조에서 상기 수집된 영상 정보에서 보행자에 해당되는 영역을 마스크에 기초하여 학습하고, 상기 주변의 환경 문맥 정보들을 상기 수집된 영상 정보에 기초하여 학습하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제1항에 있어서,

상기 충돌 가능성을 판단하는 단계는,

차량의 주행 계획에 기초하여 차량이 미래에 점유하게 될 미래 점유 공간을 산출하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제9항에 있어서,

상기 충돌 가능성을 판단하는 단계는,

상기 예측된 보행자의 미래 자세 데이터 및 미래 위치 데이터를 통해 상기 산출된 미래 점유 공간과 중첩되는지 여부를 확인하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제1항에 있어서,

상기 충돌 가능성을 판단하는 단계는,

상기 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 기초하여 각 위치에 대한 충돌 위험도를 계산하고, 상기 계산된 충돌 위험도를 순위화하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제1항에 있어서,

상기 충돌 가능성을 판단하는 단계는,

상기 계산된 충돌 위험도가 임계값 이상으로 증가할 경우, 제동과 관련된 충돌방지를 위한 제어 명령을 통해 상기 차량을 제어하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제1항에 있어서,

상기 보행자를 검출하는 단계는,

차량에 장착된 카메라를 이용하여 일정시간 수집된 비디오 영상 정보 각각에 대해 보행자 검출 신경망을 이용하여 보행자를 검출하는 단계

를 포함하는 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법.
제1항 내지 제13항 중 어느 한 항의 딥러닝 기술을 기반으로 예측된 보행자의 자세 정보를 활용하여 충돌 위험도를 추정하는 방법을 상기 자세 예측 및 충돌 위험도 추정 시스템에 실행시키기 위해 비-일시적인 컴퓨터 판독가능한 기록 매체에 저장되는 컴퓨터 프로그램.
자세 예측 및 충돌 위험도 추정 시스템에 있어서,

일정시간 동안 수집된 영상 정보의 각각으로부터 보행자를 검출하는 보행자 검출부;

상기 검출된 보행자를 포함하는 영상 정보를 이용하여 매 프레임에 대해 보행자의 스켈레톤 사이의 연결 관계에 따라 일정시간 동안의 보행자의 자세 정보를 추정하는 자세 추정부;

상기 추정된 일정시간 동안의 보행자의 자세 정보의 시계열 분석을 통해 보행자의 미래 자세 데이터와 미래 위치 데이터를 예측하는 미래 자세 및 위치 예측부; 및

차량의 주행 속도 및 방향을 기반으로 상기 예측된 보행자의 미래 자세 데이터와 미래 위치 데이터에 이용하여 충돌 가능성을 판단하는 충돌 판단부

를 포함하는 자세 예측 및 충돌 위험도 추정 시스템.