KR102676130B1 - 인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템 - Google Patents

인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템 Download PDF

Info

Publication number
KR102676130B1
KR102676130B1 KR1020240009411A KR20240009411A KR102676130B1 KR 102676130 B1 KR102676130 B1 KR 102676130B1 KR 1020240009411 A KR1020240009411 A KR 1020240009411A KR 20240009411 A KR20240009411 A KR 20240009411A KR 102676130 B1 KR102676130 B1 KR 102676130B1
Authority
KR
South Korea
Prior art keywords
gobo
image
type
behavior
lighting
Prior art date
Application number
KR1020240009411A
Other languages
English (en)
Inventor
노지효
조창래
Original Assignee
주식회사 빛글
Filing date
Publication date
Application filed by 주식회사 빛글 filed Critical 주식회사 빛글
Application granted granted Critical
Publication of KR102676130B1 publication Critical patent/KR102676130B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/105Controlling the light source in response to determined parameters
    • H05B47/115Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings
    • H05B47/125Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings by using cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/165Controlling the light source following a pre-assigned programmed sequence; Logic control [LC]
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/17Operational modes, e.g. switching from manual to automatic mode or prohibiting specific operations

Abstract

실시예들은 인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템을 제공한다. 일 실시예에 따른 고보 조명 시스템은, 고보 조명을 투사하는 사전 설정된 영역에 대한 영상을 촬영하는 카메라 장치; 상기 카메라 장치와 연동되어 상기 영상으로부터 객체를 식별하고, 식별된 객체에 대한 정보를 기반으로 제1 조명 설정 정보 및 제2 조명 설정 정보를 생성하는 제어 장치; 제1 고보 이미지의 투사 범위, 제1 고보 이미지의 광량 및 제1 고보 이미지의 색상을 포함하는 상기 제1 조명 설정 정보를 기반으로 상기 제1 고보 이미지를 상기 객체에게 직접 투사하는 제1 고보 조명 장치; 제2 고보 이미지의 투사 범위, 제2 고보 이미지의 광량 및 제2 고보 이미지의 색상을 포함하는 상기 제2 조명 설정 정보를 기반으로 상기 제2 고보 이미지를 상기 사전 설정된 영역의 바닥면에 투사하는 제2 고보 조명 장치를 포함할 수 있다.
상기 제어 장치는, 상기 영상을 기반으로 제1 뉴럴 네트워크를 이용하는 객체 추출 모델을 통해 객체의 종류, 객체의 크기 및 객체의 위치를 실시간으로 결정하고, 상기 영상, 상기 객체의 종류, 상기 객체의 크기 및 상기 객체의 위치를 기반으로 제2 뉴럴 네트워크를 이용하는 행동 분석 모델을 통해 객체의 행동 유형을 결정하고, 상기 객체에 대한 정보는 상기 객체의 종류, 상기 객체의 크기 및 상기 객체의 행동 유형을 포함할 수 있다.
상기 제1 고보 조명 장치는 상기 객체의 위치를 실시간으로 트랙킹하면서 상기 제1 고보 이미지를 투사할 수 있다. 상기 제2 고보 조명 장치는 상기 제2 고보 이미지의 투사 위치에 상기 제2 고보 이미지를 투사할 수 있다.
상기 제2 고보 이미지의 투사 위치는 상기 객체의 위치 및 상기 객체의 행동 유형에 기반하여 결정될 수 있다. 상기 제2 고보 이미지는 상기 객체의 종류 및 상기 객체의 행동 유형을 기반으로 결정된 메시지를 포함할 수 있다.

Description

인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템{GOBO LIGHTING SYSTEM DYNAMICALLY TRACKING OBJECTS THROUGH ARTIFICIAL INTELLIGENCE}
본 개시의 실시예들은 고보 조명 시스템에 관한 것으로, 인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템에 대한 것이다.
고보 조명(gobo light)은 도형, 그림 또는 기호 등을 형성된 원판을 조명장치에 결합하여, 원판에 형성된 도형, 그림 또는 기호 등에 따라 조명의 빛을 선택적으로 투과할 수 있는 장치이다.
이와 같은, 고보 조명은 종래에는 공연이나 방송 등의 특수 효과의 연출 용도에 주로 사용되었으나, 최근에는 기업이나 제품 등을 광고 또는 홍보하기 위한 상(image)을 도로의 바닥면 또는 건물의 벽면 등에 투사하는 광고 용도로도 널리 사용되고 있다.
한편, 관제(管制, control)는 사회의 안전과 편안, 또는 질서의 유지와 보전 등을 위하여 사람 또는 사물을 관리하고 통제하는 것을 의미한다. 일반적으로, 통합 관제 시스템(Integrated control system)은 국가 또는 지역자치단체 등이 교통사고, 범죄, 재난상황 또는 각종 위법행위 등을 사전에 예방하거나 조속히 해결하기 위하여 운영하는 시스템이다.
기존의 카메라를 통한 관리 시스템은 CCTV(Closed Circuit TeleVision, 폐쇄 회로 텔레비전) 및 인터넷망(internet protocol network) 등을 이용하여 정보를 획득하고, 획득된 정보를 기초로 사건(event)의 발생 여부를 파악하고, 발생된 사건에 관한 정보를 소방방재청, 경찰청 등과 같은 유관기관에 즉각적으로 제공하는 역할을 수행하였다.
그러나, 이와 같은 기존의 통합 관제 시스템은 일반적으로 다수의 CCTV가 요구되며, 다수의 CCTV가 각각 촬영한 영상 정보를 하나의 관제실로 실시간으로 전송하기 위하여 광대역폭(wide bandwidth)이 요구되며, 각각의 CCTV 로부터 수신된 다수의 영상을 실시간으로 시청하여 사건이 발생하였는지 판단하는 많은 인력이 요구된다. 즉, 기존의 통합 관제 시스템은 국가 또는 지역자치단체 등과 같이 많은 자원과 인력이 확보된 조직만이 이용할 수 있는 시스템에 불과하다.
따라서, 주택가에서 쓰레기를 무단으로 투기하는 행위를 개인이 통제하거나, 또는 건물 내 금연 구역에서 흡연하는 행위를 통제하는 등과 같이, 개인 또는 소규모의 조직이 협소한 지리적 범위 내에서 관제하기 위한 솔루션이 요구되고 있는 실정이다.
또한, 기존 관제 시스템은 비대면을 이용한 딥러닝 기반의 시스템을 사용하고 있지만, 현장에 직접 개입할 수 있는 조치가 미흡하다. 일반적으로, 음향 장치를 이용하여 원격으로 현장에 개입하고 있으나, 음향 출력 장치(예: 이어폰)를 착용한 사람에게는 효과가 떨어지며, 해당 관제 시스템 주변의 주민들은 소음에 노출될 수 있는 문제가 있다.
이에, 시인성이 확보될 수 있는 고보 조명을 사용하되, 카메라 장치를 통해 획득된 영상을 기반으로 인공지능을 통해 해당 영상 내 객체에 대한 정보를 분석하고, 객체에 대한 정보를 기반으로 해당 객체에게 직접 고보 조명을 투사하며, 주변 사람들에게 현재 상황을 공유하기 위해 바닥면에 고보 조명을 투사하는 시스템이 필요하다.
본 개시의 실시예들은, 인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템을 제공할 수 있다.
실시예들에서 이루고자 하는 기술적 과제들은 이상에서 언급한 사항들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 이하 설명할 다양한 실시예들로부터 당해 기술분야에서 통상의 지식을 가진 자에 의해 고려될 수 있다.
일 실시예에 따른 인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템은, 고보 조명을 투사하는 사전 설정된 영역에 대한 영상을 촬영하는 카메라 장치; 상기 카메라 장치와 연동되어 상기 영상으로부터 객체를 식별하고, 식별된 객체에 대한 정보를 기반으로 제1 조명 설정 정보 및 제2 조명 설정 정보를 생성하는 제어 장치; 제1 고보 이미지의 투사 범위, 제1 고보 이미지의 광량 및 제1 고보 이미지의 색상을 포함하는 상기 제1 조명 설정 정보를 기반으로 상기 제1 고보 이미지를 상기 객체에게 직접 투사하는 제1 고보 조명 장치; 제2 고보 이미지의 투사 범위, 제2 고보 이미지의 광량 및 제2 고보 이미지의 색상을 포함하는 상기 제2 조명 설정 정보를 기반으로 상기 제2 고보 이미지를 상기 사전 설정된 영역의 바닥면에 투사하는 제2 고보 조명 장치를 포함할 수 있다.
상기 제어 장치는, 상기 영상을 기반으로 제1 뉴럴 네트워크를 이용하는 객체 추출 모델을 통해 객체의 종류, 객체의 크기 및 객체의 위치를 실시간으로 결정하고, 상기 영상, 상기 객체의 종류, 상기 객체의 크기 및 상기 객체의 위치를 기반으로 제2 뉴럴 네트워크를 이용하는 행동 분석 모델을 통해 객체의 행동 유형을 결정하고, 상기 객체에 대한 정보는 상기 객체의 종류, 상기 객체의 크기 및 상기 객체의 행동 유형을 포함할 수 있다.
상기 제1 고보 조명 장치는 상기 객체의 위치를 실시간으로 트랙킹하면서 상기 제1 고보 이미지를 투사할 수 있다. 상기 제2 고보 조명 장치는 상기 제2 고보 이미지의 투사 위치에 상기 제2 고보 이미지를 투사할 수 있다.
상기 제2 고보 이미지의 투사 위치는 상기 객체의 위치 및 상기 객체의 행동 유형에 기반하여 결정될 수 있다. 상기 제2 고보 이미지는 상기 객체의 종류 및 상기 객체의 행동 유형을 기반으로 결정된 메시지를 포함할 수 있다.
일 실시예에 따라, 상기 객체 추출 모델은 바운딩 박스 조정(bounding box coordinate)과 분류(classification)를 동시에 실행하는 알고리즘을 사용할 수 있다.
상기 영상에 대한 제1 데이터 전처리를 통해 복수의 이미지 벡터가 생성될 수 있다. 이미지 벡터는 상기 영상의 정지 이미지에 대한 픽셀 값을 포함할 수 있다.
상기 제1 뉴럴 네트워크는 컨피던스 손실(confidence loss) 함수와 바운딩 박스의 위치를 조정하기 위한 지역화 손실(localization loss) 함수 및 객체의 클래스를 예측하기 위한 클래스 손실 함수가 최소화하는 방향으로 학습될 수 있다.
상기 복수의 이미지 벡터 각각이 사전 설정된 사이즈의 그리드로 분할되고, 각 그리드 셀에 대해 객체의 클래스별로 해당 객체가 존재할 확률이 예측되고, 상기 객체의 클래스별 객체가 존재할 확률을 기반으로 상기 객체의 종류가 결정되고, 분할된 그리드를 기반으로 상기 객체의 위치가 결정되고, 상기 객체의 위치에 바운딩 박스가 설정되고, 상기 복수의 이미지 벡터 각각에 대한, 바운딩 박스의 시작 좌표와 높이, 너비 정보 및 바운딩 박스의 깊이 정보를 기반으로 상기 객체의 크기가 결정될 수 있다.
실시예들에 따르면, 고보 조명 시스템은 영상을 기반으로 제1 뉴럴 네트워크를 이용하는 객체 추출 모델을 통해 객체의 종류, 객체의 크기 및 객체의 위치를 실시간으로 결정함으로써, 객체의 종류 및 객체의 크기에 적합한 제1 고보 이미지를 객체의 위치를 트랙킹하여 객체에게 직접 투사하여 객체의 행동을 저지할 수 있다.
실시예들에 따르면, 고보 조명 시스템은 영상, 객체의 종류, 객체의 크기 및 객체의 위치를 기반으로 제2 뉴럴 네트워크를 이용하는 행동 분석 모델을 통해 객체의 행동 유형을 결정하고, 제2 고보 이미지의 투사 위치를 객체의 위치 및 객체의 행동 유형에 기반하여 결정하고, 제2 고보 이미지는 객체의 종류 및 객체의 행동 유형을 기반으로 결정된 메시지를 포함함으로써, 객체에 대한 안내 또는 경고 메시지를 형성하는 제2 고보 이미지를 효과적으로 투사할 수 있다.
실시예들로부터 얻을 수 있는 효과들은 이상에서 언급된 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 이하의 상세한 설명을 기반으로 당해 기술분야에서 통상의 지식을 가진 자에게 명확하게 도출되고 이해될 수 있다.
실시예들에 대한 이해를 돕기 위해 상세한 설명의 일부로 포함된, 첨부 도면은 다양한 실시예들을 제공하고, 상세한 설명과 함께 다양한 실시예들의 기술적 특징을 설명한다.
도 1은 일 실시예에 따른 인공지능을 이용하여 객체를 트랙킹하는 고보 조명(gobo light)을 이용하는 시스템에 대한 도면이다.
도 2는 일 실시예에 따른 객체 추출 모델이 객체의 종류, 크기 및 위치를 결정하는 방법에 대한 흐름도이다.
도 3은 일 실시예에 따른 객체 추출 모델의 예를 나타낸다.
도 4는 일 실시예에 따라 객체와 관련된 시야 방향이 외부 방향인 경우 제1 고보 이미지 및 제2 고보 이미지의 투사 위치를 나타낸 도면이다.
도 5는 일 실시예에 따라 인공지능을 이용하여 객체를 트랙킹하는 고보 조명을 투사하는 방법에 대한 흐름도이다.
이하의 실시예들은 실시예들의 구성요소들과 특징들을 소정 형태로 결합한 것들이다. 각 구성요소 또는 특징은 별도의 명시적 언급이 없는 한 선택적인 것으로 고려될 수 있다. 각 구성요소 또는 특징은 다른 구성요소나 특징과 결합되지 않은 형태로 실시될 수 있다. 또한, 일부 구성요소들 및/또는 특징들을 결합하여 다양한 실시예들을 구성할 수도 있다. 다양한 실시예들에서 설명되는 동작들의 순서는 변경될 수 있다. 어느 실시예의 일부 구성이나 특징은 다른 실시예에 포함될 수 있고, 또는 다른 실시예의 대응하는 구성 또는 특징과 교체될 수 있다.
도면에 대한 설명에서, 다양한 실시예들의 요지를 흐릴 수 있는 절차 또는 단계 등은 기술하지 않았으며, 당해 기술분야에서 통상의 지식을 가진 자의 수준에서 이해할 수 있을 정도의 절차 또는 단계는 또한 기술하지 아니하였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함(comprising 또는 including)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 다양한 실시예들을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
이하, 다양한 실시예들에 따른 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 다양한 실시예들의 예시적인 실시 형태를 설명하고자 하는 것이며, 유일한 실시형태를 나타내고자 하는 것이 아니다.
또한, 다양한 실시예들에서 사용되는 특정(特定) 용어들은 다양한 실시예들의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 다양한 실시예들의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.
도 1은 일 실시예에 따른 인공지능을 이용하여 객체를 트랙킹하는 고보 조명(gobo light)을 이용하는 시스템에 대한 도면이다. 도 1의 일 실시예는 본 개시의 다양한 실시예들과 결합될 수 있다.
도 1을 참조하면, 인공지능을 이용하여 객체를 트랙킹하는 고보 조명을 이용하는 시스템(100)(이하, 고보 조명 시스템)은 카메라 장치(110), 제어 장치(120), 제1 고보 조명 장치(130) 및 제2 고보 조명 장치(140)를 포함할 수 있다.
고보 조명 시스템(100)은 사전 설정된 영역 내 객체의 종류, 크기 및 행동 유형에 따라 제1 고보 이미지를 객체에게 직접 투사하고, 경고 또는 안내 메시지를 형성하는 제2 고보 이미지를 객체의 시야 방향 또는 객체를 바라보는 관찰자(예: 보행자)의 시야 방향에 맞추어 바닥면에 투사하는 시스템이다.
카메라 장치(110)는 고보 조명을 투사하는 사전 설정된 영역에 대한 영상을 촬영하여 제어 장치(120)에게 제공할 수 있다. 예를 들어, 카메라 장치(110)는 설치된 위치를 축으로 가로 또는 세로 방향으로 틸트(tilt)하며 영상을 촬영할 수 있다. 또는, 카메라 장치(110)는 설치된 위치에서 고정적으로 영상을 촬영할 수 있다. 카메라 장치(110)는 렌즈를 통해 입사된 빛을 CCD(Charge Coupled Device)를 통해 전기적 신호로 변환하고, 전기적 신호를 ADC(Analog-Digital Converter)를 이용하여 디지털 신호로 변환하고, 변환된 디지털 신호를 설정된 포맷 (format)에 따라 압축하여 영상을 저장할 수 있다. 카메라 장치(110)는 상시 동작(permanent activation)하며, 촬영된 영상을 제어 장치(120)에게 전송할 수 있다. 예를 들어, 카메라 장치(110)는 제어 장치(120)로부터 수신된 신호에 대응하여, 특정 시점의 영상만을 촬영하여 제어 장치(120)에게 전송할 수 있다. 예를 들어, 제1 고보 조명 장치(130) 및 제2 고보 조명 장치(140)가 고보 조명을 투사할 수 있는 영역과 카메라 장치(110)의 피 촬영 영역은 서로 동일하거나 또는 포함 관계가 될 수 있다. 카메라 장치(110)와 제어 장치(120)는 광 케이블(optical cable)을 이용하여 직접 연결될 수 있다. 제어 장치(120)는 UDP(User Datagram Protocol) 또는 IPX(Internetwork Packet Exchange)를 통해 카메라 장치(110)로부터 영상 데이터를 수신할 수 있다. 예를 들어, 카메라 장치(110)는 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
제어 장치(120)는 카메라 장치(110), 제1 고보 조명 장치(130) 및 제2 고보 조명 장치(140)를 제어하는 장치일 수 있다. 예를 들어, 제어 장치(120)는 카메라 장치(110)와 연동되어 수신한 영상으로부터 객체를 식별하고, 식별된 객체에 대한 정보를 기반으로 제1 조명 설정 정보 및 제2 조명 설정 정보를 생성할 수 있다. 여기서, 제1 조명 설정 정보는 제1 고보 조명 장치(130)의 조명 설정에 대한 정보이며, 제1 고보 이미지의 투사 범위, 제1 고보 이미지의 광량 및 제1 고보 이미지의 색상을 포함할 수 있다. 제1 고보 이미지의 투사 범위는 제1 고보 이미지가 투사되는 반경을 포함할 수 있다. 제1 고보 이미지의 광량은 제1 고보 이미지를 투사하기 위한 제1 고보 조명 장치(130)의 광원의 조도이며, 룩스(lux) 단위일 수 있다. 제1 고보 이미지의 색상은 RGB 값으로 표현될 수 있다. 제2 조명 설정 정보는 제2 고보 조명 장치(140)의 조명 설정에 대한 정보이며, 제2 고보 이미지의 투사 범위, 제2 고보 이미지의 광량 및 제2 고보 이미지의 색상을 포함할 수 있다. 제2 고보 이미지의 투사 범위는 제2 고보 이미지가 투사되는 반경을 포함할 수 있다. 제2 고보 이미지의 광량은 제2 고보 이미지를 투사하기 위한 제2 고보 조명 장치(140)의 광원의 조도이며, 룩스(lux) 단위일 수 있다. 제2 고보 이미지의 색상은 RGB 값으로 표현될 수 있다.
예를 들어, 제어 장치(120)는 영상을 기반으로 제1 뉴럴 네트워크를 이용하는 객체 추출 모델을 통해 객체의 종류, 객체의 크기 및 객체의 위치를 실시간으로 결정할 수 있다.
예를 들어, 제어 장치(120)는 영상, 객체의 종류, 객체의 크기 및 객체의 위치를 기반으로 제2 뉴럴 네트워크를 이용하는 행동 분석 모델을 통해 객체의 행동 유형을 결정할 수 있다.
객체에 대한 정보는 객체의 종류, 객체의 크기, 객체의 위치 또는 객체의 행동 유형 중 적어도 하나를 포함할 수 있다.
객체의 종류는 사람, 동물 및 차량을 포함할 수 있고, 동물은 개, 고양이 또는 쥐와 같이 도심에서 나타나는 동물의 종류를 포함할 수 있다. 차량은 자동차, 오토바이, 자전거 및 킥보드를 포함할 수 있다.
객체의 행동 유형은 복수의 행동 유형 중 어느 하나의 유형일 수 있다. 복수의 행동 유형은 범죄 행위와 관련된 행동 유형, 공공질서 위반과 관련된 행동 유형, 위급 상황과 관련된 행동 유형 및 여기서, 기타 행동 유형을 포함할 수 있다. 범죄 행위와 관련된 행동 유형은 타인을 폭행하는 동작 및 타인의 물건을 훔치는 동작 등을 포함할 수 있다. 공공질서 위반과 관련된 행동 유형은 무단으로 쓰레기를 투기하는 동작, 흡연하는 동작 및 노상방뇨 동작 등을 포함할 수 있다. 위급 상황과 관련된 제3 행동 유형은 사람이 갑자기 쓰러지는 동작 및 사람이 기대어 앉아 있는 동작 등을 포함할 수 있다. 기타 행동 유형은 사람 이외에 동물 및 차량의 행동 유형을 포함할 수 있다. 즉, 기타 행동 유형은 객체가 사람이 아닌 동물 또는 차량인 경우에 선택되는 행동 유형일 수 있다.
예를 들어, 제1 고보 이미지의 투사 범위, 제1 고보 이미지의 광량 및 제1 고보 이미지의 색상 각각은 객체의 종류, 객체의 크기 및 객체의 행동 유형에 따라 상이하게 결정될 수 있다. 제2 고보 이미지의 투사 범위, 제2 고보 이미지의 광량 및 제2 고보 이미지의 색상 각각은 객체의 종류, 객체의 크기 및 객체의 행동 유형에 따라 상이하게 결정될 수 있다.
예를 들어, 객체의 종류, 객체의 크기 및 객체의 행동 유형에 따른 제1 고보 이미지의 투사 범위, 제1 고보 이미지의 광량 및 제1 고보 이미지의 색상이 사전 설정될 수 있다.
예를 들어, 객체의 종류, 객체의 크기 및 객체의 행동 유형에 따른 제2 고보 이미지의 투사 범위, 제2 고보 이미지의 광량 및 제2 고보 이미지의 색상이 사전 설정될 수 있다.
예를 들어, 제2 고보 이미지를 통해 형성되는 복수의 메시지가 객체의 종류 및 객체의 행동 유형에 따라 매칭되어 제어 장치(120)에 사전 저장될 수 있다.
제1 고보 조명 장치(130)는 제1 조명 설정 정보를 기반으로 제1 고보 이미지를 객체에게 직접 투사할 수 있다. 예를 들어, 제1 고보 조명 장치(130)는 객체의 위치를 실시간으로 트랙킹하면서 제1 고보 이미지를 투사할 수 있다. 여기서, 제1 고보 이미지는 객체를 강조하기 위한 조명의 역할을 하는 고보 이미지일 수 있다. 제1 고보 조명 장치(130)는 특정 색상의 필름 또는 렌즈를 장착하여 벽이나 바닥에 투사하여 비추는 장치로 높은 시인성을 확보할 수 있다. 이때, 복수의 필름 또는 렌즈가 구비되어 객체의 종류, 객체의 크기 및 객체의 행동 유형에 따라 제1 고보 조명 장치(130)에 장착되는 필름 또는 렌즈가 자동 변경될 수 있다. 예를 들어, 제1 고보 조명 장치(130)는 복수의 필름 또는 렌즈를 구비하는 회전 원판을 구비하여 회전 원판을 회전시킴으로써, 제1 고보 조명 장치(130)에 장착되는 필름 또는 렌즈를 자동으로 변경시킬 수 있다.
제2 고보 조명 장치(140)는 제2 조명 설정 정보를 기반으로 제2 고보 이미지를 사전 설정된 영역의 바닥면에 투사할 수 있다. 예를 들어, 제2 고보 조명 장치(140)는 제2 고보 이미지의 투사 위치에 제2 고보 이미지를 투사할 수 있다. 제2 고보 이미지의 투사 위치는 객체의 위치 및 객체의 행동 유형에 기반하여 결정될 수 있다. 제2 고보 이미지는 객체의 종류 및 객체의 행동 유형을 기반으로 결정된 메시지를 포함할 수 있다. 즉, 제2 고보 이미지는 객체의 종류 및 객체의 행동 유형에 따라 상이한 메시지로 형성될 수 있다. 제2 고보 조명 장치(140)는 특정 문구 또는 그림의 조합이 각인된 필름 또는 렌즈를 장착하여 벽이나 바닥에 투사하여 비추는 장치로 높은 시인성을 확보할 수 있다. 이때, 복수의 필름 또는 렌즈가 구비되어 객체의 종류 및 객체의 행동 유형에 따라 제2 고보 조명 장치(140)에 장착되는 필름 또는 렌즈가 자동 변경될 수 있다. 예를 들어, 제2 고보 조명 장치(140)는 복수의 필름 또는 렌즈를 구비하는 회전 원판을 구비하여 회전 원판을 회전시킴으로써, 제2 고보 조명 장치(140)에 장착되는 필름 또는 렌즈를 자동으로 변경시킬 수 있다.
예를 들어, 고보 조명 시스템(100)은 사용자 단말(200) 및 서버(300)를 더 포함하여 구성될 수 있다.
사용자 단말(200)은 제어 장치(120)로부터 객체에 대한 정보 또는 카메라 장치(110)에 의해 촬영된 영상 정보를 무선 네트워크를 통해 수신할 수 있다. 사용자 단말(200)은 무선 네트워크를 통해 제어 장치(120)에게 카메라 장치(110), 제1 고보 조명 장치(130) 및 제2 고보 조명 장치(140)에 대한 제어 정보를 전송할 수 있다. 이를 통해, 사용자 단말(200)은 원격으로 카메라 장치(110), 제1 고보 조명 장치(130) 및 제2 고보 조명 장치(140)를 제어할 수 있다.
서버(300)는 사전 설정된 영역 주변에 대한 지도 정보나 카메라 장치(110)에 대한 설정 정보, 제1 고보 조명 장치(130) 및 제2 고보 조명 장치(140)의 설정 정보를 무선 네트워크를 통해 수신할 수 있다. 예를 들어, 서버(300)는 제어 장치(120)로부터 카메라 장치(110)에 의해 촬영된 영상을 수신하여 객체에 대한 정보를 결정할 수 있고, 결정된 객체에 대한 정보를 제어 장치(120)에게 전송할 수 있다.
예를 들어, 제어 장치(120), 사용자 단말(200) 및 서버(300)는 프로세서, 메모리 및 통신모듈을 포함할 수 있다.
프로세서는, 예를 들면, 소프트웨어를 실행하여 프로세서에 연결된 장치의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서는 다른 구성요소(예: 통신모듈)로부터 수신된 명령 또는 데이터를 휘발성 메모리에 저장하고, 휘발성 메모리에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리에 저장할 수 있다. 일 실시예에 따르면, 프로세서는 메인 프로세서(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다.
인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 장치 자체(예: 제어 장치(120))에서 수행될 수 있고, 별도의 서버(예: 서버(300))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리는 장치의 적어도 하나의 구성요소(예: 프로세서)에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리는, 휘발성 메모리 또는 비휘발성 메모리를 포함할 수 있다. 예를 들어, 메모리는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
통신모듈은 장치와 외부 장치 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신모듈은 프로세서와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시예에 따르면, 통신모듈은 무선 통신모듈(예: 셀룰러 통신모듈, 근거리 무선 통신모듈, 또는 GNSS(global navigation satellite system) 통신모듈) 또는 유선 통신모듈(예: LAN(local area network) 통신모듈, 또는 전력선 통신모듈)을 포함할 수 있다. 이들 통신모듈 중 해당하는 통신모듈은 제1 네트워크(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제2 네트워크(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 장치와 통신할 수 있다. 이런 여러 종류의 통신모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다.
본 명세서에 걸쳐, 뉴럴 네트워크(neural network), 신경망 네트워크, 네트워크 함수는, 동일한 의미로 사용될 수 있다. 뉴럴 네트워크는, 일반적으로 "노드"라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 "노드"들은, "뉴런(neuron)"들로 지칭될 수도 있다. 뉴럴 네트워크는, 적어도 둘 이상의 노드들을 포함하여 구성된다. 뉴럴 네트워크들을 구성하는 노드(또는 뉴런)들은 하나 이상의 "링크"에 의해 상호 연결될 수 있다.
뉴럴 네트워크 내에서, 링크를 통해 연결된 둘 이상의 노드들은 상대적으로 입력 노드 및 출력 노드의 관계를 형성할 수 있다. 입력 노드 및 출력 노드의 개념은 상대적인 것으로서, 하나의 노드에 대하여 출력 노드 관계에 있는 임의의 노드는 다른 노드와의 관계에서 입력 노드 관계에 있을 수 있으며, 그 역도 성립할 수 있다. 전술한 바와 같이, 입력 노드 대 출력 노드 관계는 링크를 중심으로 생성될 수 있다. 하나의 입력 노드에 하나 이상의 출력 노드가 링크를 통해 연결될 수 있으며, 그 역도 성립할 수 있다.
하나의 링크를 통해 연결된 입력 노드 및 출력 노드 관계에서, 출력 노드는 입력 노드에 입력된 데이터에 기초하여 그 값이 결정될 수 있다. 여기서, 입력 노드와 출력 노드를 상호 연결하는 노드는 가중치를 가질 수 있다. 가중치는 가변적일 수 있으며, 뉴럴 네트워크가 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 가중치에 기초하여 출력 노드 값을 결정할 수 있다.
전술한 바와 같이, 뉴럴 네트워크는, 둘 이상의 노드들이 하나 이상의 링크를 통해 상호연결 되어 뉴럴 네트워크 내에서 입력 노드 및 출력 노드 관계를 형성한다. 뉴럴 네트워크 내에서 노드들과 링크들의 개수 및 노드들과 링크들 사이의 연관관계, 링크들 각각에 부여된 가중치의 값에 따라, 신경망 네트워크의 특성이 결정될 수 있다. 예를 들어, 동일한 개수의 노드 및 링크들이 존재하고, 링크들 사이의 가중치 값이 상이한 두 신경망 네트워크가 존재하는 경우, 두 개의 신경망 네트워크들은 서로 상이한 것으로 인식될 수 있다.
도 2는 일 실시예에 따른 객체 추출 모델이 객체의 종류, 크기 및 위치를 결정하는 방법에 대한 흐름도이다. 도 3은 일 실시예에 따른 객체 추출 모델의 예를 나타낸다. 도 2 및 도 3의 실시예들은 본 개시의 다양한 실시예들과 결합될 수 있다.
객체 탐색 모델은 YOLO(you only look once) 기반의 모델을 포함할 수 있다. 객체 추출 모델은 바운딩 박스 조정(bounding box coordinate)과 분류(classification)를 동시에 실행하는 알고리즘을 사용할 수 있다. 이때, 객체 탐색 모델에 사용되는 제1 뉴럴 네트워크는 객체가 존재할 확률을 나타내는 컨피던스 손실(confidence loss) 함수와 바운딩 박스의 위치를 조정하기 위한 지역화 손실(localization loss) 함수 및 객체의 클래스를 예측하기 위한 클래스 손실 함수가 최소화하는 방향으로 학습될 수 있다.
제어 장치(120)는 카메라 장치(110)로부터 촬영된 영상에 대한 제1 데이터 전처리를 통해 복수의 이미지 벡터를 생성할 수 있다. 이미지 벡터는 영상의 정지 이미지에 대한 픽셀 값을 포함할 수 있다. 복수의 이미지 벡터는 영상의 시간구간별 정지 이미지 각각에 대한 이미지 벡터일 수 있다.
예를 들어, 제어 장치(120)는 복수의 이미지 벡터를 객체 탐색 모델에 입력시킴으로써, 객체의 종류, 객체의 크기 및 객체의 위치를 결정할 수 있다.
구체적으로, 도 2를 참조하면, 단계 S210에서, 객체 추출 모델은 복수의 이미지 벡터 각각을 사전 설정된 사이즈의 그리드로 분할할 수 있다.
단계 S220에서, 객체 추출 모델은 각 그리드 셀에 대해 객체의 클래스별로 해당 객체가 존재할 확률을 예측할 수 있다.
예를 들어, 객체의 클래스는 복수의 클래스를 포함할 수 있고, 복수의 클래스는 사람, 동물 및 차량을 포함할 수 있다.
단계 S230에서, 객체 추출 모델은 객체의 클래스별 객체가 존재할 확률을 기반으로 각 그리드 셀을 분할할 수 있다.
예를 들어, 객체 추출 모델은 객체가 존재할 확률이 사전 설정된 확률 이상인 클래스를 객체의 종류로 결정할 수 있다.
예를 들어, 객체의 클래스가 복수 개인 경우, 객체 추출 모델은 객체가 존재할 확률이 사전 설정된 확률 이상인 그리드 셀들을 객체의 클래스별로 분할할 수 잇다.
단계 S240에서, 객체 추출 모델은 분할된 그리드를 기반으로 객체의 위치를 결정할 수 있다.
예를 들어, 객체 추출 모델은 객체가 존재할 확률이 사전 설정된 확률 이상인 그리드를 객체의 위치로 결정할 수 있다.
예를 들어, 객체 추출 모델은 객체의 클래스가 복수 개인 경우에는 각 클래스에 해당하는 객체별로 위치를 결정할 수 있다.
단계 S250에서, 객체 추출 모델은 객체의 위치에 바운딩 박스를 설정할 수 있다. 단계 S260에서, 객체 추출 모델은 바운딩 박스를 기반으로 객체의 크기를 결정할 수 있다.
예를 들어, 객체 추출 모델은 바운딩 박스의 시작 좌표와 높이, 너비 정보 및 바운딩 박스의 깊이 정보를 기반으로 객체의 크기를 결정할 수 있다.
도 3을 참조하면, 객체 추출 모델(310)은 백본 네트워크(backbone network)와 감지 네트워크(detection network)로 구성되며, 백본 네트워크는 모델 크기에 따라 상이한 개수의 컨벌루션 레이어와 FC(fully connected) 레이어를 포함할 수 있다. 이때, 백본 네트워크는 CSP(Cross Stage Partial connections)를 도입하여 효율적인 특징 추출과 그래디언트 전파를 수행하게 할 수 있다. 백본 네트워크의 모델 크기는 소형, 중형, 대형 및 초대형을 포함할 수 있다. 백본 네트워크는 모델 크기에 따라 복수 개의 컨벌루션 레이어와 복수 개의 FC 레이어를 포함할 수 있다. 예를 들어, 모델 크기가 클수록 많은 개수의 컨벌루션 레이어와 FC 레이어가 사용될 수 있다. 이때, 컨벌루션 레이어는 채널 사이의 상호작용을 조절하는 1X1 컨벌루션 레이어와 공간 패턴을 학습하는 3X3 컨벌루션 레이어가 교차로 배치되어 모델의 복잡성을 낮추고 성능을 향상시킬 수 있다.
예를 들어, 백본 네트워크에 입력되는 이미지 벡터의 총 개수 및 각 이미지 벡터의 해상도에 기반하여 컨벌루션 레이어의 개수 및 FC 레이어의 개수를 포함하는 백본 네트워크의 모델 크기가 결정될 수 있다.
이러한 백본 네트워크는 각각의 이미지 벡터에서 낮은 레벨의 시각적 특징을 추출하고, 시각적 특징을 고수준의 시맨틱 정보로 변환하는 과정을 통해, 객체의 형태, 구조 및 주요 특징을 학습할 수 있다. 또한, 백본 네트워크는 객체의 다양한 크기와 위치를 감지하기 위해 여러 레이어를 통해 다양한 크기와 수준의 특징을 추출할 수 있다. 또한, 백본 네트워크는 CSP 블록을 사용하여 입력 데이터를 두 부분으로 나누어 처리한 후, 중간에 다른 연산을 거친 다음 다시 두 부분을 결합함으로써, 부분적으로 특징을 교환할 수 있다.
객체 추출 모델(310)은 전역 평균 풀링을 이용하여 특징 맵의 공간 정보를 간단한 평균값으로 변환함으로써, 파라미터를 줄이고 속도를 향상시킬 수 있다.
객체 추출 모델(310)은 중간 특징 맵과 최종 특쟁 맵을 결합하여 이용할 수 있다. 즉, 앞 단의 컨벌루션 레이어의 고해상도 특징 맵을 뒷 단의 컨벌루션 레이어의 저해상도 특징 맵에 추가할 수 있다.
객체 추출 모델(310)은 SPP(spatial pyramid pooling), PAN(path aggregation network) 및 밀집 예측(dense prediction) 기술이 사용될 수 있다. 예를 들어, SPP는 컨벌루션 레이어의 마지막 특징 맵을 고정된 크기의 그리드로 분할하여 평균을 구함으로써, 고정된 크기의 표현을 획득하는 방식일 수 있다. 예를 들어, PAN은 저레벨의 특징 맵에 대한 특징을 고레벨의 특징 맵의 특징으로 바텀-업 방식으로 전달하여, 객체의 정확한 위치와 경계를 예측하는 방식일 수 있다. 밀집 예측은 동일한 클래스의 객체가 겹친 상태에 대해 바운딩 박스를 추출하기 위해, 소프트-NMS(Non-Maximum Suppression) 알고리즘이 사용될 수 있다.
객체 추출 모델(310)은 바틀넥(bottleneck) CSP를 사용하여 각 계층의 연산량을 균등하게 분배할 수 있다. 이를 통해, 연산 바틀넥을 없애고 CNN 계층의 연산 활용 능력을 증가시킬 수 있다.
객체 추출 모델(310)은 이미지 벡터에 대해 SXS 개의 그리드로 분할할 수 있다. 객체 추출 모델(310)은 그리드 영역에서 객체가 존재할 영역으로 추측되는 N개의 바운딩 박스를 결정할 수 있다. 객체 추출 모델(310)은 N개의 바운딩 박스 각각에 대해 예측 중심점, 너비, 높이 및 깊이에 대한 정보를 결정할 수 있다. 객체 추출 모델(310)은 N개의 바운딩 박스에 대해 컨피던스 점수와 클래스 확률을 예측할 수 있다. 컨피던스 점수는 바운딩 박스 내 객체가 존재할 확률을 나타내는 점수로 0에서 1사이의 값을 가질 수 있다. 클래스 확률은 바운딩 박스의 물체가 특정 클래스(사람, 동물 또는 차량)일 확률을 나타내며, 0에서 1 사이의 값을 가질 수 있다. 예를 들어, 객체 추출 모델(310)은 예측한 바운딩 박스와 실제 객체의 바운딩 박스 두 개의 교집합을 예측한 바운딩 박스와 실제 객체의 바운딩 박스에 대한 총 넓이로 나눈 값인 IOU(intersection over union)를 계산할 수 있다. 이때, 인접한 그리드 셀들에 동일한 객체를 예측하는 바운딩 박스들이 생성되면, 소프트-NMS 알고리즘을 통해 하나의 바운딩 박스가 결정될 수 있다.
이와 같은 과정을 통해, 객체 추출 모델(310)은 입력된 이미지 벡터에 대해 바운딩 박스에 대한 클래스 값, 바운딩 박스의 예측 중심점에 대한 xy 좌표 값, 바운딩 박스의 너비, 바운딩 박스의 높이 및 바운딩 박스의 깊이를 결정할 수 있다. 클래스 값은 사람에 대한 값, 동물과 관련된 값 또는 차량과 관련된 값 중 어느 하나를 포함할 수 있다. 동물과 관련된 값은 복수의 동물 중 어느 하나의 동물을 나타내는 값을 포함할 수 있다. 복수의 동물은 개, 고양이, 쥐 등과 같이 도심에서 나타나는 동물의 종류를 포함할 수 있다. 차량과 관련된 값은 자동차, 오토바이, 자전거 및 킥보드 중 어느 하나를 나타내는 값을 포함할 수 있다. 예를 들어, 클래스 값은 사전 설정된 값일 수 있다.
부가적으로, 예를 들어, 백본 네트워크의 컨벌루션 레이어의 개수 및 FC 레이어의 개수는 수학식 1에 의해 결정될 수 있다.
상기 수학식 1에서, 상기 numbercov는 상기 백본 네트워크의 컨벌루션 레이어의 개수이고, 상기 numberfc는 상기 백본 네트워크의 FC 레이어의 개수이고, 상기 Nmax는 컨벌루션 레이어의 최대 개수이고, 상기 navg는 상기 백본 네트워크에서 학습되는 이미지 벡터의 총 개수에 대한 평균 값이고, 상기 ni는 상기 백본 네트워크에서 학습된 이미지 벡터의 총 개수이고, 상기 pw는 이미지 벡터의 가로 픽셀 값이고, 상기 ph는 이미지 벡터의 세로 픽셀 값이고, 상기 ws는 이미지 벡터의 해상도에 따른 가중치일 수 있다.
예를 들어, 컨벌루션 레이어의 최대 개수는 제어 장치의 프로세서가 사용 가능한 컨벌루션 레이어의 최대 개수이며, 프로세서의 성능에 따라 상이하게 설정될 수 있다. 이때, 학습되는 이미지 벡터의 총 개수가 많을수록 컨벌루션 레이어의 개수를 감소시킴으로써, 백본 네트워크의 처리 속도가 급격하게 감소하는 것을 방지할 수 있다.
예를 들어, navg는 백본 네트워크에서 복수의 영역에 대해 학습된 이미지 벡터의 총 개수들에 대한 평균 값일 수 있다. 예를 들어, wS는 이미지 벡터의 해상도가 높을수록 큰 값을 가지며, 0.5에서 1 사이의 값일 수 있다.
예를 들어, ceil 함수는 괄호 안의 값에 소수점을 올려서 다음 정수 값으로 반환하는 함수이며, 올림 함수로 지칭될 수 있다.
이를 통해, 백본 네트워크의 정확도와 속도를 결정하는 컨벌루션 레이어의 개수와 FC 레이어의 개수를 백본 네트워크에서 학습되는 이미지 벡터의 총 개수 및 이미지 벡터의 해상도에 따라 효과적으로 결정할 수 있다.
일 실시예에 따르면, 제2 뉴럴 네트워크는 CNN(convolutional neural network) 기반의 뉴럴 네트워크가 사용될 수 있다.
예를 들어, 제어 장치(120)는 객체의 종류가 사전 설정된 종류인 경우, 영상 및 객체의 위치에 대한 데이터 전처리를 통해 객체의 골격을 추정한 시간구간별 복수의 2차원 좌표에 대한 값 및 상기 복수의 2차원 좌표 사이의 각도의 시간구간별 분포 값을 포함하는 골격 벡터를 생성할 수 있다. 객체의 골격을 추정한 시간구간별 복수의 2차원 좌표에 대한 값은 복수의 이미지 각각에 대한 객체의 위치를 기반으로 해당 이미지 각각에서 객체의 엣지를 구성하는 꼭지점들을 포함할 수 있다. 복수의 2차원 좌표 사이의 각도의 시간구간별 분포 값은 복수의 이미지 각각의 꼭지점들 중 꼭지점에 인접한 두 선분의 각도가 임계 각도 이상인 꼭지점들만의 분포를 포함할 수 있다.
예를 들어, 제어 장치(120)는 클래스 값이 사전 설정된 클래스 값에 해당하는 경우, 영상 및 객체의 위치에 대한 데이터 전처리를 통해 골격 벡터를 생성할 수 있다. 여기서, 사전 설정된 클래스 값은 사람에 대한 값일 수 있다.
예를 들어, 제어 장치(120)는 클래스 값이 사전 설정된 클래스 값에 해당하지 않는 경우, 객체의 행동 유형을 기타 행동 유형으로 결정할 수 있다.
예를 들어, 제어 장치(120)는 객체의 크기에 대한 값을 포함하는 객체 벡터를 생성할 수 있다. 객체의 크기에 대한 값은 객체가 이미지에서 차지하는 면적에 비례하는 값일 수 있다. 예를 들어, 객체의 크기에 대한 값은 객체가 이미지에서 차지하는 면적에 사전 설정된 비율을 적용하여 추정된 크기에 대한 값일 수 있다. 사전 설정된 비율은 이미지와 사전 설정된 영역 사이의 스케일일 수 있다.
예를 들어, 제어 장치(120)는 골격 벡터 및 객체 벡터를 행동 분석 모델에 입력함으로써, 객체의 행동 유형을 결정할 수 있다. 행동 분석 모델은 복수의 골격 벡터, 복수의 객체 벡터, 복수의 기준 골격 벡터 및 복수의 정답 행동 유형을 기반으로 학습될 수 있다.
구체적으로, 제2 뉴럴 네트워크는 입력 레이어, 하나 이상의 히든 레이어 및 출력 레이어를 포함할 수 있다.
예를 들어, 복수의 골격 벡터, 복수의 객체 벡터, 복수의 기준 골격 벡터 및 복수의 정답 행동 유형으로 구성된 학습 데이터는 입력 레이어에 입력되어 하나 이상의 히든 레이어 및 출력 레이어를 통과하여 출력 벡터로 출력되고, 출력 벡터는 출력 레이어에 연결된 손실함수 레이어에 입력되고, 손실함수 레이어는 출력 벡터와 각각의 학습 데이터에 대한 정답 벡터를 비교하는 손실함수를 이용하여 손실 값을 출력하고, 제2 뉴럴 네트워크의 파라미터가 손실 값이 작아지는 방향으로 학습될 수 있다.
하나 이상의 히든 레이어는 하나 이상의 컨벌루션 레이어 및 하나 이상의 풀링 레이어를 포함할 수 있다. 예를 들어, 컨벌루션 레이어에서 복수의 골격 벡터 및 복수의 객체 벡터가 필터링될 수 있고, 컨벌루션 레이어를 통해 특징 맵(feature map)이 형성될 수 있다.
예를 들어, 풀링 레이어에서 형성된 특징 맵에 기반하여 차원 축소를 위해 특징과 관련된 고정 벡터를 선별하고, 상기 형성된 특징 맵에서 서브-샘플링을 수행함으로써, 상기 벡터화된 시계열 데이터에서 복수의 기준 골격 벡터 및 복수의 정답 행동 유형과 관련된 특징을 추출할 수 있다. 예를 들어, 풀링 레이어는 가장 큰 값을 추출하는 맥스 풀링 레이어일 수 있다. 예를 들어, 풀링 레이어는 평균 값을 추출하는 평균 풀링 레이어일 수 있다. 예를 들어, 이때, 제2 뉴럴 네트워크의 파라미터는 상기 컨벌루션 레이어 및 상기 풀링 레이어와 관련된 파라미터(특징 맵의 크기, 필터의 크기, 깊이, 스트라이드, 제로 패딩)를 포함할 수 있다.
예를 들어, 하나의 골격 벡터, 하나의 기준 골격 벡터 및 하나의 정답 행동 유형은 하나의 학습 데이터 세트를 구성할 수 있다. 이때, 복수의 학습 데이터 세트가 사전 저장될 수 있다.
기준 골격 벡터는 하나의 학습 데이터로 구성된 정답 행동 유형을 나타내는 골격 벡터 및 객체 벡터일 수 있다. 예를 들어, 특정 행동 유형이 객체의 크기가 중간 크기인 사람이 갑자기 쓰러지는 동작인 경우, 기준 골격 벡터는 중간 크기를 나타내는 객체의 크기에 대한 값과 중간 크기의 골격이 갑자기 쓰러지는 동작을 표현한 시간구간별 복수의 2차원 좌표에 대한 값 및 상기 복수의 2차원 좌표 사이의 각도의 시간구간별 분포 값을 포함할 수 있다. 즉, 기준 골격 벡터는 특정 크기의 객체가 특정 행동 유형을 수행할 때 기준이 되는 골격 벡터 및 객체 벡터일 수 있다. 복수의 기준 골격 벡터는 복수의 객체 크기별 복수의 행동 유형을 나타내는 골격 벡터를 포함할 수 있다.
정답 행동 유형은 범죄 행위와 관련된 행동 유형, 공공질서 위반과 관련된 행동 유형 및 위급 상황과 관련된 행동 유형을 포함할 수 있다.
예를 들어, 행동 분석 모델은 입력된 골격 벡터 및 객체 벡터와 복수의 정답 행동 유형 각각에 대한 유사도를 결정하고, 가장 큰 유사도를 갖는 정답 행동 유형을 해당 객체의 행동 유형으로 결정할 수 있다.
부가적으로, 예를 들어, 하나의 정답 행동 유형에 대한 유사도는 하기 수학식 2에 의해 결정될 수 있다.
상기 수학식 2에서, 상기 S는 상기 유사도이고, 상기 aread는 입력된 객체 벡터와 기준 골격 벡터에 포함된 객체 벡터 사이의 차이 값에 대한 절대 값이고, 상기 n은 시간구간의 개수이고, boi는 입력된 골격 벡터의 i번째 시간 구간에 대한 복수의 2차원 좌표 사이의 각도의 분포 값이고, bsi는 기준 골격 벡터에 포함된 골격 벡터의 i번째 시간 구간에 대한 복수의 2차원 좌표 사이의 각도의 분포 값이고, wa는 해당 정답 행동 유형에 대한 가중치일 수 있다.
예를 들어, 해당 정답 행동 유형에 대한 가중치는 1보다 크고 1.2 이하의 값을 가질 수 있다. 예를 들어, 복수의 정답 행동 유형 각각에 대해 wa가 상이하게 결정될 수 있다. 예를 들어, wa는 정답 행동 유형에 대한 학습 데이터의 개수가 많고, 골격 벡터의 용량이 작을수록 가중치가 1에 가까운 값으로 결정될 수 있다. 예를 들어, wa는 정답 행동 유형에 대한 학습 데이터의 개수가 적고, 골격 벡터의 용량이 클수록 가중치가 1.2에 가까운 값으로 결정될 수 있다. 즉, wa를 통해 유사도의 신뢰성을 확보할 수 있다.
일 실시예에 따르면, 제어 장치(120)는 객체의 행동 유형을 기반으로 상기 객체와 관련된 시야 방향이 외부 방향 또는 내부 방향 중 어느 하나를 결정할 수 있다. 여기서, 외부 방향은 사전 설정된 영역과 관련된 이동 경로에 따라 객체를 바라보는 방향일 수 있다. 내부 방향은 사전 설정된 영역 내 위치한 객체의 안구 위치에 따른 시야 방향일 수 있다.
예를 들어, 객체의 행동 유형이 범죄 행위와 관련된 행동 유형, 위급 상황과 관련된 상황인 경우 또는 기타 행동 유형 중 어느 하나에 해당하는 경우, 객체와 관련된 시야 방향은 외부 방향으로 결정될 수 있다.
예를 들어, 객체의 행동 유형이 공공질서 위반과 관련된 행동 유형에 해당하는 경우, 객체와 관련된 시야 방향은 내부 방향으로 결정될 수 있다.
예를 들어, 제어 장치(120)는 객체의 위치 및 객체와 관련된 시야 방향을 기반으로 제2 고보 이미지의 투사 위치를 실시간으로 결정할 수 있다.
도 4는 일 실시예에 따라 객체와 관련된 시야 방향이 외부 방향인 경우 제1 고보 이미지 및 제2 고보 이미지의 투사 위치를 나타낸 도면이다. 도 4의 일 실시예는 본 개시의 다양한 실시예들과 결합될 수 있다.
도 4를 참조하면, 객체와 관련된 시야 방향이 외부 방향인 경우, 제어 장치(120)는 객체를 트랙킹하여 제1 고보 조명 장치(130)를 통해 객체에게 제1 고보 이미지를 직접 투사할 수 있다.
객체와 관련된 시야 방향이 외부 방향인 경우, 제어 장치(120)는 사전 설정된 영역과 관련된 이동 경로를 통해 이동하는 보행자에게 위급 상황을 알리기 위해 보행자의 시야를 방해하는 시야 방해물(400)을 고려하여 보행자의 시야가 확보되는 제2 고보 이미지의 투사 위치(410)를 결정할 수 있다. 제어 장치(120)는 제2 고보 조명 장치(140)를 통해 제2 고보 이미지의 투사 위치(410)에 제2 고보 이미지를 투사할 수 있다.
예를 들어, 객체와 관련된 시야 방향이 외부 방향인 경우, 제어 장치(120)는 제2 고보 이미지의 투사 위치를 객체의 현재 위치에 매칭되는 복수의 후보 위치 중에서 가장 높은 노출 점수를 가진 후보 위치로 결정할 수 있다.
예를 들어, 복수의 후보 위치 및 복수의 후보 위치 각각에 대한 노출 점수는 복수의 시야 이미지 및 객체의 행동 유형을 기반으로 제3 뉴럴 네트워크를 이용하는 투사 위치 결정 모델을 통해 결정될 수 있다. 복수의 시야 이미지는 사전 설정된 영역과 관련된 이동 경로에서 사전 설정된 영역을 서로 다른 각도로 촬영한 이미지를 포함할 수 있다. 사전 설정된 영역과 관련된 이동 경로는 사전 설정된 영역에 대한 시야가 확보되는 복수의 이동 경로를 포함할 수 있다.
부가적으로, 예를 들어, 제어 장치(120)는 복수의 시야 이미지에 대한 데이터 전처리를 통해 적어도 하나의 시야 방해물에 대한 3차원 위치 좌표 값을 포함하는 시야 벡터를 생성할 수 있다.
예를 들어, 제어 장치(120)는 객체의 행동 유형에 대한 값을 포함하는 유형 벡터를 생성할 수 있다.
예를 들어, 제어 장치(120)는 시야 벡터 및 유형 벡터를 투사 위치 결정 모델에 입력함으로써, 복수의 후보 위치 및 복수의 후보 위치 각각에 대한 노출 점수를 결정할 수 있다. 투사 위치 결정 모델은 복수의 시야 벡터, 복수의 유형 벡터, 복수의 기준 위치 벡터, 복수의 정답 후보 위치 세트 및 상기 복수의 정답 후보 위치 세트에 대한 노출 점수를 기반으로 학습될 수 있다.
구체적으로, 예를 들어, 제3 뉴럴 네트워크는 CNN 기반의 뉴럴 네트워크일 수 있다. 제3 뉴럴 네트워크는 입력 레이어, 하나 이상의 히든 레이어 및 출력 레이어를 포함할 수 있다.
예를 들어, 복수의 시야 벡터, 복수의 유형 벡터, 복수의 기준 위치 벡터, 복수의 정답 후보 위치 세트 및 상기 복수의 정답 후보 위치 세트에 대한 노출 점수로 구성된 학습 데이터는 입력 레이어에 입력되어 하나 이상의 히든 레이어 및 출력 레이어를 통과하여 출력 벡터로 출력되고, 출력 벡터는 출력 레이어에 연결된 손실함수 레이어에 입력되고, 손실함수 레이어는 출력 벡터와 각각의 학습 데이터에 대한 정답 벡터를 비교하는 손실함수를 이용하여 손실 값을 출력하고, 제3 뉴럴 네트워크의 파라미터가 손실 값이 작아지는 방향으로 학습될 수 있다.
하나 이상의 히든 레이어는 하나 이상의 컨벌루션 레이어 및 하나 이상의 풀링 레이어를 포함할 수 있다. 예를 들어, 컨벌루션 레이어에서 복수의 시야 벡터, 복수의 유형 벡터 및 복수의 기준 위치 벡터가 필터링될 수 있고, 컨벌루션 레이어를 통해 특징 맵(feature map)이 형성될 수 있다.
예를 들어, 풀링 레이어에서 형성된 특징 맵에 기반하여 차원 축소를 위해 특징과 관련된 고정 벡터를 선별하고, 상기 형성된 특징 맵에서 서브-샘플링을 수행함으로써, 상기 벡터화된 시계열 데이터에서 복수의 정답 후보 위치 세트 및 상기 복수의 정답 후보 위치 세트에 대한 노출 점수와 관련된 특징을 추출할 수 있다. 예를 들어, 풀링 레이어는 가장 큰 값을 추출하는 맥스 풀링 레이어일 수 있다. 예를 들어, 풀링 레이어는 평균 값을 추출하는 평균 풀링 레이어일 수 있다. 예를 들어, 이때, 제3 뉴럴 네트워크의 파라미터는 상기 컨벌루션 레이어 및 상기 풀링 레이어와 관련된 파라미터(특징 맵의 크기, 필터의 크기, 깊이, 스트라이드, 제로 패딩)를 포함할 수 있다.
예를 들어, 하나의 시야 벡터 및 하나의 유형 벡터는 하나의 기준 위치 벡터, 하나의 정답 후보 위치 세트 및 하나의 정답 후보 위치 세트에 포함된 각각의 정답 후보 위치에 대한 노출 점수로 하나의 학습 데이터 세트를 구성할 수 있다. 이때, 복수의 학습 데이터 세트가 사전 저장될 수 있다.
기준 위치 벡터는 사전 설정된 영역 내에서 객체가 위치할 수 있는 좌표 값들을 포함할 수 있다. 하나의 정답 후보 위치 세트는, 하나의 학습 데이터로 구성된 객체가 위치할 수 있는 좌표 값들 각각에 대해, 시야 벡터를 기준으로 제2 고보 이미지를 투사할 수 있는 투사 위치를 후보 위치로 결정하여 포함할 수 있다. 노출 점수는 투사 위치에 투사된 제2 고보 이미지가 사전 설정된 영역과 관련된 이동 경로를 통해 이동하는 보행자에게 노출되는 정도를 나타낼 수 있다.
부가적으로, 예를 들어, 노출 점수는 하기 수학식 3에 의해 결정될 수 있다.
상기 수학식 3에서, 상기 E는 상기 노출 점수이고, 상기 ntotal은 복수의 이미지의 총 개수이고, 상기 nv는 상기 복수의 이미지 중에서 해당 후보 위치에 대한 시야가 확보되는 이미지의 개수이고, 상기 rd는 현재 객체의 위치와 해당 후보 위치 사이의 거리이고, 상기 wb는 해당 행동 유형에 대한 가중치일 수 있다.
예를 들어, 노출 점수는 0보다 크고 100 이하의 값을 가질 수 있다. 예를 들어, rd는 현재 객체의 위치에 대한 좌표 값과 해당 후보 위치의 좌표 값 사이의 거리로 결정될 수 있다. 예를 들어, 해당 행동 유형에 대한 가중치는 1보다 크고 1.2 이하의 값을 가질 수 있다. 예를 들어, wb는 행동 유형에 대한 복수의 이미지의 개수가 적고, 사전 설정된 영역의 면적이 클수록 가중치가 1.2에 가까운 값으로 결정될 수 있다. 즉, wb를 통해 노출 점수의 신뢰성을 확보할 수 있다.
예를 들어, min 함수는 괄호 안의 두 개의 값 중에서 더 작은 값을 선택하는 함수일 수 있다.
이를 통해, 투사 위치 결정 모델은 사전 설정된 영역 내 시야 방해물의 위치를 고려하여 사전 설정된 영역과 관련된 이동 경로를 통해 이동하는 보행자의 시야에 노출될 수 있는 복수의 후보 위치와 복수의 후보 위치 각각에 대한 노출 점수를 결정하도록 학습될 수 있다.
따라서, 제어 장치(120)는 투사 위치 결정 모델을 이용하여 사전 설정된 영역에서 관찰자에 대한 시야에서 노출 가능성이 가장 높고, 객체를 가장 잘 발견할 수 있는 투사 위치를 결정할 수 있다.
예를 들어, 객체와 관련된 시야 방향이 내부 방향인 경우, 제어 장치(120)는 골격 벡터를 기반으로 객체의 시야 방향 및 객체의 시야 각도를 결정할 수 있다. 예를 들어, 제어 장치(120)는 객체의 골격을 추정한 시간구간별 복수의 2차원 좌표에 대한 값의 변화 방향에 따라, 객체의 이동 방향을 결정할 수 있다. 예를 들어, 제어 장치(120)는 객체의 골격을 추청한 복수의 2차원 좌표에서 안구의 상대적인 위치를 객체의 안구 위치로 결정하고, 객체의 이동 방향 및 객체의 안구 위치를 기준으로 객체의 시야 방향 및 객체의 시야 각도를 결정할 수 있다. 예를 들어, 제어 장치(120)는 사전 설정된 영역 내에서 객체의 시야 방향 및 객체의 시야 각도에 해당하는 영역을 제2 고보 이미지의 투사가 가능한 영역으로 결정할 수 있다. 예를 들어, 제어 장치(120)는 제2 고보 이미지의 투사가 가능한 영역 내에 제2 고보 이미지의 투사 위치를 결정할 수 있다.
도 5는 일 실시예에 따라 인공지능을 이용하여 객체를 트랙킹하는 고보 조명을 투사하는 방법에 대한 흐름도이다. 도 5의 일 실시예는 본 개시의 다양한 실시예들과 결합될 수 있다.
도 5를 참조하면, 단계 S501에서, 제어 장치(120)는 카메라 장치(110)를 통해 사전 설정된 영역을 촬영한 영상을 획득할 수 있다.
단계 S502에서, 제어 장치(120)는 영상을 기반으로 제1 뉴럴 네트워크를 이용하는 객체 추출 모델을 통해 객체의 종류, 객체의 크기 및 객체의 위치를 실시간으로 결정할 수 있다.
단계 S503에서, 제어 장치(120)는 사전 설정된 영역 내 복수의 객체가 존재하는지 여부를 결정할 수 있다.
예를 들어, 제어 장치(120)는 영상을 기반으로 제1 뉴럴 네트워크를 이용하는 객체 추출 모델을 통해 복수의 객체에 대한 종류, 크기와 위치가 결정된 경우, 사전 설정된 영역 내 복수의 객체가 존재하는 것으로 결정할 수 있다.
단계 S504에서, 복수의 객체가 존재하는 경우, 제어 장치(120)는 복수의 객체 각각에 대한 행동 유형을 결정할 수 있다.
예를 들어, 제어 장치(120)는 영상, 객체의 종류, 객체의 크기 및 객체의 위치를 기반으로 제2 뉴럴 네트워크를 이용하는 행동 분석 모델을 통해 객체의 행동 유형을 결정할 수 있다.
예를 들어, 제어 장치(120)는 객체의 종류가 사전 설정된 제1 종류(예: 사람)에 해당하는 경우, 영상 및 객체의 위치에 대한 데이터 전처리를 통해 골격 벡터를 생성할 수 있다. 즉, 제어 장치(120)는 객체의 종류가 사전 설정된 종류에 해당할 때, 골격 벡터 및 객체 벡터를 생성하여 행동 분석 모델에 입력함으로써, 객체의 행동 유형을 결정할 수 있다. 이때, 객체의 종류는 제1 뉴럴 네트워크의 클래스 값에 따라 결정될 수 있다.
예를 들어, 제어 장치(120)는 객체의 종류가 사전 설정된 제2 종류(예: 동물 또는 차량)에 해당하는 경우, 객체의 행동 유형을 기타 행동 유형으로 결정할 수 있다. 이때, 객체의 종류는 제1 뉴럴 네트워크의 클래스 값에 따라 결정될 수 있다.
단계 S505에서, 제어 장치(120)는 복수의 객체 각각에 대한 행동 유형에 따라 복수의 객체 각각에 대한 우선 순위를 결정할 수 있다.
부가적으로, 예를 들어, 행동 유형에 매칭되는 우선 순위는 제어 장치(120)에 사전 설정될 수 있다. 예를 들어, 위급 상황과 관련된 행동 유형이 가장 큰 우선 순위로 설정되고, 범죄 행위와 관련된 행동 유형이 그 다음 우선 순위로 설정되고, 공공질서 위반과 관련된 행동 유형이 그 다음 우선 순위로 설정되고, 기타 행동 유형이 그 다음 우선 순위로 설정될 수 있다.
예를 들어, 동일한 행동 유형으로 결정된 객체가 복수 개인 경우, 객체의 크기가 작을수록 우선 순위가 높게 결정될 수 있다.
단계 S506에서, 제어 장치(120)는 복수의 객체 중에서 가장 우선 순위가 높은 객체에 대한 정보를 기반으로 제1 조명 설정 정보를 결정하여 제1 고보 이미지를 제1 고보 조명 장치(130)를 통해 해당 객체에게 직접 투사할 수 있다.
단계 S507에서, 제어 장치(120)는 복수의 객체 중에서 가장 우선 순위가 높은 객체에 대한 정보를 기반으로 제2 조명 설정 정보를 결정하여 해당 객체의 위치에 따라 제2 고보 조명 장치(140)를 통해 제2 고보 이미지의 투사 위치에 제2 고보 이미지를 투사할 수 있다.
단계 S508에서, 하나의 객체가 존재하는 경우, 제어 장치(120)는 해당 객체가 사람인지 여부를 결정할 수 있다.
예를 들어, 제어 장치(120)는 객체의 종류를 제1 뉴럴 네트워크의 클래스 값에 따라 결정할 수 있다. 예를 들어, 클래스 값이 사람에 대한 값인 경우, 제어 장치(120)는 해당 객체가 사람인 것으로 결정할 수 있다.
단계 S509에서, 해당 객체가 사람인 경우, 제어 장치(120)는 골격 벡터 및 객체 벡터를 생성하여 행동 분석 모델에 입력함으로써, 객체에 대한 행동 유형을 결정할 수 있다.
단계 S510에서, 제어 장치(120)는 객체에 대한 정보를 기반으로 제1 조명 설정 정보를 결정하여 해당 객체에게 제1 고보 이미지를 제1 고보 조명 장치(130)를 통해 투사할 수 있다.
단계 S511에서, 제어 장치(120)는 객체에 대한 정보를 기반으로 제2 조명 설정 정보를 결정하여 해당 객체의 위치에 따라 제2 고보 조명 장치(140)를 통해 제2 고보 이미지의 투사 위치에 제2 고보 이미지를 투사할 수 있다
단계 S512에서, 해당 객체가 동물 또는 차량인 경우, 제어 장치(120)는 객체에 대한 행동 유형을 기타 행동 유형으로 결정할 수 있다.
단계 S513에서, 제어 장치(120)는 객체에 대한 정보를 기반으로 제1 조명 설정 정보를 결정하여 해당 객체에게 제1 고보 이미지를 제1 고보 조명 장치(130)를 통해 투사할 수 있다.
단계 S514에서, 제어 장치(120)는 객체에 대한 정보를 기반으로 제2 조명 설정 정보를 결정하여 해당 객체의 위치에 따라 제2 고보 조명 장치(140)를 통해 제2 고보 이미지의 투사 위치에 제2 고보 이미지를 투사할 수 있다
예를 들어, 단계 S507, 단계 S511 및 단계 S514에서, 제어 장치(120)는 객체의 위치 및 객체와 관련된 시야 방향을 기반으로 제2 고보 이미지의 투사 위치를 실시간으로 결정할 수 있다.
예를 들어, 객체와 관련된 시야 방향이 외부 방향인 경우, 제어 장치(120)는 제2 고보 이미지의 투사 위치를 객체의 현재 위치에 매칭되는 복수의 후보 위치 중에서 가장 높은 노출 점수를 가진 후보 위치로 결정할 수 있다. 예를 들어, 복수의 후보 위치 및 복수의 후보 위치 각각에 대한 노출 점수는 복수의 시야 이미지 및 객체의 행동 유형을 기반으로 제3 뉴럴 네트워크를 이용하는 투사 위치 결정 모델을 통해 결정될 수 있다.
예를 들어, 객체와 관련된 시야 방향이 내부 방향인 경우, 제어 장치(120)는 골격 벡터를 기반으로 제2 고보 이미지의 투사가 가능한 영역 내에 제2 고보 이미지의 투사 위치를 결정할 수 있다. 예를 들어, 제2 고보 이미지의 투사가 가능한 영역은 사전 설정된 영역 내에서 객체의 시야 방향 및 객체의 시야 각도에 해당하는 영역에 포함될 수 있다. 객체의 골격을 추청한 복수의 2차원 좌표에서 안구의 상대적인 위치를 객체의 안구 위치가 결정되고, 객체의 이동 방향 및 객체의 안구 위치를 기준으로 객체의 시야 방향 및 객체의 시야 각도가 결정될 수 있다.
부가적으로, 예를 들어, 제1 고보 이미지의 색상 및 제2 고보 이미지의 색상은 영상에서 배경이 분리되고, 분리된 배경의 평균 색상과 보색이 되는 색상(complementary)으로 결정될 수 있다. 객체의 눈에 선명하게 보일 수 있는 색상이 스크린(예를 들어, 지면 또는 벽면)의 종류 및 색상에 따라 달라질 수 있기 때문이다.
예를 들어, 제어 장치(120)는 산출된 배경의 평균 색상과 보색이 되는 색상을 결정할 수 있다. 예를 들어, 제어 장치(120)는 제1 고보 이미지의 색상 또는 제2 고보 이미지의 색상을 하기 수학식 4에 의해 결정할 수 있다.
상기 수학식 4에서, Rback, Gback, Bback이 상기 배경의 평균 색상의 RGB 값이고, Rout, Gout, Bout이 상기 보색 색상의 RGB 일 수 있다.
이를 통해, 객체의 눈에 선명하게 보일 수 있는 색상이 결정될 수 있다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (5)

  1. 고보 조명을 투사하는 사전 설정된 영역에 대한 영상을 촬영하는 카메라 장치;
    상기 카메라 장치와 연동되어 상기 영상으로부터 객체를 식별하고, 식별된 객체에 대한 정보를 기반으로 제1 조명 설정 정보 및 제2 조명 설정 정보를 생성하는 제어 장치;
    제1 고보 이미지의 투사 범위, 제1 고보 이미지의 광량 및 제1 고보 이미지의 색상을 포함하는 상기 제1 조명 설정 정보를 기반으로 상기 제1 고보 이미지를 상기 객체에게 직접 투사하는 제1 고보 조명 장치;
    제2 고보 이미지의 투사 범위, 제2 고보 이미지의 광량 및 제2 고보 이미지의 색상을 포함하는 상기 제2 조명 설정 정보를 기반으로 상기 제2 고보 이미지를 상기 사전 설정된 영역의 바닥면에 투사하는 제2 고보 조명 장치를 포함하되,
    상기 제어 장치는,
    상기 영상을 기반으로 제1 뉴럴 네트워크를 이용하는 객체 추출 모델을 통해 객체의 종류, 객체의 크기 및 객체의 위치를 실시간으로 결정하고,
    상기 영상, 상기 객체의 종류, 상기 객체의 크기 및 상기 객체의 위치를 기반으로 제2 뉴럴 네트워크를 이용하는 행동 분석 모델을 통해 객체의 행동 유형을 결정하고,
    상기 객체에 대한 정보는 상기 객체의 종류, 상기 객체의 크기 및 상기 객체의 행동 유형을 포함하고,
    상기 제1 고보 조명 장치는 상기 객체의 위치를 실시간으로 트랙킹하면서 상기 제1 고보 이미지를 투사하고,
    상기 제2 고보 조명 장치는 상기 제2 고보 이미지의 투사 위치에 상기 제2 고보 이미지를 투사하고,
    상기 제2 고보 이미지의 투사 위치는 상기 객체의 위치 및 상기 객체의 행동 유형에 기반하여 결정되고,
    상기 제2 고보 이미지는 상기 객체의 종류 및 상기 객체의 행동 유형을 기반으로 결정된 메시지를 포함하고,
    상기 객체의 행동 유형을 기반으로 상기 객체와 관련된 시야 방향이 외부 방향 또는 내부 방향 중 어느 하나로 결정되고,
    상기 객체의 위치 및 상기 객체와 관련된 시야 방향을 기반으로 상기 제2 고보 이미지의 투사 위치가 실시간으로 결정되고,
    상기 외부 방향은 상기 사전 설정된 영역과 관련된 이동 경로에 따라 상기 객체를 바라보는 방향이고,
    상기 내부 방향은 상기 사전 설정된 영역 내 위치한 객체의 안구 위치에 따른 시야 방향이고,
    상기 객체와 관련된 시야 방향이 외부 방향인 경우, 상기 제2 고보 이미지의 투사 위치는 상기 객체의 현재 위치에 매칭되는 복수의 후보 위치 중에서 가장 높은 노출 점수를 가진 후보 위치로 결정되고,
    상기 복수의 후보 위치 및 상기 복수의 후보 위치 각각에 대한 노출 점수는 복수의 시야 이미지 및 상기 객체의 행동 유형을 기반으로 제3 뉴럴 네트워크를 이용하는 투사 위치 결정 모델을 통해 결정되고,
    상기 복수의 시야 이미지는 상기 사전 설정된 영역과 관련된 이동 경로에서 상기 사전 설정된 영역을 서로 다른 각도로 촬영한 이미지를 포함하고,
    상기 사전 설정된 영역과 관련된 이동 경로는 상기 사전 설정된 영역에 대한 시야가 확보되는 복수의 이동 경로를 포함하고,
    상기 복수의 시야 이미지에 대한 데이터 전처리를 통해 적어도 하나의 시야 방해물에 대한 3차원 위치 좌표 값을 포함하는 시야 벡터가 생성되고,
    상기 객체의 행동 유형에 대한 값을 포함하는 유형 벡터가 생성되고,
    상기 시야 벡터 및 상기 유형 벡터가 상기 투사 위치 결정 모델에 입력되는 것으로써, 상기 복수의 후보 위치 및 상기 복수의 후보 위치 각각에 대한 노출 점수가 결정되고,
    상기 투사 위치 결정 모델은 복수의 시야 벡터, 복수의 유형 벡터, 복수의 기준 위치 벡터, 복수의 정답 후보 위치 세트 및 상기 복수의 정답 후보 위치 세트에 대한 노출 점수를 기반으로 학습되는,
    고보 조명 시스템.
  2. 제 1항에 있어서,
    상기 객체 추출 모델은 바운딩 박스 조정(bounding box coordinate)과 분류(classification)를 동시에 실행하는 알고리즘을 사용하고,
    상기 영상에 대한 제1 데이터 전처리를 통해 복수의 이미지 벡터가 생성되고,
    이미지 벡터는 상기 영상의 정지 이미지에 대한 픽셀 값을 포함하고,
    상기 제1 뉴럴 네트워크는 컨피던스 손실(confidence loss) 함수와 바운딩 박스의 위치를 조정하기 위한 지역화 손실(localization loss) 함수 및 객체의 클래스를 예측하기 위한 클래스 손실 함수가 최소화하는 방향으로 학습되고,
    상기 복수의 이미지 벡터 각각이 사전 설정된 사이즈의 그리드로 분할되고,
    각 그리드 셀에 대해 객체의 클래스별로 해당 객체가 존재할 확률이 예측되고,
    상기 객체의 클래스별 객체가 존재할 확률을 기반으로 상기 객체의 종류가 결정되고,
    분할된 그리드를 기반으로 상기 객체의 위치가 결정되고,
    상기 객체의 위치에 바운딩 박스가 설정되고,
    상기 복수의 이미지 벡터 각각에 대한, 바운딩 박스의 시작 좌표와 높이, 너비 정보 및 바운딩 박스의 깊이 정보를 기반으로 상기 객체의 크기가 결정되는,
    고보 조명 시스템.
  3. 제 2항에 있어서,
    상기 제2 뉴럴 네트워크는 CNN(convolutional neural network) 기반의 뉴럴 네트워크가 사용되고,
    상기 객체의 종류가 사전 설정된 종류인 경우, 상기 영상 및 상기 객체의 위치에 대한 데이터 전처리를 통해 객체의 골격을 추정한 시간구간별 복수의 2차원 좌표에 대한 값 및 상기 복수의 2차원 좌표 사이의 각도의 시간구간별 분포 값을 포함하는 골격 벡터가 생성되고,
    상기 객체의 크기에 대한 값을 포함하는 객체 벡터가 생성되고,
    상기 골격 벡터 및 상기 객체 벡터가 상기 행동 분석 모델에 입력되고, 상기 객체의 행동 유형이 결정되고,
    상기 행동 분석 모델은 복수의 골격 벡터, 복수의 객체 벡터, 복수의 기준 골격 벡터 및 복수의 정답 행동 유형을 기반으로 학습되는,
    고보 조명 시스템.
  4. 삭제
  5. 삭제
KR1020240009411A 2024-01-22 인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템 KR102676130B1 (ko)

Publications (1)

Publication Number Publication Date
KR102676130B1 true KR102676130B1 (ko) 2024-06-18

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102624302B1 (ko) * 2023-04-05 2024-01-15 주식회사 상상이노베이션 범죄 예방을 위한 고보조명 시스템 및 조명 출력 제어 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102624302B1 (ko) * 2023-04-05 2024-01-15 주식회사 상상이노베이션 범죄 예방을 위한 고보조명 시스템 및 조명 출력 제어 방법

Similar Documents

Publication Publication Date Title
WO2022022721A1 (zh) 轨迹预测方法、装置、设备、存储介质及程序
JP6849898B2 (ja) 生成ニューラルネットワークと、判別ニューラルネットワークとを含む敵対的生成ネットワークを利用して、合成可否判断不可の合成イメージを生成する方法、及び装置
US20220343138A1 (en) Analysis of objects of interest in sensor data using deep neural networks
Yogameena et al. Computer vision based crowd disaster avoidance system: A survey
US11373067B2 (en) Parametric top-view representation of scenes
US8744125B2 (en) Clustering-based object classification
KR101833359B1 (ko) 차량의 외부 영상 빅데이터를 이용한 교통 정보 수집 방법 및 장치
CN107729799A (zh) 基于深度卷积神经网络的人群异常行为视觉检测及分析预警系统
KR101877294B1 (ko) 객체, 영역 및 객체가 유발하는 이벤트의 유기적 관계를 기반으로 한 복수 개 기본행동패턴 정의를 통한 복합 상황 설정 및 자동 상황 인지가 가능한 지능형 방범 cctv 시스템
KR102122850B1 (ko) 딥 러닝 기반의 교통분석 및 차량번호 인식 솔루션
KR102301631B1 (ko) 협업 주행을 수행하는 자동차들로부터 획득된 주행 이미지들을 통합하는 방법 및 이를 이용한 주행 이미지 통합 장치
KR102246706B1 (ko) 자율 주행 장치 및 이상 도로 상황에서 자율 주행 장치 운용 방법
KR102246462B1 (ko) 지능형 엣지 기반 도로교통 상황인지 방법
Lohumi et al. Automatic detection of flood severity level from flood videos using deep learning models
CN112462774A (zh) 一种基于无人机航行跟随的城市道路监管方法、系统及可读存储介质
KR102143034B1 (ko) 객체의 미래 움직임 예측을 통한 동영상에서의 객체 추적을 위한 방법 및 시스템
US20230142676A1 (en) Trajectory prediction method and apparatus, device, storage medium and program
CN114266889A (zh) 图像识别方法及其装置、可读介质和电子设备
CN115273032A (zh) 交通标志识别方法、装置、设备及介质
CN114926791A (zh) 一种路口车辆异常变道检测方法、装置、存储介质及电子设备
CN114972182A (zh) 一种物体检测方法及其装置
Mannion Vulnerable road user detection: state-of-the-art and open challenges
Galvão et al. Pedestrian and vehicle behaviour prediction in autonomous vehicle system—A review
KR102676130B1 (ko) 인공지능을 이용하여 객체를 트랙킹하는 고보 조명 시스템
Agarwal et al. Camera-based smart traffic state detection in india using deep learning models