KR20230070700A - 인공지능 감시카메라를 이용한 이벤트 발생 감지 - Google Patents

인공지능 감시카메라를 이용한 이벤트 발생 감지 Download PDF

Info

Publication number
KR20230070700A
KR20230070700A KR1020210156542A KR20210156542A KR20230070700A KR 20230070700 A KR20230070700 A KR 20230070700A KR 1020210156542 A KR1020210156542 A KR 1020210156542A KR 20210156542 A KR20210156542 A KR 20210156542A KR 20230070700 A KR20230070700 A KR 20230070700A
Authority
KR
South Korea
Prior art keywords
event
surveillance camera
artificial intelligence
place
neural network
Prior art date
Application number
KR1020210156542A
Other languages
English (en)
Inventor
손명화
박주원
Original Assignee
한화비전 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한화비전 주식회사 filed Critical 한화비전 주식회사
Priority to KR1020210156542A priority Critical patent/KR20230070700A/ko
Publication of KR20230070700A publication Critical patent/KR20230070700A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/188Capturing isolated or intermittent images triggered by the occurrence of a predetermined event, e.g. an object reaching a predetermined position
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

본 명세서는 인공지능 감시카메라에서 이벤트 발생을 감지하는 방법에 관한 것이다. 상기 방법은 인공지능 감시카메라가 설치된 장소에서 주변 영상을 촬영하여 영상 데이터를 획득하는 단계; 상기 영상 데이터를 제1 인공 신경망에 입력하여 인공지능 감시카메라가 설치된 장소를 판단하는 단계; 상기 판단 결과에 기초하여 복수의 이벤트 감지 인공 신경망들 중 상기 인공지능 감시카메라가 설치된 장소에 대응되는 제2 인공 신경망을 결정하는 단계; 상기 영상 데이터를 상기 제2 인공 신경망에 입력하여 상기 인공지능 감시카메라가 설치된 장소에서 이벤트의 발생 여부를 판단하는 단계; 및 상기 영상 데이터에서 이벤트가 발생한 것으로 판단되면, 상기 발생된 이벤트에 대한 이벤트 발생 신호를 출력하는 단계;를 포함하며, 사용자로 하여금 감시카메라를 간편하게 설치하게 하고, 감시카메라로 하여금 정확하게 이벤트 발생을 감지하게 하도록 할 수 있는 효과가 있다.

Description

인공지능 감시카메라를 이용한 이벤트 발생 감지{EVENT DETECTION USING ARTIFICIAL INTELLIGENCE SURVEILLANCE CAMERA}
본 명세서는 인공지능 감시카메라 및 이를 이용한 이벤트 발생 감지 방법에 관한 것이다.
감시카메라는 피사체를 촬영한 영상을 사용자에게 제공하여 사용자로 하여금 촬영 대상 또는 촬영 장소에서 이벤트가 발생했는지를 직접 확인할 수 있도록 해주는 장치이다. 최근의 감시카메라는 인공지능 기술이 접목되어 촬영 영역 내의 특정 피사체의 동선을 추적하고 피사체를 식별할 수 있는 기능까지 갖추게 되었다.
하지만 이러한 최근의 감시카메라는 사용자가 설치 장소 또는 설치 상황에 따라 일일이 설치 장소 또는 설치 상황 정보를 감시카메라에 입력하고, 또한 이벤트 발생 기준을 정의해 주어야 이벤트의 발생을 정확하게 감지할 수 있어서 발생된 이벤트 발생 알람이 사용자에게 유용한 정보가 될 수 있게 되는 문제가 있었다.
본 명세서는 전술한 문제점을 해결하기 위한 것으로서, 본 명세서의 일 실시 예는 구비된 복수의 인공 신경망을 통해 감시카메라가 설치된 장소 또는 상황을 판단하고, 판단된 설치 장소 또는 상황에 적합한 이벤트를 설정함으로써 사용자로 하여금 감시카메라를 간편하게 설치하게 하고, 감시카메라로 하여금 정확하게 이벤트 발생을 감지하게 하도록 하는 것을 목적으로 한다.
또한, 본 명세서의 일 실시 예는 감시카메라가 설치된 장소 또는 상황에 따라 발생 가능한 이벤트의 목록을 인공 신경망을 통해 추천하고, 사용자로 하여금 선택하게 함으로써, 이벤트의 종류를 용이하게 설정하고, 이벤트 발생 감지의 정확도를 높일 수 있는 감시카메라 및 이벤트 발생 감지 방법을 제공하는 것을 목적으로 한다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
본 명세서는 인공지능 감시카메라에서 이벤트 발생을 감지하는 방법을 제시한다. 상기 방법은 인공지능 감시카메라가 설치된 장소에서 주변 영상을 촬영하여 영상 데이터를 획득하는 단계; 상기 영상 데이터를 제1 인공 신경망에 입력하여 인공지능 감시카메라가 설치된 장소를 판단하는 단계; 상기 판단 결과에 기초하여 복수의 이벤트 감지 인공 신경망들 중 상기 인공지능 감시카메라가 설치된 장소에 대응되는 제2 인공 신경망을 결정하는 단계; 상기 영상 데이터를 상기 제2 인공 신경망에 입력하여 상기 인공지능 감시카메라가 설치된 장소에서 이벤트의 발생 여부를 판단하는 단계; 및 상기 영상 데이터에서 이벤트가 발생한 것으로 판단되면, 상기 발생된 이벤트에 대한 이벤트 발생 신호를 출력하는 단계;를 포함할 수 있다.
상기 인공지능 감시카메라에서 이벤트 발생을 감지하는 방법 및 그 밖의 실시예는 다음과 같은 특징을 포함할 수 있다.
실시 예에 따라, 상기 영상 데이터를 제1 인공 신경망에 입력하여 인공지능 감시카메라가 설치된 장소를 판단하는 단계는, 상기 영상 데이터를 인공지능 감시카메라가 설치된 장소의 판단을 위한 객체 정보를 출력하도록 훈련된 상기 제1 인공 신경망에 입력하는 단계; 및 상기 제1 인공 신경망의 출력에 기초하여 인공지능 감시카메라가 설치된 장소를 판단하는 단계;를 포함할 수 있다.
실시 예에 따라, 또한, 상기 판단 결과에 기초하여 복수의 이벤트 감지 인공 신경망들 중 상기 인공지능 감시카메라가 설치된 장소에 대응되는 제2 인공 신경망을 결정하는 단계는, 복수의 장소에 대해 각 장소에서 촬영된 영상 데이터를 입력 받아, 해당 장소에서 발생하는 이벤트를 감지하도록 훈련된 상기 복수의 이벤트 감지 인공 신경망들 중에서 상기 제1 인공 신경망의 출력에 기초하여 판단된 상기 인공지능 감시카메라가 설치된 장소에 대응되는 상기 제2 인공 신경망을 결정하는 단계; 및 상기 복수의 장소 중 각 장소에서 발생할 수 있는 것으로 미리 결정된 이벤트들을 포함하는 이벤트 그룹들 중에서 상기 인공지능 감시카메라가 설치된 장소에서 발생하는 이벤트들을 포함하는 이벤트 그룹을 상기 제2 인공 신경망과 관련된 이벤트 그룹으로 결정하는 단계;를 포함할 수 있다.
실시 예에 따라, 또한, 상기 복수의 장소 중 각 장소에서 발생할 수 있는 것으로 미리 결정된 이벤트들을 포함하는 이벤트 그룹들 중에서 상기 인공지능 감시카메라가 설치된 장소에서 발생하는 이벤트들을 포함하는 이벤트 그룹을 상기 제2 인공 신경망과 관련된 이벤트 그룹으로 결정하는 단계는, 상기 인공지능 감시카메라가 설치된 장소에서 발생하는 이벤트들을 포함하는 이벤트 그룹의 이벤트들을 사용자 단말에 출력하는 단계; 및 상기 사용자 단말에 출력된 이벤트들 중 상기 사용자 단말로부터 선택된 이벤트들을 상기 제2 인공 신경망이 감지하는 이벤트로 결정하는 단계;를 포함할 수 있다.
실시 예에 따라, 또한, 상기 인공지능 감시카메라에서 이벤트 발생을 감지하는 방법은, 상기 사용자 단말로부터 선택된 이벤트들을 상기 제2 인공 신경망에 대응되는 장소 정보에 연관된 이벤트 목록 데이터베이스에 저장하는 단계; 및 상기 이벤트 목록 데이터베이스에 저장된 상기 사용자 단말로부터 선택된 이벤트들로 상기 제2 인공 신경망을 학습시키는 단계;를 더 포함할 수 있다.
실시 예에 따라, 또한, 상기 영상 데이터를 상기 제2 인공 신경망에 입력하여 상기 인공지능 감시카메라가 설치된 장소에서 이벤트의 발생 여부를 판단하는 단계는, 상기 영상 데이터를 인공지능 감시카메라가 설치된 장소에서 발생하는 이벤트의 감지를 위한 객체 정보를 출력하도록 훈련된 상기 제2 인공 신경망에 입력하는 단계; 및 상기 제2 인공 신경망의 출력에 기초하여 상기 인공지능 감시카메라가 설치된 장소에서 이벤트의 발생 여부를 판단하는 단계;를 포함할 수 있다.
실시 예에 따라, 또한, 상기 이벤트 발생 신호는 ONVIF RTP 패킷 중 padding 영역에 포함되고, 상기 padding 영역은 상기 발생된 이벤트에 대한 발생 장소 정보, 상기 발생된 이벤트에 대한 긴급도 정보, 및 상기 발생된 이벤트에 대한 종류 정보를 포함할 수 있다.
실시 예에 따라, 또한, 상기 인공지능 감시카메라에서 이벤트 발생을 감지하는 방법은, 동일 그룹으로 설정된 제2 인공지능 감시카메라로부터 상기 제2 인공지능 감시카메라의 제1 인공 신경망의 출력을 수신하는 단계; 및 상기 인공지능 감시카메라의 제1 인공 신경망의 출력 및 상기 제2 인공지능 감시카메라의 제1 인공 신경망의 출력 중 적어도 하나에 기초하여 상기 인공지능 감시카메라가 설치된 장소를 판단하는 단계;를 더 포함할 수 있다.
한편, 본 명세서는 인공지능 감시카메라를 제시한다. 상기 인공지능 감시카메라는 인공지능 감시카메라가 설치된 장소를 촬영하여 영상 데이터를 획득하는 촬영부; 상기 영상 데이터에서 상기 인공지능 감시카메라가 설치된 장소의 판단을 위한 객체 분석 결과를 출력하도록 훈련된 제1 인공 신경망 및 상기 제1 인공 신경망의 출력에 기초하여 판단될 수 있는 장소별로 이벤트의 발생 여부의 판단을 위한 객체 분석 결과를 출력하도록 훈련된 복수의 이벤트 감지 인공 신경망들을 포함하는 판별부; 상기 제1 인공 신경망의 출력에 기초하여 상기 인공지능 감시카메라가 설치된 장소를 판단하고, 상기 복수의 이벤트 감지 인공 신경망들 중 상기 인공지능 감시카메라가 설치된 장소에 대한 판단 결과에 대응되는 제2 인공 신경망을 결정하고, 상기 제2 인공 신경망의 출력 결과에 기초하여 이벤트의 발생 여부를 판단하는 연산부; 및 상기 제2 인공 신경망의 출력 결과에 기초하여 이벤트가 발생한 것으로 판단되면, 상기 발생된 이벤트에 대한 이벤트 발생 신호를 사용자에게 전달하도록 출력하는 출력부;를 포함할 수 있다.
상기 인공지능 감시카메라 및 그 밖의 실시예는 다음과 같은 특징을 포함할 수 있다.
실시 예에 따라, 상기 출력부는, 상기 제1 인공 신경망의 출력에 기초하여 판단된 상기 인공지능 감시카메라가 설치된 장소에서 발생할 수 있는 이벤트 그룹에 포함된 이벤트들을 사용자 단말로 전송하고, 상기 인공지능 감시카메라가 설치된 장소에서 발생할 수 있는 이벤트 그룹에 포함되는 이벤트들 중 상기 사용자 단말로부터 선택된 이벤트들을 상기 제2 인공 신경망이 감지하는 이벤트로 결정할 수 있다.
실시 예에 따라, 또한, 상기 인공지능 감시카메라는, 인공지능 감시카메라가 설치될 수 있는 장소 정보 및 상기 장소 별로 발생될 수 있는 이벤트들을 포함하는 이벤트 그룹에 대한 이벤트 목록 데이터베이스를 저장하는 저장부;를 더 포함하고, 상기 출력부는, 상기 제1 인공 신경망의 출력에 기초하여 판단된 상기 인공지능 감시카메라가 설치된 장소 정보에 상기 사용자 단말로부터 선택된 이벤트 정보를 연관지어 상기 이벤트 목록 데이터베이스를 갱신하고, 상기 이벤트 목록 데이터베이스에 저장된 상기 사용자 단말로부터 선택된 이벤트들로 상기 제2 인공 신경망을 학습시킬 수 있다.
실시 예에 따라, 또한, 상기 이벤트 발생 신호는 ONVIF RTP 패킷 중 padding 영역에 포함되고, 상기 padding 영역은 상기 발생된 이벤트에 대한 발생 장소 정보, 상기 발생된 이벤트에 대한 긴급도 정보, 및 상기 발생된 이벤트에 대한 종류 정보를 포함할 수 있다.
실시 예에 따라, 또한, 상기 연산부는, 동일 그룹으로 설정된 제2 인공지능 감시카메라로부터 상기 제2 인공지능 감시카메라의 제1 인공 신경망의 출력을 수신하고, 및 상기 인공지능 감시카메라의 제1 인공 신경망의 출력 및 상기 제2 인공지능 감시카메라의 제1 인공 신경망의 출력 중 적어도 하나에 기초하여 상기 인공지능 감시카메라가 설치된 장소를 판단할 수 있다.
본 명세서에 개시된 실시 예는 구비된 복수의 인공 신경망을 통해 감시카메라가 설치된 장소 또는 상황을 판단하고, 판단된 설치 장소 또는 상황에 적합한 이벤트를 설정함으로써 사용자로 하여금 감시카메라를 간편하게 설치하게 하고, 감시카메라로 하여금 정확하게 이벤트 발생을 감지하게 하도록 할 수 있는 효과가 있다.
또한, 본 명세서에 개시된 실시 예는 감시카메라가 설치된 장소 또는 상황에 따라 발생 가능한 이벤트의 목록을 인공 신경망을 통해 추천하고, 사용자로 하여금 선택하게 함으로써, 이벤트의 종류를 용이하게 설정하고, 이벤트 발생 감지의 정확도를 높일 수 있는 감시카메라 및 이벤트 발생 감지 방법을 제공할 수 있는 효과가 있다.
한편, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명을 실시하기 위한 구체적인 내용과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 본 명세서의 일 실시예에 따른 인공지능 감시카메라에서 이벤트 발생을 감지하는 방법을 구현하기 위한 인공지능 감시카메라 시스템을 설명하기 위한 도면이다.
도 2는 본 명세서의 일 실시예에 따른 인공지능 감시카메라의 개략적인 블록도이다.
도 3은 본 명세서의 일 실시예에 따른 인공지능 감시카메라의 인공지능 영상 처리에 적용되는 AI 장치를 설명하기 위한 도면이다.
도 4는 본 명세서의 일 실시예에 따른 인공지능 감시카메라에서 전송되는 이벤트 발생 신호의 예를 도시한다.
도 5는 본 명세서의 일 실시 예에 따른 인공지능 감시카메라가 이벤트 발생을 감지하는 방법에 대한 순서도를 도시한다.
본 명세서에 개시된 기술은 인공지능 감시카메라에 적용될 수 있다. 그러나 본 명세서에 개시된 기술은 이에 한정되지 않고, 상기 기술의 기술적 사상이 적용될 수 있는 모든 장치 및 방법에도 적용될 수 있다.
본 명세서에서 사용되는 기술적 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 명세서에 개시된 기술의 사상을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 명세서에서 사용되는 기술적 용어는 본 명세서에서 특별히 다른 의미로 정의되지 않는 한, 본 명세서에 개시된 기술이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 명세서에서 사용되는 기술적인 용어가 본 명세서에 개시된 기술의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는, 본 명세서에 개시된 기술이 속하는 분야에서 통상의 지식을 가진 자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 명세서에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥 상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.
본 명세서에서 사용되는 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성 요소는 제2 구성 요소로 명명될 수 있고, 유사하게 제2 구성 요소도 제1 구성 요소로 명명될 수 있다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예들을 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
또한, 본 명세서에 개시된 기술을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 기술의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 기술의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 그 기술의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.
이하에서는 첨부의 도면을 참조하여 본 발명의 실시 예를 상세하게 설명한다.
도 1은 본 명세서의 일 실시예에 따른 인공지능 감시카메라에서 이벤트 발생을 감지하는 방법을 구현하기 위한 인공지능 감시카메라 시스템을 설명하기 위한 도면이다.
도 1을 참조하면, 본 명세서의 일 실시예에 따른 인공지능 감시카메라 시스템(1000)은 인공지능 감시카메라(100) 및 AI 데이터 저장 서버(200)를 포함할 수 있다. 인공지능 감시카메라(100)는 특정 장소의 고정된 위치에 배치되는 촬영용 전자 장치일 수도 있고, 일정한 경로를 따라 자동 또는 수동으로 움직일 수 있는 촬영용 전자 장치일 수도 있고, 사람 또는 로봇 등에 의하여 이동될 수 있는 촬영용 전자 장치일 수도 있다. 인공지능 감시카메라(100)는 유무선 인터넷에 연결하여 사용하는 IP 카메라일 수 있다. 인공지능 감시카메라(100)는 팬(pan), 틸트(tilt), 및 줌(zoom) 기능을 갖는 PTZ 카메라일 수 있다. 인공지능 감시카메라(100)는 감시하는 영역을 녹화하거나 사진을 촬영하는 기능을 가질 수 있다. 인공지능 감시카메라(100)는 감시하는 영역에서 발생하는 소리를 녹음하는 기능을 가질 수 있다. 인공지능 감시카메라(100)는 감시하는 영역에서 움직임 또는 소리 등 변화가 발생할 경우, 이에 대한 알림을 발생시키거나 녹화 또는 사진 촬영을 수행하는 기능을 가질 수 있다.
한편, 인공지능 감시카메라(100)는 촬영된 영상을 용도에 대응되도록 분석할 수 있다. 예를 들어, 인공지능 감시카메라(100)는 영상에서 객체를 검출하기 위해 객체 검출 알고리즘을 이용하여 객체를 검출할 수 있다. 상기 객체 검출 알고리즘은 AI 기반 알고리즘이 적용될 수 있으며, 미리 학습된 인공 신경망 모델을 적용하여 객체를 검출할 수 있다. 인공지능 감시카메라(100)는 인공지능 감시카메라(100)가 설치된 장소 또는 설치 상황을 판단하기 위한 영상 내의 객체와 객체를 제외한 배경을 검출할 수 있는 인공 신경망 모델(101)을 포함할 수 있다. 또한, 인공지능 감시카메라(100)는 인공지능 감시카메라(100)가 설치된 장소 또는 설치 상황이 판단된 뒤에는 각 설치된 장소 또는 설치 상황에서 발생할 수 있는 이벤트를 효과적으로 감지하기 위한 객체를 검출할 수 있는 최적화된 미리 학습된 인공 신경망 모델(102)을 포함하고 있을 수 있다. 또한, 인공지능 감시카메라(100)는 상기 인공 신경망 모델들(101, 102)이 감지할 수 있는 장소와 이벤트에 대한 정보를 저장하고 있는 장소/이벤트 정보 DB(103)을 포함할 수 있다.
따라서, 본 명세서의 일 실시예에 따른 인공지능 감시카메라 시스템(1000) 또는 인공지능 감시카메라(100)는 어느 장소에 설치되고 나면, 일정 시간동안 설치된 장소를 촬영한 영상 데이터를 설치 장소 또는 설치 상황을 판단하기 위한 인공 신경망 모델(101)에 입력하여, 인공지능 감시카메라(100)가 설치된 장소 또는 상황을 판단한 뒤, 설치된 장소 또는 상황에 적합한 인공 신경망 모델, 즉, 인공지능 감시카메라(100)가 설치된 장소 또는 상황에서 발생할 수 있는 이벤트를 감지할 수 있는 인공 신경망 모델(102)에 촬영한 영상 데이터를 다시 입력하여 인공지능 감시카메라(100)가 설치된 장소 또는 상황에서 발생한 이벤트를 정확하게 감지할 수 있다.
AI 데이터 저장 서버(200)는 인공지능 감시카메라(100)가 설치되는 장소 또는 설치되는 상황에 대한 정보 데이터베이스와 카메라 장치 자체에 대한 정보 데이터베이스를 포함할 수 있다. AI 데이터 저장 서버(200)에 저장되어 있는 인공지능 감시카메라(100)가 설치되는 장소 또는 설치되는 상황에 대한 정보는 인공지능 감시카메라(100)에 제공되어 인공지능 감시카메라(100)가 설치된 장소 또는 설치된 상황을 감지 및/또는 판단하는데 사용될 수 있다.
한편, 감시카메라 시스템(1000)은 인공지능 감시카메라(100) 및/또는 AI 데이터 저장 서버(200)와 유무선 통신을 수행할 수 있는 사용자 단말(300)을 더 포함할 수 있다. 사용자 단말(300)은 하나의 인공지능 감시카메라(100) 또는 동일 장소 또는 동일 상황 내에 설치되어 있는 다수의 인공지능 감시카메라(100)로부터 촬영된 영상 자체 및/또는 해당 영상을 편집하여 얻어지는 영상을 수신하여 저장하거나, 구비된 디스플레이를 통해 사용자에게 출력해 줄 수 있는 장치로 사용자의 모바일 단말, 통합 영상 관제 시스템(Video Management System; VMS), 및 네트워크 비디오 레코더(Network Video Recorder; NVR) 등의 장치 일 수 있다.
감시카메라 시스템(1000)은 인공지능 감시카메라(100), AI 데이터 저장 서버(200), 및/또는 사용자 단말(300) 간의 유무선 통신 경로인 통신망을 더 포함할 수 있다. 통신망은 예컨대 LANs(Local Area Networks), WANs(Wide Area Networks), MANs(Metropolitan Area Networks), ISDNs(Integrated Service Digital Networks) 등의 유선 네트 워크나, 무선 LANs, CDMA, 블루투스, 위성 통신 등의 무선 네트워크를 망라할 수 있으나, 본 명세서의 범위가 이에 한정되는 것은 아니다.
인공지능 감시카메라(100), AI 데이터 저장 서버(200), 및/또는 사용자 단말(300)은 상기 통신망을 통해 ONVIF(Open Network Video Interface Forum) RTP 패킷으로 촬영된 영상 및 영상 관련 정보, 각종 제어 신호 등을 송수신할 수 있다.
도 2는 본 명세서의 일 실시예에 따른 인공지능 감시카메라의 개략적인 블록도이다.
본 명세서에 개시된 인공지능 감시카메라(100)는 이벤트 발생 감지 등의 지능형 영상분석 기능을 수행하여 상기 영상분석 신호를 생성하는 네트워크 카메라임을 그 예로 설명하나, 본 발명의 실시예에 의한 네트워크 감시카메라 시스템의 동작이 반드시 이에 한정되는 것은 아니다.
도 2를 참조하면, 본 명세서에 개시된 인공지능 감시카메라(100)는 촬영부(110), 인코더(120), 저장부(130), 통신부(140), 판별부(150), 연산부(160), 및 출력부(170)를 포함할 수 있다. 도시된 구성요소들은 필수적인 것은 아니어서, 그 보다 많은 구성요소들을 갖거나, 그보다 적은 구성요소들을 갖는 인공지능 감시카메라가 구현될 수도 있다. 이러한 구성요소는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합을 통해서 구현될 수 있다.
촬영부(110)는 감시 영역을 촬영하여 영상을 획득하는 기능을 수행하는 것으로서, 예컨대, CCD(Charge-Coupled Device) 센서, CMOS(Complementary Metal-Oxide-Semiconductor) 센서 등의 이미지센서를 포함하여 구현될 수 있다. 즉, 촬영부(110)는 상기 이미지 센서를 이용하여 인공지능 감시카메라(100)가 설치된 장소를 촬영하여 영상 데이터를 획득한다. 이 때, 촬영부(110)는 별도로 구비된 마이크 등의 음성센서를 이용하여 설치 장소에 대한 영상과 함께 소리 데이터도 획득할 수 있다.
인코더(120)는 촬영부(110)를 통해 획득한 영상을 디지털 신호로 부호화하는 동작을 수행하며, 이는 예컨대, H.264, H.265, MPEG(Moving Picture Experts Group), M-JPEG(Motion Joint Photographic Experts Group) 표준 등을 따를 수 있다.
저장부(130)는 영상 데이터, 음성 데이터, 스틸 이미지, 메타데이터 등을 저장할 수 있다. 상기 메타데이터는 감시영역에서 촬영된 객체 검출 정보(움직임, 소리, 지정지역 침입 등), 객체 식별 정보(사람, 차, 얼굴, 모자, 의상 등), 및 검출된 위치 정보(좌표, 크기 등)을 포함하는 데이터일 수 있다.
또한, 상기 스틸 이미지는 상기 메타데이터와 함께 생성되어 저장부(130)에 저장되는 것으로서, 상기 영상분석 정보들 중 특정 분석 영역에 대한 이미지 정보를 캡쳐하여 생성될 수 있다. 일 예로, 상기 스틸 이미지는 JPEG 이미지 파일로 구현될 수 있다. 또한, 일 예로, 상기 스틸 이미지는 특정 영역 및 특정 기간 동안 검출된 상기 감시영역의 영상 데이터들 중 식별 가능한 객체로 판단된 영상 데이터의 특정영역을 크롭핑(cropping)하여 생성될 수 있으며, 이는 상기 메타데이터와 함께 실시간으로 전송될 수 있다.
통신부(140)는 상기 영상 데이터, 음성 데이터, 스틸 이미지, 및/또는 메타데이터를 사용자 단말(300)에 전송한다. 일 실시예에 따른 통신부(140)는 영상 데이터, 음성 데이터, 스틸 이미지, 및/또는 메타데이터를 사용자 단말 (300)에 실시간으로 전송할 수 있다. 통신부(150)는 유무선 LAN(Local Area Network), 와이파이(Wi-Fi), 지그비(ZigBee), 블루투스(Bluetooth), 근거리 통신(Near Field Communication) 등 전술한 통신망 중 적어도 하나의 통신 기능을 수행할 수 있다.
판별부(150)는 인공지능 영상 처리를 위한 것으로서, 본 명세서의 일 실시예에 따라 감시카메라 시스템을 통해 획득된 영상에서 관심객체로 학습된 딥러닝 기반의 객체 탐지(Objection Detection) 알고리즘을 적용한다. 상기 판별부(150)는 시스템 전반에 걸쳐 제어하는 연산부(160)와 하나의 모듈로 구현되거나 독립된 모듈로 구현될 수 있다.
판별부(150)는 촬영부(110)가 촬영한 영상 데이터에서 인공지능 감시카메라(100)가 설치된 장소를 판단하는 데 기초자료로 사용되는 객체를 탐지하여 출력하거나 또는 객체를 제외한 배경 영상을 출력하도록 훈련된 장소/상황 판단 인공 신경망(101), 및 상기 장소/상황 판단 인공 신경망(101)의 출력에 기초하여 판단될 수 있는 장소별로 각 장소에서의 이벤트 발생의 판단을 위한 객체 분석 결과를 출력하도록 훈련된 복수의 이벤트 감지 인공 신경망(102)들을 포함할 수 있다.
본 명세서의 일 실시예에 의한 판별부(150)는 촬영된 영상 내에서의 객체 탐지에 있어서 YOLO(You Only Lock Once) 알고리즘을 적용할 수 있다. YOLO는 객체 검출 속도가 빠르기 때문에 실시간 동영상을 처리하는 감시카메라에 적당한 AI 알고리즘이다. YOLO 알고리즘은 다른 객체 기반 알고리즘들(Faster R-CNN, R_FCN, FPN-FRCN 등)과 달리 한 장의 입력 영상을 리사이즈(Resize)후 단일 신경망을 단 한 번 통과시킨 결과로 각 객체의 위치를 인디케이팅하는 바운딩 박스(Bounding Box)와 객체가 무엇인가로 분류된 정확도를 나타내는 확률을 출력한다. 최종적으로 Non-max suppression을 통해 하나의 객체를 한번 인식(detection)한다. 한편, 본 명세서에 개시되는 객체 인식 알고리즘은 전술한 YOLO에 한정되지 않고 다양한 딥러닝 알고리즘으로 구현될 수 있음을 밝혀 둔다.
또한, 본 명세서의 일 실시예에 의한 판별부(150)는 촬영된 영상 내에서의 장소 인식을 위한 객체 탐지 및 배경 분리에 있어서 GMM(Gaussian Mixture Model) 알고리즘을 이용하여 객체와 배경을 분리하고, 객체 패턴 분석과 장소 인식에 대한 알고리즘은 LSTM(Long Short-Term Memory) 알고리즘을 적용할 수 있다. 본 명세서에서는 영상에서 객체를 제거한 배경 분리에 있어서, 시간의 변화와 외부 환경에 따라 실제 배경의 밝기가 변할 수 있는데, 이 같은 변화를 모델링하기 위해서는 하나가 아닌 다수의 가우시안 분포를 가지는 적응형 가우시안 분포인 GMM이 주로 사용된다. LSTM 알고리즘은 RNN 알고리즘의 특별한 한 종류로서, 단순 형태의 RNN은 짧은 시퀀스 데이터에서 효과를 보이나 학습 시퀀스가 길어질수록 정확한 예측이 어려워져 이를 보완하기 위해 LSTM 알고리즘을 사용한다. LSTM 알고리즘의 경우 장기적인 정보에 대해 더 정교한 예측이 가능하며 행동 패턴 및 배경 예측에 대한 용도로 사용이 가능하다. 즉, 판별부(150)의 장소/상황 판단 인공 신경망(101)에 GMM 알고리즘을 사용하여 촬영된 영상에서 객체와 배경을 분리하고, LSTM 알고리즘을 사용하여 객체가 삭제된 순수 배경 영상에서 장소를 인식할 수 있는 데이터를 출력할 수 있다.
연산부(160)는 상기 장소/상황 판단 인공 신경망(101)의 출력에 기초하여 인공지능 감시카메라(100)가 설치된 장소를 판단하고, 복수의 이벤트 감지 인공 신경망들 중 인공지능 감시카메라(100)가 설치된 장소에 대한 판단 결과에 대응되는 이벤트 감지 인공 신경망(102)을 결정하고, 이벤트 감지 인공 신경망(102)의 출력 결과에 기초하여 이벤트의 발생 여부를 판단할 수 있다.
연산부(160)가 판단할 수 있는 감시카메라(100)의 설치 장소와 각 설치 장소의 판단을 위한 객체 정보의 예는 다음의 표 1과 같다.
ID 장소 포함 가능 장소 및 특징
0 알려지지 않음 -
1 도로 도로/도로 표지판/도로 노면 표시 글자 및 기호
2 카지노 카지노 기계/카지노 테이블/주차장
3 은행 업무용 책상/창문의 문구(XX은행)/고객 좌석/ATM기
4 매장(편의점/백화점 등) 계산대/상품 진열대/주차장
5 학교/학원 교실/복도/운동장/공터/소각장/교문
6 사무실 복도/업무용 책상/회사 로비
7 산업시설 공장 기계/복도/주차장/회사 입구/창고
'ID'는 감시카메라가 설치될 수 있는 장소 또는 환경을 나타내는 구분 코드이며, '포함 가능 장소 및 특징'은 각 장소에 포함될 수 있는 부분적인 장소 정보와 각 장소를 나타낼 수 있는 객체의 특징들을 나타낼 수 있다.한편, 연산부(160)가 판단할 수 있는 감시카메라(100)의 설치 장소별 발생 이벤트의 예는 다음의 표 2와 같으며, 각 장소별로 발생할 수 있는 이벤트의 종류와 이벤트에 대한 긴급도는 사용자의 결정에 의해 다양하게 미리 정의될 수 있다.
ID 장소 발생 이벤트(긴급도)
0 알려지지 않음 -
1 도로 5: 차량 폭발/차량+사람 충돌 4: 차량 충돌(차량+ 차량/차량+건물/차량+기타) 3: 차량 이상 감지 2: 차선 침범 1: 신호위반, 과속, 정지선 침범 및 기타 교통 법규 위반
2 카지노 5: 건물 화재 및 파괴/인명 피해 발생(폭력/총기 난사/칼부림)/폭발음 4: 칼 소지자 발견/총기 위협/폭력적 행동 3: 도난/카지노 재물 파손/카지노 게임 룰 위반 감지 2: 침입자 발견 1: 사용자 정의
3 은행 5: 건물 화재 및 파괴/인명 피해 발생(폭력/총기 난사/칼부림)/폭발음 4: 칼 소지자 발견/총기 위협/폭력적 행동 3: 도난/재물 파손 2: 침입자 발견/ATM 뒷사람의 훔쳐보기 1: 사용자 정의
4 매장(편의점/백화점 등) 5: 건물 화재 및 파괴/인명 피해 발생(폭력/총기 난사/칼부림)/폭발음 4: 칼 소지자 발견/총기 위협/폭력적 행동 3: 도난/재물 파손 2: 두리번거리는 사람의 행동 발견 1: 사용자 정의
5 학교/학원 5: 건물 화재 및 파괴/인명 피해 발생(폭력/총기 난사/칼부림)/폭발음 4: 칼 소지자 발견/총기 위협/폭력적 행동 3: 도난/재물 파손/유괴 2: 비명/울음소리 1: 사용자 정의
6 사무실 5: 건물 화재 및 파괴/인명 피해 발생(폭력/총기 난사/칼부림)/폭발음 4: 칼 소지자 발견/총기 위협/폭력적 행동 3: 도난/재물 파손/유괴 2: 비명/사용자 정의 1: 사용자 정의
7 산업시설 5: 건물 화재 및 파괴/인명 피해 발생(폭력/총기 난사/칼부림)/폭발음 4: 칼 소지자 발견/총기 위협/폭력적 행동/노동자 추락 및 쓰러짐 3: 도난/재물 파손/유괴/제품 추락 2: 비명 1: 사용자 정의
표 2에 숫자로 표시한 발생 이벤트의 긴급도(우선 순위)는 그 숫자가 클수록 우선 순위가 높아서 긴급하게 대응해야 하는 이벤트임을 나타낼 수 있고, 상기 긴급도는 사용자에 의해 정의 가능하다.따라서, 본 명세서의 일 실시예에 의한 인공지능 감시카메라(100) 또는 인공지능 감시카메라 시스템(1000)은 감시카메라(100)가 어떤 장소에 설치되고 나면, 먼저 해당 장소에 대한 촬영 영상을 장소/상황 판단 인공 신경망(101)에 입력한 뒤, 그 출력 결과에 기초하여 감시카메라(100)가 설치된 장소 또는 상황을 판단하여 이벤트 발생 여부를 판단하기 위한 설치 장소 또는 설치 상황의 범위를 좁히고, 다음으로 해당 장소에 대한 촬영 영상을 다양한 장소들에 대해서 이벤트를 감지할 수 있는 복수의 이벤트 감지 인공 신경망 중에서 감시카메라(100)가 설치된 장소 또는 설치 상황에 대응되는 이벤트 감지 인공 신경망(102)에 입력하여 감시카메라(100)가 설치된 것으로 결정된(판단된) 장소와 상황에서 발생할 수 있는 것으로 미리 결정되어 있는 이벤트들 중에서 발생되는 이벤트를 감지할 수 있다. 따라서 사용자가 감시카메라(100)를 설치한 뒤에 직접 설치 장소 또는 설치 상황에 맞게 이벤트 발생을 감지하기 위한 설정을 해줄 필요가 없으며, 감시카메라(100)가 스스로 설치 장소 또는 상황을 인식하고, 해당 장소 또는 상황에서 발생할 수 있는 이벤트를 정의할 수 있어서 사용의 편의성이 증대될 수 있다.
예를 들어, 연산부(160)는 어떤 장소에서 촬영된 영상에 대해서 판별부(150)의 장소/상황 판단 인공 신경망(101)(여기에서, 장소/상황 판단 인공 신경망(101)은 표 1의 알려지지 않은 장소, 도로, 카지노, 은행, 매장, 학교/학원, 사무실, 산업시설의 8가지 장소 중에서 어느 하나의 장소를 판단할 수 있음)의 객체 인식 출력 결과가 '업무용 책상', '창문에 인쇄된 문구의 XX은행', 'ATM기' 등일 경우, 감시카메라(100)가 '은행'에 설치되어 있다고 판단하고, 그 후, 촬영된 영상을 알려지지 않은 장소, 도로, 카지노, 은행, 매장, 학교/학원, 사무실, 산업시설의 8가지 장소 중 각 장소에서의 이벤트의 발생을 감지할 수 있는 8 개의 이벤트 감지 인공 신경망(102)들 중 은행에서의 이벤트의 발생을 감지할 수 있는 이벤트 감지 인공 신경망(102)에 입력하여, 객체 인식 출력 결과에 따라 건물 화재 및 파괴, 인명 피해 발생(폭력/총기 난사/칼부림), 폭발음, 칼 소지자 발견, 총기 위협, 폭력적 행동, 도난, 재물 파손, 침입자 발견, ATM 뒷사람의 훔쳐보기, 사용자 정의 등의 이벤트 중에서 적어도 하나 이상의 이벤트 발생을 감지할 수 있다.
출력부(170)는 이벤트 감지 인공 신경망의 출력 결과에 기초하여 이벤트가 발생한 것으로 판단되면, 발생된 이벤트에 대한 이벤트 발생 신호를 사용자에게 전달하도록 출력할 수 있다. 이벤트 발생 신호는 도 4에 도시한 바와 같은 ONVIF RTP 패킷(400) 중에서 padding 영역(410)에 포함될 수 있으며, padding 영역(410)은 발생된 이벤트에 대한 발생 장소 정보, 발생된 이벤트에 대한 긴급도 정보, 및 발생된 이벤트에 대한 이벤트 종류 정보를 포함할 수 있다.
또한, 출력부(170)는 상기 장소/상황 판단 인공 신경망의 출력에 기초하여 인공지능 감시카메라(100)가 설치된 것으로 판단된 장소에서 발생할 수 있는 이벤트 그룹에 포함된 이벤트들을 사용자 단말(300)로 전송하여 사용자 단말(300)에 출력되게 하고, 인공지능 감시카메라(100)가 설치된 장소에서 발생할 수 있는 이벤트 그룹에 포함되는 이벤트들 중 사용자 단말(300)로부터 선택된 이벤트들을 이벤트 감지 인공 신경망이 감지하는 이벤트로 결정할 수 있다.
한편, 저장부(130)는 인공지능 감시카메라(100)가 설치될 수 있는 장소들에 대한 정보 및 상기 설치 장소 별로 발생될 수 있는 이벤트들의 모음인 이벤트 그룹에 대한 이벤트 목록 데이터베이스를 저장할 수 있다.
또한, 출력부(170)는 상기 장소/상황 판단 인공 신경망의 출력에 기초하여 판단된 인공지능 감시카메라(100)가 설치된 장소 정보에 사용자 단말(300)로부터 선택된 이벤트 정보를 연관지어 저장부(130)의 이벤트 목록 데이터베이스를 갱신하고, 이벤트 목록 데이터베이스에 저장된 사용자 단말로부터 선택된 이벤트들로 대응되는 장소/상황에 대한 이벤트 감지 인공 신경망을 학습시킬 수 있다.
또한, 인공지능 감시카메라(100)의 연산부(160)는 동일 그룹으로 설정된 다른 인공지능 감시카메라로부터 상기 다른 인공지능 감시카메라의 판단부의 장소/상황 판단 인공 신경망의 출력을 수신한 뒤, 인공지능 감시카메라(100)의 장소/상황 판단 인공 신경망의 출력과 상기 다른 인공지능 감시카메라의 장소/상황 판단 인공 신경망의 출력 중 적어도 하나에 기초하여 인공지능 감시카메라(100)가 설치된 장소를 판단할 수 있다. 예를 들어, 동일 장소 또는 동일 환경에 설치되어 동일 그룹으로 묶여 있는 복수의 인공지능 감시카메라들 중에서 제1 인공지능 감시카메라는 제2 인공지능 감시카메라로부터 수신된 장소/상황 판단 인공 신경망의 출력 결과에 기초하여 제1 인공지능 감시카메라가 설치된 장소 또는 상황을 판단할 수 있다. 즉, 제1 인공지능 감시카메라는 자신의 장소/상황 판단 인공 신경망의 출력 결과에 기초하여 설치된 장소 또는 상황을 판단하기 어려울 경우, 동일 그룹 내의 다른 인공지능 감시카메라의 장소/상황 판단 인공 신경망의 출력 결과에 기초하여 설치된 장소 또는 상황을 판단할 수 있다.
도 3은 본 명세서의 일 실시예에 따른 인공지능 감시카메라의 인공지능 영상 처리에 적용되는 AI 장치를 설명하기 위한 도면이다.
도 3을 살펴보면, AI 장치(250)는 AI 프로세싱을 수행할 수 있는 전자 기기 또는 서버 등에 포함될 수 있다. 또한, AI 장치(250)는 감시카메라의 적어도 일부의 구성으로 포함되어 AI 프로세싱 중 적어도 일부를 함께 수행하도록 구비될 수도 있다.
AI 프로세싱은 인공지능 감시카메라(100)의 판별부(150) 및/또는 연산부(160)와 관련된 모든 동작들을 포함할 수 있다. 예를 들어, AI 모듈(250)은 도 2의 판별부(150) 및 연산부(160)에서 수행되는 인공지능 감시카메라(100)가 설치된 장소 또는 상황을 판단하거나, 인공지능 감시카메라(100)가 설치된 장소 또는 상황에서 발생하는 이벤트를 감지하기 위한 영상 처리를 위한 AI 프로세싱 중 적어도 일부를 함께 수행하도록 구비될 수 있다. 즉, 인공지능 감시카메라(100)는 획득된 영상 신호를 AI 프로세싱하여 처리/판단하는 동작, 제어 신호를 생성하는 동작을 수행할 수 있다.
AI 장치(250)는 AI 프로세싱 결과를 직접 이용하는 클라이언트 디바이스이거나, AI 프로세싱 결과를 다른 기기에 제공하는 클라우드 환경의 디바이스일 수도 있다. AI 장치(250)는 신경망을 학습할 수 있는 컴퓨팅 장치로서, 서버, 데스크탑 PC, 노트북 PC, 태블릿 PC 등과 같은 다양한 전자 장치로 구현되거나, 또는 하나의 프로세서로 구현될 수도 있다.
AI 장치(250)는 AI 프로세서(251), 메모리(255) 및/또는 통신부(257)를 포함할 수 있다.
AI 프로세서(251)는 메모리(255)에 저장된 프로그램을 이용하여 신경망을 학습할 수 있다. 특히, AI 프로세서(251)는 감시카메라의 관련 데이터를 인식하기 위한 신경망을 학습할 수 있다. 여기서, 감시카메라의 관련 데이터를 인식하기 위한 신경망은 인간의 뇌 구조를 컴퓨터 상에서 모의하도록 설계될 수 있으며, 인간의 신경망의 뉴런(neuron)을 모의하는, 가중치를 갖는 복수의 네트워크 노드들을 포함할 수 있다. 복수의 네트워크 모드들은 뉴런이 시냅스(synapse)를 통해 신호를 주고받는 뉴런의 시냅틱 활동을 모의하도록 각각 연결 관계에 따라 데이터를 주고받을 수 있다. 여기서 신경망은 신경망 모델에서 발전한 딥러닝 모델을 포함할 수 있다. 딥러닝 모델에서 복수의 네트워크 노드들은 서로 다른 레이어에 위치하면서 컨볼루션(convolution) 연결 관계에 따라 데이터를 주고받을 수 있다. 신경망 모델의 예는 심층 신경망(DNN, deep neural networks), 합성곱 신경망(CNN, convolutional deep neural networks), 순환 신경망(RNN, Recurrent Boltzmann Machine), 제한 볼츠만 머신(RBM, Restricted Boltzmann Machine), 심층 신뢰 신경망(DBN, deep belief networks), 심층 Q-네트워크(Deep Q-Network)와 같은 다양한 딥 러닝 기법들을 포함하며, 컴퓨터비젼(CV), 음성인식, 자연어처리, 음성/신호처리 등의 분야에 적용될 수 있다.
한편, 전술한 바와 같은 기능을 수행하는 AI 프로세서(251)는 범용 프로세서(예를 들어, CPU)일 수 있으나, 인공지능 학습을 위한 AI 전용 프로세서(예를 들어, GPU)일 수 있다.
메모리(255)는 AI 장치(250)의 동작에 필요한 각종 프로그램 및 데이터를 저장할 수 있다. 메모리(255)는 비 휘발성 메모리, 휘발성 메모리, 플래시 메모리(flash-memory), 하드디스크 드라이브(HDD) 또는 솔리드 스테이트 드라이브(SDD) 등으로 구현할 수 있다. 메모리(255)는 AI 프로세서(251)에 의해 액세스되며, AI 프로세서(251)에 의한 데이터의 독취/기록/수정/삭제/갱신 등이 수행될 수 있다. 또한, 메모리(255)는 본 발명의 일 실시예에 따른 데이터 분류/인식을 위한 학습 알고리즘을 통해 생성된 신경망 모델(예를 들어, 딥 러닝 모델(256))을 저장할 수 있다.
한편, AI 프로세서(251)는 데이터 분류/인식을 위한 신경망을 학습하는 데이터 학습부(252)를 포함할 수 있다. 데이터 학습부(252)는 데이터 분류/인식을 판단하기 위하여 어떤 학습 데이터를 이용할지, 학습 데이터를 이용하여 데이터를 어떻게 분류하고 인식할지에 관한 기준을 학습할 수 있다. 데이터 학습부(252)는 학습에 이용될 학습 데이터를 획득하고, 획득된 학습데이터를 딥러닝 모델에 적용함으로써, 딥러닝 모델을 학습할 수 있다.
데이터 학습부(252)는 적어도 하나의 하드웨어 칩 형태로 제작되어 AI 장치(250)에 탑재될 수 있다. 예를 들어, 데이터 학습부(252)는 인공지능(AI)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 범용 프로세서(CPU) 또는 그래픽 전용 프로세서(GPU)의 일부로 제작되어 AI 장치(250)에 탑재될 수도 있다. 또한, 데이터 학습부(252)는 소프트웨어 모듈로 구현될 수 있다. 소프트웨어 모듈(또는 인스트럭션(instruction)을 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록 매체(non-transitory computer readable media)에 저장될 수 있다. 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 애플리케이션에 의해 제공될 수 있다.
데이터 학습부(252)는 학습 데이터 획득부(253) 및 모델 학습부(254)를 포함할 수 있다.
학습 데이터 획득부(253)는 데이터를 분류하고 인식하기 위한 신경망 모델에 필요한 학습 데이터를 획득할 수 있다.
모델 학습부(254)는 획득된 학습 데이터를 이용하여, 신경망 모델이 소정의 데이터를 어떻게 분류할지에 관한 판단 기준을 가지도록 학습할 수 있다. 이 때 모델 학습부(254)는 학습 데이터 중 적어도 일부를 판단 기준으로 이용하는 지도 학습(supervised learning)을 통하여, 신경망 모델을 학습시킬 수 있다. 또는 모델 학습부(254)는 지도 없이 학습 데이터를 이용하여 스스로 학습함으로써, 판단 기준을 발견하는 비지도 학습(unsupervised learning)을 통해 신경망 모델을 학습시킬 수 있다. 또한, 모델 학습부(254)는 학습에 따른 상황 판단의 결과가 올바른지에 대한 피드백을 이용하여 강화 학습(reinforcement learning)을 통하여, 신경망 모델을 학습시킬 수 있다. 또한, 모델 학습부(254)는 오류 역전파법(error back-propagation) 또는 경사 하강법(gradient decent)을 포함하는 학습 알고리즘을 이용하여 신경망 모델을 학습시킬 수 있다.
신경망 모델이 학습되면, 모델 학습부(254)는 학습된 신경망 모델을 메모리에 저장할 수 있다. 모델 학습부(254)는 학습된 신경망 모델을 AI 장치(250)와 유선 또는 무선 네트워크로 연결된 서버의 메모리에 저장할 수도 있다.
데이터 학습부(252)는 인식 모델의 분석 결과를 향상시키거나, 인식 모델의 생성에 필요한 리소스 또는 시간을 절약하기 위해 학습 데이터 전처리부(미도시) 및 학습 데이터 선택부(미도시)를 더 포함할 수도 있다.
학습 데이터 전처리부는 획득된 데이터가 상황 판단을 위한 학습에 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 예를 들어, 학습 데이터 전처리부는, 모델 학습부(254)가 이미지 인식을 위한 학습을 위하여 획득된 학습 데이터를 이용할 수 있도록, 획득된 데이터를 기 설정된 포맷으로 가공할 수 있다.
또한, 학습 데이터 선택부는, 학습 데이터 획득부(253)에서 획득된 학습 데이터 또는 전처리부에서 전처리된 학습 데이터 중 학습에 필요한 데이터를 선택할 수 있다. 선택된 학습 데이터는 모델 학습부(254)에 제공될 수 있다.
또한, 데이터 학습부(252)는 신경망 모델의 분석 결과를 향상시키기 위하여 모델 평가부(미도시)를 더 포함할 수도 있다.
모델 평가부는, 신경망 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 분석 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(252)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 인식 모델을 평가하기 위한 기 정의된 데이터일 수 있다. 일 예로, 모델 평가부는 평가 데이터에 대한 학습된 인식 모델의 분석 결과 중, 분석 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우, 소정 기준을 만족하지 못한 것으로 평가할 수 있다.
통신부(257)는 AI 프로세서(251)에 의한 AI 프로세싱 결과를 외부 전자 기기로 전송할 수 있다. 예를 들어, 외부 전자 기기는 감시카메라, 블루투스 장치, 자율주행 차량, 로봇, 드론, AR 기기, 모바일 기기, 가전 기기 등을 포함할 수 있다.
한편, 도 3에 도시된 AI 장치(250)는 AI 프로세서(251)와 메모리(255), 통신부(257) 등으로 기능적으로 구분하여 설명하였지만, 전술한 구성요소들이 하나의 모듈로 통합되어 AI 모듈로 호칭될 수도 있음을 밝혀둔다.
본 명세서의 개시는 감시용 카메라, 자율주행 차량, 사용자 단말기 및 서버 중 하나 이상이 인공 지능(Artificial Intelligence) 모듈, 로봇, 증강현실(Augmented Reality, AR) 장치, 가상 현실(Virtual reality, VT) 장치, 5G 서비스, 6G 서비스와 관련된 장치 등과 연계될 수 있다.
이하에서는 첨부의 도면을 참조하여 본 발명의 실시 예에 따른 인공지능 감시카메라가 이벤트 발생을 감지하는 방법을 상세하게 설명한다.
도 5는 본 명세서의 일 실시 예에 따른 인공지능 감시카메라가 이벤트 발생을 감지하는 방법에 대한 순서도를 도시한다.
도 5에 도시된 이벤트 발생을 감지하는 방법은 도 1 내지 도 3을 통해 설명한 인공지능 감시카메라 시스템, 인공지능 감시카메라, 인공지능 감시카메라에 포함된 연산부, 판별부 등의 구성들, 또는 프로세서를 통해 구현될 수 있다. 설명의 편의를 위해 상기 이벤트 발생을 감지하는 방법은 도 2에 도시된 인공지능 감시카메라(100)를 통해 다양한 기능들이 제어될 수 있음을 전제로 설명하나, 본 명세서는 이에 한정되는 것이 아님을 밝혀둔다.
도 5를 참조하면, 인공지능 감시카메라(100)는 인공지능 감시카메라(100)가 설치된 장소에서 주변 영상을 촬영하여 영상 데이터를 획득한다(S500). 상기 영상 데이터는 동영상을 포함할 수 있으며, 소리(음성) 데이터도 포함할 수 있다. 인공지능 감시카메라(100)는 어떤 장소에 설치된 후에는 최초로 설치된 이후 일정 시간동안 주변의 감시 영역을 촬영하여 영상 데이터를 획득한다.
인공지능 감시카메라(100)는 상기 영상 데이터를 장소/상황 판단 인공 신경망(제1 인공 신경망)에 입력하여 자신이 설치된 장소를 판단한다(S510). 인공지능 감시카메라(100)는 상기 영상 데이터를 인공지능 감시카메라가 설치된 장소의 판단을 위한 객체 정보를 출력하도록 훈련된 상기 장소/상황 판단 인공 신경망에 입력한 뒤, 상기 장소/상황 판단 인공 신경망의 출력에 기초하여 자신이 설치된 장소를 판단한다.
인공지능 감시카메라(100)는 상기 장소 판단 결과에 기초하여 복수의 이벤트 감지 인공 신경망들 중 자신이 설치된 장소에 대응되는 이벤트 감지 인공 신경망(제2 인공 신경망)을 결정한다(S520). 인공지능 감시카메라(100)는 복수의 장소에 대해 각 장소에서 촬영된 영상 데이터를 입력 받아, 해당 장소에서 발생하는 이벤트를 감지하도록 훈련된 상기 복수의 이벤트 감지 인공 신경망들 중에서 상기 장소/상황 판단 인공 신경망의 출력에 기초하여 판단된 상기 인공지능 감시카메라(100)가 설치된 장소에 대응되는 상기 이벤트 감지 인공 신경망을 결정하고, 상기 복수의 장소 중 각 장소에서 발생할 수 있는 것으로 미리 결정된 이벤트들을 포함하는 이벤트 그룹들 중에서 상기 인공지능 감시카메라(100)가 설치된 장소에서 발생하는 이벤트들을 포함하는 이벤트 그룹을 상기 이벤트 감지 인공 신경망과 관련된 이벤트 그룹으로 결정한다. 또한, 인공지능 감시카메라(100)는 상기 인공지능 감시카메라(100)가 설치된 장소에서 발생하는 이벤트들을 포함하는 이벤트 그룹의 이벤트들을 사용자 단말(300)에 전송하여 출력한 뒤, 사용자 단말(300)에 출력된 이벤트들 중 사용자 단말(300)로부터 선택된 이벤트들을 상기 이벤트 감지 인공 신경망이 감지하는 이벤트로 결정한다. 인공지능 감시카메라(100)는 사용자 단말(300)로부터 선택된 상기 이벤트들을 상기 이벤트 감지 인공 신경망에 대응되는 장소 정보에 연관된 이벤트 목록 데이터베이스에 저장하고, 상기 이벤트 목록 데이터베이스에 저장된 사용자 단말(300)로부터 선택된 이벤트들로 상기 이벤트 감지 인공 신경망을 학습시킴으로써 특정 장소에 대응되는 이벤트 감지 인공 신경망의 학습 정확도를 향상시킬 수 있다.
다음으로, 인공지능 감시카메라(100)는 상기 영상 데이터를 상기 이벤트 감지 인공 신경망(제2 인공 신경망)에 입력하여 자신이 설치된 장소에서 이벤트의 발생 여부를 판단한다(S530). 인공지능 감시카메라(100)의 상기 영상 데이터를 인공지능 감시카메라(100)가 설치된 장소에서 발생하는 이벤트의 감지를 위한 객체 정보를 출력하도록 훈련된 상기 이벤트 감지 인공 신경망에 입력한 뒤, 상기 이벤트 감지 인공 신경망의 출력에 기초하여 상기 인공지능 감시카메라(100)가 설치된 장소에서 이벤트의 발생 여부를 판단한다.
다음으로, 인공지능 감시카메라(100)는 상기 영상 데이터에서 이벤트가 발생한 것으로 판단되면, 상기 발생된 이벤트에 대한 이벤트 발생 신호를 출력한다(S540). 이벤트 발생 신호는 도 4에 도시한 바와 같이 ONVIF RTP 패킷(400) 중 padding 영역(410)에 포함되고, padding 영역(410)은 상기 발생된 이벤트에 대한 발생 장소 정보(411), 상기 발생된 이벤트에 대한 긴급도 정보(412), 및 상기 발생된 이벤트에 대한 종류 정보(413)를 포함할 수 있다. 상기 발생 장소 정보(411)는 표 1의 ID항목 0 내지 7로 구분될 수 있다. 또한, 상기 발생된 이벤트에 대한 종류(413)의 긴급도에 따라 상기 발생된 이벤트에 대한 긴급도 정보(412)는 1 내지 5로 구분될 수 있으며, 긴급도는 이상 감지(1), 재산 피해 경고(2), 재산 피해 발생(3), 인명 피해 경고(4), 인명 피해 발생(5)으로 정의될 수 있다.
한편, 인공지능 감시카메라(100)는 동일 그룹으로 설정된 제2 인공지능 감시카메라로부터 상기 제2 인공지능 감시카메라의 장소/상황 판단 인공 신경망의 출력을 수신한 뒤, 상기 인공지능 감시카메라(100)의 장소/상황 판단 인공 신경망의 출력 및 상기 제2 인공지능 감시카메라의 장소/상황 판단 인공 신경망의 출력 중 적어도 하나에 기초하여 상기 인공지능 감시카메라가 설치된 장소를 판단하여, 자신이 설치된 장소 또는 상황에 대한 판단의 정확도를 높일 수 있다.
상술한 설명에서, 단계들 또는 동작들은 본 발명의 구현예에 따라서, 추가적인 단계 또는 동작으로 더 분할되거나, 더 적은 단계 또는 동작으로 조합될 수 있다. 또한, 일부 단계 또는 동작은 필요에 따라 생략될 수도 있고, 단계 또는 동작 간의 순서가 전환될 수도 있다.
본 명세서에서 사용된 용어 "부"는(예를 들면, 제어부 등), 예를 들어, 하드웨어, 소프트웨어 또는 펌웨어(firmware) 중 하나 또는 둘 이상의 조합을 포함하는 단위(unit)를 의미할 수 있다. "부"는, 예를 들어, 유닛(unit), 로직(logic), 논리블록(logical block), 부품(component), 또는 회로(circuit) 등의 용어와 바꾸어 사용(interchangeably use)될 수 있다. "부"는, 일체로 구성된 부품의 최소 단위 또는 그 일부가 될 수 있다. "부"는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수도 있다. "부"는 기계적으로 또는 전자적으로 구현될 수 있다. 예를 들어, "부"는, 알려졌거나 앞으로 개발될, 어떤 동작들을 수행하는 ASIC(Application-Specific Integrated Circuit) 칩, FPGAs(Field-Programmable Gate Arrays) 또는 프로그램 가능 논리 장치(programmable-logic device) 중 적어도 하나를 포함할 수 있다.
다양한 실시예에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는, 예컨대, 프로그램 모듈의 형태로 컴퓨터로 읽을 수 있는 저장매체(computer-readable storage media)에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서에 의해 실행될 경우, 상기 하나 이상의 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터로 읽을 수 있는 저장매체/컴퓨터로 판독 가능한 기록 매체는, 하드디스크, 플로피디스크, 마그네틱 매체(magnetic media)(예: 자기테이프), 광기록 매체(optical media)(예: CD-ROM(compact disc read only memory), DVD(digital versatile disc), 자기-광 매체(magneto-optical media)(예: 플롭티컬 디스크(floptical disk)), 하드웨어 장치(예: ROM(read only memory), RAM(random access memory), 또는 플래시 메모리 등) 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함할 수 있다. 또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드 뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 다양한 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지다.
다양한 실시예에 따른 모듈 또는 프로그램 모듈은 전술된 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 다양한 실시예에 따른 모듈, 프로그램 모듈 또는 다른 구성요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱(heuristic)한 방법으로 실행될 수 있다. 또한, 일부 동작은 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.
본 명세서에 사용된 용어 "하나"는 하나 또는 하나 이상으로 정의된다. 또한, 청구 범위에서 "적어도 하나" 및 "하나 이상"과 같은 도입 문구를 사용하는 것은, 동일한 청구항에 "적어도 하나" 및 "하나 이상"과 같은 도입 문구 및 "하나" 같은 불명료한 문구가 포함되어 있는 경우라 할지라도, 불명료한 문구 "하나"에 의한 다른 청구항 요소의 도입이 그러한 요소를 하나만을 포함하는 발명에 대해 그렇게 도입된 청구항 요소를 포함하는 임의의 특정 청구항을 제한한다는 것을 의미하는 것으로 해석되어서는 안된다.
본 문서에서, "A 또는 B" 또는 "A 및/또는 B 중 적어도 하나" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다.
달리 명시하지 않는 한, "제1" 및 "제2"와 같은 용어는 그러한 용어가 설명하는 요소들을 임의로 구별하는 데 사용된다. 따라서, 이들 용어는 그러한 요소들의 시간적 또는 다른 우선 순위를 나타내도록 반드시 의도된 것은 아니며, 특정 수단이 서로 다른 청구항들에 열거되어 있다는 단순한 사실만으로 이러한 수단들의 조합이 유리하게 사용될 수 없다는 것을 나타내는 것은 아니다. 따라서, 이들 용어는 그러한 요소의 시간적 또는 다른 우선 순위를 나타내도록 반드시 의도되지는 않는다. 특정 조치가 서로 다른 주장에 인용되었다는 단순한 사실만으로 이러한 조치의 조합이 유용하게 사용될 수 없다는 것을 나타내지는 않는다.
동일한 기능을 달성하기 위한 구성 요소의 배열은 효과적으로 "관련"되어 원하는 기능이 달성된다. 따라서, 특정 기능성을 달성하기 위해 결합된 임의의 2 개의 구성 요소는 구조 또는 중개하는 구성 요소와 관계없이 원하는 기능이 달성되도록 서로 "관련"되는 것으로 간주될 수 있다. 마찬가지로 이와 같이 연관된 두 개의 구성 요소는 원하는 기능을 달성하기 위해 서로 "작동 가능하게 연결"되거나 "작동 가능하게 결합된" 것으로 간주될 수 있다.
또한, 통상의 기술자는 전술한 동작들의 기능성 사이의 경계가 단지 예시적인 것임을 인식할 것이다. 복수의 동작들은 단일 동작으로 결합될 수 있고, 단일 동작은 추가 동작들로 분산될 수 있으며, 동작들은 시간적으로 적어도 부분적으로 겹쳐서 실행될 수 있다. 또한, 대안적인 실시예들은 특정 동작에 대한 복수의 인스턴스들을 포함할 수 있고, 동작들의 순서는 다양한 다른 실시예에서 변경될 수 있다. 그러나, 다른 수정, 변형 및 대안이 또한 가능하다. 따라서, 상세한 설명 및 도면은 제한적인 의미가 아니라 예시적인 것으로 간주되어야 한다.
"X일 수 있다"는 문구는 조건 X가 충족될 수 있음을 나타낸다. 이 문구는 또한 조건 X가 충족되지 않을 수도 있음을 나타낸다. 예를 들어, 특정 구성 요소를 포함하는 시스템에 대한 참조는 시스템이 특정 구성 요소를 포함하지 않는 시나리오도 포함해야 한다. 예를 들어, 특정 동작을 포함하는 방법에 대한 참조는 해당 방법이 특정 구성 요소를 포함하지 않는 시나리오도 포함해야 한다. 그러나 또 다른 예를 들면, 특정 동작을 수행하도록 구성된 시스템에 대한 참조는 시스템이 특정 작업을 수행하도록 구성되지 않은 시나리오도 포함해야 한다.
용어 "포함하는", "갖는", "구성된", "이루어진" 및 "본질적으로 이루어진"은 상호 교환적으로 사용된다. 예를 들어, 임의의 방법은 적어도 도면 및/또는 명세서에 포함된 동작을 포함할 수 있으며, 도면 및/또는 명세서에 포함된 동작만을 포함할 수 있다. 또는, "포함하는"이라는 단어는 청구항에 나열된 요소들 또는 동작들의 존재를 배제하지 않는다.
통상의 기술자는 논리 블록들 사이의 경계가 단지 예시적인 것이며, 대안적인 실시 예들이 논리 블록들 또는 회로 소자들을 병합하거나 또는 다양한 논리 블록들 또는 회로 소자들 상에 기능의 대체적인 분해를 부과할 수 있음을 인식할 것이다. 따라서, 여기에 도시된 아키텍처는 단지 예시적인 것이며, 사실 동일한 기능을 달성하는 많은 다른 아키텍처가 구현될 수 있다는 것으로 이해되어야 한다.
또한, 예를 들어, 일 실시예에서, 도시된 예들은 단일 집적 회로 상에 또는 동일한 장치 내에 위치된 회로로서 구현될 수 있다. 대안적으로, 상기 예들은 임의의 수의 개별적인 집적 회로들 또는 적합한 방식으로 서로 상호 접속된 개별 장치들로서 구현될 수 있으며, 다른 변경, 수정, 변형 및 대안들이 또한 가능하다. 따라서, 명세서 및 도면은 제한적인 의미가 아니라 예시적인 것으로 간주되어야 한다.
또한, 예를 들어, 전술한 예들 또는 그 일부는, 임의의 적절한 유형의 하드웨어 기술 언어와 같은, 물리적 회로 또는 물리적 회로로 변환 가능한 논리적 표현의 소프트웨어 또는 코드 표현으로서 구현될 수 있다.
또한, 본 발명은 비 프로그래머블 하드웨어로 구현된 물리적 장치 또는 유닛으로 제한되지 않지만, 일반적으로 본원에서는 '컴퓨터 시스템'으로 표시되는 메인 프레임, 미니 컴퓨터, 서버, 워크스테이션, 개인용 컴퓨터, 노트패드(notepad), 개인용 디지털 정보 단말기(PDA), 전자 게임(electronic games), 자동차 및 기타 임베디드 시스템, 휴대전화 및 다양한 다른 무선 장치 등과 같은, 적절한 프로그램 코드에 따라 동작함으로써 원하는 장치 기능을 수행할 수 있는 프로그램 가능한 장치 또는 유닛에도 적용될 수 있다.
이 명세서에 언급된 시스템, 장치 또는 디바이스는 적어도 하나의 하드웨어 구성 요소를 포함한다.
본 명세서에 설명된 바와 같은 연결들은 예를 들어 중간 장치를 통해 각각의 노드, 유닛 또는 장치로부터 또는 각각의 노드, 유닛 또는 장치로 신호를 전송하기에 적합한 임의의 유형의 연결일 수 있다. 따라서, 묵시적으로 또는 달리 언급되지 않는 한, 연결은 예를 들어 직접 연결 또는 간접 연결일 수 있다. 연결은 단일 연결, 다수의 연결, 단방향 연결 또는 양방향 연결이라는 것을 참조하여 설명되거나 묘사될 수 있다. 그러나, 서로 다른 실시 예들은 연결의 구현을 변화시킬 수 있다. 예를 들어 양방향 연결이 아닌 별도의 단방향 연결을 사용할 수 있으며 그 반대의 경우도 가능할 수 있다. 또한, 다수의 연결은 복수의 신호를 순차적으로 또는 시간 다중화 방식으로 전송하는 단일 연결로 대체될 수 있다. 마찬가지로, 복수의 신호를 전송하는 단일 연결은 이러한 신호의 서브 세트를 전송하는 다양한 연결로 분리될 수 있다. 따라서 신호를 전송하기 위한 많은 옵션들이 존재한다.
이상에서 본 명세서의 기술에 대한 바람직한 실시 예가 첨부된 도면들을 참조하여 설명되었다. 여기서, 본 명세서 및 청구 범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 한다. 본 발명의 범위는 본 명세서에 개시된 실시 예들로 한정되지 아니하고, 본 발명은 본 발명의 사상 및 특허청구범위에 기재된 범주 내에서 다양한 형태로 수정, 변경, 또는 개선될 수 있다.
1000: 인공지능 감시카메라 시스템
100: 인공지능 감시카메라 101: 장소/상황 판단 인공 신경망
102: 이벤트 감지 인공 신경망 103: 장소/이벤트 정보 DB
110: 촬영부 120: 인코더
130: 저장부 140: 통신부
150: 판별부 151: AI 프로세서
152: 데이터 학습부 153: 학습 데이터 획득부
154: 모델 학습부 155: 메모리
156: 딥러닝 모델 157: 통신부
160: 연산부 170: 출력부
200: AI 데이터 저장 서버 300: 사용자 단말

Claims (13)

  1. 인공지능 감시카메라에서 이벤트 발생을 감지하는 방법에 있어서,
    인공지능 감시카메라가 설치된 장소에서 주변 영상을 촬영하여 영상 데이터를 획득하는 단계;
    상기 영상 데이터를 제1 인공 신경망에 입력하여 인공지능 감시카메라가 설치된 장소를 판단하는 단계;
    상기 판단 결과에 기초하여 복수의 이벤트 감지 인공 신경망들 중 상기 인공지능 감시카메라가 설치된 장소에 대응되는 제2 인공 신경망을 결정하는 단계;
    상기 영상 데이터를 상기 제2 인공 신경망에 입력하여 상기 인공지능 감시카메라가 설치된 장소에서 이벤트의 발생 여부를 판단하는 단계; 및
    상기 영상 데이터에서 이벤트가 발생한 것으로 판단되면, 상기 발생된 이벤트에 대한 이벤트 발생 신호를 출력하는 단계;
    를 포함하는 방법.
  2. 제1 항에 있어서,
    상기 영상 데이터를 제1 인공 신경망에 입력하여 인공지능 감시카메라가 설치된 장소를 판단하는 단계는,
    상기 영상 데이터를 인공지능 감시카메라가 설치된 장소의 판단을 위한 객체 정보를 출력하도록 훈련된 상기 제1 인공 신경망에 입력하는 단계; 및
    상기 제1 인공 신경망의 출력에 기초하여 인공지능 감시카메라가 설치된 장소를 판단하는 단계;
    를 포함하는 것을 특징으로 하는 방법.
  3. 제2 항에 있어서,
    상기 판단 결과에 기초하여 복수의 이벤트 감지 인공 신경망들 중 상기 인공지능 감시카메라가 설치된 장소에 대응되는 제2 인공 신경망을 결정하는 단계는,
    복수의 장소에 대해 각 장소에서 촬영된 영상 데이터를 입력 받아, 해당 장소에서 발생하는 이벤트를 감지하도록 훈련된 상기 복수의 이벤트 감지 인공 신경망들 중에서 상기 제1 인공 신경망의 출력에 기초하여 판단된 상기 인공지능 감시카메라가 설치된 장소에 대응되는 상기 제2 인공 신경망을 결정하는 단계; 및
    상기 복수의 장소 중 각 장소에서 발생할 수 있는 것으로 미리 결정된 이벤트들을 포함하는 이벤트 그룹들 중에서 상기 인공지능 감시카메라가 설치된 장소에서 발생하는 이벤트들을 포함하는 이벤트 그룹을 상기 제2 인공 신경망과 관련된 이벤트 그룹으로 결정하는 단계;
    를 포함하는 것을 특징으로 하는 방법.
  4. 제3 항에 있어서,
    상기 복수의 장소 중 각 장소에서 발생할 수 있는 것으로 미리 결정된 이벤트들을 포함하는 이벤트 그룹들 중에서 상기 인공지능 감시카메라가 설치된 장소에서 발생하는 이벤트들을 포함하는 이벤트 그룹을 상기 제2 인공 신경망과 관련된 이벤트 그룹으로 결정하는 단계는,
    상기 인공지능 감시카메라가 설치된 장소에서 발생하는 이벤트들을 포함하는 이벤트 그룹의 이벤트들을 사용자 단말에 출력하는 단계; 및
    상기 사용자 단말에 출력된 이벤트들 중 상기 사용자 단말로부터 선택된 이벤트들을 상기 제2 인공 신경망이 감지하는 이벤트로 결정하는 단계;
    를 포함하는 것을 특징으로 하는 방법.
  5. 제4 항에 있어서,
    상기 사용자 단말로부터 선택된 이벤트들을 상기 제2 인공 신경망에 대응되는 장소 정보에 연관된 이벤트 목록 데이터베이스에 저장하는 단계; 및
    상기 이벤트 목록 데이터베이스에 저장된 상기 사용자 단말로부터 선택된 이벤트들로 상기 제2 인공 신경망을 학습시키는 단계;
    를 더 포함하는 것을 특징으로 하는 방법.
  6. 제1 항에 있어서,
    상기 영상 데이터를 상기 제2 인공 신경망에 입력하여 상기 인공지능 감시카메라가 설치된 장소에서 이벤트의 발생 여부를 판단하는 단계는,
    상기 영상 데이터를 인공지능 감시카메라가 설치된 장소에서 발생하는 이벤트의 감지를 위한 객체 정보를 출력하도록 훈련된 상기 제2 인공 신경망에 입력하는 단계; 및
    상기 제2 인공 신경망의 출력에 기초하여 상기 인공지능 감시카메라가 설치된 장소에서 이벤트의 발생 여부를 판단하는 단계;
    를 포함하는 것을 특징으로 하는 방법.
  7. 제1 항에 있어서,
    상기 이벤트 발생 신호는 ONVIF RTP 패킷 중 padding 영역에 포함되고,
    상기 padding 영역은 상기 발생된 이벤트에 대한 발생 장소 정보, 상기 발생된 이벤트에 대한 긴급도 정보, 및 상기 발생된 이벤트에 대한 종류 정보를 포함하는 것을 특징으로 하는 방법.
  8. 제2 항에 있어서,
    동일 그룹으로 설정된 제2 인공지능 감시카메라로부터 상기 제2 인공지능 감시카메라의 제1 인공 신경망의 출력을 수신하는 단계; 및
    상기 인공지능 감시카메라의 제1 인공 신경망의 출력 및 상기 제2 인공지능 감시카메라의 제1 인공 신경망의 출력 중 적어도 하나에 기초하여 상기 인공지능 감시카메라가 설치된 장소를 판단하는 단계;
    를 더 포함하는 것을 특징으로 하는 방법.
  9. 인공지능 감시카메라가 설치된 장소를 촬영하여 영상 데이터를 획득하는 촬영부;
    상기 영상 데이터에서 상기 인공지능 감시카메라가 설치된 장소의 판단을 위한 객체 분석 결과를 출력하도록 훈련된 제1 인공 신경망 및 상기 제1 인공 신경망의 출력에 기초하여 판단될 수 있는 장소별로 이벤트의 발생 여부의 판단을 위한 객체 분석 결과를 출력하도록 훈련된 복수의 이벤트 감지 인공 신경망들을 포함하는 판별부;
    상기 제1 인공 신경망의 출력에 기초하여 상기 인공지능 감시카메라가 설치된 장소를 판단하고, 상기 복수의 이벤트 감지 인공 신경망들 중 상기 인공지능 감시카메라가 설치된 장소에 대한 판단 결과에 대응되는 제2 인공 신경망을 결정하고, 상기 제2 인공 신경망의 출력 결과에 기초하여 이벤트의 발생 여부를 판단하는 연산부; 및
    상기 제2 인공 신경망의 출력 결과에 기초하여 이벤트가 발생한 것으로 판단되면, 상기 발생된 이벤트에 대한 이벤트 발생 신호를 사용자에게 전달하도록 출력하는 출력부;
    를 포함하는 인공지능 감시카메라.
  10. 제9 항에 있어서, 상기 출력부는,
    상기 제1 인공 신경망의 출력에 기초하여 판단된 상기 인공지능 감시카메라가 설치된 장소에서 발생할 수 있는 이벤트 그룹에 포함된 이벤트들을 사용자 단말로 전송하고,
    상기 인공지능 감시카메라가 설치된 장소에서 발생할 수 있는 이벤트 그룹에 포함되는 이벤트들 중 상기 사용자 단말로부터 선택된 이벤트들을 상기 제2 인공 신경망이 감지하는 이벤트로 결정하는 것을 특징으로 하는 인공지능 감시카메라.
  11. 제10 항에 있어서,
    인공지능 감시카메라가 설치될 수 있는 장소 정보 및 상기 장소 별로 발생될 수 있는 이벤트들을 포함하는 이벤트 그룹에 대한 이벤트 목록 데이터베이스를 저장하는 저장부;를 더 포함하고,
    상기 출력부는,
    상기 제1 인공 신경망의 출력에 기초하여 판단된 상기 인공지능 감시카메라가 설치된 장소 정보에 상기 사용자 단말로부터 선택된 이벤트 정보를 연관지어 상기 이벤트 목록 데이터베이스를 갱신하고,
    상기 이벤트 목록 데이터베이스에 저장된 상기 사용자 단말로부터 선택된 이벤트들로 상기 제2 인공 신경망을 학습시키는 것을 특징으로 하는 인공지능 감시카메라.
  12. 제9 항에 있어서,
    상기 이벤트 발생 신호는 ONVIF RTP 패킷 중 padding 영역에 포함되고,
    상기 padding 영역은 상기 발생된 이벤트에 대한 발생 장소 정보, 상기 발생된 이벤트에 대한 긴급도 정보, 및 상기 발생된 이벤트에 대한 종류 정보를 포함하는 것을 특징으로 하는 인공지능 감시카메라.
  13. 제9 항에 있어서, 상기 연산부는,
    동일 그룹으로 설정된 제2 인공지능 감시카메라로부터 상기 제2 인공지능 감시카메라의 제1 인공 신경망의 출력을 수신하고, 및
    상기 인공지능 감시카메라의 제1 인공 신경망의 출력 및 상기 제2 인공지능 감시카메라의 제1 인공 신경망의 출력 중 적어도 하나에 기초하여 상기 인공지능 감시카메라가 설치된 장소를 판단하는 것을 특징으로 하는 인공지능 감시카메라.
KR1020210156542A 2021-11-15 2021-11-15 인공지능 감시카메라를 이용한 이벤트 발생 감지 KR20230070700A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210156542A KR20230070700A (ko) 2021-11-15 2021-11-15 인공지능 감시카메라를 이용한 이벤트 발생 감지

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210156542A KR20230070700A (ko) 2021-11-15 2021-11-15 인공지능 감시카메라를 이용한 이벤트 발생 감지

Publications (1)

Publication Number Publication Date
KR20230070700A true KR20230070700A (ko) 2023-05-23

Family

ID=86544461

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210156542A KR20230070700A (ko) 2021-11-15 2021-11-15 인공지능 감시카메라를 이용한 이벤트 발생 감지

Country Status (1)

Country Link
KR (1) KR20230070700A (ko)

Similar Documents

Publication Publication Date Title
KR102152237B1 (ko) 상황 분석 기반의 cctv 관제 방법 및 시스템
US11615623B2 (en) Object detection in edge devices for barrier operation and parcel delivery
Dee et al. How close are we to solving the problem of automated visual surveillance? A review of real-world surveillance, scientific progress and evaluative mechanisms
JP6080940B2 (ja) 人物検索方法及びホーム滞留人物検索装置
US11580747B2 (en) Multi-spatial scale analytics
US10740675B2 (en) Scalable deep learning video analytics
Duque et al. Prediction of abnormal behaviors for intelligent video surveillance systems
US20210343136A1 (en) Event entity monitoring network and method
KR102195706B1 (ko) 침입 탐지방법 및 그 장치
WO2021095351A1 (ja) 監視装置、監視方法、及びプログラム
KR102028930B1 (ko) 움직임 정보를 이용한 인공지능 학습기반의 이동객체 영상 분류처리 방법
US11726210B2 (en) Individual identification and tracking via combined video and lidar systems
JP7473978B2 (ja) 機械学習によりサブシーンを含むシーンを分類する方法
KR20210062256A (ko) 행동 시퀀스 기반으로 이상행동 여부를 판단하는 방법, 프로그램 및 시스템
EP3746938A2 (en) System and method for neuromorphic visual activity classification based on foveated detection and contextual filtering
Rehman et al. Internet-of-things-based suspicious activity recognition using multimodalities of computer vision for smart city security
KR102317459B1 (ko) Cctv 영상 분석을 통한 객체의 이벤트 발생 감지 방법, 장치 및 컴퓨터프로그램
KR102585665B1 (ko) 위험 상황 분석 및 위험 객체 수색 시스템
Priya et al. Abnormal activity detection techniques in intelligent video surveillance: A survey
Yadav et al. Video anomaly detection for pedestrian surveillance
Amrutha et al. A robust system for video classification: identification and tracking of suspicious individuals from surveillance videos
KR20230070700A (ko) 인공지능 감시카메라를 이용한 이벤트 발생 감지
KR20230064095A (ko) 딥러닝 기반 영상분석을 통한 이상행동 탐지 장치 및 방법
Arshad et al. Anomalous Situations Recognition in Surveillance Images Using Deep Learning
Nandhini et al. IoT Based Smart Home Security System with Face Recognition and Weapon Detection Using Computer Vision