KR102152237B1 - Cctv central control system and method based on situation analysis - Google Patents

Cctv central control system and method based on situation analysis Download PDF

Info

Publication number
KR102152237B1
KR102152237B1 KR1020200063746A KR20200063746A KR102152237B1 KR 102152237 B1 KR102152237 B1 KR 102152237B1 KR 1020200063746 A KR1020200063746 A KR 1020200063746A KR 20200063746 A KR20200063746 A KR 20200063746A KR 102152237 B1 KR102152237 B1 KR 102152237B1
Authority
KR
South Korea
Prior art keywords
metadata
situation
image analysis
camera
image
Prior art date
Application number
KR1020200063746A
Other languages
Korean (ko)
Inventor
오상석
이상균
Original Assignee
주식회사 와치캠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 와치캠 filed Critical 주식회사 와치캠
Priority to KR1020200063746A priority Critical patent/KR102152237B1/en
Application granted granted Critical
Publication of KR102152237B1 publication Critical patent/KR102152237B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • H04N5/23206
    • H04N5/23299
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

A CCTV control method and system based on situation analysis are disclosed. According to the present invention, the CCTV control system based on situation analysis comprises: a first image analysis device; a second image analysis device; and an integrated control server. The first image analysis device controls the operation of a camera based on first metadata, and the second image analysis device determines whether or not an event has occurred using at least one of the first metadata and second metadata. According to the present invention, since the control is based on a movement of an object and a change in a situation, it is possible to probably reduce false information in event detection.

Description

상황 분석 기반의 CCTV 관제 방법 및 시스템{CCTV CENTRAL CONTROL SYSTEM AND METHOD BASED ON SITUATION ANALYSIS}CCTV control method and system based on situation analysis {CCTV CENTRAL CONTROL SYSTEM AND METHOD BASED ON SITUATION ANALYSIS}

본 발명은 상황 분석 기반의 CCTV 관제 방법 및 시스템에 관한 것으로, 더욱 상세하게는 에지에서 객체 감지 및 클라우드에서 상황 분석에 기반하는 CCTV 관제 방법 및 시스템에 관한 것이다.The present invention relates to a CCTV control method and system based on situation analysis, and more particularly, to a CCTV control method and system based on object detection at the edge and situation analysis in the cloud.

주거 및 업무시설에 설치된 기존의 CCTV 설비의 주된 이용현황을 보면 이벤트 발생 시점에서 즉각적인 대응을 못하고, 발생 후 저장된 영상을 통하여 이벤트에 대한 원인 분석 및 결과 처리 정도로 이용되고 있는 실정이다. 따라서 기존의 CCTV 설비로는 사고 및 범죄에 대한 예방 및 즉각적인 조치가 어려운 경우가 많았다.Looking at the main use status of existing CCTV facilities installed in residential and business facilities, it is not possible to respond immediately at the time of event occurrence, and it is used to analyze the cause of the event and process the result through the image stored after the occurrence. Therefore, there were many cases where it was difficult to prevent accidents and crimes and take immediate measures with existing CCTV facilities.

지능형 CCTV의 초기는 룰 기반이었는데, 룰 기반의 지능형 CCTV는 영상에서 움직이는 픽셀을 감지해 이동 물체를 감지하는 것을 의미한다. 그런데 룰 기반의 지능형 CCTV는 사람과 사물을 구분하지 못했고, 수동으로 감지레벨이 설정되어야 하는 어려움이 있었다. 룰 기반의 지능형 CCTV에서 사람이 지나갈 때 알림이 울려야 하는데, 개나 고양이가 지나갈 때, 낙엽이 날라가거나 나무가 바람에 나부낄 때, 심지어 노이즈가 생겼을 때 알람이 울리는 등 하루에 수십 번의 오보가 발생했다. 그래서 지능형 CCTV를 설치해 놓고도 알람을 작동시키지 않은 상태로 육안 관제에 의존해야 했다.The early days of intelligent CCTV were rule-based, but rule-based intelligent CCTV means detecting moving objects by detecting moving pixels in an image. However, rule-based intelligent CCTV could not distinguish between people and objects, and there was a difficulty in manually setting the detection level. In the rule-based intelligent CCTV, a notification should sound when a person passes by, but dozens of misinformations occur a day, such as when a dog or cat passes, when fallen leaves are blown by the wind, when a tree is blowing in the wind, or even when noise occurs. did. So, even with the intelligent CCTV installed, it was necessary to rely on visual control without triggering the alarm.

하나의 관련 기술로서 지능형 협업 서버, 시스템 및 이의 협업 기반 분석 방법이 등록번호 KR 제10-2008503호의 공개공보에 개시된다. 이 관련 기술에 따르면 여러 가지 분석 기법에 의한 정보 분석이 실제로는 불가능하고, 제1 영상 분석 정보와 제2 영상 분석 정보가 서로 상충하는 경우 높은 신뢰도를 갖는 분석 기법을 선택하는 방법이 제시되어 있지 않다. 그리고 위의 관련 기술은 영상 분석에 기초하여 카메라 제어 정보를 생성하는 것에 한정되어 있다는 단점이 있다.As one related technology, an intelligent collaboration server, a system, and a collaboration-based analysis method thereof are disclosed in the publication of registration number KR 10-2008503. According to this related technology, information analysis by various analysis techniques is practically impossible, and when the first image analysis information and the second image analysis information conflict with each other, there is no method of selecting an analysis method with high reliability. . In addition, the above related technology has a disadvantage in that it is limited to generating camera control information based on image analysis.

KR 등록특허공보 제10-2008503호 (2019.08.01. 공개)KR Registered Patent Publication No. 10-2008503 (published on August 1, 2019)

본 발명의 일 과제는, 즉각적인 대응을 못했던 초기의 CCTV 및 객체의 움직임 검출에 따라 오보가 많았던 종래의 지능형 CCTV 관제 시스템의 문제점을 해결하는 것이다.An object of the present invention is to solve the problem of the conventional intelligent CCTV control system, which had a lot of misinformation due to initial CCTV and object motion detection, which did not immediately respond.

본 발명의 일 과제는, 객체의 움직임이 적은 주거 또는 업무 시설에 설치되는 감시용 CCTV와, 객체의 움직임이 많은 교차로에 설치되는 교통 관제용 CCTV를 구별하여 서로 다른 시스템이 적용되었던 종래의 CCTV 관제 시스템의 문제점을 해결하기 위해, 주거, 업무시설에 설치되는 CCTV와 교통 관제용 CCTV 모두에 적용될 수 있는 지능형 CCTV 관제 시스템을 제공하는 것이다.An object of the present invention is to distinguish between a CCTV for surveillance installed in a residential or business facility with little movement of an object and a CCTV for traffic control installed at an intersection with many movements of an object, so that different systems are applied to the conventional CCTV control system. In order to solve the problems of the system, it is to provide an intelligent CCTV control system that can be applied to both CCTV installed in residential and business facilities and CCTV for traffic control.

본 발명의 일 과제는, 에지 및 클라우드에서의 전이 학습을 통해 성능이 업데이트될 수 있는 인공지능 모델을 활용할 수 있는 CCTV 관제 시스템을 제공하는 것이다.An object of the present invention is to provide a CCTV control system that can utilize an artificial intelligence model whose performance can be updated through transfer learning at the edge and in the cloud.

본 발명의 과제는 이상에서 언급한 과제에 한정되지 않으며, 언급되지 않은 본 발명의 다른 과제 및 장점들은 하기의 실시 예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 과제 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 알 수 있을 것이다.The subject of the present invention is not limited to the problems mentioned above, and other problems and advantages of the present invention not mentioned will be more clearly understood by the following examples. In addition, it will be appreciated that the problems and advantages of the present invention can be realized by the means shown in the claims and combinations thereof.

본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 시스템은, 감시 영상을 수집하고 이를 전송하는 적어도 하나 이상의 카메라; 감시 영상에서 감지된 객체의 동작 기반의 제1차 영상분석을 통해 제1 메타데이터를 생성하는 제1 영상분석 장치; 제1 메타데이터가 이용되는, 감시 영상에서 감지된 상황 기반의 제2차 영상분석을 통해 제2 메타데이터를 생성하는 제2 영상분석 장치; 및 감시 영상을 통합 관제 뷰어를 통해 디스플레이 하고, 미리 설정된 조건의 이벤트의 발생을 알리는 통합 관제 서버를 포함하도록 구성될 수 있다. 그리고, 제1 영상분석 장치는, 제1 메타데이터에 기초하여 카메라의 동작을 제어하고, 통합 관제 서버는, 제2 메타데이터에 기초하여 카메라의 동작을 제어하고, 제1 메타데이터 및 제2 메타데이터를 이용하여 이벤트 발생 여부를 판단할 수 있다.A CCTV control system based on situation analysis according to an embodiment of the present invention includes at least one camera for collecting and transmitting a surveillance image; A first image analysis device for generating first metadata through a first image analysis based on a motion of an object detected from a surveillance image; A second image analysis device that generates second metadata through a second image analysis based on a context sensed in a surveillance image, in which the first metadata is used; And an integrated control server that displays the surveillance image through the integrated control viewer and notifies the occurrence of an event of a preset condition. In addition, the first video analysis device controls the operation of the camera based on the first metadata, the integrated control server controls the operation of the camera based on the second metadata, and the first metadata and the second metadata Using data, it is possible to determine whether an event has occurred.

또한, 제1 영상분석 장치는, 감시 영상에서 객체를 추출하고, 추출된 객체에 인공지능 모델 기반의 객체 분류를 통해, 학습된 패턴을 매칭시켜 객체에 관한 제1 메타데이터를 추출할 수 있다.In addition, the first image analysis apparatus may extract first metadata about the object by extracting an object from the surveillance image and matching the learned pattern to the extracted object through object classification based on an artificial intelligence model.

또한, 제2 영상분석 장치는, 감시 영상으로부터 추출된 배경의 특징에 딥러닝(deep learning) 모델을 적용하여 배경을 인식하고, 제1 메타데이터를 이용하여 배경에서 객체의 동작을 통해 추론되는 상황 변화에 관한 제2 메타데이터를 추출할 수 있다.In addition, the second image analysis device recognizes the background by applying a deep learning model to the features of the background extracted from the surveillance image, and the situation inferred through the motion of the object in the background using the first metadata. Second metadata about the change can be extracted.

또한, 제1 영상분석 장치는, 점등된 신호기의 색깔 및 교통신호 제어기로부터 수신한 신호 정보 중에서 적어도 하나를 이용하여 차량 및 사람의 신호 위반의 움직임을 감지할 수 있다.In addition, the first image analysis apparatus may detect a motion of a signal violation of a vehicle or a person using at least one of a color of a lighted signal and signal information received from a traffic signal controller.

또한, 제1항에 있어서, 제2 영상분석 장치는, 감시 영상으로부터 추출된 배경에 학습에 의해 훈련된 인공지능 모델을 적용하여 어린이보호구역, 횡단보도, 교차로 중에서 적어도 하나를 인식하고, 제1 메타데이터를 이용하여 인식된 배경에서 차량과 사람의 동작을 통해 추론되는 상황의 변화 여부를 판단할 수 있다.In addition, according to claim 1, wherein the second image analysis device recognizes at least one of a child protection zone, a crosswalk, and an intersection by applying an artificial intelligence model trained by learning to a background extracted from the surveillance image, It is possible to determine whether or not the situation inferred through the motion of the vehicle and the person in the recognized background changes using the metadata.

또한, 통합 관제 서버가 수행하는 방법으로서, 상황 분석 기반의 CCTV 관제 방법은, CCTV 카메라를 통해 수집된 영상으로 구성된 훈련 데이터 셋을 이용하는 학습에 따른 훈련에 기초하여 객체의 움직임을 판단하는 모델 및 상황 변화를 판단하는 모델을 구성하는 단계; 이벤트의 발생을 알리기 위해 상기 CCTV 카메라로부터 감시 영상을 수신하는 단계; 객체의 움직임을 판단하는 모델을 이용하여, 감시 영상에서 감지된 객체의 동작 기반의 제1차 영상분석 기반의 제1 메타데이터를 수신하는 단계; 제1 메타데이터 및 상황 변화를 판단하는 모델을 이용하여, 감시 영상에서 감지된 상황 기반의 제2차 영상분석 기반의 제2 메타데이터를 수신하는 단계; 및 감시 영상을 통합 관제 뷰어를 통해 디스플레이 하고, 미리 설정된 조건의 이벤트의 발생을 알리는 단계를 포함하도록 구성될 수 있다. 그리고 제1 메타데이터 및 제2 메타데이터 중에서 적어도 하나를 이용하여 이벤트 발생 여부가 판단될 수 있다.In addition, as a method performed by the integrated control server, the CCTV control method based on situation analysis is a model and situation that determines the movement of an object based on training based on training using a training data set composed of images collected through CCTV cameras. Constructing a model for determining change; Receiving a surveillance video from the CCTV camera to notify the occurrence of an event; Receiving first metadata based on the first image analysis based on the motion of the object detected in the surveillance image by using the model for determining the motion of the object; Receiving second metadata based on the second image analysis based on the context detected in the surveillance image by using the first metadata and a model for determining the change of the situation; And displaying the surveillance image through the integrated control viewer and notifying the occurrence of an event of a preset condition. In addition, it may be determined whether an event occurs using at least one of the first metadata and the second metadata.

또한, 상황 분석 기반의 CCTV 관제 방법은, 카메라의 동작을 제어하는 단계를 더 포함하도록 구성될 수 있다. 그리고, 제1 메타데이터에 기반하여 엣지에서 카메라의 동작이 제어하고, 제2 메타데이터에 기반하여 클라우드에 의해 카메라의 동작이 제어될 수 있다.In addition, the CCTV control method based on situation analysis may be configured to further include controlling the operation of the camera. Further, the operation of the camera at the edge may be controlled based on the first metadata, and the operation of the camera may be controlled by the cloud based on the second metadata.

본 발명에 의하면, 객체의 움직임 및 상황 변화에 기반하므로 이벤트 검출에서의 오보를 확률적으로 줄일 수 있다.According to the present invention, since it is based on the movement of the object and the change in the situation, it is possible to probabilistically reduce the false information in event detection.

본 발명에 의하면, 하나의 이벤트 검출 알고리즘이 범죄 예방용 CCTV와 교통 관제용 CCTV에 모두 적용될 수 있다.According to the present invention, one event detection algorithm can be applied to both CCTV for crime prevention and CCTV for traffic control.

본 발명에 의하면, 인공지능 모델의 에지 및 클라우드에서의 전이학습을 통해 CCTV의 관제 지능이 점차 향상될 수 있다.According to the present invention, the control intelligence of CCTV can be gradually improved through transfer learning at the edge of the artificial intelligence model and in the cloud.

도 1은 종래 기술에 따른 CCTV 관제 시스템의 블록도이다.
도 2는 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 시스템이 연결된 네트워크 환경의 예시도이다.
도 3은 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 시스템의 블록도이다.
도 4는 본 발명의 일 실시 예에 따른 영상분석 장치의 블록도이다.
도 5는 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 시스템의 상세한 블록도이다.
도 6은 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 방법의 흐름도이다.
도 7은 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 방법의 흐름도이다.
도 8은 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 방법의 흐름도이다.
1 is a block diagram of a CCTV control system according to the prior art.
2 is an exemplary diagram of a network environment connected to a CCTV control system based on situation analysis according to an embodiment of the present invention.
3 is a block diagram of a CCTV control system based on situation analysis according to an embodiment of the present invention.
4 is a block diagram of an image analysis apparatus according to an embodiment of the present invention.
5 is a detailed block diagram of a CCTV control system based on situation analysis according to an embodiment of the present invention.
6 is a flowchart of a CCTV control method based on situation analysis according to an embodiment of the present invention.
7 is a flowchart of a CCTV control method based on situation analysis according to an embodiment of the present invention.
8 is a flowchart of a CCTV control method based on situation analysis according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.Hereinafter, exemplary embodiments disclosed in the present specification will be described in detail with reference to the accompanying drawings, but identical or similar elements are denoted by the same reference numerals regardless of reference numerals, and redundant descriptions thereof will be omitted. The suffixes "module" and "unit" for components used in the following description are given or used interchangeably in consideration of only the ease of preparation of the specification, and do not have meanings or roles that are distinguished from each other by themselves. In addition, in describing the embodiments disclosed in the present specification, when it is determined that a detailed description of related known technologies may obscure the subject matter of the embodiments disclosed in the present specification, the detailed description thereof will be omitted. In addition, the accompanying drawings are for easy understanding of the embodiments disclosed in the present specification, and the technical idea disclosed in the present specification is not limited by the accompanying drawings, and all modifications included in the spirit and scope of the present invention It should be understood to include equivalents or substitutes.

제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.Terms including ordinal numbers, such as first and second, may be used to describe various elements, but the elements are not limited by the terms. These terms are used only for the purpose of distinguishing one component from another component.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.When a component is referred to as being "connected" or "connected" to another component, it is understood that it may be directly connected or connected to the other component, but other components may exist in the middle. Should be. On the other hand, when a component is referred to as being "directly connected" or "directly connected" to another component, it should be understood that there is no other component in the middle.

도 1은 종래 기술에 따른 CCTV 관제 시스템의 블록도이다.1 is a block diagram of a CCTV control system according to the prior art.

도 1을 참조하면, 서버 기반의 영상분석 방법을 수행하는 영상 분석 서버가 도시되어 있다. 영상 분석(Video Analysis) 서버는 n개의 카메라에서 전송되는 비디오 스트림을 처리하고, n개 채널의 비디오 스트림 중에서 이벤트와 관련된 비디오 스트림이 통합 관제 서버(Video Management Server)를 통해 집중적으로 보여지고, 알람이 동작된다. 영상 분석 서버가 수행하는 객체 감지 기술은 머신 러닝에 기초하여, 학습된 행동 패턴을 기반으로 감시, 위험 상황 혹은 특이 사항 등을 인지하고 추출할 수 있다.Referring to FIG. 1, an image analysis server performing a server-based image analysis method is illustrated. The video analysis server processes video streams transmitted from n cameras, and among the video streams of n channels, video streams related to events are intensively displayed through the video management server, and alarms are displayed. It works. The object detection technology performed by the video analysis server is based on machine learning, and can recognize and extract monitoring, dangerous situations, or unusual matters based on learned behavior patterns.

서버 기반의 영상분석 방법은 카메라로부터 영상을 전송 받아서 지능형 영상분석을 수행하는 집중형 구조로써 카메라에 대한 의존성이 없기 때문에 기존 시스템에 적용하기 용이하지만, 서버 한대가 처리할 수 있는 카메라 수가 제한적이기 때문에 확장성에 문제가 있다.Server-based video analysis method is a centralized structure that performs intelligent video analysis by receiving video from a camera, and it is easy to apply to existing systems because it does not depend on cameras, but because the number of cameras that can be processed by one server is limited. There is a problem with scalability.

그리고 서버 기반의 영상분석의 문제점은 학습패턴과 동일 또는 유사한 상황이나 대상에 대해 인지하고 추출하는 경우가 아닌 예상 밖의 상황의 변화와 연관된 객체 변화 등의 발생을 인식하고 대상 추출에 과도한 이벤트가 발생하거나 오탐률이 높아지는 것이다.And the problem of server-based image analysis is that it is not the case of recognizing and extracting the same or similar situation or object as the learning pattern, but recognizing the occurrence of object change related to the change of unexpected situation, and excessive events occurring in object extraction. The false positive rate increases.

또한 영상 분석 서버가 다수의 채널에서 송신되는 영상 정보를 분석하고 처리하므로 과도한 영상 데이터의 전송 및 처리로 인한 네트워크 및 시스템의 부하 문제도 발생할 수 있다.In addition, since the video analysis server analyzes and processes video information transmitted through a plurality of channels, a network and system load problem may occur due to excessive video data transmission and processing.

서버 기반의 영상분석 방법 외에 에지 기반의 영상분석 방법은 카메라 또는 카메라와 연결된 영상 인코더에서 영상을 분석하는 방법으로 영상을 전송하기 위해서 압축하는 과정에서 발생하는 신호의 왜곡 없이 영상을 분석할 수 있다는 장점이 있다.In addition to the server-based image analysis method, the edge-based image analysis method is a method that analyzes the image in a camera or an image encoder connected to the camera, and has the advantage of analyzing the image without distortion of the signal that occurs during the compression process to transmit the image. There is this.

그러나 임베디드 장비의 연산 능력이 제한되기 때문에 복잡도가 높은 영상분석 기법을 적용할 수 없고 추후 기능 업그레이드가 어려운 문제점이 있다.However, since the computing power of the embedded device is limited, there is a problem that the image analysis technique with high complexity cannot be applied and it is difficult to upgrade the function later.

본 발명의 일 실시 예에 따른 상황 기반의 CCTV 관제 방법 및 이를 이용하는 관제 시스템(100)은 에지 기반의 영상분석과 서버 기반의 영상분석을 모두 포함하는 하이브리드 영상분석 방법에 기반하는 것을 특징으로 한다. 즉 상황 기반의 CCTV 관제 방법은, 높은 네트워크 대역폭 사용율, 서버당 처리할 수 있는 채널의 수 문제, 에지 기반의 방법의 디바이스 연산 능력으로 고수준 영상분석 기법의 적용 제한 등의 문제점을 해결하기 위하여 두 방법의 장점을 결합한 하이브리드 기반의 방법에 해당한다.The situation-based CCTV control method and the control system 100 using the same according to an embodiment of the present invention are characterized by a hybrid image analysis method including both edge-based image analysis and server-based image analysis. That is, the situation-based CCTV control method is two methods to solve problems such as high network bandwidth usage, the number of channels that can be processed per server, and the limitation of application of high-level video analysis techniques with the device operation capability of the edge-based method. It corresponds to a hybrid-based method that combines the advantages of.

상황 기반의 CCTV 관제 시스템(100)은 영상분석에 있어서 에지에서 객체의 움직임을 감지하고, 객체의 움직임에 기반하여 상황 변화를 감지하고, 객체의 움직임과 상황 변화에 기반하여 이벤트의 발생 여부를 판단할 수 있다.Context-based CCTV control system 100 detects the movement of an object at the edge in image analysis, detects a situation change based on the movement of the object, and determines whether an event occurs based on the movement of the object and the change of the situation. can do.

도 2는 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 시스템이 연결된 네트워크 환경의 예시도이다.2 is an exemplary diagram of a network environment connected to a CCTV control system based on situation analysis according to an embodiment of the present invention.

도 2를 참조하면, 상황 분석 기반의 CCTV 관제 시스템(100)은 카메라(110), 제1 영상분석 장치(120), 제2 영상분석 장치(130) 및 통합 관제 서버(150)를 포함하도록 구성될 수 있다.Referring to FIG. 2, the CCTV control system 100 based on situation analysis is configured to include a camera 110, a first video analysis device 120, a second video analysis device 130, and an integrated control server 150. Can be.

카메라(110)는 CCTV 관제 시스템(100)의 여러 가지 용도에 따라 다양한 장소에 설치될 수 있다. 예를 들어 카메라(100)는 교통데이터 수집, 통과차량 카운팅, 차량의 진행방향 확인, 차량의 비정상적인 정차 감지를 위해 교차로에 설치되거나, 특정지역의 주의상황 감지, 특정지역의 침입자 감지, 근거리 화재 또는 연기감지, 게이트로의 출입자 탐지, 배회자 추적을 위해 사유 또는 공공 건조물이나 거리에 설치되거나, 폭력 감지, 어린이 추돌사고, 횡단보도 안전사고의 감지를 위해 학교 시설물이나 어린이 보호구역에 설치될 수 있다.The camera 110 may be installed in various places according to various uses of the CCTV control system 100. For example, the camera 100 may be installed at an intersection to collect traffic data, count passing vehicles, check the direction of the vehicle, and detect abnormal stops of the vehicle, or detect a caution situation in a specific area, detect an intruder in a specific area, or It may be installed on private or public buildings or streets for smoke detection, entrance to gate detection, and roaming tracking, or in school facilities or child protection zones to detect violence, child collision, and crosswalk safety accidents. .

카메라(110)는 네트워크 상에서 IP 주소가 부여되지 않은 카메라 및 IP 주소가 부여된 IP 카메라 중에서 적어도 하나의 종류를 포함하도록 구성될 수 있다. IP 주소가 부여되지 않은 카메라는 IP 주소가 부여된 영상 인코딩 장치와 연결될 수 있다. 따라서 IP 카메라 또는 영상 인코딩 장치는 인코딩된 비디오 스트리밍을 제1 영상분석 장치(120) 및 제2 영상분석(130)에 전송할 수 있다.The camera 110 may be configured to include at least one type of a camera to which an IP address has not been assigned and an IP camera to which an IP address has been assigned on a network. A camera to which an IP address is not assigned may be connected to a video encoding device to which an IP address is assigned. Accordingly, the IP camera or the image encoding device may transmit the encoded video streaming to the first image analysis device 120 and the second image analysis device 130.

제1 영상분석 장치(120)는 객체의 움직임에 기초하여 영상을 분석할 수 있다. 반면 제2 영상분석 장치(120)는 상황 변화에 기초하여 영상을 분석할 수 있다. 여기서 제1 영상분석 장치(120)는 임베디드 시스템 형태로 카메라(110)에 포함되도록 구성될 수 있다. 이벤트의 발생을 감지하기 위해 제1 영상분석 장치(120)는 이벤트 발생과 관련된 객체의 움직임을 판단하는데 필요한 제1 영상분석을 수행하고, 제2 영상분석 장치(130)는 이벤트 발생과 관련된 상황 변화를 판단하는데 필요한 영상분석을 수행할 수 있다.The first image analysis device 120 may analyze an image based on the motion of the object. On the other hand, the second image analysis device 120 may analyze an image based on a change in situation. Here, the first image analysis device 120 may be configured to be included in the camera 110 in the form of an embedded system. In order to detect the occurrence of an event, the first image analysis device 120 performs a first image analysis necessary to determine the movement of an object related to the occurrence of the event, and the second image analysis device 130 performs a situation change related to the event occurrence. Image analysis necessary to determine

또한, 제1 영상분석 장치(120)와 제2 영상분석 장치(130)는 인공지능 모델, 예를 들어 인공지능 모델로서 인공 신경망을 저장하고 있어서 이를 이용하여 영상을 분석할 수 있는데, 각각의 장치가 이용하는 인공지능 모델은 객체의 움직임 파악에 중점을 둔 학습과 상황의 변화에 중점을 둔 학습에 의해 각각 따로 훈련되는 것을 특징으로 한다. 여기서, 제2 영상분석 장치(130)는 제1 영상분석 장치(120)의 영상분석 결과물인 제1 메타데이터를 이용하여 제2 메타데이터를 생성할 수 있다.In addition, the first image analysis device 120 and the second image analysis device 130 store an artificial neural network as an artificial intelligence model, for example, an artificial intelligence model, so that an image can be analyzed using the artificial intelligence model. The artificial intelligence model used by is characterized by being trained separately by learning focusing on the movement of objects and learning focusing on changes in the situation. Here, the second image analysis device 130 may generate the second metadata by using the first metadata that is the result of image analysis by the first image analysis device 120.

제2 영상분석 장치(130)는 제1 메타데이터와 제2 메타데이터를 이용하여 객체의 움직임이 이벤트의 발생으로 연결되는지 최종적인 판단을 한다.The second image analysis apparatus 130 finally determines whether the movement of the object is connected to the occurrence of an event by using the first metadata and the second metadata.

통합 관제 서버(150)는 이벤트 발생의 알람을 표시하고, 해당 영상을 통합 관제 뷰어(160)를 통해 표시할 수 있다. 그 밖에 수신한 제2 메타데이터를 이용하여 카메라(110)의 동작을 제어할 수 있다. 또한, 통합 관제 서버(150)는 영상분석에 필요한 각종 설정을 제1 영상분석 장치(120)와 제2 영상분석 장치(130)에 저장할 수 있다.The integrated control server 150 may display an alarm of occurrence of an event, and display a corresponding image through the integrated control viewer 160. In addition, the operation of the camera 110 may be controlled using the received second metadata. In addition, the integrated control server 150 may store various settings required for image analysis in the first image analysis device 120 and the second image analysis device 130.

상환 분석 기반의 CCTV 시스템(100)은 그 밖에 통합 관제 뷰어(160), 영상 저장장치(NVR)(170), 메타데이터 저장장치(180) 등을 추가적으로 포함하도록 구성될 수 있다. 즉 통합 관제 뷰어(160)는 통합 관제 서버(150)에 직접 연결되거나 별도의 서버로 구성될 수 있고, 비디오 스트리밍은 네트워크 비디오 레코더(Network Video Recorder)에 해당하는 NVR(170)에 저장될 수 있고, 그리고 제1 영상분석 장치(120)가 생성하는 제1 메타데이터와 제2 영상분석 장치(130)가 생성하는 제2 메타데이터는 별도의 메타데이터 저장장치(180)에 저장될 수 있다.The CCTV system 100 based on reimbursement analysis may be configured to additionally include an integrated control viewer 160, an image storage device (NVR) 170, a metadata storage device 180, and the like. That is, the integrated control viewer 160 may be directly connected to the integrated control server 150 or configured as a separate server, and the video streaming may be stored in the NVR 170 corresponding to a network video recorder. And, the first metadata generated by the first image analysis apparatus 120 and the second metadata generated by the second image analysis apparatus 130 may be stored in a separate metadata storage device 180.

카메라(110)는 PTZ 카메라와 관련이 있으며 회전 변화, 기울기 변화 및 확대 변화를 위한 동작이 제어될 수 있다. 제1 영상분석 장치(120)는 에지 영역에서 카메라(110)에 연결되어 객체 움직임에 중점을 둔 영상분석의 결과물인 제1 메타데이터를 이용하여 카메라(110)의 동작을 직접 제어할 수 있다. 반면에 통합 관제 서버(150)는 상황 변화에 중점을 둔 영상분석의 결과물인 제2 메타데이터를 이용하여 카메라(110)의 동작을 제어할 수 있다. 그 밖에 카메라(110)는 통합 관제 뷰어(160)의 도움으로 관리자에 의해 직접 제어될 수 있다.The camera 110 is related to a PTZ camera, and operations for rotation change, tilt change, and magnification change may be controlled. The first image analysis apparatus 120 may be connected to the camera 110 in the edge region and directly control the operation of the camera 110 using first metadata, which is a result of image analysis focusing on object movement. On the other hand, the integrated control server 150 may control the operation of the camera 110 by using the second metadata that is a result of image analysis focusing on a change in situation. In addition, the camera 110 may be directly controlled by an administrator with the help of the integrated control viewer 160.

네트워크(190)는 유선 및 무선 네트워크, 예를 들어 LAN(local area network), WAN(wide area network), 인터넷(internet), 인트라넷(intranet) 및 엑스트라넷(extranet), 그리고 모바일 네트워크, 예를 들어 셀룰러, 3G, LTE, 5G, WiFi 네트워크, 애드혹 네트워크 및 이들의 조합을 비롯한 임의의 적절한 통신 네트워크 일 수 있다.The network 190 is a wired and wireless network, for example, a local area network (LAN), a wide area network (WAN), an Internet, an intranet and an extranet, and a mobile network, for example. It may be any suitable communication network including cellular, 3G, LTE, 5G, WiFi networks, ad hoc networks, and combinations thereof.

네트워크(190)는 허브, 브리지, 라우터, 스위치 및 게이트웨이와 같은 네트워크 요소들의 연결을 포함할 수 있다. 네트워크(190)는 인터넷과 같은 공용 네트워크 및 안전한 기업 사설 네트워크와 같은 사설 네트워크를 비롯한 하나 이상의 연결된 네트워크들, 예컨대 다중 네트워크 환경을 포함할 수 있다. 네트워크(190)에의 액세스는 하나 이상의 유선 또는 무선 액세스 네트워크들을 통해 제공될 수 있다.Network 190 may include a connection of network elements such as hubs, bridges, routers, switches and gateways. Network 190 may include one or more connected networks, such as a multi-network environment, including a public network such as the Internet and a private network such as a secure corporate private network. Access to network 190 may be provided through one or more wired or wireless access networks.

도 3은 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 시스템의 블록도이다.3 is a block diagram of a CCTV control system based on situation analysis according to an embodiment of the present invention.

도 3을 참조하면, 상황 분석 기반의 CCTV 관제 시스템(100)을 구성하는 카메라, 에지 지능형 영상분석 장치(120), 상황기반 영상분석 장치(130), 통합 관제 서버(150), 통합 관제 뷰어(160), 영상 저장장치(170), 및 메타데이터 저장장치(180)가 도시되어 있다. 여기서 제1차 영상분석 장치는 에지 지능형 영상분석 장치로, 제2차 영상분석 장치는 상황기반 영상분석 장치로 지칭될 수 있다.3, a camera constituting a CCTV control system 100 based on situation analysis, an edge intelligent video analysis device 120, a situation-based video analysis device 130, an integrated control server 150, an integrated control viewer ( 160), an image storage device 170, and a metadata storage device 180 are shown. Here, the first image analysis device may be referred to as an edge intelligent image analysis device, and the second image analysis device may be referred to as a context-based image analysis device.

n개의 카메라(110)를 통해 영상이 수집되고, 수집된 영상과 카메라정보는 에지 지능형 영상분석 장치(120)와 상황기반 영상분석 장치(130)로 전송될 수 있다. 에지 지능형 영상분석 장치(120)는 객체의 움직임에 중점을 둔 영상분석을 통해 제1 메타데이터를 추출하고, 제1 메타데이터에 포함된 제어정보는 카메라(110)에 전송될 수 있다.Images are collected through the n cameras 110, and the collected images and camera information may be transmitted to the edge intelligent image analysis device 120 and the context-based image analysis device 130. The edge intelligent image analysis apparatus 120 may extract first metadata through image analysis focusing on the movement of an object, and control information included in the first metadata may be transmitted to the camera 110.

에지 지능형 영상분석 장치(120)는 영상분석 설정에 따라 카메라(110)로부터 수신한 영상을 객체의 움직임 판단에 중점을 두면서 분석한다. 제1 분석을 통해 객체의 움직임과 관련된 시간, 카메라, 위치 및 객체의 색상에 관한 정보를 포함하는 제1 메타데이터가 상황기반 영상분석 장치(130)에 전송될 수 있다.The edge intelligent image analysis device 120 analyzes the image received from the camera 110 according to the image analysis setting, focusing on determining the motion of the object. Through the first analysis, first metadata including information on time, camera, location, and color of the object related to the movement of the object may be transmitted to the context-based image analysis apparatus 130.

상황기반 영상분석 장치(130)는 수신한 제1 메타데이터를 이용하면서, 상황 변화 판단에 중점을 둔 제2 영상분석을 통해 제2 메타데이터를 생성할 수 있다. 제2 메타데이터는 움직인 객체의 정체, 인식된 배경의 종류, 객체의 배경에 대한 움직임에 따른 장면 구성 및 인식, 그리고 상황 추론 및 분석에 따른 상황 변화에 관한 정보를 포함할 수 있다.The context-based image analysis apparatus 130 may generate second metadata through a second image analysis focusing on determining a situation change while using the received first metadata. The second metadata may include information on the identity of the moved object, the type of the recognized background, the composition and recognition of the scene according to the movement of the object background, and the situation change according to the situation inference and analysis.

제1 메타데이터와 제2 메타데이터는 별도의 메타데이터 저장장치(180)에 저장되어 통합 관제 서버(150)에 의해 관리될 수 있다.The first metadata and the second metadata may be stored in a separate metadata storage device 180 and managed by the integrated control server 150.

통합 관제 서버(150)는 영상분석의 결과 즉 이벤트 발생에 관한 정보를 이용하여 알람을 표시하고 해당 영상의 이벤트 발생을 북마크 할 수 있다. 또한, 통합 관제 서버(150)는 상황기반 영상분석 장치(130)로부터 수신한 영상을 별도의 영상 저장장치(170)에 저장하고 이를 관리할 수 있다.The integrated control server 150 may display an alarm using the result of image analysis, that is, information on event occurrence, and bookmark the event occurrence of the corresponding image. In addition, the integrated control server 150 may store the image received from the context-based image analysis device 130 in a separate image storage device 170 and manage it.

또한, 통합 관제 서버(150)는 통합 관제 뷰어(160)를 통해 영상분석 정보와 함께 해당 영상을 표시할 수 있다. 그 밖에 통합 관제 서버(150)는 영상분석에 필요한 환경 설정을 에지 지능형 영상분석 장치(120) 및 상황기반 영상분석 장치(130)에 저장할 수 있다.In addition, the integrated control server 150 may display a corresponding image together with image analysis information through the integrated control viewer 160. In addition, the integrated control server 150 may store environment settings required for image analysis in the edge intelligent image analysis device 120 and the context-based image analysis device 130.

상황 분석 기반의 CCTV 관제 시스템(100)은 객체의 움직임 탐지에 중점을 둔 영상분석과 상황의 변화 탐지에 중점을 둔 영상분석이 서로 다른 영상분석 장치에 의해 수행된다는 특징을 가지며, 그 밖의 영상의 저장, 메타데이터의 저장, 및 영상의 디스플레이 기능은 컴퓨터에 해당하는 하나 이상의 서버에 의해 수행될 수 있다.The CCTV control system 100 based on situation analysis has a feature that image analysis focusing on object motion detection and image analysis focusing on detection of changes in the situation are performed by different video analysis devices. Storage, metadata storage, and image display functions may be performed by one or more servers corresponding to a computer.

제1 영상분석 장치(120), 제2 영상분석 장치(130) 및 통합 관제 서버(150)도 컴퓨터 형태로 구현될 수 있다. 이하 여러 장치들을 대표하여 컴퓨터로 구현될 수 있는 제2 영상분석 장치에 대해 설명하기로 한다.The first image analysis device 120, the second image analysis device 130, and the integrated control server 150 may also be implemented in a computer form. Hereinafter, a description will be given of a second image analysis device that can be implemented as a computer representing various devices.

도 4는 본 발명의 일 실시 예에 따른 영상분석 장치의 블록도이다.4 is a block diagram of an image analysis apparatus according to an embodiment of the present invention.

도 4를 참조하면, 제2 영상분석 장치(130)는 프로세서(131), 메모리(138), 입력 디바이스(139), 디스플레이 디바이스(140), 데이터 버스(141), 송수신기(142) 및 저장 디바이스(143)를 포함하도록 구성될 수 있다.4, the second image analysis apparatus 130 includes a processor 131, a memory 138, an input device 139, a display device 140, a data bus 141, a transceiver 142, and a storage device. It can be configured to include (143).

프로세서(131)는 메모리에(138)에 저장된 프로그램 모듈을 실행할 수 있다. 프로그램 모듈의 실행을 통해 프로그램 모듈에 포함된 각종 명령어 셋과 관련된 명령이 수행되고 그 결과로서 본 발명의 일 실시 예에 따른 상황 기반의 CCTV 관제 방법을 이루는 단계가 제2 영상분석 장치(130)에 의해 수행될 수 있다.The processor 131 may execute a program module stored in the memory 138. Through the execution of the program module, commands related to various instruction sets included in the program module are executed, and as a result, the step of forming a context-based CCTV control method according to an embodiment of the present invention is performed by the second image analysis device 130. Can be done by

송수신기(142)는 카메라(110)를 통해 수집된 영상을 수신하고, 이 영상을 통합 관제 서버(150)에 전송할 수 있다. 또한, 송수신기(142)는 프로세서(131)에 의해 생성된 제2 메타데이터를 통합 관제 서버(150)에 전송할 수 있다. 송수신기(142)는 이더넷과 같은 네트워크 통신카드 형태로 구현될 수 있다.The transceiver 142 may receive an image collected through the camera 110 and transmit the image to the integrated control server 150. In addition, the transceiver 142 may transmit the second metadata generated by the processor 131 to the integrated control server 150. The transceiver 142 may be implemented in the form of a network communication card such as Ethernet.

제2 영상분석 장치(130)의 영상분석에 필요한 각종 데이터는 데이터 버스(142)를 통해 그 내부의 각종 구성장치 간에 전송될 수 있다.Various data required for image analysis by the second image analysis device 130 may be transmitted between various components therein through the data bus 142.

이하 컴퓨터로 구현될 수 있는 에지 지능형 영상분석 장치(120) 및 상황기반 영상분석 장치(130)가 프로세서와 메모리를 통해 수행하는 알고리즘에 대해 자세히 설명하기로 한다.Hereinafter, an algorithm performed by the edge intelligent image analysis device 120 and the context-based image analysis device 130 that can be implemented as a computer through a processor and a memory will be described in detail.

도 5는 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 시스템의 상세한 블록도이다.5 is a detailed block diagram of a CCTV control system based on situation analysis according to an embodiment of the present invention.

도 5를 참조하면, 에지 지능형 영상분석 장치(120), 상황기반 영상분석 장치(130), 및 통합 관제 서버(150)의 각 프로세서(121, 131, 151)와 메모리에 저장된 각종 프로그램 모듈이 수행하는 CCTV 관제 방법이 도시되어 있다.Referring to FIG. 5, the edge intelligent image analysis device 120, the context-based image analysis device 130, and each processor 121, 131, 151 of the integrated control server 150 and various program modules stored in the memory are executed. The CCTV control method is shown.

에지 지능형 영상분석 장치(120)는, 카메라(110)로부터 영상 및 카메라정보를 수신하고, 카메라제어정보를 카메라(110)에 전송할 수 있다. 프로세서(121)는 일단 지능형 영상분석 장치(120)는, 제1 영상분석과 관련하여 환경을 설정할 수 있다. 다음으로 프로세서(121)는 해당 프로그램 모듈의 제어를 통해 객체를 추출할 수 있다(122). 다음으로 프로세서(121)는 해당 프로그램 모듈의 제어를 통해 영상과 학습패턴을 매칭할 수 있다(123). 다음으로 프로세서(121)는 해당 프로그램 모듈의 제어를 통해 메타데이터를 추출할 수 있다(124). 에지 지능형 영상분석 장치(120)의 프로세서(121)에 의해 추출된 메타데이터는 제1 메타데이터로 지칭될 수 있다. 제1차 메타데이터는 상황기반 영상분석 장치(130)로 전송될 수 있다.The edge intelligent image analysis device 120 may receive an image and camera information from the camera 110 and transmit camera control information to the camera 110. The processor 121 may set an environment in relation to the first image analysis, once the intelligent image analysis device 120. Next, the processor 121 may extract the object through the control of the corresponding program module (122). Next, the processor 121 may match the image and the learning pattern through the control of the corresponding program module (123). Next, the processor 121 may extract metadata through the control of the corresponding program module (124). The metadata extracted by the processor 121 of the edge intelligent image analysis device 120 may be referred to as first metadata. The first metadata may be transmitted to the context-based image analysis device 130.

제1 메타데이터는 영상에서 발생하는 객체의 움직임에 관한 정보를 포함할 수 있다. 예를 들어 제1차 메타데이터는 객체의 출현 위치, 객체의 움직임 시간, 객체의 크기, 및 객체의 색상에 관한 정보를 포함할 수 있다.The first metadata may include information on movement of an object occurring in an image. For example, the first metadata may include information on the appearance position of the object, the movement time of the object, the size of the object, and the color of the object.

상황기반 영상분석 장치(130)는 카메라(110)로부터 직접 영상 및 카메라정보를 수신할 수 있다. 또한 상황기반 영상분석 장치(130)는 제1 메타데이터와 함께 영상을 에지 지능형 영상분석 장치(120)로부터 수신할 수도 있다.The context-based image analysis device 130 may directly receive an image and camera information from the camera 110. In addition, the context-based image analysis device 130 may receive an image together with the first metadata from the edge intelligent image analysis device 120.

통합 관제 서버(150)는 상황기반 영상분석 장치(130)에 의한 영상분석 결과를 이용하여 이벤트 발생의 알람과 확인이 필요한 영상을 알림을 표시할 수 있다. 통합 관제 서버(150)는 제2 메타데이터를 수신할 수 있고, 카메라(110)의 동작을 제어하는 제2 메타데이터에 포함된 카메라제어정보를 카메라(110)로 송신할 수 있다.The integrated control server 150 may display an alarm of occurrence of an event and a notification of an image requiring confirmation by using the image analysis result by the context-based image analysis device 130. The integrated control server 150 may receive the second metadata and transmit camera control information included in the second metadata for controlling the operation of the camera 110 to the camera 110.

도 6은 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 방법의 흐름도이다.도 6을 참조하면, 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 시스템(100)은, 객체의 움직임을 판단하는 모델과 상황 변화를 판단하는 모델을 구성하는 단계(S110), 감시 영상을 수신하는 단계(S120), 객체의 움직임 판단에 중점을 둔 제1차 영상분석의 결과로서 제1 메타데이터를 생성하는 단계(S130), 상황 변화 판단에 중점을 둔 제2차 영상분석의 결과로서 제2 메타데이터를 생성하는 단계(S140), 및 감시 영상을 디스플레이하고, 제1 메타데이터 및 제2 메타데이터 기반으로 이벤트의 발생을 알리는 단계(S150)를 포함하도록 구성될 수 있다.6 is a flowchart of a CCTV control method based on situation analysis according to an embodiment of the present invention. Referring to FIG. 6, a CCTV control system based on situation analysis according to an embodiment of the present invention 100 The first metadata as a result of the first image analysis focusing on determining the motion of the object, the step of constructing a model for determining the motion and a model for determining the situation change (S110), receiving a surveillance image (S120), and Generating (S130), generating second metadata as a result of the second image analysis focusing on determining the situation change (S140), and displaying the surveillance image, and displaying the first metadata and the second metadata. It may be configured to include a step (S150) of notifying the occurrence of an event based on data.

본 발명의 일 실시 예에 따르면 객체의 움직임을 판단하는 모델과 상황 변화를 판단하는 모델을 구분하여 각 모델이 따로 구성될 수 있다(S110). 여기서 객체의 움직임을 판단하는 모델은 그 기능의 특성상 에지에 연결된 제1 영상분석 장치(120)에 의해 구동될 수 있다. 특히 제1 영상분석 장치(120)는 각 카메라(110) 내부에 임베디드 시스템 형태로 구현될 수도 있다. 그리고 상황 변화를 판단하는 모델은 그 기능의 특성상 클라우드에 연결된 제2 영상분석 장치(130)에 이해 구동될 수 있다.According to an embodiment of the present invention, each model may be separately configured by dividing a model for determining the movement of an object and a model for determining a situation change (S110). Here, the model for determining the motion of the object may be driven by the first image analysis device 120 connected to the edge due to the characteristic of the function. In particular, the first image analysis device 120 may be implemented in the form of an embedded system inside each camera 110. In addition, the model for determining the change of the situation may be driven by understanding the second image analysis device 130 connected to the cloud due to the characteristic of the function.

감시 영상은 선별된 위치에 설치된 카메라(110)에 의해 수집될 수 있다. 감시 영상은 제1 영상분석 장치(120)와 제2 영상분석 장치(130)가 수행하는 영상분석의 대상이자, 제1 영상분석 장치(120)와 제2 영상분석 장치(130)에 각각 저장되어 구동되는 객체의 움직임 판단 모델과 상황의 변화 판단 모델의 훈련하는 필요한 학습 데이터로도 이용될 수 있다. 감시 영상을 훈련 데이터 셋으로 이용하는 학습방법에 대해서는 후술하기로 한다.The surveillance image may be collected by the camera 110 installed at the selected location. The surveillance image is an object of image analysis performed by the first image analysis device 120 and the second image analysis device 130, and is stored in the first image analysis device 120 and the second image analysis device 130, respectively. It can also be used as necessary training data for training a motion determination model of a driven object and a situation change determination model. A learning method using a surveillance image as a training data set will be described later.

본 발명의 일 실시 예에 따르면 영상분석은 2단계를 통해 서로 다른 장치에 의해 각각 수행될 수 있다. 그리고 각각의 영상분석 단계는 순서에 관계없이 동시에 수행될 수 있다. 제1 영상분석은 객체의 움직임 판단에 중점을 둔 영상분석이고, 제2 영상분석은 상황의 변화 판단에 중점을 둔 영상분석에 해당한다. 제1 영상분석을 통해 제1 메타데이터가 생성되고(S130), 제2 영상분석을 통해 제2 메타데이터가 생성될 수 있다(S140).According to an embodiment of the present invention, image analysis may be performed by different devices through two steps. And, each image analysis step can be performed simultaneously regardless of the order. The first image analysis is an image analysis focusing on determining the motion of an object, and the second image analysis is an image analysis focusing on determining a change in a situation. First metadata may be generated through the first image analysis (S130), and second metadata may be generated through the second image analysis (S140).

제1 메타데이터는 감시 영상에서 감지된 객체의 움직임에 관한 정보를 포함할 수 있다. 예를 들어 제1 메타데이터는 객체의 출현, 출현 시간, 출현 위치, 카메라 및 객체의 색상에 관한 정보를 포함할 수 있다. 그리고 제2 메타데이터는 감시 영상에서 감지된 상환의 변화에 관한 정보를 포함할 수 있다. 예를 들어 제2 메타데이터는 인식된 객체의 정체, 추출된 배경의 종류, 추출된 배경에 대해 인식된 객체의 행위분석에 의한 장면 구성 및 인식, 그리고 이를 이용한 상환 추론 및 분석에 따른 상환 변화에 관한 정보를 포함할 수 있다. 구체적인 예를 들면 제2 영상분석 장치(130)는 객체의 움직임 정보에 기초하여 객체가 사람임을 인식하고, 배경 중에서 어린이보호 구역을 알리는 표지를 문자인식을 통해 인식하고, 객체의 행위분석에 따라 어린이보호 구역에서의 객체에 해당하는 사람과 차량에 의한 충돌로 인한 상황 변화를 인식할 수 있다.The first metadata may include information on motion of an object detected in the surveillance image. For example, the first metadata may include information on the appearance of an object, an appearance time, an appearance position, a camera, and a color of the object. In addition, the second metadata may include information on a change in redemption detected in the surveillance image. For example, the second metadata is used to determine the identity of the recognized object, the type of the extracted background, the scene composition and recognition by the behavior analysis of the recognized object against the extracted background, and the repayment change according to the reimbursement reasoning and analysis. May include information about. For a specific example, the second image analysis device 130 recognizes that the object is a person based on the motion information of the object, recognizes a sign indicating a child protection zone in the background through character recognition, and analyzes the behavior of the object. Changes in the situation due to collision between a vehicle and a person corresponding to an object in the protected area can be recognized.

영상분석의 결과로 생성된 제1 메타데이터와 제2 메타데이터의 조합을 통해, 즉 객체의 움직임과 상황 변화의 종합적 판단을 통해 이벤트의 발생 여부가 판단되고, 이에 대응하여 알람이 표시될 수 있다(S150).Whether or not an event has occurred is determined through a combination of the first metadata and the second metadata generated as a result of image analysis, that is, through a comprehensive determination of the movement of an object and a change in situation, and an alarm may be displayed in response thereto. (S150).

위에 서술된 상황 분석 기반의 CCTV 관제 방법(S100)은, 상황 분석 기반의 CCTV 관제 시스템(100)을 주체로 하는 관점에서 서술되었다. 그 밖에 상황 분석 기반의 CCTV 관제 방법(S100)은, 객체의 움직임을 판단하는 모델, 상황 변화를 판단하는 모델을 이용하여 분석된 영상분석 결과로서 제1 메타데이터를 수신하는 단계, 제2 메타데이터를 수신하는 단계 및 감시 영상을 디스플레이, 제1 및 제2 메타데이터 기반으로 이벤트의 발생을 알리는 단계를 포함하도록 구성될 수도 있다.The above-described situation analysis-based CCTV control method (S100) has been described in terms of the situation analysis-based CCTV control system 100 as a subject. In addition, the situation analysis-based CCTV control method (S100) includes receiving first metadata as a result of image analysis analyzed using a model for determining the movement of an object, a model for determining a change in situation, and a second metadata. It may be configured to include receiving and displaying the surveillance image, and notifying the occurrence of an event based on the first and second metadata.

도 7은 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 방법의 흐름도이다.7 is a flowchart of a CCTV control method based on situation analysis according to an embodiment of the present invention.

도 7을 참조하면, 도 6의 S130 내지 S150에 관한 상세한 단계가 도시되어 있다. S211 내지 S214 단계는 에지에서 제1 영상분석 장치에 의해 수행될 수 있다. 그리고 S310 내지 S370 단계는 클라우드에서 제2 영상분석 장치에 의해 수행될 수 있다.Referring to FIG. 7, detailed steps relating to S130 to S150 of FIG. 6 are shown. Steps S211 to S214 may be performed by the first image analysis device at the edge. In addition, steps S310 to S370 may be performed by the second image analysis device in the cloud.

통합 관제 서버(150)는 객체의 움직임이 판단된 영상, 상황 변화가 판단된 영상 및 이벤트의 발생이 판단된 영상을 통합 관제 뷰어(160)를 통해 출력할 수 있다.The integrated control server 150 may output an image in which movement of an object is determined, an image in which a situation change is determined, and an image in which an event occurs, through the integrated control viewer 160.

S364 단계에서 제1 영상분석 장치 및 제2 영상분석 장치의 영상분석에 따라 객체의 움직임, 상황의 변화 및 이벤트의 발생으로 판단된 해당 영상들은 객체의 움직임을 판단하는 모델과 상황의 변화를 판단하는 모델의 훈련 데이터로 사용될 수 있다.In step S364, according to the image analysis of the first image analysis device and the second image analysis device, the images determined to be the movement of the object, the change of the situation, and the occurrence of the event are used to determine the movement of the object and the change of the situation. It can be used as training data for the model.

S365 단계에서 객체의 움직임을 판단하는 모델과 상황의 변화를 판단하는 모델은 해당 영상을 학습하고 이를 패턴화할 수 있다.In step S365, a model for determining the movement of an object and a model for determining a change in a situation may learn a corresponding image and pattern it.

에지에 연결된 제1 영상분석 장치(120)의 메모리에 저장된 객체의 움직임을 판단하는 모델은, 에지의 특성상 업데이트가 어려울 수 있다. 그러나 본 발명의 일 실시예에 따른 제1 영상분석 장치는, 객체 움직임을 판단하는데 사용된 데이터를 훈련 데이터로 이용하여 전이 학습을 수행할 수 있다. 따라서 본 발명의 일 실시 예에 따른 객체의 움직임을 판단하는 모델은 전이학습을 통해 그 성능이 점차 향상될 수 있다. 그리고 카메라(110)를 통해 수집된 영상을 이용하는 전이학습은 제2 영상분석 장치에도 동일하게 적용될 수 있다.The model for determining the motion of the object stored in the memory of the first image analysis device 120 connected to the edge may be difficult to update due to the nature of the edge. However, the first image analysis apparatus according to an embodiment of the present invention may perform transfer learning by using data used to determine object motion as training data. Accordingly, the performance of the model for determining the motion of an object according to an embodiment of the present invention may be gradually improved through transfer learning. In addition, the transfer learning using the image collected through the camera 110 may be equally applied to the second image analysis device.

인공 지능을 구성하는 여러 학습 방법 중에서, 에지에 연결된 제1 영상분석 장치(120)에 저장된 객체의 움직임을 판단하는 인공지능 모델은, 영상에서 특징 추출과 관련하여 객체의 움직임과 관련된 특징을 스스로 추출하고 이를 이용하여 딥 러닝을 수행하도록 구성될 수 있다.Among the various learning methods constituting artificial intelligence, the artificial intelligence model that determines the motion of an object stored in the first image analysis device 120 connected to the edge automatically extracts features related to the motion of the object in relation to feature extraction from an image. And it can be configured to perform deep learning using this.

또한, 인공 지능을 구성하는 여러 학습 방법 중에서, 클라우드에 연결된 제2 영상분석 장치(130)에 저장된 상황의 변화를 판단하는 인공지능 모델은, 미리 설정된 여러 상황에 대해 상황 변화를 감지하는 학습을 수행하도록 하는 머신 러닝을 수행하도록 구성될 수 있다.In addition, among the various learning methods constituting artificial intelligence, the artificial intelligence model that determines the change of the situation stored in the second image analysis device 130 connected to the cloud performs learning to detect the change of the situation for various preset situations. It can be configured to perform machine learning to make it happen.

인공 지능(artificial intelligence, AI)은 인간의 지능으로 할 수 있는 사고, 학습, 자기계발 등을 컴퓨터가 할 수 있도록 하는 방법을 연구하는 컴퓨터 공학 및 정보기술의 한 분야로, 컴퓨터가 인간의 지능적인 행동을 모방할 수 있도록 하는 것을 의미한다. Artificial intelligence (AI) is a branch of computer science and information technology that studies how computers can do the thinking, learning, and self-development that human intelligence can do. It means being able to imitate behavior.

또한, 인공 지능은 그 자체로 존재하는 것이 아니라, 컴퓨터 과학의 다른 분야와 직간접으로 많은 관련을 맺고 있다. 특히 현대에는 정보기술의 여러 분야에서 인공지능적 요소를 도입하여, 그 분야의 문제 풀이에 활용하려는 시도가 매우 활발하게 이루어지고 있다.In addition, artificial intelligence does not exist by itself, but is directly or indirectly related to other fields of computer science. In particular, in modern times, attempts are being made very actively to introduce artificial intelligence elements in various fields of information technology and to use them in solving problems in that field.

머신 러닝(machine learning)은 인공지능의 한 분야로, 컴퓨터에 명시적인 프로그램 없이 배울 수 있는 능력을 부여하는 연구 분야이다.Machine learning is a branch of artificial intelligence, a field of research that gives computers the ability to learn without explicit programming.

구체적으로 머신 러닝은, 경험적 데이터를 기반으로 학습을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 연구하고 구축하는 기술이라 할 수 있다. 머신 러닝의 알고리즘들은 엄격하게 정해진 정적인 프로그램 명령들을 수행하는 것이라기보다, 입력 데이터를 기반으로 예측이나 결정을 이끌어내기 위해 특정한 모델을 구축하는 방식을 취한다.Specifically, machine learning can be said to be a technology that studies and builds a system that learns based on empirical data, performs prediction, and improves its own performance, and algorithms for it. Machine learning algorithms do not execute strictly defined static program instructions, but rather build specific models to derive predictions or decisions based on input data.

용어 '머신 러닝'은 용어 '기계 학습'과 혼용되어 사용될 수 있다.The term'machine learning' can be used interchangeably with the term'machine learning'.

기계 학습에서 데이터를 어떻게 분류할 것인가를 놓고, 많은 기계 학습 알고리즘이 개발되었다. 의사결정나무(Decision Tree)나 베이지안 망(Bayesian network), 서포트벡터머신(SVM: support vector machine), 그리고 인공 신경망(ANN: Artificial Neural Network) 등이 대표적이다.In terms of how to classify data in machine learning, many machine learning algorithms have been developed. Decision trees, Bayesian networks, support vector machines (SVMs), and artificial neural networks (ANNs) are typical.

의사결정나무는 의사결정규칙(Decision Rule)을 나무구조로 도표화하여 분류와 예측을 수행하는 분석방법이다.The decision tree is an analysis method that charts decision rules into a tree structure and performs classification and prediction.

베이지안 망은 다수의 변수들 사이의 확률적 관계(조건부독립성: conditional independence)를 그래프 구조로 표현하는 모델이다. 베이지안 망은 비지도 학습(unsupervised learning)을 통한 데이터마이닝(data mining)에 적합하다.The Bayesian network is a model that expresses the probabilistic relationship (conditional independence) between multiple variables in a graph structure. Bayesian networks are suitable for data mining through unsupervised learning.

서포트벡터머신은 패턴인식과 자료분석을 위한 지도 학습(supervised learning)의 모델이며, 주로 분류와 회귀분석을 위해 사용한다.The support vector machine is a model of supervised learning for pattern recognition and data analysis, and is mainly used for classification and regression analysis.

인공 신경망은 생물학적 뉴런의 동작원리와 뉴런간의 연결 관계를 모델링한 것으로 노드(node) 또는 처리 요소(processing element)라고 하는 다수의 뉴런들이 레이어(layer) 구조의 형태로 연결된 정보처리 시스템이다.An artificial neural network is an information processing system in which a number of neurons, called nodes or processing elements, are connected in the form of a layer structure by modeling the operation principle of biological neurons and the connection relationship between neurons.

인공 신경망은 기계 학습에서 사용되는 모델로써, 기계학습과 인지과학에서 생물학의 신경망(동물의 중추신경계 중 특히 뇌)에서 영감을 얻은 통계학적 학습 알고리즘이다.Artificial neural networks are models used in machine learning, and are statistical learning algorithms inspired by biological neural networks (especially the brain among animals' central nervous systems) in machine learning and cognitive science.

구체적으로 인공 신경망은 시냅스(synapse)의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜, 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다.Specifically, the artificial neural network may refer to an overall model having problem-solving ability by changing the strength of synaptic bonding through learning by artificial neurons (nodes) forming a network by combining synapses.

용어 인공 신경망은 용어 뉴럴 네트워크(Neural Network)와 혼용되어 사용될 수 있다.The term artificial neural network may be used interchangeably with the term neural network.

인공 신경망은 복수의 레이어(layer)를 포함할 수 있고, 레이어들 각각은 복수의 뉴런(neuron)을 포함할 수 있다. 또한 인공 신경망은 뉴런과 뉴런을 연결하는 시냅스를 포함할 수 있다.The artificial neural network may include a plurality of layers, and each of the layers may include a plurality of neurons. In addition, artificial neural networks may include neurons and synapses that connect neurons.

인공 신경망은 일반적으로 다음의 세가지 인자, 즉 (1) 다른 레이어의 뉴런들 사이의 연결 패턴 (2) 연결의 가중치를 갱신하는 학습 과정 (3) 이전 레이어로부터 수신되는 입력에 대한 가중 합으로부터 출력값을 생성하는 활성화 함수에 의해 정의될 수 있다.Artificial neural networks generally have three factors: (1) the connection pattern between neurons in different layers (2) the learning process to update the weight of the connection (3) the output value from the weighted sum of the input received from the previous layer. It can be defined by the activation function it creates.

인공 신경망은, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network), MLP(Multilayer Perceptron), CNN(Convolutional Neural Network)와 같은 방식의 네트워크 모델들을 포함할 수 있으나, 이에 한정되지 않는다.The artificial neural network may include network models such as DNN (Deep Neural Network), RNN (Recurrent Neural Network), BRDNN (Bidirectional Recurrent Deep Neural Network), MLP (Multilayer Perceptron), CNN (Convolutional Neural Network). , Is not limited thereto.

본 명세서에서 용어 '레이어'는 용어 '계층'과 혼용되어 사용될 수 있다.In the present specification, the term'layer' may be used interchangeably with the term'layer'.

인공 신경망은 계층 수에 따라 단층 신경망(Single-Layer Neural Networks)과 다층 신경망(Multi-Layer Neural Networks)으로 구분된다.Artificial neural networks are divided into Single-Layer Neural Networks and Multi-Layer Neural Networks according to the number of layers.

일반적인 단층 신경망은, 입력층과 출력층으로 구성된다.A general single-layer neural network is composed of an input layer and an output layer.

또한 일반적인 다층 신경망은 입력층(Input Layer)과 하나 이상의 은닉층(Hidden Layer), 출력층(Output Layer)으로 구성된다.In addition, a general multilayer neural network is composed of an input layer, one or more hidden layers, and an output layer.

입력층은 외부의 자료들을 받아들이는 층으로서, 입력층의 뉴런 수는 입력되는 변수의 수와 동일하며, 은닉층은 입력층과 출력층 사이에 위치하며 입력층으로부터 신호를 받아 특성을 추출하여 출력층으로 전달한다. 출력층은 은닉층으로부터 신호를 받고, 수신한 신호에 기반한 출력 값을 출력한다. 뉴런간의 입력신호는 각각의 연결강도(가중치)와 곱해진 후 합산되며 이 합이 뉴런의 임계치보다 크면 뉴런이 활성화되어 활성화 함수를 통하여 획득한 출력값을 출력한다. The input layer is a layer that receives external data, the number of neurons in the input layer is the same as the number of input variables, and the hidden layer is located between the input layer and the output layer, receives signals from the input layer, extracts characteristics, and transfers them to the output layer. do. The output layer receives a signal from the hidden layer and outputs an output value based on the received signal. The input signal between neurons is multiplied by each connection strength (weight) and then summed. If the sum is greater than the neuron's threshold, the neuron is activated and the output value obtained through the activation function is output.

한편 입력층과 출력 층 사이에 복수의 은닉층을 포함하는 심층 신경망은, 기계 학습 기술의 한 종류인 딥 러닝을 구현하는 대표적인 인공 신경망일 수 있다.Meanwhile, a deep neural network including a plurality of hidden layers between an input layer and an output layer may be a representative artificial neural network implementing deep learning, a type of machine learning technology.

한편 용어 '딥 러닝'은 용어 '심층 학습'과 혼용되어 사용될 수 있다.Meanwhile, the term'deep learning' can be used interchangeably with the term'deep learning'.

인공 신경망은 훈련 데이터(training data)를 이용하여 학습(training)될 수 있다. 여기서 학습이란, 입력 데이터를 분류(classification)하거나 회귀분석(regression)하거나 군집화(clustering)하는 등의 목적을 달성하기 위하여, 학습 데이터를 이용하여 인공 신경망의 파라미터(parameter)를 결정하는 과정을 의미할 수 있다. 인공 신경망의 파라미터의 대표적인 예시로써, 시냅스에 부여되는 가중치(weight)나 뉴런에 적용되는 편향(bias)을 들 수 있다.The artificial neural network can be trained using training data. Here, learning refers to the process of determining the parameters of the artificial neural network using training data in order to achieve the purpose of classifying, regressing, or clustering input data. I can. Representative examples of parameters of an artificial neural network include weights applied to synapses or biases applied to neurons.

훈련 데이터에 의하여 학습된 인공 신경망은, 입력 데이터를 입력 데이터가 가지는 패턴에 따라 분류하거나 군집화 할 수 있다. The artificial neural network learned by the training data may classify or cluster input data according to patterns of the input data.

한편 훈련 데이터를 이용하여 학습된 인공 신경망을, 본 명세서에서는 학습 모델(a trained model)이라 명칭 할 수 있다.Meanwhile, an artificial neural network trained using training data may be referred to as a trained model in this specification.

다음은 인공 신경망의 학습 방식에 대하여 설명한다.The following describes the learning method of artificial neural networks.

인공 신경망의 학습 방식은 크게, 지도 학습, 비 지도 학습, 준 지도 학습(Semi-Supervised Learning), 강화 학습(Reinforcement Learning)으로 분류될 수 있다.Learning methods of artificial neural networks can be classified into supervised learning, unsupervised learning, semi-supervised learning, and reinforcement learning.

지도 학습은 훈련 데이터로부터 하나의 함수를 유추해내기 위한 기계 학습의 한 방법이다. Supervised learning is a method of machine learning to infer a function from training data.

그리고 이렇게 유추되는 함수 중, 연속 적인 값을 출력하는 것을 회귀분석(Regression)이라 하고, 입력 벡터의 클래스(class)를 예측하여 출력하는 것을 분류(Classification)라고 할 수 있다.And among the functions to be inferred, outputting a continuous value is called regression, and predicting and outputting the class of an input vector can be called classification.

지도 학습에서는, 훈련 데이터에 대한 레이블(label)이 주어진 상태에서 인공 신경망을 학습시킨다.In supervised learning, an artificial neural network is trained with a label for training data.

여기서 레이블이란, 훈련 데이터가 인공 신경망에 입력되는 경우 인공 신경망이 추론해 내야 하는 정답(또는 결과 값)을 의미할 수 있다.Here, the label may mean a correct answer (or result value) that the artificial neural network must infer when training data is input to the artificial neural network.

본 명세서에서는 훈련 데이터가 입력되는 경우 인공 신경망이 추론해 내야 하는 정답(또는 결과값)을 레이블 또는 레이블링 데이터(labeling data)이라 명칭 한다.In this specification, when training data is input, the correct answer (or result value) to be inferred by the artificial neural network is referred to as a label or labeling data.

또한 본 명세서에서는, 인공 신경망의 학습을 위하여 훈련 데이터에 레이블을 설정하는 것을, 훈련 데이터에 레이블링 데이터를 레이블링(labeling) 한다고 명칭 한다.In addition, in this specification, setting a label on training data for learning an artificial neural network is referred to as labeling the training data with labeling data.

이 경우 훈련 데이터와 훈련 데이터에 대응하는 레이블)은 하나의 트레이닝 셋(training set)을 구성하고, 인공 신경망에는 트레이닝 셋의 형태로 입력될 수 있다.In this case, the training data and the label corresponding to the training data) constitute one training set, and may be input to the artificial neural network in the form of a training set.

한편 훈련 데이터는 복수의 특징(feature)을 나타내고, 훈련 데이터에 레이블이 레이블링 된다는 것은 훈련 데이터가 나타내는 특징에 레이블이 달린다는 것을 의미할 수 있다. 이 경우 훈련 데이터는 입력 객체의 특징을 벡터 형태로 나타낼 수 있다.Meanwhile, the training data represents a plurality of features, and labeling of the training data may mean that a label is attached to the feature represented by the training data. In this case, the training data may represent the characteristics of the input object in the form of a vector.

인공 신경망은 훈련 데이터와 레이블링 데이터를 이용하여, 훈련 데이터와 레이블링 데이터의 연관 관계에 대한 함수를 유추할 수 있다. 그리고, 인공 신경망에서 유추된 함수에 대한 평가를 통해 인공 신경망의 파라미터가 결정(최적화)될 수 있다.The artificial neural network can infer a function for the correlation between the training data and the labeling data using the training data and the labeling data. In addition, parameters of the artificial neural network may be determined (optimized) through evaluation of a function inferred from the artificial neural network.

비 지도 학습은 기계 학습의 일종으로, 훈련 데이터에 대한 레이블이 주어지지 않는다.Unsupervised learning is a type of machine learning, where no labels are given for training data.

구체적으로, 비 지도 학습은, 훈련 데이터 및 훈련 데이터에 대응하는 레이블의 연관 관계 보다는, 훈련 데이터 자체에서 패턴을 찾아 분류하도록 인공 신경망을 학습시키는 학습 방법일 수 있다.Specifically, the unsupervised learning may be a learning method of training an artificial neural network to find and classify patterns in the training data itself, rather than a correlation between training data and labels corresponding to the training data.

비 지도 학습의 예로는, 군집화 또는 독립 성분 분석(Independent Component Analysis)을 들 수 있다.Examples of unsupervised learning include clustering or independent component analysis.

본 명세서에서 용어 '군집화'는 용어 '클러스터링'과 혼용되어 사용될 수 있다.In this specification, the term'clustering' may be used interchangeably with the term'clustering'.

비지도 학습을 이용하는 인공 신경망의 일례로 생성적 적대 신경망(GAN: Generative Adversarial Network), 오토 인코더(AE: Autoencoder)를 들 수 있다.Examples of artificial neural networks using unsupervised learning include Generative Adversarial Network (GAN) and Autoencoder (AE).

생성적 적대 신경망이란, 생성기(generator)와 판별기(discriminator), 두 개의 서로 다른 인공지능이 경쟁하며 성능을 개선하는 머신 러닝 방법이다.A generative adversarial neural network is a machine learning method in which two different artificial intelligences compete and improve performance, a generator and a discriminator.

이 경우 생성기는 새로운 데이터를 창조하는 모형으로, 원본 데이터를 기반으로 새로운 데이터를 생성할 수 있다.In this case, the generator is a model that creates new data and can create new data based on the original data.

또한 판별기는 데이터의 패턴을 인식하는 모형으로, 입력된 데이터가 원본 데이터인지 또는 생성기에서 생성한 새로운 데이터인지 여부를 감별하는 역할을 수행할 수 있다.Also, the discriminator is a model that recognizes a pattern of data, and may play a role of discriminating whether the input data is original data or new data generated by the generator.

그리고 생성기는 판별기를 속이지 못한 데이터를 입력 받아 학습하며, 판별기는 생성기로부터 속은 데이터를 입력 받아 학습할 수 있다. 이에 따라 생성기는 판별기를 최대한 잘 속이도록 진화할 수 있고, 판별기는 원본 데이터와 생성기에 의해 생성된 데이터를 잘 구분하도록 진화할 수 있다.In addition, the generator learns by receiving data that cannot be deceived by the discriminator, and the discriminator can learn by receiving deceived data from the generator. Accordingly, the generator can evolve to deceive the discriminator as well as possible, and the discriminator can evolve to distinguish between the original data and the data generated by the generator.

오토 인코더는 입력 자체를 출력으로 재현하는 것을 목표로 하는 신경망이다.Auto encoders are neural networks that aim to reproduce the input itself as an output.

오토 인코더는 입력층, 적어도 하나의 은닉층 및 출력층을 포함한다. The auto encoder includes an input layer, at least one hidden layer and an output layer.

이 경우 은닉 계층의 노드 수가 입력 계층의 노드 수보다 적으므로 데이터의 차원이 줄어들게 되며, 이에 따라 압축 또는 인코딩이 수행되게 된다.In this case, since the number of nodes in the hidden layer is smaller than the number of nodes in the input layer, the dimension of the data is reduced, and compression or encoding is performed accordingly.

또한 은닉 계층에서 출력한 데이터는 출력 계층으로 들어간다. 이 경우 출력 계층의 노드 수는 은닉 계층의 노드 수보다 많으므로, 데이터의 차원이 늘어나게 되며, 이에 따라 압축 해제 또는 디코딩이 수행되게 된다.Also, data output from the hidden layer goes to the output layer. In this case, since the number of nodes in the output layer is larger than the number of nodes in the hidden layer, the dimension of the data increases, and accordingly, decompression or decoding is performed.

한편 오토 인코더는 학습을 통해 뉴런의 연결 강도를 조절함으로써 입력 데이터가 은닉층 데이터로 표현된다. 은닉층에서는 입력층보다 적은 수의 뉴런으로 정보를 표현하는데 입력 데이터를 출력으로 재현할 수 있다는 것은, 은닉층이 입력 데이터로부터 숨은 패턴을 발견하여 표현했다는 것을 의미할 수 있다.Meanwhile, the auto-encoder controls the connection strength of neurons through learning, so that the input data is expressed as hidden layer data. In the hidden layer, information is expressed with fewer neurons than in the input layer, but being able to reproduce the input data as an output may mean that the hidden layer found and expressed a hidden pattern from the input data.

준 지도 학습은 기계 학습의 일종으로, 레이블이 주어진 훈련 데이터와 레이블이 주어지지 않은 훈련 데이터를 모두 사용하는 학습 방법을 의미할 수 있다.Semi-supervised learning is a kind of machine learning, and may mean a learning method using both labeled training data and unlabeled training data.

준 지도 학습의 기법 중 하나로, 레이블이 주어지지 않은 훈련 데이터의 레이블을 추론한 후 추론된 라벨을 이용하여 학습을 수행하는 기법이 있으며, 이러한 기법은 레이블링에 소요되는 비용이 큰 경우에 유용하게 사용될 수 있다.As one of the techniques of semi-supervised learning, there is a technique of inferring a label of training data that is not given a label and then performing learning using the inferred label. This technique is useful when the cost for labeling is high. I can.

강화 학습은, 에이전트(Agent)가 매 순간 어떤 행동을 해야 좋을지 판단할 수 있는 환경이 주어진다면, 데이터 없이 경험으로 가장 좋을 길을 찾을 수 있다는 이론이다. Reinforcement learning is the theory that, given an environment in which an agent can judge what action to do at every moment, it can find the best way to experience without data.

강화 학습은 주로 마르코프 결정 과정(MDP: Markov Decision Process)에 의하여 수행될 수 있다.Reinforcement learning can be mainly performed by the Markov Decision Process (MDP).

마르코프 결정 과정을 설명하면, 첫 번째로 에이전트가 다음 행동을 하기 위해 필요한 정보들이 구성된 환경이 주어지며, 두 번째로 그 환경에서 에이전트가 어떻게 행동할지 정의하고, 세 번째로 에이전트가 무엇을 잘하면 보상(reward)를 주고 무엇을 못하면 벌점(penalty)을 줄지 정의하며, 네 번째로 미래의 보상이 최고점에 이를 때까지 반복 경험하여 최적의 정책(policy)을 도출하게 된다.Explaining the Markov decision process, first, an environment is given that contains the information necessary for the agent to perform the next action, second, it defines how the agent will behave in that environment, and thirdly, what the agent does well is rewarded ( Reward) is given and the penalty is given for failing to do something, and fourthly, the optimum policy is derived by repeatedly experiencing until the future reward reaches the peak.

인공 신경망은 모델의 구성, 활성 함수(Activation Function), 손실 함수(Loss Function) 또는 비용 함수(Cost Function), 학습 알고리즘, 최적화 알고리즘 등에 의해 그 구조가 특정되며, 학습 전에 하이퍼파라미터(Hyperparameter)가 미리 설정되고, 이후에 학습을 통해 모델 파라미터(Model Parameter)가 설정되어 내용이 특정될 수 있다.The structure of the artificial neural network is specified by the configuration of the model, activation function, loss function or cost function, learning algorithm, optimization algorithm, etc., and hyperparameters are pre-trained. It is set, and then, a model parameter is set through learning, so that the content can be specified.

예컨대, 인공 신경망의 구조를 결정하는 요소에는 은닉층의 개수, 각 은닉층에 포함된 은닉 노드의 개수, 입력 특징 벡터(Input Feature Vector), 대상 특징 벡터(Target Feature Vector) 등이 포함될 수 있다.For example, factors determining the structure of an artificial neural network may include the number of hidden layers, the number of hidden nodes included in each hidden layer, an input feature vector, a target feature vector, and the like.

하이퍼파라미터는 모델 파라미터의 초기값 등과 같이 학습을 위하여 초기에 설정하여야 하는 여러 파라미터들을 포함한다. 그리고, 모델 파라미터는 학습을 통하여 결정하고자 하는 여러 파라미터들을 포함한다.Hyperparameters include several parameters that must be initially set for learning, such as initial values of model parameters. And, the model parameter includes several parameters to be determined through learning.

예컨대, 하이퍼파라미터에는 노드 간 가중치 초기값, 노드 간 편향 초기값, 미니 배치(Mini-batch) 크기, 학습 반복 횟수, 학습률(Learning Rate) 등이 포함될 수 있다. 그리고, 모델 파라미터에는 노드 간 가중치, 노드 간 편향 등이 포함될 수 있다.For example, the hyperparameter may include an initial weight value between nodes, an initial bias value between nodes, a mini-batch size, a number of learning iterations, and a learning rate. In addition, the model parameters may include weights between nodes, biases between nodes, and the like.

손실 함수는 인공 신경망의 학습 과정에서 최적의 모델 파라미터를 결정하기 위한 지표(기준)로 이용될 수 있다. 인공 신경망에서 학습은 손실 함수를 줄이기 위하여 모델 파라미터들을 조작하는 과정을 의미하며, 학습의 목적은 손실 함수를 최소화하는 모델 파라미터를 결정하는 것으로 볼 수 있다.The loss function can be used as an index (reference) for determining an optimal model parameter in the learning process of the artificial neural network. In artificial neural networks, learning refers to the process of manipulating model parameters to reduce the loss function, and the purpose of learning can be seen as determining model parameters that minimize the loss function.

손실 함수는 주로 평균 제곱 오차(MSE: Mean Squared Error) 또는 교차 엔트로피 오차(CEE, Cross Entropy Error)를 사용할 수 있으며, 본 발명이 이에 한정되지는 않는다. The loss function may mainly use a mean squared error (MSE) or a cross entropy error (CEE), but the present invention is not limited thereto.

교차 엔트로피 오차는 정답 레이블이 원 핫 인코딩(one-hot encoding)된 경우에 사용될 수 있다. 원 핫 인코딩은 정답에 해당하는 뉴런에 대하여만 정답 레이블 값을 1로, 정답이 아닌 뉴런은 정답 레이블 값이 0으로 설정하는 인코딩 방법이다.The cross entropy error may be used when the correct answer label is one-hot encoded. One-hot encoding is an encoding method in which the correct answer label value is set to 1 only for neurons corresponding to the correct answer, and the correct answer label value is set to 0 for non-correct answer neurons.

머신 러닝 또는 딥 러닝에서는 손실 함수를 최소화하기 위하여 학습 최적화 알고리즘을 이용할 수 있으며, 학습 최적화 알고리즘에는 경사 하강법(GD: Gradient Descent), 확률적 경사 하강법(SGD: Stochastic Gradient Descent), 모멘텀(Momentum), NAG(Nesterov Accelerate Gradient), Adagrad, AdaDelta, RMSProp, Adam, Nadam 등이 있다.In machine learning or deep learning, learning optimization algorithms can be used to minimize loss functions, and learning optimization algorithms include Gradient Descent (GD), Stochastic Gradient Descent (SGD), and Momentum. ), NAG (Nesterov Accelerate Gradient), Adagrad, AdaDelta, RMSProp, Adam, Nadam, etc.

경사 하강법은 현재 상태에서 손실 함수의 기울기를 고려하여 손실 함수값을 줄이는 방향으로 모델 파라미터를 조정하는 기법이다. Gradient descent is a technique that adjusts model parameters in the direction of reducing the loss function value by considering the slope of the loss function in the current state.

모델 파라미터를 조정하는 방향은 스텝(step) 방향, 조정하는 크기는 스텝 사이즈(size)라고 칭한다.The direction to adjust the model parameter is called the step direction, and the size to be adjusted is called the step size.

이때, 스텝 사이즈는 학습률을 의미할 수 있다.In this case, the step size may mean a learning rate.

경사 하강법은 손실 함수를 각 모델 파라미터들로 편미분하여 기울기를 획득하고, 모델 파라미터들을 획득한 기울기 방향으로 학습률만큼 변경하여 갱신할 수 있다.In the gradient descent method, a gradient is obtained by partially differentiating a loss function into each model parameter, and the model parameters may be updated by changing the acquired gradient direction by a learning rate.

확률적 경사 하강법은 학습 데이터를 미니 배치로 나누고, 각 미니 배치마다 경사 하강법을 수행하여 경사 하강의 빈도를 높인 기법이다.The stochastic gradient descent method is a technique that increases the frequency of gradient descent by dividing training data into mini-batch and performing gradient descent for each mini-batch.

Adagrad, AdaDelta 및 RMSProp는 SGD에서 스텝 사이즈를 조절하여 최적화 정확도를 높이는 기법이다. SGD에서 모멘텀 및 NAG는 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다. Adam은 모멘텀과 RMSProp를 조합하여 스텝 사이즈와 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다. Nadam은 NAG와 RMSProp를 조합하여 스텝 사이즈와 스텝 방향을 조절하여 최적화 정확도를 높이는 기법이다.Adagrad, AdaDelta, and RMSProp are techniques that increase optimization accuracy by adjusting the step size in SGD. In SGD, momentum and NAG are techniques to increase optimization accuracy by adjusting the step direction. Adam is a technique that improves optimization accuracy by adjusting the step size and step direction by combining momentum and RMSProp. Nadam is a technique that increases optimization accuracy by adjusting step size and step direction by combining NAG and RMSProp.

인공 신경망의 학습 속도와 정확도는 인공 신경망의 구조와 학습 최적화 알고리즘의 종류뿐만 아니라, 하이퍼파라미터에 크게 좌우되는 특징이 있다. 따라서, 좋은 학습 모델을 획득하기 위하여는 적당한 인공 신경망의 구조와 학습 알고리즘을 결정하는 것뿐만 아니라, 적당한 하이퍼파라미터를 설정하는 것이 중요하다.The learning speed and accuracy of an artificial neural network are highly dependent on hyperparameters as well as the structure of the artificial neural network and the type of learning optimization algorithm. Therefore, in order to obtain a good learning model, it is important not only to determine an appropriate artificial neural network structure and learning algorithm, but also to set appropriate hyperparameters.

통상적으로 하이퍼파라미터는 실험적으로 다양한 값으로 설정해가며 인공 신경망을 학습시켜보고, 학습 결과 안정적인 학습 속도와 정확도를 제공하는 최적의 값으로 설정한다.In general, hyperparameters are experimentally set to various values to train an artificial neural network, and as a result of learning, the hyperparameter is set to an optimal value that provides stable learning speed and accuracy.

도 8은 본 발명의 일 실시 예에 따른 상황 분석 기반의 CCTV 관제 방법의 흐름도이다.8 is a flowchart of a CCTV control method based on situation analysis according to an embodiment of the present invention.

도 8을 참조하면, 도 7의 S360 단계를 통해 이벤트의 발생 여부가 판단되는 알고리즘이 도시되어 있다. 제2 영상분석 장치(130)는 제1 메타데이터와 제2 메타데이터를 조합하여 이벤트의 발생 여부를 판단할 수 있다. 예를 들어 제1 메타데이터와 제2 메타데이터의 조합을 통해 객체의 움직임 및 객체의 움직임과 관련하여 상황 변화가 발생하였다면, 이벤트가 발생한 것으로 판단된다. 그러나 객체의 움직임만 판단되거나, 상황의 변화만 판단된 경우에는 이벤트 발생에까지는 미치지 못하고 이상여부가 확인될 필요에 따라 해당 영상을 촬영한 카메라, 시간 및 상황이 북마크 된다.Referring to FIG. 8, an algorithm for determining whether an event occurs through step S360 of FIG. 7 is illustrated. The second image analysis apparatus 130 may determine whether an event occurs by combining the first metadata and the second metadata. For example, if a situation change occurs in relation to the movement of the object and the movement of the object through the combination of the first metadata and the second metadata, it is determined that an event has occurred. However, when only the movement of the object is determined or only the change of the situation is determined, the event does not reach the occurrence of the event, and the camera, the time and the situation where the video was captured are bookmarked as necessary to determine whether there is an abnormality.

객체의 움직임과 상황 변화를 모두 고려하는 이벤트 발생 여부의 판단에 대해 예를 들어 설명하기로 한다.Determination of whether an event occurs that considers both the movement of an object and a change in situation will be described as an example.

본 발명의 일 실시 예에 따른 상황 기반의 CCTV 관제 방법에 따르면 객체의 움직임 판단 외에 상황 변화의 판단에 기초하여 이벤트 발생 여부가 판단될 수 있다. 여기서 상황 변화의 판단은 추출된 객체와 배경을 이용하여 장면을 구성하고 이를 인식하는 것에 기초한다. 종래의 기술에 따라 객체의 움직임만을 기초로 이벤트의 발생을 판단하게 된다면, 동물의 움직임이나 나무의 움직임에 의해 오보가 발생할 수 있으나, 본 발명의 일 실시 예에 따르면 객체가 무엇인지 인식되고, 인식된 객체에 의해 상황 변화가 판단되면, 객체의 움직임 정보와 상황 변화 정보를 이용하여 이벤트의 발생이 판단될 수 있다.According to the situation-based CCTV control method according to an exemplary embodiment of the present invention, in addition to determining the movement of an object, whether or not an event occurs may be determined based on a determination of a change in a situation. Here, the judgment of the situation change is based on constructing a scene using the extracted object and background and recognizing it. According to the prior art, if the occurrence of an event is determined based only on the movement of the object, misinformation may occur due to the movement of an animal or a movement of a tree, but according to an embodiment of the present invention, what is an object is recognized When a situation change is determined by the object, the occurrence of an event may be determined using motion information and situation change information of the object.

본 발명의 일 실시 예에 의하면, 객체의 움직임 및 상황 변화에 기반하므로 이벤트 검출에서의 오보를 확률적으로 줄일 수 있다.According to an embodiment of the present invention, since it is based on a movement of an object and a change in a situation, it is possible to probably reduce a false report in event detection.

본 발명에 의하면, 하나의 이벤트 검출 알고리즘이 범죄 예방용 CCTV와 교통 관제용 CCTV에 모두 적용될 수 있다.According to the present invention, one event detection algorithm can be applied to both CCTV for crime prevention and CCTV for traffic control.

본 발명에 의하면, 인공지능 모델의 에지 및 클루우드에서의 전이학습을 통해 CCTV의 관제 지능이 점차 향상될 수 있다.According to the present invention, the control intelligence of CCTV can be gradually improved through transfer learning in the edge and cloud of the artificial intelligence model.

이상 설명된 본 발명에 따른 실시 예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다.The embodiment according to the present invention described above may be implemented in the form of a computer program that can be executed through various components on a computer, and such a computer program may be recorded in a computer-readable medium. In this case, the medium is a magnetic medium such as a hard disk, a floppy disk, and a magnetic tape, an optical recording medium such as a CD-ROM and a DVD, a magneto-optical medium such as a floptical disk, and a ROM. A hardware device specially configured to store and execute program instructions, such as, RAM, flash memory, and the like.

한편, 상기 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.Meanwhile, the computer program may be specially designed and configured for the present invention, or may be known and usable to those skilled in the computer software field. Examples of the computer program may include not only machine language codes produced by a compiler but also high-level language codes that can be executed by a computer using an interpreter or the like.

본 발명의 명세서(특히 특허청구범위에서)에서 '상기'의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 본 발명에서 범위(range)를 기재한 경우 상기 범위에 속하는 개별적인 값을 적용한 발명을 포함하는 것으로서(이에 반하는 기재가 없다면), 발명의 상세한 설명에 상기 범위를 구성하는 각 개별적인 값을 기재한 것과 같다.In the specification of the present invention (especially in the claims), the use of the term'above' and a reference term similar thereto may correspond to both the singular and the plural. In addition, when a range is described in the present invention, the invention to which an individual value falling within the range is applied (unless otherwise stated), and each individual value constituting the range is described in the detailed description of the invention. Same as

본 발명에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 발명이 한정되는 것은 아니다. 본 발명에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 발명을 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 발명의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.If there is no explicit order or contradictory description of the steps constituting the method according to the present invention, the steps may be performed in an appropriate order. The present invention is not necessarily limited according to the order of description of the steps. The use of all examples or illustrative terms (for example, etc.) in the present invention is merely for describing the present invention in detail, and the scope of the present invention is limited by the above examples or illustrative terms unless limited by the claims. It does not become. In addition, those skilled in the art can recognize that various modifications, combinations, and changes may be configured according to design conditions and factors within the scope of the appended claims or their equivalents.

따라서, 본 발명의 사상은 상기 설명된 실시 예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention is limited to the above-described embodiments and should not be determined, and all ranges equivalent to or equivalently changed from the claims to be described later as well as the claims to be described later are the scope of the spirit of the present invention. It will be said to belong to.

100: 상황 기반의 CCTV 관제 시스템
110: 카메라
120: 에지 지능형 영상분석 장치
130: 상황기반 영상분석 장치
150: 통합 관제 서버
160: 통합 관제 뷰어
170: 영상 저장장치
180: 메타데이터 저장장치
100: situation-based CCTV control system
110: camera
120: edge intelligent image analysis device
130: context-based image analysis device
150: integrated control server
160: integrated control viewer
170: video storage device
180: metadata storage device

Claims (7)

감시 영상을 수집하고 이를 전송하는 적어도 하나 이상의 카메라;
상기 감시 영상에서 감지된 객체의 동작 기반의 제1차 영상분석을 통해 상기 객체의 동작과 관련된 제1 메타데이터로서, 상기 객체의 움직임 시간, 상기 객체의 출현 위치 및 시간, 상기 객체의 크기 및 색상에 관한 정보, 및 상기 카메라의 정보를 포함하는 제1 메타데이터를 생성하는 에지 영역의 제1 영상분석 장치;
상기 제1 메타데이터가 이용되는, 상기 감시 영상에서 감지된 상황 기반의 제2차 영상분석을 통해 상황 판단과 관련된 제2 메타데이터로서, 상기 객체의 정체, 인식된 배경의 종류, 상기 인식된 배경에 대한 상기 객체의 움직임에 따른 장면 구성 및 인식과, 상황 추론 및 분석에 따른 상황 변화에 관한 정보를 포함하는 제2 메타데이터를 생성하는 클라우드 영역의 제2 영상분석 장치; 및
상기 감시 영상을 통합 관제 뷰어를 통해 디스플레이 하고, 미리 설정된 조건의 이벤트의 발생을 알리는 통합 관제 서버를 포함하되,
상기 제1 영상분석 장치는,
상기 감시 영상에서 상기 객체를 추출하고, 상기 객체에 인공지능 모델 기반의 객체 분류를 통해, 학습된 패턴을 매칭시켜 상기 객체에 대한 상기 제1 메타데이터를 생성하며, 에지 영역에서 상기 카메라에 연결되어 상기 제1 메타데이터에 기초한 상기 객체의 움직임에 따라 상기 카메라의 동작을 제어하고,
상기 제2 영상분석 장치는,
상기 감시 영상으로부터 추출된 상기 배경의 특징에 인공지능 모델을 적용하여 상기 배경을 인식하고, 상기 제1 메타데이터를 이용하여 상기 배경에서 상기 객체의 동작을 통해 추론되는 상황 변화에 관한 제2 메타데이터를 생성하며, 상기 제1 메타데이터 및 상기 제2 메타데이터의 조합에 기초하여 이벤트 발생 여부를 판단하고,
상기 통합 관제 서버는,
클라우드 영역에서 상기 제2 메타데이터에 기초한 상황 변화에 따라 상기 카메라의 동작을 제어하며, 상기 제2 영상분석 장치를 통해, 상기 제1 메타데이터와 상기 제2 메타데이터의 조합에 기초해 상기 객체의 움직임 및 상기 객체의 움직임과 관련한 상황 변화가 발생되면 이벤트가 발생한 것으로 판단하여 이벤트 발생을 알리고, 상기 객체의 움직임만 판단되거나 상황 변화만 판단된 경우에는 해당 영상을 촬영한 카메라, 시간 및 상황이 북마크되도록 하는,
상황 분석 기반의 CCTV 관제 시스템.
At least one or more cameras that collect and transmit surveillance images;
As first metadata related to the motion of the object through the motion-based first image analysis of the object detected in the surveillance image, the motion time of the object, the location and time of appearance of the object, the size and color of the object A first image analysis device in an edge region that generates first metadata including information about the camera and information about the camera;
As second metadata related to situation determination through a context-based secondary image analysis detected in the surveillance image, in which the first metadata is used, the identity of the object, the type of the recognized background, and the recognized background A second image analysis device in a cloud region for generating second metadata including information on a scene composition and recognition according to the movement of the object and information on a situation change according to situation inference and analysis; And
Comprising an integrated control server that displays the surveillance image through an integrated control viewer and notifies the occurrence of an event under a preset condition,
The first image analysis device,
The object is extracted from the surveillance image, and the learned pattern is matched to the object through object classification based on an artificial intelligence model to generate the first metadata for the object, and connected to the camera in the edge region. Controlling the operation of the camera according to the movement of the object based on the first metadata,
The second image analysis device,
Second metadata regarding a situation change inferred through the motion of the object in the background by applying an artificial intelligence model to the background feature extracted from the surveillance image to recognize the background, and using the first metadata And determining whether an event occurs based on a combination of the first metadata and the second metadata,
The integrated control server,
The operation of the camera is controlled according to a change in the situation based on the second metadata in the cloud area, and the object is displayed based on a combination of the first metadata and the second metadata through the second image analysis device. When a change in the situation related to the movement and the movement of the object occurs, it is determined that the event has occurred and the occurrence of the event is notified, and when only the movement of the object is determined or only the situation change is determined, the camera, the time and the situation that took the video are bookmarked. As possible,
CCTV control system based on situation analysis.
제1항에 있어서,
상기 제1 영상분석 장치는,
임베디드 시스템 형태로 상기 카메라에 포함되도록 구성되는,
상황 분석 기반의 CCTV 관제 시스템.
The method of claim 1,
The first image analysis device,
It is configured to be included in the camera in the form of an embedded system,
CCTV control system based on situation analysis.
삭제delete 제1항에 있어서,
상기 제2 영상분석 장치는,
점등된 신호기의 색깔 및 교통신호 제어기로부터 수신한 신호 정보 중에서 적어도 하나를 이용하여 차량 및 사람의 신호 위반의 움직임을 감지하는,
상황 분석 기반의 CCTV 관제 시스템.
The method of claim 1,
The second image analysis device,
Using at least one of the color of the lighted beacon and signal information received from the traffic signal controller to detect the movement of a signal violation of a vehicle and a person,
CCTV control system based on situation analysis.
제1항에 있어서,
상기 제2 영상분석 장치는,
상기 감시 영상으로부터 추출된 배경에 학습에 의해 훈련된 인공지능 모델을 적용하여 어린이보호구역, 횡단보도, 교차로 중에서 적어도 하나를 인식하고, 상기 제1 메타데이터를 이용하여 인식된 배경에서 차량과 사람의 동작을 통해 추론되는 상황의 변화 여부를 판단하는,
상황 분석 기반의 CCTV 관제 시스템.
The method of claim 1,
The second image analysis device,
By applying an artificial intelligence model trained by learning to the background extracted from the surveillance image, at least one of a child protection zone, a pedestrian crossing, and an intersection is recognized, and between the vehicle and the person in the background recognized using the first metadata. To determine whether the situation inferred through the action changes,
CCTV control system based on situation analysis.
상황 분석 기반의 CCTV 관제 시스템이 수행하는 방법으로서,
CCTV 카메라를 통해 수집된 영상으로 구성된 훈련 데이터 셋을 이용하는 학습에 따른 훈련에 기초하여 객체의 움직임을 판단하는 모델 및 상황 변화를 판단하는 모델을 구성하는 단계;
이벤트의 발생을 알리기 위해 상기 CCTV 카메라를 이용하여 감시 영상을 수집하는 단계;
에지 영역에서, 상기 객체의 움직임을 판단하는 인공지능 모델을 이용하여, 상기 감시 영상에서 상기 객체를 추출하고, 상기 객체에 인공지능 모델 기반의 객체 분류를 통해, 학습된 패턴을 매칭시켜 상기 객체의 움직임에 중점을 둔 제1 영상분석의 결과로서 제1 메타데이터를 생성하는 단계;
클라우드 영역에서, 상기 제1 메타데이터 및 상기 상황 변화를 판단하는 인공지능 모델을 이용하여, 상기 감시 영상으로부터 추출된 배경의 특징에 인공지능 모델을 적용하여 상기 배경을 인식하고, 상기 제1 메타데이터를 이용하여 상기 배경에서 상기 객체의 동작을 통해 추론되는 상기 감시 영상에서 감지된 상황 변화에 중점을 둔 제2 영상분석의 결과로서 상황 판단을 하는 제2 메타데이터를 생성하는 단계; 및
상기 감시 영상을 통합 관제 뷰어를 통해 디스플레이 하고, 미리 설정된 조건의 이벤트의 발생을 알리는 단계를 포함하되,
상기 제1 메타데이터 및 상기 제2 메타데이터의 조합에 기초하여 이벤트 발생 여부가 판단되며,
상기 제1 메타데이터와 상기 제2 메타데이터의 조합에 기초해 상기 객체의 움직임 및 상기 객체의 움직임과 관련한 상황 변화가 발생되면 이벤트가 발생한 것으로 판단하여 이벤트 발생을 알리고, 상기 객체의 움직임만 판단되거나 상황 변화만 판단된 경우에는 해당 영상을 촬영한 카메라, 시간 및 상황이 북마크되도록 하고,
상기 카메라의 동작을 제어하는 단계를 더 포함하되, 상기 제1 메타데이터를 이용하여 상기 객체의 움직임에 따라 에지에서 상기 카메라의 동작이 제어되고, 상기 제2 메타데이터를 이용하여 상황 변화에 따라 클라우드에서 상기 카메라의 동작이 제어되며,
상기 제1 메타데이터는, 상기 객체의 움직임 시간, 상기 객체의 출현 위치 및 시간, 상기 객체의 크기 및 색상에 관한 정보, 및 카메라 정보를 포함하고,
상기 제2 메타데이터는, 상기 객체의 정체, 인식된 배경의 종류, 상기 인식된 배경에 대한 상기 객체의 움직임에 따른 장면 구성 및 인식과, 상황 추론 및 분석에 따른 상황 변화에 관한 정보를 포함하는,
상황 분석 기반의 CCTV 관제 방법.
As a method performed by a CCTV control system based on situation analysis,
Constructing a model for determining a movement of an object and a model for determining a situation change based on training according to learning using a training data set composed of images collected through a CCTV camera;
Collecting a surveillance image using the CCTV camera to notify the occurrence of an event;
In the edge region, the object is extracted from the surveillance image using an artificial intelligence model that determines the movement of the object, and the learned pattern is matched to the object through object classification based on the artificial intelligence model. Generating first metadata as a result of the first image analysis focusing on motion;
In the cloud area, the first metadata and the artificial intelligence model for determining the situation change are used to recognize the background by applying an artificial intelligence model to the characteristics of the background extracted from the surveillance image, and the first metadata Generating second metadata for determining a situation as a result of a second image analysis focusing on a change in the situation detected in the surveillance image inferred through the motion of the object in the background by using: And
Displaying the surveillance image through an integrated control viewer, comprising the step of notifying the occurrence of an event of a preset condition,
Whether an event occurs is determined based on the combination of the first metadata and the second metadata,
Based on the combination of the first metadata and the second metadata, when the movement of the object and the change in the situation related to the movement of the object occur, it is determined that an event has occurred and the event is notified, and only the movement of the object is determined, or If only the situation change is determined, the camera, the time and the situation where the video was taken are bookmarked,
Further comprising the step of controlling the operation of the camera, wherein the operation of the camera is controlled at the edge according to the movement of the object using the first metadata, and the cloud according to the change of the situation using the second metadata The operation of the camera is controlled in
The first metadata includes a movement time of the object, an appearance position and time of the object, information on the size and color of the object, and camera information,
The second metadata includes information on the identity of the object, the type of the recognized background, the scene composition and recognition according to the movement of the object with respect to the recognized background, and the situation change according to the situation inference and analysis. ,
CCTV control method based on situation analysis.
삭제delete
KR1020200063746A 2020-05-27 2020-05-27 Cctv central control system and method based on situation analysis KR102152237B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200063746A KR102152237B1 (en) 2020-05-27 2020-05-27 Cctv central control system and method based on situation analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200063746A KR102152237B1 (en) 2020-05-27 2020-05-27 Cctv central control system and method based on situation analysis

Publications (1)

Publication Number Publication Date
KR102152237B1 true KR102152237B1 (en) 2020-09-04

Family

ID=72470942

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200063746A KR102152237B1 (en) 2020-05-27 2020-05-27 Cctv central control system and method based on situation analysis

Country Status (1)

Country Link
KR (1) KR102152237B1 (en)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102313283B1 (en) * 2020-11-25 2021-10-18 주식회사 케이씨에스 A artificial intelligence multipurpose emergency bell system with video analysis function
KR102317935B1 (en) * 2020-09-28 2021-10-28 한국생산기술연구원 Dualized closed-loop data analytics system
KR102322772B1 (en) 2021-07-05 2021-11-08 주식회사 하나씨엔에스 Multiple situation identification system for CCTV cameras
KR102346204B1 (en) * 2021-09-10 2022-01-03 (주)디에이치정보기술 Method, device and system for processing cctv image installed in public place based on artificial intelligence
WO2022059122A1 (en) * 2020-09-17 2022-03-24 株式会社日立国際電気 Monitoring system, analyzing device, and ai model generating method
KR102395440B1 (en) * 2021-07-12 2022-05-10 주식회사 넥스트케이 Cloud-based building management system and method thereof
KR102411209B1 (en) 2021-12-24 2022-06-22 쿨사인 주식회사 System and Method for Image Classification Based on Object Detection Events by Edge Device
KR102414773B1 (en) 2021-12-24 2022-06-29 쿨사인 주식회사 System for Supplementing or Adding Metadata Generated by Edge Device After Reanalysis on Server
KR102448096B1 (en) 2021-11-23 2022-09-27 쿨사인 주식회사 system and method for Intelligent CCTV synchronization using PTP
KR102456189B1 (en) 2021-11-23 2022-10-18 쿨사인 주식회사 system for Cloud edge-based video analysis
KR20220168342A (en) * 2021-06-16 2022-12-23 주식회사 인찬 A traffic sign apparatus for school zone traffic safety
KR102492694B1 (en) * 2022-06-21 2023-01-27 (주)와이즈콘 Video surveillance apparatus using gnss, method and computer readable program therefor
WO2023058809A1 (en) * 2021-10-05 2023-04-13 아이픽셀 주식회사 Generation system and generation method for metadata for movement estimation
WO2023096084A1 (en) * 2021-11-25 2023-06-01 한국전자기술연구원 System and method for analyzing image by selecting and applying ai model optimized for surrounding environment information by edge-based cctv
KR102591399B1 (en) 2022-12-13 2023-10-19 세종신호에너지(주) CCTV artificial intelligence system including super-directional speaker and radar for bus platform safety management solution
KR102595318B1 (en) 2022-06-24 2023-10-26 (주)제로웹 Video control system for easy tracking of floating population
KR102596384B1 (en) * 2023-02-22 2023-10-30 진병선 Camera Equipment Equipped with Neural Processing Unit for Artificial Intelligence Computation
KR102621196B1 (en) * 2023-07-10 2024-01-09 주식회사 웹게이트 CCTV system for personal image information protection
KR102633147B1 (en) * 2023-11-03 2024-02-02 주식회사 이투온 Edge-cloud platform system
WO2024075950A1 (en) * 2022-10-07 2024-04-11 한국전자기술연구원 Method and system for generating edge ai model for edge cctv

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150100141A (en) * 2014-02-24 2015-09-02 주식회사 케이티 Apparatus and method for analyzing behavior pattern
KR101954717B1 (en) * 2018-10-22 2019-03-06 주식회사 인텔리빅스 Apparatus for Processing Image by High Speed Analysis and Driving Method Thereof
KR20190051175A (en) * 2017-11-06 2019-05-15 전자부품연구원 Intelleigent cooperating server, system and method of analyzing based on cooperation thereof
KR102105892B1 (en) * 2019-11-25 2020-04-29 주식회사 인텔리빅스 Apparatus for Smart Monitoring Service and Driving Method Thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150100141A (en) * 2014-02-24 2015-09-02 주식회사 케이티 Apparatus and method for analyzing behavior pattern
KR20190051175A (en) * 2017-11-06 2019-05-15 전자부품연구원 Intelleigent cooperating server, system and method of analyzing based on cooperation thereof
KR102008503B1 (en) 2017-11-06 2019-10-21 전자부품연구원 Intelleigent cooperating server, system and method of analyzing based on cooperation thereof
KR101954717B1 (en) * 2018-10-22 2019-03-06 주식회사 인텔리빅스 Apparatus for Processing Image by High Speed Analysis and Driving Method Thereof
KR102105892B1 (en) * 2019-11-25 2020-04-29 주식회사 인텔리빅스 Apparatus for Smart Monitoring Service and Driving Method Thereof

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022059122A1 (en) * 2020-09-17 2022-03-24 株式会社日立国際電気 Monitoring system, analyzing device, and ai model generating method
KR102317935B1 (en) * 2020-09-28 2021-10-28 한국생산기술연구원 Dualized closed-loop data analytics system
KR102313283B1 (en) * 2020-11-25 2021-10-18 주식회사 케이씨에스 A artificial intelligence multipurpose emergency bell system with video analysis function
KR102645892B1 (en) 2021-06-16 2024-03-11 주식회사 인찬 A traffic sign apparatus for school zone traffic safety
KR20220168342A (en) * 2021-06-16 2022-12-23 주식회사 인찬 A traffic sign apparatus for school zone traffic safety
KR102322772B1 (en) 2021-07-05 2021-11-08 주식회사 하나씨엔에스 Multiple situation identification system for CCTV cameras
KR102395440B1 (en) * 2021-07-12 2022-05-10 주식회사 넥스트케이 Cloud-based building management system and method thereof
KR102346204B1 (en) * 2021-09-10 2022-01-03 (주)디에이치정보기술 Method, device and system for processing cctv image installed in public place based on artificial intelligence
WO2023058809A1 (en) * 2021-10-05 2023-04-13 아이픽셀 주식회사 Generation system and generation method for metadata for movement estimation
KR102448096B1 (en) 2021-11-23 2022-09-27 쿨사인 주식회사 system and method for Intelligent CCTV synchronization using PTP
KR102456189B1 (en) 2021-11-23 2022-10-18 쿨사인 주식회사 system for Cloud edge-based video analysis
WO2023096084A1 (en) * 2021-11-25 2023-06-01 한국전자기술연구원 System and method for analyzing image by selecting and applying ai model optimized for surrounding environment information by edge-based cctv
KR102411209B1 (en) 2021-12-24 2022-06-22 쿨사인 주식회사 System and Method for Image Classification Based on Object Detection Events by Edge Device
KR102414773B1 (en) 2021-12-24 2022-06-29 쿨사인 주식회사 System for Supplementing or Adding Metadata Generated by Edge Device After Reanalysis on Server
KR102492694B1 (en) * 2022-06-21 2023-01-27 (주)와이즈콘 Video surveillance apparatus using gnss, method and computer readable program therefor
KR102595318B1 (en) 2022-06-24 2023-10-26 (주)제로웹 Video control system for easy tracking of floating population
WO2024075950A1 (en) * 2022-10-07 2024-04-11 한국전자기술연구원 Method and system for generating edge ai model for edge cctv
KR102591399B1 (en) 2022-12-13 2023-10-19 세종신호에너지(주) CCTV artificial intelligence system including super-directional speaker and radar for bus platform safety management solution
KR102596384B1 (en) * 2023-02-22 2023-10-30 진병선 Camera Equipment Equipped with Neural Processing Unit for Artificial Intelligence Computation
KR102621196B1 (en) * 2023-07-10 2024-01-09 주식회사 웹게이트 CCTV system for personal image information protection
KR102633147B1 (en) * 2023-11-03 2024-02-02 주식회사 이투온 Edge-cloud platform system
KR102641536B1 (en) * 2023-11-03 2024-02-27 주식회사 이투온 Cloud-edge platform
KR102641534B1 (en) * 2023-11-03 2024-02-27 주식회사 이투온 Cloud-edge integrated platform system
KR102643330B1 (en) * 2023-11-03 2024-03-05 주식회사 이투온 Edge network cloud system

Similar Documents

Publication Publication Date Title
KR102152237B1 (en) Cctv central control system and method based on situation analysis
KR101850286B1 (en) A deep learning based image recognition method for CCTV
US11195067B2 (en) Systems and methods for machine learning-based site-specific threat modeling and threat detection
US11449045B2 (en) Artificial intelligence device and method of diagnosing malfunction using operation log and artificial intelligence model
KR102212217B1 (en) Autonomous vehicle for preventing collisions effectively, apparatus and method for controlling the autonomous vehicle
KR20190094133A (en) An artificial intelligence apparatus for recognizing object and method for the same
Duque et al. Prediction of abnormal behaviors for intelligent video surveillance systems
KR20210053052A (en) Color restoration method and apparatus
US11436848B2 (en) Automatic labeling apparatus and method for object recognition
KR101377029B1 (en) The apparatus and method of monitoring cctv with control moudule
Aberkane et al. Deep reinforcement learning for real-world anomaly detection in surveillance videos
Regazzoni et al. Multisensorial generative and descriptive self-awareness models for autonomous systems
Gong et al. Enhanced few-shot learning for intrusion detection in railway video surveillance
Nikouei et al. I-safe: Instant suspicious activity identification at the edge using fuzzy decision making
US20210209787A1 (en) Approach photographing device and method for controlling the same
KR102585665B1 (en) Risk Situation Analysis and Hazard Object Detection System
EP3907652A1 (en) Method for adapting the quality and/or frame rate of a live video stream based upon pose
KR102502922B1 (en) Method, device and system for alarming and monitoring of emergency situation
Mohammad et al. New Ontology structure for intelligent controlling of traffic signals
Siddique et al. Analysis of Real-Time Hostile Activitiy Detection from Spatiotemporal Features Using Time Distributed Deep CNNs, RNNs and Attention-Based Mechanisms
KR102591399B1 (en) CCTV artificial intelligence system including super-directional speaker and radar for bus platform safety management solution
KR20210004173A (en) Apparatus and method for user monitoring
EP3910541A1 (en) Method for adapting the quality and/or frame rate of a live video stream based upon pose
Chiappino et al. A bio-inspired knowledge representation method for anomaly detection in cognitive video surveillance systems
Wan et al. Dynamic scene modelling and anomaly detection based on trajectory analysis

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant