KR102664027B1 - Camera to analyze video based on artificial intelligence and method of operating thereof - Google Patents

Camera to analyze video based on artificial intelligence and method of operating thereof Download PDF

Info

Publication number
KR102664027B1
KR102664027B1 KR1020200029565A KR20200029565A KR102664027B1 KR 102664027 B1 KR102664027 B1 KR 102664027B1 KR 1020200029565 A KR1020200029565 A KR 1020200029565A KR 20200029565 A KR20200029565 A KR 20200029565A KR 102664027 B1 KR102664027 B1 KR 102664027B1
Authority
KR
South Korea
Prior art keywords
artificial intelligence
camera
cameras
normal
image
Prior art date
Application number
KR1020200029565A
Other languages
Korean (ko)
Other versions
KR20200111104A (en
Inventor
김현호
최진혁
김대봉
변재운
이상욱
김준식
정경전
김은영
Original Assignee
한화비전 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한화비전 주식회사 filed Critical 한화비전 주식회사
Priority to EP20772993.0A priority Critical patent/EP3944628A4/en
Priority to PCT/KR2020/003391 priority patent/WO2020189953A1/en
Publication of KR20200111104A publication Critical patent/KR20200111104A/en
Priority to US17/475,801 priority patent/US11979660B2/en
Application granted granted Critical
Publication of KR102664027B1 publication Critical patent/KR102664027B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/632Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing using a connection between clients on a wide area network, e.g. setting up a peer-to-peer communication via Internet for retrieving video segments from the hard-disk of other client devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Studio Devices (AREA)

Abstract

네트워크를 통해 서로 통신할 수 있는 인공지능 카메라들 중 어느 하나의 동작 방법에 있어서, 인공지능 카메라들 각각은 딥 러닝 방식을 이용한 영상 분석을 수행하도록 구성되는 인공지능 프로세서를 포함하되, 동작 방법은, 네트워크를 통해 다른 인공지능 카메라와 서로 등록 정보를 교환함으로써 다른 인공지능 카메라와 함께 영상 분석을 위한 클러스터를 구성하는 단계, 네트워크를 통해 노멀 카메라들에 액세스할 수 있도록 노멀 카메라들의 등록 정보를 다른 인공지능 카메라와 공유하는 단계, 노멀 카메라들 중 하나를 할당받을 때, 할당된 노멀 카메라에 액세스하여 할당된 노멀 카메라에 의해 촬영된 영상을 수신하는 단계, 인공지능 프로세서를 이용하여 수신된 영상을 분석하는 단계, 그리고 수신된 영상의 분석에 따른 결과 정보를 할당된 노멀 카메라의 식별자와 함께 네트워크를 통해 외부 장치로 전송하는 단계를 포함한다.In a method of operating any one of artificial intelligence cameras capable of communicating with each other through a network, each of the artificial intelligence cameras includes an artificial intelligence processor configured to perform image analysis using a deep learning method, and the operating method includes: Step of forming a cluster for video analysis with other artificial intelligence cameras by exchanging registration information with other artificial intelligence cameras through the network; registering the registration information of normal cameras with other artificial intelligence cameras so that normal cameras can be accessed through the network A step of sharing with a camera, when one of the normal cameras is assigned, a step of accessing the assigned normal camera and receiving an image taken by the assigned normal camera, a step of analyzing the received image using an artificial intelligence processor. , and transmitting the result information according to the analysis of the received video to an external device through a network along with the identifier of the assigned normal camera.

Description

인공지능에 기반하여 영상을 분석하는 카메라 및 그것의 동작 방법{CAMERA TO ANALYZE VIDEO BASED ON ARTIFICIAL INTELLIGENCE AND METHOD OF OPERATING THEREOF}Camera that analyzes video based on artificial intelligence and its operating method {CAMERA TO ANALYZE VIDEO BASED ON ARTIFICIAL INTELLIGENCE AND METHOD OF OPERATING THEREOF}

본 발명은 영상을 촬영할 수 있는 카메라 및 그것의 동작 방법에 관한 것으로, 좀 더 구체적으로는 인공지능에 기반하여 영상을 분석하는 카메라 및 그것의 동작 방법에 관한 것이다.The present invention relates to a camera that can capture images and a method of operating the same, and more specifically, to a camera that analyzes images based on artificial intelligence and a method of operating the same.

통신 네트워크를 통하여 외부 장비와 연결된 카메라들을 포함하는 영상 촬영 시스템에서, 카메라들은 호스트 장치 및 사용자 단말기와 같은 외부 장비와 통신을 수행하지만, 카메라들도 서로 P2P(peer to peer) 방식에 의하여 통신을 수행할 수도 있다. 그럼에도 불구하고, 종래에는 카메라들은 외부 장비와 통신하여 서비스를 제공하는 방식들이 주를 이루었다. 이러한 경우, 카메라들 사이의 통신은 일반적으로 수행되지 않아 카메라들 각각은 개별적으로 동작할 수 있다.In an image capture system that includes cameras connected to external equipment through a communication network, the cameras communicate with external equipment such as host devices and user terminals, but the cameras also communicate with each other using a P2P (peer to peer) method. You may. Nevertheless, in the past, cameras primarily provided services by communicating with external equipment. In this case, communication between the cameras is generally not performed so that each of the cameras can operate individually.

한편, 인공지능 기능을 포함하는 카메라가 개발되고 있다. 인공지능 기술은 딥 러닝(기계학습) 및 딥 러닝을 활용한 요소 기술들로 구성된다. 딥 러닝은 입력 데이터의 특징들을 스스로 분류/학습하는 알고리즘이며, 요소 기술은 딥 러닝을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 시각적 이해, 추론/예측, 지식 표현 등의 기술들을 포함할 수 있다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함할 수 있다. 추론/예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함할 수 있다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함할 수 있다.Meanwhile, cameras that include artificial intelligence functions are being developed. Artificial intelligence technology consists of deep learning (machine learning) and element technologies using deep learning. Deep learning is an algorithm that classifies/learns the characteristics of input data on its own, and elemental technology is a technology that utilizes deep learning to mimic the functions of the human brain such as perception and judgment, including visual understanding, inference/prediction, and knowledge expression. May include technologies. Visual understanding is a technology that recognizes and processes objects like human vision, and can include object recognition, object tracking, image search, person recognition, scene understanding, spatial understanding, and image improvement. Inference/prediction is a technology that judges information to make logical inferences and predictions, and may include knowledge/probability-based reasoning, optimization prediction, preference-based planning, and recommendations. Knowledge expression is a technology that automatically processes human experience information into knowledge data, and can include knowledge construction (data creation/classification), knowledge management (data utilization), etc.

위 기재된 내용은 오직 본 발명의 기술적 사상들에 대한 배경 기술의 이해를 돕기 위한 것이며, 따라서 그것은 본 발명의 기술 분야의 당업자에게 알려진 선행 기술에 해당하는 내용으로 이해될 수 없다.The content described above is only intended to help understand the background technology of the technical ideas of the present invention, and therefore, it cannot be understood as content corresponding to prior art known to those skilled in the art of the present invention.

본 발명의 실시 예들은 인공지능에 기반한 영상 분석 범위를 효율적으로 확장시킬 수 있는 인공지능 카메라 및 그것의 동작 방법에 관한 것이다.Embodiments of the present invention relate to an artificial intelligence camera and a method of operating the same that can efficiently expand the scope of image analysis based on artificial intelligence.

본 발명의 실시 예에 따른 네트워크를 통해 서로 통신할 수 있는 인공지능 카메라들 중 어느 하나의 동작 방법에 있어서, 상기 인공지능 카메라들 각각은 딥 러닝 방식을 이용한 영상 분석을 수행하도록 구성되는 인공지능 프로세서를 포함하되, 상기 동작 방법은, 상기 네트워크를 통해 다른 인공지능 카메라와 서로 등록 정보를 교환함으로써, 상기 다른 인공지능 카메라와 함께 상기 영상 분석을 위한 클러스터를 구성하는 단계; 상기 네트워크를 통해 노멀 카메라들에 액세스할 수 있도록, 상기 노멀 카메라들의 등록 정보를 상기 다른 인공지능 카메라와 공유하는 단계; 상기 노멀 카메라들 중 하나를 할당받을 때, 상기 할당된 노멀 카메라에 액세스하여 상기 할당된 노멀 카메라에 의해 촬영된 영상을 수신하는 단계; 상기 인공지능 프로세서를 이용하여 상기 수신된 영상을 분석하는 단계; 및 상기 수신된 영상의 상기 분석에 따른 결과 정보를 상기 할당된 노멀 카메라의 식별자와 함께 상기 네트워크를 통해 외부 장치로 전송하는 단계를 포함한다.In a method of operating any one of artificial intelligence cameras capable of communicating with each other through a network according to an embodiment of the present invention, each of the artificial intelligence cameras is an artificial intelligence processor configured to perform image analysis using a deep learning method. Including, the operating method includes exchanging registration information with other artificial intelligence cameras through the network, thereby configuring a cluster for image analysis with the other artificial intelligence cameras; sharing registration information of the normal cameras with the other artificial intelligence cameras so that the normal cameras can be accessed through the network; When one of the normal cameras is assigned, accessing the assigned normal camera and receiving an image captured by the assigned normal camera; Analyzing the received image using the artificial intelligence processor; and transmitting result information according to the analysis of the received video to an external device through the network along with the identifier of the assigned normal camera.

상기 동작 방법은 추가적인 인공지능 카메라의 등록 정보를 수신하는 단계; 및 상기 수신된 등록 정보에 따라 상기 추가적인 인공지능 카메라에 액세스하여 상기 추가적인 인공지능 카메라를 상기 클러스터에 추가하는 단계를 더 포함할 수 있다.The operating method includes receiving registration information of an additional artificial intelligence camera; And it may further include accessing the additional artificial intelligence camera according to the received registration information and adding the additional artificial intelligence camera to the cluster.

상기 클러스터를 구성하는 단계는 상기 다른 인공지능 카메라와 통신하여 상기 인공지능 카메라들 중 어느 하나를 상기 클러스터의 마스터 노드로 결정하는 단계를 포함하되, 상기 할당된 노멀 카메라는 상기 마스터 노드로부터의 커맨드에 따라 결정될 수 있다.The step of configuring the cluster includes determining one of the artificial intelligence cameras as a master node of the cluster by communicating with the other artificial intelligence cameras, wherein the assigned normal camera responds to a command from the master node. It can be decided accordingly.

상기 촬영된 영상을 수신하는 단계는, 상기 할당된 노멀 카메라에서 생성된 이벤트 알람 신호를 수신하는 단계; 및 상기 이벤트 알람 신호에 응답하여 상기 할당된 노멀 카메라에 상기 촬영된 영상의 제공을 요청하는 단계를 포함할 수 있다.Receiving the captured image may include receiving an event alarm signal generated from the assigned normal camera; and requesting the assigned normal camera to provide the captured image in response to the event alarm signal.

상기 클러스터를 구성하는 단계는 상기 다른 인공지능 카메라와 통신하여 상기 인공지능 카메라들 중 어느 하나를 상기 클러스터의 마스터 노드로 결정하는 단계를 포함하되, 상기 이벤트 알람 신호는 상기 마스터 노드를 통해 수신될 수 있다.The step of configuring the cluster includes determining one of the artificial intelligence cameras as a master node of the cluster by communicating with the other artificial intelligence cameras, wherein the event alarm signal can be received through the master node. there is.

상기 촬영된 영상을 수신하는 단계는, 상기 할당된 노멀 카메라에 상기 촬영된 영상의 제공을 요청하기 전에, 상기 이벤트 알람 신호에 응답하여 상기 할당된 노멀 카메라의 설정을 소정의 설정값으로 변경하는 단계를 더 포함할 수 있다.The step of receiving the captured image includes changing the settings of the assigned normal camera to a predetermined setting value in response to the event alarm signal before requesting the assigned normal camera to provide the captured image. It may further include.

상기 할당된 노멀 카메라에 의해 촬영된 영상을 수신하는 단계에서, 상기 인공지능 프로세서를 이용하여 상기 수신된 영상을 분석할 때 딥러닝에 따른 확률이 임계치 이상이 되는지 여부에 따라, 상기 할당된 노멀 카메라로부터 수신하는 상기 영상의 길이는 가변적으로 조절될 수 있다.In the step of receiving the image captured by the assigned normal camera, depending on whether the probability according to deep learning is greater than or equal to a threshold when analyzing the received image using the artificial intelligence processor, the assigned normal camera The length of the video received from can be variably adjusted.

상기 동작 방법은 상기 다른 인공지능 카메라와 상태 메시지들을 통신하는 단계; 상기 상태 메시지들에 근거하여 상기 다른 인공지능 카메라가 비정상으로 판별될 때, 상기 다른 인공지능 카메라에 할당된 다른 노멀 카메라에 액세스하여 상기 다른 노멀 카메라에 의해 촬영된 영상을 추가적으로 수신하는 단계; 상기 인공지능 프로세서를 이용하여 상기 추가적으로 수신된 영상을 분석하는 단계; 및 상기 추가적으로 수신된 영상의 상기 분석에 따른 결과 정보를 상기 다른 노멀 카메라의 식별자와 함께 상기 네트워크를 통해 상기 외부 장치로 전송하는 단계를 더 포함할 수 있다.The operating method includes communicating status messages with the other artificial intelligence camera; When the other artificial intelligence camera is determined to be abnormal based on the status messages, accessing another normal camera assigned to the other artificial intelligence camera and additionally receiving images captured by the other normal camera; analyzing the additionally received image using the artificial intelligence processor; And it may further include transmitting result information according to the analysis of the additionally received image to the external device through the network along with the identifier of the other normal camera.

상기 인공지능 카메라는 이미지 센서를 더 포함하되, 상기 동작 방법은 상기 이미지 센서를 통해 영상을 촬영하는 단계; 및 상기 인공지능 프로세서를 이용하여 상기 촬영된 영상을 분석하는 단계를 더 포함할 수 있다.The artificial intelligence camera further includes an image sensor, and the operating method includes capturing an image through the image sensor; And it may further include analyzing the captured image using the artificial intelligence processor.

상기 외부 장치로 전송하는 단계는, 상기 촬영된 영상, 제 1 메타 데이터, 및 제 2 메타 데이터를 상기 외부 장치로 전송하는 단계를 포함하되, 상기 제 1 메타 데이터는 상기 촬영된 영상의 상기 분석에 따른 결과 정보를 포함하고, 상기 제 2 메타 데이터는 상기 수신된 영상의 상기 분석에 따른 상기 결과 정보를 및 상기 할당된 노멀 카메라의 상기 식별자를 포함할 수 있다.The transmitting to the external device includes transmitting the captured image, first metadata, and second metadata to the external device, wherein the first metadata is used in the analysis of the captured image. The second metadata may include the result information according to the analysis of the received image and the identifier of the assigned normal camera.

상기 클러스터를 구성하는 단계는, 사용자 단말기로부터 상기 다른 인공지능 카메라의 상기 등록 정보를 수신하는 단계; 및 상기 수신된 등록 정보를 이용하여 상기 다른 인공지능 카메라와 통신을 수행함으로써 상기 클러스터를 구성하는 단계를 포함할 수 있다.The step of configuring the cluster includes receiving the registration information of the other artificial intelligence camera from a user terminal; And it may include configuring the cluster by communicating with the other artificial intelligence camera using the received registration information.

상기 노멀 카메라들의 등록 정보를 상기 다른 인공지능 카메라와 공유하는 단계는, 사용자 단말기로부터 상기 노멀 카메라들의 등록 정보를 수신하는 단계; 및 상기 수신된 등록 정보를 상기 다른 인공지능 카메라에 제공하는 단계를 포함할 수 있다.The sharing of the registration information of the normal cameras with the other artificial intelligence cameras includes: receiving the registration information of the normal cameras from a user terminal; And it may include providing the received registration information to the other artificial intelligence camera.

본 발명의 다른 일면은 카메라에 관한 것이다. 본 발명의 실시 예에 따른 카메라는, 광학계; 상기 광학계를 통해 수신되는 빛에 따라 생성된 영상을 처리하도록 구성되는 제 1 프로세서; 상기 제 1 프로세서의 제어에 응답하여 동작하되, 딥 러닝 방식에 기반하여 상기 처리된 영상을 분석하도록 구성되는 제 2 프로세서; 및 네트워크를 통한 통신을 제공하는 네트워크 인터페이스를 포함하되, 상기 제 1 프로세서는, 상기 네트워크를 통해 외부 인공지능 카메라와 서로 등록 정보를 교환함으로써, 상기 외부 인공지능 카메라와 함께 영상 분석을 위한 클러스터를 구성하고, 상기 네트워크를 통해 노멀 카메라들에 액세스할 수 있도록, 상기 노멀 카메라들의 등록 정보를 상기 외부 인공지능 카메라와 공유하고, 상기 노멀 카메라들 중 하나를 할당받을 때, 상기 할당된 노멀 카메라에 액세스하여 상기 할당된 노멀 카메라에 의해 촬영된 영상을 수신하고, 상기 제 2 프로세서에 상기 수신된 영상을 분석하도록 커맨드하고, 상기 수신된 영상의 상기 분석에 따른 결과 정보를 상기 할당된 노멀 카메라의 식별자와 함께 상기 네트워크를 통해 외부 장치로 전송하도록 구성된다.Another aspect of the present invention relates to a camera. A camera according to an embodiment of the present invention includes an optical system; a first processor configured to process an image generated according to light received through the optical system; a second processor that operates in response to control of the first processor and is configured to analyze the processed image based on a deep learning method; and a network interface that provides communication through a network, wherein the first processor exchanges registration information with an external artificial intelligence camera through the network, thereby forming a cluster for image analysis with the external artificial intelligence camera. In order to access the normal cameras through the network, the registration information of the normal cameras is shared with the external artificial intelligence camera, and when one of the normal cameras is assigned, the assigned normal camera is accessed. Receive an image captured by the assigned normal camera, command the second processor to analyze the received image, and provide result information according to the analysis of the received image together with the identifier of the assigned normal camera. It is configured to transmit to an external device through the network.

상기 제 1 프로세서는 추가적인 인공지능 카메라의 등록 정보가 수신될 때, 상기 수신된 등록 정보에 따라 상기 추가적인 인공지능 카메라에 액세스하여 상기 추가적인 인공지능 카메라를 상기 클러스터에 추가하도록 구성될 수 있다.When registration information of an additional artificial intelligence camera is received, the first processor may be configured to access the additional artificial intelligence camera according to the received registration information and add the additional artificial intelligence camera to the cluster.

상기 제 1 프로세서는 상기 외부 인공지능 카메라와 통신하여 상기 클러스터의 카메라들 중 어느 하나를 상기 클러스터의 마스터 노드로 결정하도록 구성되고, 상기 할당된 노멀 카메라는 상기 마스터 노드로부터의 커맨드에 따라 결정될 수 있다.The first processor is configured to communicate with the external artificial intelligence camera to determine one of the cameras in the cluster as the master node of the cluster, and the assigned normal camera can be determined according to a command from the master node. .

상기 제 1 프로세서는 상기 할당된 노멀 카메라에 상기 촬영된 영상의 제공을 요청하기 전에, 상기 할당된 노멀 카메라의 설정을 소정의 설정값으로 변경하도록 구성될 수 있다.The first processor may be configured to change the settings of the assigned normal camera to a predetermined value before requesting the assigned normal camera to provide the captured image.

상기 제 1 프로세서는 상기 제 2 프로세서에서 상기 수신된 영상을 분석할 때 딥러닝에 따른 확률이 임계치 이상이 되는지 여부에 따라, 상기 할당된 노멀 카메라로부터 수신하는 상기 영상의 길이를 가변적으로 조절하도록 구성될 수 있다.The first processor is configured to variably adjust the length of the image received from the assigned normal camera depending on whether the probability according to deep learning is greater than a threshold when the second processor analyzes the received image. It can be.

본 발명의 실시 예들에 따르면, 인공지능에 기반한 영상 분석 범위를 효율적으로 확장시킬 수 있는 인공지능 카메라 및 그것의 동작 방법이 제공된다.According to embodiments of the present invention, an artificial intelligence camera and a method of operating the same are provided that can efficiently expand the scope of image analysis based on artificial intelligence.

도 1은 본 발명의 실시 예에 따른 영상 촬영 시스템을 보여주는 블록도이다.
도 2는 도 1의 인공지능 카메라들 중 어느 하나의 실시 예를 보여주는 블록도이다.
도 3은 도 2의 메인 프로세서의 실시 예를 보여주는 블록도이다.
도 4는 도 2의 인공지능 프로세서의 실시 예를 보여주는 블록도이다.
도 5는 인공지능 카메라의 출력 데이터의 포멧의 실시 예를 개념적으로 보여주는 도면이다.
도 6은 인공지능 카메라에 의해 촬영된 영상을 분석하는 방법을 보여주는 순서도이다.
도 7은 본 발명의 실시 예에 따른 노멀 카메라들과 인터랙션할 수 있는 클러스터를 구성하기 위한 인공지능 카메라의 동작 방법을 보여주는 순서도이다.
도 8은 도 7의 S210단계의 실시 예를 보여주는 순서도이다.
도 9는 도 7의 S220단계의 실시 예를 보여주는 순서도이다.
도 10은 클러스터를 구성한 후 인공지능 카메라들에 저장 및 공유되는 클러스터 정보를 보여주는 테이블이다.
도 11은 클러스터를 구성한 후 인공지능 카메라들에 저장 및 공유되는 노멀 카메라 정보를 보여주는 테이블이다.
도 12는 노멀 카메라들과 인터랙션할 수 있는 클러스터에 인공지능 카메라를 추가하는 방법의 실시 예를 보여주는 순서도이다.
도 13은 본 발명의 실시 예에 따른 클러스터에 포함된 인공지능 카메라에서 노멀 카메라의 영상을 분석하는 방법을 보여주는 순서도이다.
도 14는 도 12의 S420단계의 실시 예를 보여주는 순서도이다.
도 15는 본 발명의 다른 실시 예에 따른 클러스터에 포함된 인공지능 카메라에서 노멀 카메라의 영상을 분석하는 방법을 보여주는 순서도이다.
1 is a block diagram showing an image capturing system according to an embodiment of the present invention.
FIG. 2 is a block diagram showing an example of one of the artificial intelligence cameras of FIG. 1.
FIG. 3 is a block diagram showing an embodiment of the main processor of FIG. 2.
Figure 4 is a block diagram showing an embodiment of the artificial intelligence processor of Figure 2.
Figure 5 is a diagram conceptually showing an example of the format of output data from an artificial intelligence camera.
Figure 6 is a flowchart showing a method of analyzing images captured by an artificial intelligence camera.
Figure 7 is a flowchart showing a method of operating an artificial intelligence camera to configure a cluster that can interact with normal cameras according to an embodiment of the present invention.
Figure 8 is a flowchart showing an example of step S210 of Figure 7.
Figure 9 is a flowchart showing an example of step S220 of Figure 7.
Figure 10 is a table showing cluster information stored and shared with artificial intelligence cameras after forming a cluster.
Figure 11 is a table showing normal camera information stored and shared with artificial intelligence cameras after forming a cluster.
Figure 12 is a flowchart showing an example of a method for adding an artificial intelligence camera to a cluster that can interact with normal cameras.
Figure 13 is a flowchart showing a method of analyzing images from a normal camera in an artificial intelligence camera included in a cluster according to an embodiment of the present invention.
FIG. 14 is a flowchart showing an example of step S420 of FIG. 12.
Figure 15 is a flowchart showing a method of analyzing images from a normal camera in an artificial intelligence camera included in a cluster according to another embodiment of the present invention.

이하, 본 발명에 따른 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기의 설명에서는 본 발명에 따른 동작을 이해하는데 필요한 부분만이 설명되며 그 이외 부분의 설명은 본 발명의 요지를 모호하지 않도록 하기 위해 생략될 것이라는 것을 유의하여야 한다. 또한 본 발명은 여기에서 설명되는 실시 예에 한정되지 않고 다른 형태로 구체화될 수도 있다. 단지, 여기에서 설명되는 실시 예는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여 제공되는 것이다.Hereinafter, a preferred embodiment according to the present invention will be described in detail with reference to the attached drawings. It should be noted that in the following description, only the parts necessary to understand the operation according to the present invention will be described, and the description of other parts will be omitted in order to not obscure the gist of the present invention. Additionally, the present invention is not limited to the embodiments described herein and may be embodied in other forms. However, the embodiments described herein are provided to explain in detail enough to enable those skilled in the art to easily implement the technical idea of the present invention.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다. 여기에서 사용된 용어는 특정한 실시예들을 설명하기 위한 것이며 본 발명을 한정하기 위한 것이 아니다. 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. "X, Y, 및 Z 중 적어도 어느 하나", 그리고 "X, Y, 및 Z로 구성된 그룹으로부터 선택된 적어도 어느 하나"는 X 하나, Y 하나, Z 하나, 또는 X, Y, 및 Z 중 둘 또는 그 이상의 어떤 조합 (예를 들면, XYZ, XYY, YZ, ZZ) 으로 해석될 수 있다. 여기에서, "및/또는"은 해당 구성들 중 하나 또는 그 이상의 모든 조합을 포함한다.Throughout the specification, when a part is said to be "connected" to another part, this includes not only the case where it is "directly connected," but also the case where it is "indirectly connected" with another element in between. . The terminology used herein is for the purpose of describing specific embodiments and is not intended to limit the invention. Throughout the specification, when a part is said to “include” a certain element, this means that it may further include other elements rather than excluding other elements, unless specifically stated to the contrary. “at least one of X, Y, and Z”, and “at least one selected from the group consisting of It can be interpreted as any combination (e.g., XYZ, XYY, YZ, ZZ). As used herein, “and/or” includes any combination of one or more of the constituents.

도 1은 본 발명의 실시 예에 따른 영상 촬영 시스템을 보여주는 블록도이다.1 is a block diagram showing an image capturing system according to an embodiment of the present invention.

영상 촬영 시스템은 여기에 설명된 실시 예들에 따른 방법들을 수행하도록 동작하는 복수의 장치들, 서버들, 및/또는 소프트웨어 구성 요소들을 포함할 수 있다. 도 1에 도시된 장치들 및 서버들은 다른 방식으로 배치될 수 있고, 그러한 장치들 및/또는 서버들에 의해 제공되는 동작들 및 서비스들은 여기에 설명된 실시 예들을 수행하기 위해 결합되거나 분리될 수 있으며, 더 많은 수 혹은 더 적은 수의 장치들 및 서버들에 의해 수행될 수도 있다. 하나 또는 그 이상의 장치들 및/또는 서버들은 동일한 혹은 다른 독립체들(entities), 예를 들면 기업들에 의해 구동될 수 있다.An imaging system may include a plurality of devices, servers, and/or software components operative to perform methods according to embodiments described herein. The devices and servers shown in FIG. 1 may be deployed in different ways, and the operations and services provided by such devices and/or servers may be combined or separated to perform the embodiments described herein. and may be performed by more or fewer devices and servers. One or more devices and/or servers may be run by the same or different entities, for example companies.

도 1을 참조하면, 영상 촬영 시스템(100)은 네트워크(50), 사용자 단말기(110), 복수의 인공지능(artificial intelligence) 카메라들(121~123), 제 1 내지 제 n 노멀 카메라들(131~13n), 및 영상 관리 서버(140)를 포함할 수 있다.Referring to FIG. 1, the image capturing system 100 includes a network 50, a user terminal 110, a plurality of artificial intelligence cameras 121 to 123, and first to nth normal cameras 131. ~13n), and may include a video management server 140.

네트워크(50)는 공용 네트워크(public network), 적어도 하나의 사설 네트워크(private network), 유선 네트워크, 무선 네트워크, 다른 적절한 타입의 네트워크, 및 그것들의 조합들 중 적어도 하나를 포함할 수 있다. 영상 촬영 시스템(100) 내 구성 요소들 각각은 유선 통신 기능 및 무선 통신 기능 중 적어도 하나를 포함할 수 있으며, 그에 따라 네트워크(50)를 통해 상호 간 통신할 수 있다.Network 50 may include at least one of a public network, at least one private network, a wired network, a wireless network, another suitable type of network, and combinations thereof. Each of the components within the imaging system 100 may include at least one of a wired communication function and a wireless communication function, and thus may communicate with each other through the network 50 .

사용자 단말기(110)는 네트워크(50)를 통해 복수의 인공지능 카메라들(121~123), 제 1 내지 제 n 노멀 카메라들(131~13n), 및 영상 관리 서버(140)와 통신할 수 있다. 사용자 단말기(110)는 복수의 인공지능 카메라들(121~123) 및 제 1 내지 제 n 노멀 카메라들(131~13n) 각각으로부터 촬영되고 있는 영상을 실시간으로 수신하고, 수신된 영상을 디스플레이할 수 있다. 또한, 사용자 단말기(110)는 영상 관리 서버(140)에 액세스하여, 영상 관리 서버(140)에 저장된 영상들을 수신하고, 수신된 영상들을 디스플레이할 수 있다. 이때, 영상 관리 서버(140)에 저장된 영상들은 복수의 인공지능 카메라들(121~123) 및 제 1 내지 제 n 노멀 카메라들(131~13n)에 의해 촬영된 영상들일 수 있다.The user terminal 110 can communicate with a plurality of artificial intelligence cameras 121 to 123, first to nth normal cameras 131 to 13n, and the video management server 140 through the network 50. . The user terminal 110 can receive images being captured in real time from each of the plurality of artificial intelligence cameras 121 to 123 and the first to nth normal cameras 131 to 13n, and display the received images. there is. Additionally, the user terminal 110 may access the video management server 140, receive images stored in the video management server 140, and display the received images. At this time, the images stored in the video management server 140 may be images captured by a plurality of artificial intelligence cameras 121 to 123 and the first to nth normal cameras 131 to 13n.

영상 관리 서버(140)는 영상과 연관하여 움직임 감지, 얼굴 감지, 침입 감지, 총 소리 감지, 오브젝트/패턴 정보, 오브젝트들의 유사도 정보 등 다양한 타입들을 정보를 포함할 수 있는 메타 데이터를 더 저장한다. 그러나, 본 발명의 실시 예들은 여기에 한정되지 않는다. 예를 들면, 영상 및 영상과 연관된 메타 데이터는 서로 다른 데이터베이스들에 저장될 수 있다.The video management server 140 further stores metadata that may include various types of information, such as motion detection, face detection, intrusion detection, gun sound detection, object/pattern information, and similarity information of objects, in relation to the image. However, embodiments of the present invention are not limited thereto. For example, images and metadata associated with images may be stored in different databases.

메타 데이터는 인공지능 카메라에 의해 제공될 수 있다. 사용자 단말기(110)는 영상 관리 서버(140)로부터 메타 데이터를 수신하고, 수신된 메타 데이터가 나타내는 정보를 디스플레이하고, 메타 데이터를 선택하는 사용자 입력에 응답하여 영상 관리 서버(140)로부터 해당 영상을 수신하고, 수신된 영상을 디스플레이할 수 있다.Metadata can be provided by artificial intelligence cameras. The user terminal 110 receives metadata from the video management server 140, displays information indicated by the received metadata, and receives the corresponding video from the video management server 140 in response to a user input for selecting metadata. You can receive and display the received video.

실시 예들에서, 사용자 단말기(110)는 컴퓨터 장치를 포함하되, 컴퓨터 장치는 네트워크(50)에 연결된 복수의 인공지능 카메라들(121~123), 제 1 내지 제 n 노멀 카메라들(131~13n), 및 영상 관리 서버(140)와 같은 구성 요소에 액세스하고, 그로부터 영상을 수신하고, 수신된 영상을 디스플레이하기 위한 응용 애플리케이션들을 포함할 수 있다.In embodiments, the user terminal 110 includes a computer device, and the computer device includes a plurality of artificial intelligence cameras 121 to 123 connected to the network 50, and first to nth normal cameras 131 to 13n. , and may include application applications for accessing components such as the video management server 140, receiving video therefrom, and displaying the received video.

복수의 인공지능 카메라들(121~123)이 영상 촬영 시스템(100)에 제공될 수 있다. 도 1에서, 3개의 인공지능 카메라들(121~123)이 제공되는 것으로 예시되어 있다. 제 1 내지 제 3 인공지능 카메라들(121~123) 각각은 인공지능에 기반하여 영상 분석을 수행하도록 구성되는 적어도 하나의 인공지능 프로세서를 포함한다. 제 1 내지 제 3 인공지능 카메라들(121~123) 각각은 영상을 촬영하고, 촬영된 영상을 인공지능 프로세서를 통해 분석하고, 촬영된 영상 및 영상 분석 결과를 영상 관리 서버(140)에 제공할 수 있다. 또한, 제 1 내지 제 3 인공지능 카메라들 각각은 오디오를 녹음하고, 인공지능 프로세서를 통해 녹음된 오디오를 분석하고, 녹음된 오디오 및 오디오 분석 결과를 영상 관리 서버(140)에 제공할 수 있다. 이하, 설명의 편의를 위해 영상 분석을 위한 동작들을 중심으로 본 발명의 실시 예들이 설명된다. 그러나, 이는 설명의 편의를 위한 것으로, 본 발명의 기술적 사상은 오디오 분석에도 적용될 수 있다.A plurality of artificial intelligence cameras 121 to 123 may be provided to the image capture system 100. In Figure 1, it is illustrated that three artificial intelligence cameras 121 to 123 are provided. Each of the first to third artificial intelligence cameras 121 to 123 includes at least one artificial intelligence processor configured to perform image analysis based on artificial intelligence. Each of the first to third artificial intelligence cameras 121 to 123 captures images, analyzes the captured images through an artificial intelligence processor, and provides the captured images and video analysis results to the video management server 140. You can. Additionally, each of the first to third artificial intelligence cameras can record audio, analyze the recorded audio through an artificial intelligence processor, and provide the recorded audio and audio analysis results to the video management server 140. Hereinafter, for convenience of explanation, embodiments of the present invention will be described focusing on operations for image analysis. However, this is for convenience of explanation, and the technical idea of the present invention can also be applied to audio analysis.

제 1 내지 제 3 인공지능 카메라들(121~123) 각각은 제 1 내지 제 n 노멀 카메라들(131~13n) 중 적어도 하나로부터 영상을 수신하고, 수신된 영상을 인공지능 프로세서를 통해 분석하고, 영상 분석 결과를 영상 관리 서버(140)에 제공할 수 있다. 이때, 노멀 카메라는 비 인공지능(non-AI) 카메라일 수 있다. 예를 들면, 노멀 카메라는 인공지능이 아닌, 모션 감지(motion detection), 얼굴 감지(face detection), 소리 감지(sound detection)와 같은 종래의 이벤트 감지 알고리즘들을 수행하도록 구성되는 프로세서를 포함할 수 있으며, 반면 인공지능 프로세서는 포함하지 않을 수 있다.Each of the first to third artificial intelligence cameras 121 to 123 receives an image from at least one of the first to nth normal cameras 131 to 13n, and analyzes the received image through an artificial intelligence processor, The video analysis results may be provided to the video management server 140. At this time, the normal camera may be a non-AI camera. For example, a normal camera may include a processor configured to perform conventional event detection algorithms, such as motion detection, face detection, and sound detection, rather than artificial intelligence. , on the other hand, may not include an artificial intelligence processor.

제 1 내지 제 3 인공지능 카메라들(121~123)은 서로 등록 정보를 교환함으로써 영상 분석을 위한 클러스터(CLST)를 구성하고, 각 노멀 카메라를 클러스터(CLST) 내 인공지능 카메라들(121~123) 중 어느 하나에 할당할 수 있다. 이때, 등록 정보는 인공지능 카메라의 URL(uniform resource locator) 어드레스, IP(internet protocol) 어드레스, 포트(port) 번호, 카메라 로그인 계정과 같은 카메라에 액세스하기 위한 정보를 포함할 수 있다. 각 인공지능 카메라의 등록 정보는 사용자 단말기(110)로부터 제 1 내지 제 3 인공지능 카메라들(121~123) 중 어느 하나에 수신될 수 있으며, 제 1 내지 제 3 인공지능 카메라들(121~123)에 의해 공유될 수 있다. 실시 예들에서, 제 1 내지 제 3 인공지능 카메라들(121~123)은 그것들의 등록 정보를 주기적으로 동기화할 수 있다.The first to third artificial intelligence cameras (121 to 123) exchange registration information with each other to form a cluster (CLST) for image analysis, and each normal camera is connected to the artificial intelligence cameras (121 to 123) in the cluster (CLST). ) can be assigned to any one of the following. At this time, the registration information may include information for accessing the camera, such as the artificial intelligence camera's URL (uniform resource locator) address, IP (internet protocol) address, port number, and camera login account. The registration information of each artificial intelligence camera may be received from the user terminal 110 to any one of the first to third artificial intelligence cameras (121 to 123), and the first to third artificial intelligence cameras (121 to 123) ) can be shared by. In embodiments, the first to third artificial intelligence cameras 121 to 123 may periodically synchronize their registration information.

제 1 내지 제 3 인공지능 카메라들(121~123) 각각에 어떤 노멀 카메라를 할당할지 여부는 다양한 방식들에 따라 결정될 수 있다. 예를 들면, 제 1 내지 제 3 인공지능 카메라들(121~123)은 서로에게 자신의 가용 자원을 알리고, 그러한 가용 자원을 참조하여 각 노멀 카메라에 대한 할당이 수행될 수 있다. 예를 들면, 제 1 내지 제 3 인공지능 카메라들(121~123)은 서로 통신하여 마스터 노드로서 기능할 인공지능 카메라를 결정하고, 마스터 노드는 테스크 스케줄링의 기능을 수행할 수 있다. 마스터 노드는 제 1 내지 제 3 인공지능 카메라들(121~123) 각각의 가용 자원을 참조하여 각 노멀 카메라를 제 1 내지 제 3 인공지능 카메라들(121~123) 중 어느 하나에 할당할 수 있다.Which normal camera to assign to each of the first to third artificial intelligence cameras 121 to 123 can be determined according to various methods. For example, the first to third artificial intelligence cameras 121 to 123 may inform each other of their available resources, and allocation to each normal camera may be performed with reference to such available resources. For example, the first to third artificial intelligence cameras 121 to 123 communicate with each other to determine which artificial intelligence camera will function as a master node, and the master node may perform a task scheduling function. The master node can assign each normal camera to one of the first to third artificial intelligence cameras (121 to 123) by referring to the available resources of each of the first to third artificial intelligence cameras (121 to 123). .

이와 같이, 제 1 내지 제 3 인공지능 카메라들(121~123)을 포함하는 클러스터(CLST)를 구성하여 제 1 내지 제 n 노멀 카메라들(131~13n)의 영상들을 분석함으로써, 각 노멀 카메라는 제 1 내지 제 3 인공지능 카메라들(121~123) 중 어느 하나에 예를 들면 가용 자원을 참조함으로써 할당될 수 있고, 따라서 제 1 내지 제 n 노멀 카메라들(131~13n)의 영상들에 대한 분석은 별도의 인공지능 기능을 포함하는 서버를 제공하지 않고도 제 1 내지 제 3 인공지능 카메라들(121~123)을 이용하여 효율적으로 수행될 수 있다. 이에 따라, 별도의 인공지능 기능을 포함하는 서버 없이도, 인공지능에 기반한 영상 분석은 제 1 내지 제 n 인공지능 카메라들(121~123)에 의해 촬영되는 영상들뿐만 아니라 제 1 내지 제 n 노멀 카메라들(131~13n)에 의해 촬영되는 영상들에까지 확장될 수 있다. 따라서, 인공지능에 기반한 영상 분석의 범위를 효율적으로 확장시킬 수 있는 인공지능 카메라 및 그것을 포함하는 영상 촬영 시스템이 제공될 수 있다.In this way, by configuring a cluster (CLST) including the first to third artificial intelligence cameras (121 to 123) and analyzing the images of the first to nth normal cameras (131 to 13n), each normal camera It can be assigned to any one of the first to third artificial intelligence cameras (121 to 123), for example, by referring to available resources, and thus to the images of the first to nth normal cameras (131 to 13n). Analysis can be efficiently performed using the first to third artificial intelligence cameras 121 to 123 without providing a server including a separate artificial intelligence function. Accordingly, without a server containing a separate artificial intelligence function, image analysis based on artificial intelligence can be performed on not only the images captured by the first to nth artificial intelligence cameras 121 to 123, but also the first to nth normal cameras. It can be extended to images captured by fields 131 to 13n. Therefore, an artificial intelligence camera and an image capture system including the same that can efficiently expand the scope of image analysis based on artificial intelligence can be provided.

도 2는 도 1의 인공지능 카메라들 중 어느 하나의 실시 예를 보여주는 블록도이다. 도 3은 도 2의 메인 프로세서의 실시 예를 보여주는 블록도이다. 도 4는 도 2의 인공지능 프로세서의 실시 예를 보여주는 블록도이다.FIG. 2 is a block diagram showing an example of one of the artificial intelligence cameras of FIG. 1. FIG. 3 is a block diagram showing an embodiment of the main processor of FIG. 2. Figure 4 is a block diagram showing an embodiment of the artificial intelligence processor of Figure 2.

도 2를 참조하면, 인공지능 카메라(200)는 광학계(205), 이미지 센서(210), 램(220, Random Access Memory: RAM), EEPROM(230, Electrically Erasable and Programmable Read Only Memory), 스토리지(240), 메인 프로세서(250), 네트워크 인터페이스(260), 및 인공지능(artificial intelligence: AI) 프로세서(270)를 포함할 수 있다.Referring to FIG. 2, the artificial intelligence camera 200 includes an optical system 205, an image sensor 210, RAM (220, Random Access Memory), EEPROM (230, Electrically Erasable and Programmable Read Only Memory), and storage ( 240), a main processor 250, a network interface 260, and an artificial intelligence (AI) processor 270.

광학계(205)는 피사체로부터의 빛을 광학적으로 처리한다.The optical system 205 optically processes light from the subject.

이미지 센서(210)는 메인 프로세서(250)의 제어에 응답하여 동작할 수 있다. 이미지 센서(210)는 렌즈(205)를 통해 수신된 광학 신호를 전기 신호로 변환하고, 변환된 전기 신호를 디지털화하여 영상을 생성하도록 구성된다. 예를 들면, 이미지 센서(210)는 아날로그 영상 신호를 디지털 영상 데이터로 변환하도록 구성되는 아날로그 디지털 컨버터를 포함할 수 있다.The image sensor 210 may operate in response to control from the main processor 250. The image sensor 210 is configured to convert the optical signal received through the lens 205 into an electrical signal and digitize the converted electrical signal to generate an image. For example, the image sensor 210 may include an analog-to-digital converter configured to convert analog image signals into digital image data.

램(220)은 메인 프로세서(250)와 연결된다. 램(220)은 메인 프로세서(250)에 의해 처리된 영상을 일시적으로 저장할 수 있다. 램(220)은 버퍼 메모리로서 사용될 수 있다. 램(220)은 메인 프로세서(250)의 워킹 메모리로서 사용될 수 있다. EEPROM(Electrically Erasable and Programmable Read Only Memory, 230)은 메인 프로세서(250)의 동작에 필요한 프로그램 코드들 및/또는 명령어들을 저장할 수 있다. 스토리지(240)는 메인 프로세서(250)의 동작들에 필요한 설정 데이터를 저장할 수 있다. 또한, 스토리지(240)는 메인 프로세서(250)에 의해 실행될 프로그램 코드들 및/또는 명령어들을 더 저장할 수 있다. 이러한 프로그램 코드들 및/또는 명령어들은 스토리지(240)로부터 램(220)에 로딩되고, 메인 프로세서(250)에 의해 실행될 수 있다. 아래에서 설명될 메인 프로세서(250)의 동작들 중 적어도 일부는 메인 프로세서(250)에 의해 이러한 프로그램 코드들 및/또는 명령어들을 실행함으로써 수행될 수 있다. 실시 예들에서, 스토리지(240)는 플래시 메모리와 같은 불휘발성 저장 매체를 포함할 수 있다.RAM 220 is connected to the main processor 250. RAM 220 may temporarily store images processed by the main processor 250. RAM 220 may be used as a buffer memory. RAM 220 may be used as a working memory of the main processor 250. Electrically Erasable and Programmable Read Only Memory (EEPROM) 230 can store program codes and/or instructions necessary for the operation of the main processor 250. The storage 240 may store setting data required for operations of the main processor 250. Additionally, the storage 240 may further store program codes and/or instructions to be executed by the main processor 250. These program codes and/or instructions may be loaded into RAM 220 from storage 240 and executed by main processor 250. At least some of the operations of the main processor 250, which will be described below, may be performed by the main processor 250 by executing these program codes and/or instructions. In embodiments, storage 240 may include a non-volatile storage medium, such as flash memory.

메인 프로세서(250)는 인공지능 카메라(200)의 제반 동작을 제어한다. 메인 프로세서(250)는 네트워크 인터페이스(260)를 통해 네트워크(50, 도 1 참조)에 연결된 구성 요소들과 통신할 수 있다. 메인 프로세서(250)는 이미지 센서(210)로부터 수신된 영상을 적절히 처리하도록 구성되며, 처리된 영상을 네트워크 인터페이스(260)를 통해 사용자 단말기(110)에 라이브-뷰로 전송할 수 있다. 또한, 메인 프로세서(250)는 처리된 영상을 네트워크 인터페이스(260)를 통해 영상 관리 서버(140)에 업로드할 수 있다. 나아가, 메인 프로세서(250)는 마이크로폰(미도시)을 통해 수신되는 오디오 데이터를 수신하고, 수신된 오디오 데이터를 적절히 처리하고, 처리된 오디오 데이터를 네트워크 인터페이스(260)를 통해 외부 장비로 전송할 수 있다. 이러한 경우, 오디오 데이터 및 영상 데이터는 멀티미디어 데이터를 구성할 수 있다.The main processor 250 controls overall operations of the artificial intelligence camera 200. The main processor 250 may communicate with components connected to the network 50 (see FIG. 1) through the network interface 260. The main processor 250 is configured to appropriately process the image received from the image sensor 210, and can transmit the processed image to the user terminal 110 through the network interface 260 in live-view. Additionally, the main processor 250 may upload the processed video to the video management server 140 through the network interface 260. Furthermore, the main processor 250 may receive audio data received through a microphone (not shown), appropriately process the received audio data, and transmit the processed audio data to external equipment through the network interface 260. . In this case, audio data and video data may constitute multimedia data.

도 3을 참조하면, 메인 프로세서(250)는 코어 프로세서(251), 데이터 포메터(252), 데이터 변환기(253), 리사이저(254), MPEG(Moving Picture Experts Group) 인코더(255), 및 JPEG(Joint Photographic Experts Group) 인코더(256)를 포함한다.Referring to FIG. 3, the main processor 250 includes a core processor 251, a data formatter 252, a data converter 253, a resizer 254, a Moving Picture Experts Group (MPEG) encoder 255, and Includes a Joint Photographic Experts Group (JPEG) encoder (256).

코어 프로세서(251)는 인공지능 카메라(200, 도 2 참조)의 제반 동작을 제어한다. 또한, 코어 프로세서(251)는 데이터 포매터(252), 데이터 변환기(253), 리사이저(254), MPEG 인코더(255), 및 JPEG 인코더(256)를 제어한다. 데이터 포메터(252)는 이미지 센서(210, 도 2 참조)로부터의 영상을 램(220)에 저장하며, 데이터 변환부(253)는 적색(R), 녹색(G), 및 청색(B) 형식의 영상 데이터를 휘도(Y) 및 색차(Cb, Cr) 형식의 영상 데이터로 변환하며, 리사이저(254)는 영상 데이터의 해상도를 변환할 수 있다. MPEG 인코더(255)는 동영상 인코더로서 동영상 데이터를 압축하며, JPEG 인코더(256)는 정지 영상 인코더로서 정지 영상 데이터를 압축할 수 있다. 이와 같이, 메인 프로세서(250)는 이미지 센서(210)로부터 수신된 영상을 처리하도록 구성된다.The core processor 251 controls overall operations of the artificial intelligence camera 200 (see FIG. 2). Additionally, the core processor 251 controls the data formatter 252, data converter 253, resizer 254, MPEG encoder 255, and JPEG encoder 256. The data formatter 252 stores the image from the image sensor 210 (see FIG. 2) in the RAM 220, and the data converter 253 converts the image into red (R), green (G), and blue (B). The image data in the format is converted into image data in the luminance (Y) and chrominance (Cb, Cr) formats, and the resizer 254 can convert the resolution of the image data. The MPEG encoder 255 is a video encoder that compresses video data, and the JPEG encoder 256 is a still image encoder that can compress still image data. In this way, the main processor 250 is configured to process the image received from the image sensor 210.

실시 예들에서, 데이터 포메터(252), 데이터 변환기(253), 리사이저(254), MPEG 인코더(255), 및 JPEG 인코더(256)와 같은 영상 처리를 위한 구성 요소들은 각각 하드웨어, 소프트웨어, 펌웨어, 및 그것들의 조합을 통해 구현될 수 있으며, 서로 결합되거나 더 많은 구성 요소들로 분리될 수 있다. 데이터 포메터(252), 데이터 변환기(253), 리사이저(254), MPEG 인코더(255), 및 JPEG 인코더(256) 중 적어도 하나가 소프트웨어로 구현되는 경우, 소프트웨어는 도 2의 스토리지(240)와 같은 컴퓨터로 판독 가능한 저장 매체에 저장될 수 있으며, 코어 프로세서(251)에 의해 실행될 수 있다. 또한, 데이터 포메터(252), 데이터 변환기(253), 리사이저(254), MPEG 인코더(255), 및 JPEG 인코더(256)와 같은 와 같은 영상 처리를 위한 구성 요소들 중 적어도 일부는 이미지 프로세싱 유닛과 같은 하나의 전용 프로세서를 통해 구현될 수 있다.In embodiments, components for image processing such as the data formatter 252, the data converter 253, the resizer 254, the MPEG encoder 255, and the JPEG encoder 256 are hardware, software, and firmware, respectively. , and their combinations, and can be combined with each other or separated into more components. If at least one of the data formatter 252, data converter 253, resizer 254, MPEG encoder 255, and JPEG encoder 256 is implemented as software, the software may be implemented as storage 240 of FIG. 2. It may be stored in a computer-readable storage medium such as, and may be executed by the core processor 251. In addition, at least some of the components for image processing, such as the data formatter 252, the data converter 253, the resizer 254, the MPEG encoder 255, and the JPEG encoder 256, perform image processing. It can be implemented through one dedicated processor, such as a unit.

다시 도 2를 참조하면, 메인 프로세서(250)는 처리된 영상을 분석하도록 인공지능 프로세서(270)에 커맨드할 수 있다. 인공지능 프로세서(270)는 인공지능 방식에 기반하여 처리된 영상을 분석하도록 구성된다. 영상 분석 결과는 예를 들면 램(220)에 임시 저장되며, 메인 프로세서(250)는 영상 분석 결과를 해당 영상과 함께 네트워크 인터페이스(260)를 통해 사용자 단말기(110) 혹은 영상 관리 서버(140)에 전송할 수 있다.Referring again to FIG. 2, the main processor 250 may command the artificial intelligence processor 270 to analyze the processed image. The artificial intelligence processor 270 is configured to analyze images processed based on artificial intelligence. The video analysis results are temporarily stored in the RAM 220, for example, and the main processor 250 sends the video analysis results along with the video to the user terminal 110 or the video management server 140 through the network interface 260. Can be transmitted.

도 4를 참조하면, 인공지능 프로세서(270)는 데이터 학습부(271) 및 데이터 분석부(272)를 포함할 수 있다. 데이터 학습부(271)는 딥 러닝 프레임워크를 포함할 수 있으며, 이에 따라 CNN(Convolutional neural network)과 같은 신경망 알고리즘, SIFT(Scale Invariant Feature Transform)와 같은 비전 알고리즘을 수행할 수 있다. 데이터 학습부(271)는 오브젝트/패턴 인지, 오브젝트들의 유사도 검사 등의 다양한 영상 분석 기준들을 학습할 수 있다. 데이터 학습부(271)는 영상 분석을 위하여 어떤 데이터를 이용할지에 관한 기준들을 학습(traning)하고 추론(inferencing)할 수 있다. 데이터 학습부(271)는 학습에 이용될 데이터를 획득하고, 획득된 데이터를 데이터 분석 모델에 적용함으로써, 영상 분석을 위한 기준을 학습해 나갈 수 있다.Referring to FIG. 4, the artificial intelligence processor 270 may include a data learning unit 271 and a data analysis unit 272. The data learning unit 271 may include a deep learning framework, and thus may perform neural network algorithms such as CNN (Convolutional neural network) and vision algorithms such as SIFT (Scale Invariant Feature Transform). The data learning unit 271 can learn various image analysis standards, such as object/pattern recognition and similarity checking of objects. The data learning unit 271 can learn and infer standards regarding which data to use for image analysis. The data learning unit 271 can learn standards for image analysis by acquiring data to be used for learning and applying the acquired data to a data analysis model.

데이터 분석부(272)는 메인 프로세서(250, 도 2 참조)의 요청에 응답하여 입력된 영상에 대한 분석을 수행할 수 있다. 데이터 분석부(272)는 학습된 데이터 인식 모델을 이용하여 영상 분석을 수행할 수 있다. 데이터 분석부(272)는 학습에 의해 설정된 기준들에 따라 데이터를 획득하고, 획득된 데이터를 입력 값으로 하는 데이터 분석 모델을 이용함으로써 영상 분석을 수행하고, 분석에 따른 결과 정보를 출력할 수 있다. 또한, 영상 분석의 결과 정보는 데이터 분석 모델을 업데이트하는데 이용될 수 있다.The data analysis unit 272 may perform analysis on the input image in response to a request from the main processor 250 (see FIG. 2). The data analysis unit 272 may perform image analysis using the learned data recognition model. The data analysis unit 272 acquires data according to the standards set by learning, performs image analysis by using a data analysis model that uses the acquired data as input, and outputs result information according to the analysis. . Additionally, the result information of image analysis can be used to update the data analysis model.

데이터 학습부(271) 및 데이터 분석부(272)는 각각 하드웨어, 소프트웨어, 펌웨어, 및 그것들의 조합을 통해 구현될 수 있으며, 서로 결합되거나 더 많은 구성 요소들로 분리될 수 있다. 데이터 학습부(271) 및 데이터 분석부(272) 중 적어도 하나는 인공지능을 위한 전용 하드웨어 칩 형태로 구현되거나, 범용 프로세서 또는 그래픽 전용 프로세서를 통해 구현될 수 있다. 데이터 학습부(271) 및 데이터 분석부(272) 중 적어도 하나가 소프트웨어로 구현되는 경우, 소프트웨어는 도 2의 스토리지(240)와 같은 컴퓨터로 판독 가능한 저장 매체에 저장될 수 있으며, 상기 범용 프로세서 또는 그래픽 전용 프로세서와 같은 프로세서에 의해 실행될 수 있다.The data learning unit 271 and the data analysis unit 272 may each be implemented through hardware, software, firmware, and a combination thereof, and may be combined with each other or separated into more components. At least one of the data learning unit 271 and the data analysis unit 272 may be implemented in the form of a dedicated hardware chip for artificial intelligence, or may be implemented through a general-purpose processor or a graphics-specific processor. When at least one of the data learning unit 271 and the data analysis unit 272 is implemented as software, the software may be stored in a computer-readable storage medium such as the storage 240 of FIG. 2, and the general-purpose processor or It can be executed by a processor, such as a dedicated graphics processor.

데이터 학습부(271) 및 데이터 분석부(272)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들면, 데이터 학습부(271)는 외부 장치에 포함되고, 데이터 분석부(272)는 인공지능 카메라(200, 도 2 참조)에 포함될 수 있다. 이러한 경우, 데이터 학습부(271) 및 데이터 분석부(272)는 유선 또는 무선으로 통신할 수 있으며, 데이터 학습부(271)는 구축한 모델 정보를 데이터 분석부(272)로 제공할 수도 있고, 데이터 분석부(272)로 입력된 데이터는 추가 학습 데이터로서 데이터 학습부(271)로 제공될 수도 있다.The data learning unit 271 and the data analysis unit 272 may be mounted on one electronic device, or may be mounted on separate electronic devices. For example, the data learning unit 271 may be included in an external device, and the data analysis unit 272 may be included in the artificial intelligence camera 200 (see FIG. 2). In this case, the data learning unit 271 and the data analysis unit 272 may communicate by wire or wirelessly, and the data learning unit 271 may provide the built model information to the data analysis unit 272, Data input to the data analysis unit 272 may be provided to the data learning unit 271 as additional learning data.

다시 도 2를 참조하면, 메인 프로세서(250)는 다른 인공지능 카메라들과 서로 등록 정보를 교환함으로써 영상 분석을 위한 클러스터(CLST, 도 1 참조)를 구성하고, 제 1 내지 제 n 노멀 카메라들(131~13n)에 액세스할 수 있도록 제 1 내지 제 n 노멀 카메라들(131~13n)의 등록 정보를 다른 인공지능 카메라들과 공유할 수 있다. 다른 인공지능 카메라들 및 제 1 내지 제 n 노멀 카메라들(131~13n)과의 통신들은 네트워크 인터페이스(260)를 통해 수행된다. 메인 프로세서(250)는 제 1 내지 제 n 노멀 카메라들(131~13n) 중 어느 하나를 할당 받을 때, 할당된 노멀 카메라에 의해 촬영된 영상을 분석하도록 인공지능 프로세서(270)를 제어할 수 있다.Referring again to FIG. 2, the main processor 250 configures a cluster (CLST, see FIG. 1) for image analysis by exchanging registration information with other artificial intelligence cameras, and uses the first to nth normal cameras ( The registration information of the first to nth normal cameras (131 to 13n) can be shared with other artificial intelligence cameras so that the cameras (131 to 13n) can be accessed. Communications with other artificial intelligence cameras and the first to nth normal cameras 131 to 13n are performed through the network interface 260. When any one of the first to nth normal cameras 131 to 13n is assigned, the main processor 250 may control the artificial intelligence processor 270 to analyze the image captured by the assigned normal camera. .

도 5는 인공지능 카메라의 출력 데이터의 포멧의 실시 예를 개념적으로 보여주는 도면이다.Figure 5 is a diagram conceptually showing an example of the format of output data from an artificial intelligence camera.

도 2 및 도 5를 참조하면, 메인 프로세서(250)는 영상(VD), 오디오(AD), 제 1 메타 데이터(META1), 및 제 2 메타 데이터(META2)를 포함하는 출력 데이터(DOUT)를 네트워크 인터페이스(260)를 통해 사용자 단말기(110) 혹은 영상 관리 서버(140)에 전송할 수 있다. 영상(VD) 및 오디오(AD)는 도 2를 참조하여 설명된 바와 같이 메인 프로세서(250)에 의해 생성된다. 제 1 메타 데이터(META1)는 영상(VD) 및/또는 오디오(AD)에 대한 인공지능 프로세서(270)의 분석 결과 정보를 포함할 수 있다. 제 2 메타 데이터(META2)는 노멀 카메라로부터 수신된 영상 및/또는 오디오에 대한 인공지능 프로세서(270)의 분석 결과 정보를 포함할 수 있다.2 and 5, the main processor 250 outputs output data (DOUT) including video (VD), audio (AD), first metadata (META1), and second metadata (META2). It can be transmitted to the user terminal 110 or the video management server 140 through the network interface 260. Video (VD) and audio (AD) are generated by the main processor 250 as described with reference to FIG. 2. The first metadata (META1) may include analysis result information of the artificial intelligence processor 270 for video (VD) and/or audio (AD). The second metadata (META2) may include information on the results of analysis by the artificial intelligence processor 270 of the video and/or audio received from the normal camera.

제 2 메타 데이터(META2)는 해당 노멀 카메라의 식별자를 더 포함할 수 있다. 식별자는 노멀 카메라의 아이디, IP 어드레스 등 노멀 카메라를 식별할 수 있는 다양한 종류들의 데이터를 포함할 수 있다. 이에 따라, 출력 데이터(DOUT)를 수신하는 사용자 단말기(110) 혹은 영상 관리 서버(140)는 출력 데이터(DOUT)에 포함된 제 2 메타 데이터(META2)가 어떤 노멀 카메라에 대응하는 것임을 판별할 수 있다.The second metadata (META2) may further include an identifier of the corresponding normal camera. The identifier may include various types of data that can identify the normal camera, such as the normal camera ID and IP address. Accordingly, the user terminal 110 or the video management server 140 receiving the output data (DOUT) can determine that the second metadata (META2) included in the output data (DOUT) corresponds to a certain normal camera. there is.

메인 프로세서(250)의 동작들과 관련된 좀 더 상세한 내용이 이하에서 설명된다.More details regarding the operations of main processor 250 are described below.

도 6은 인공지능 카메라에 의해 촬영된 영상을 분석하는 방법을 보여주는 순서도이다.Figure 6 is a flowchart showing a method of analyzing images captured by an artificial intelligence camera.

도 2 및 도 6을 참조하면, S110단계에서, 이미지 센서(210)를 통해 영상이 촬영된다. S120단계에서, 촬영된 영상이 인공지능 프로세서(270)를 이용하여 분석된다. 메인 프로세서(250)는 이미지 센서(210)를 통해 촬영된 영상을 처리하고, 처리된 영상을 분석하도록 인공지능 프로세서(270)에 커맨드할 수 있다. 메인 프로세서(250)는 촬영된 영상, 오디오, 영상의 분석에 따른 결과 정보를 도 5에 도시된 출력 데이터(DOUT)의 영상(VD) 필드, 오디오(AD) 필드, 및 제 1 메타 데이터(META1) 필드에 각각 포함시킬 수 있다.Referring to FIGS. 2 and 6 , in step S110, an image is captured through the image sensor 210. In step S120, the captured image is analyzed using the artificial intelligence processor 270. The main processor 250 may process images captured through the image sensor 210 and command the artificial intelligence processor 270 to analyze the processed images. The main processor 250 stores the resulting information according to the analysis of the captured video, audio, and video into the video (VD) field, the audio (AD) field, and the first metadata (META1) of the output data (DOUT) shown in FIG. 5. ) can be included in each field.

도 7은 본 발명의 실시 예에 따른 노멀 카메라들과 인터랙션할 수 있는 클러스터를 구성하기 위한 인공지능 카메라의 동작 방법을 보여주는 순서도이다. 도 8은 도 7의 S210단계의 실시 예를 보여주는 순서도이다. 도 9는 도 7의 S220단계의 실시 예를 보여주는 순서도이다.Figure 7 is a flowchart showing a method of operating an artificial intelligence camera to configure a cluster that can interact with normal cameras according to an embodiment of the present invention. Figure 8 is a flowchart showing an example of step S210 of Figure 7. Figure 9 is a flowchart showing an example of step S220 of Figure 7.

도 1 및 도 2와 함께 도 7을 참조하면, S210단계에서, 인공지능 카메라(200)는 다른 인공지능 카메라와 서로 등록 정보를 교환함으로써 다른 인공지능 카메라와 함께 영상 분석을 위한 클러스터를 구성한다. 제 1 내지 제 3 인공지능 카메라들(121~123)은 도 1을 참조하여 설명된 바와 같이 네트워크(50)를 통해 서로 통신할 수 있으며, 각 인공지능 카메라는 다른 인공지능 카메라에 등록 정보를 전송하고 다른 인공지능 카메라로부터 등록 정보를 수신함으로써 인공지능 카메라들(121~123)을 포함하는 클러스터(CLST)가 생성될 수 있다.Referring to FIG. 7 along with FIGS. 1 and 2 , in step S210, the artificial intelligence camera 200 forms a cluster for image analysis with other artificial intelligence cameras by exchanging registration information with other artificial intelligence cameras. The first to third artificial intelligence cameras 121 to 123 can communicate with each other through the network 50 as described with reference to FIG. 1, and each artificial intelligence camera transmits registration information to other artificial intelligence cameras. And by receiving registration information from other artificial intelligence cameras, a cluster (CLST) including artificial intelligence cameras 121 to 123 can be created.

각 인공지능 카메라의 등록 정보는 사용자 단말기(110)를 통해 사용자로부터 제공될 수 있다. 도 8을 참조하면, 인공지능 카메라(200)는 사용자 단말기(110)로부터 다른 인공지능 카메라의 등록 정보를 수신하고(S211), 수신된 등록 정보에 대응하는 인공지능 카메라와 통신을 수행함으로써 해당 인공지능 카메라와 함께 클러스터(CLST)를 구성할 수 있다. 예를 들면, 사용자 단말기(110)가 제 1 인공지능 카메라(121)에 액세스하여 제 2 및 제 3 인공지능 카메라들(122, 123)의 등록 정보를 제공하면, 제 1 인공지능 카메라(121)는 제공된 등록 정보를 이용하여 제 2 및 제 3 인공지능 카메라들(122, 123) 각각에 액세스함에 따라, 제 1 내지 제 3 인공지능 카메라들(121~123)은 서로의 등록 정보를 공유할 수 있다. 이에 따라, 제 1 내지 제 3 인공지능 카메라들(121~123)을 포함하는 클러스터(CLST)가 생성될 수 있다.Registration information for each artificial intelligence camera may be provided by the user through the user terminal 110. Referring to FIG. 8, the artificial intelligence camera 200 receives registration information of another artificial intelligence camera from the user terminal 110 (S211) and communicates with the artificial intelligence camera corresponding to the received registration information, thereby A cluster (CLST) can be formed with intelligent cameras. For example, when the user terminal 110 accesses the first artificial intelligence camera 121 and provides registration information of the second and third artificial intelligence cameras 122 and 123, the first artificial intelligence camera 121 As accessing each of the second and third artificial intelligence cameras 122 and 123 using the provided registration information, the first to third artificial intelligence cameras 121 to 123 can share each other's registration information. there is. Accordingly, a cluster (CLST) including the first to third artificial intelligence cameras 121 to 123 may be created.

클러스터(CLST)의 생성 시에, 클러스터(CLST)의 제 1 내지 제 3 인공지능 카메라들(121~123)은 서로 통신하여 그 중 어느 하나를 마스터 노드로 결정하는 협상을 수행할 수 있다. 이에 따라, 제 1 내지 제 3 인공지능 카메라들(121~123) 중 어느 하나는 마스터(master) 노드로서 기능하고, 나머지 인공지능 카메라들은 에이전트(agent) 노드로서 기능할 수 있다. 마스터 노드는 제 1 내지 제 n 노멀 카메라들(131~13n)의 영상들에 대해 딥 러닝 방식을 이용한 영상 분석들을 수행하도록, 제 1 내지 제 n 노멀 카메라들(131~13n) 각각을 제 1 내지 제 3 인공지능 카메라들(121~123) 중 어느 하나에 할당할 수 있다.When creating a cluster (CLST), the first to third artificial intelligence cameras 121 to 123 of the cluster (CLST) may communicate with each other to negotiate to determine one of them as the master node. Accordingly, one of the first to third artificial intelligence cameras 121 to 123 may function as a master node, and the remaining artificial intelligence cameras may function as agent nodes. The master node configures each of the first to nth normal cameras 131 to 13n to perform image analysis using a deep learning method on the images of the first to nth normal cameras 131 to 13n. It can be assigned to any one of the third artificial intelligence cameras (121 to 123).

다시 도 1, 도 2, 및 도 7을 참조하면, S220단계에서, 인공지능 카메라(200)는 제 1 내지 제 n 노멀 카메라들(131~13n)의 등록 정보를 다른 인공지능 카메라와 공유한다. 이에 따라, 제 1 내지 제 3 인공지능 카메라들(121~123) 각각은 네트워크(50)를 통해 제 1 내지 제 n 노멀 카메라들(131~13n)에 액세스할 수 있게 된다. 예를 들면, 인공지능 카메라(200)는 다른 인공지능 카메라에 노멀 카메라의 등록 정보를 제공할 수 있으며, 또한 다른 인공지능 카메라로부터 노멀 카메라의 등록 정보를 수신할 수 있다. 이때, 등록 정보는 노멀 카메라의 URL(uniform resource locator) 어드레스, IP(internet protocol) 어드레스, 포트(port) 번호, 카메라 로그인 계정과 같은 카메라에 액세스하기 위한 정보를 포함할 수 있다.Referring again to FIGS. 1, 2, and 7, in step S220, the artificial intelligence camera 200 shares registration information of the first to nth normal cameras 131 to 13n with other artificial intelligence cameras. Accordingly, each of the first to third artificial intelligence cameras 121 to 123 can access the first to nth normal cameras 131 to 13n through the network 50. For example, the artificial intelligence camera 200 can provide registration information of a normal camera to another artificial intelligence camera, and can also receive registration information of a normal camera from another artificial intelligence camera. At this time, the registration information may include information for accessing the camera, such as the normal camera's URL (uniform resource locator) address, IP (internet protocol) address, port number, and camera login account.

노멀 카메라의 등록 정보는 사용자 단말기(110)를 통해 사용자로부터 제공될 수 있다. 다양한 방식들에 따라 제 1 내지 제 n 노멀 카메라들(131~13n)의 등록 정보가 제 1 내지 제 3 인공지능 카메라들(121~123)에 공유될 수 있다. 도 9를 참조하면, 인공지능 카메라(200)는 사용자 단말기(110)로부터 제 1 내지 제 n 노멀 카메라들(131~13n)의 등록 정보를 수신하고(S221), 수신된 등록 정보를 다른 인공지능 카메라에게 제공할 수 있다. 예를 들면, 사용자 단말기(110)가 제 1 인공지능 카메라(121)에 제 1 내지 제 n 노멀 카메라들(131~13n)의 등록 정보를 제공하면, 제 1 인공지능 카메라(121)는 제공된 등록 정보를 제 2 및 제 3 인공지능 카메라들(122, 123)에 제공할 수 있다.Registration information for the normal camera may be provided by the user through the user terminal 110. Registration information of the first to nth normal cameras 131 to 13n may be shared with the first to third artificial intelligence cameras 121 to 123 according to various methods. Referring to FIG. 9, the artificial intelligence camera 200 receives registration information of the first to nth normal cameras 131 to 13n from the user terminal 110 (S221), and sends the received registration information to another artificial intelligence. It can be provided to the camera. For example, when the user terminal 110 provides registration information of the first to nth normal cameras 131 to 13n to the first artificial intelligence camera 121, the first artificial intelligence camera 121 provides the registration information. Information can be provided to the second and third artificial intelligence cameras 122 and 123.

도 10은 클러스터를 구성한 후 인공지능 카메라들에 저장 및 공유되는 클러스터 정보를 보여주는 테이블이다.Figure 10 is a table showing cluster information stored and shared with artificial intelligence cameras after forming a cluster.

클러스터(CLST)가 생성된 후 클러스터(CLST) 내 제 1 내지 제 3 인공지능 카메라들(121~123)은 클러스터 정보(CLSTIF)를 저장 및 공유할 수 있다. 도 1 및 도 10을 참조하면, 클러스터 정보(CLSTIF)는 제 1 내지 제 3 인공지능 카메라들(121~123)의 식별자들(AICAM1, AICAM2, AICAM3) 각각에 대응하는 IP 어드레스, 인공지능에 기반한 테스크들의 처리에 따른 인공지능 프로세서의 사용량, 메인 프로세서의 사용량을 포함할 수 있다.After the cluster (CLST) is created, the first to third artificial intelligence cameras (121 to 123) within the cluster (CLST) can store and share cluster information (CLSTIF). 1 and 10, cluster information (CLSTIF) is an IP address corresponding to each of the identifiers (AICAM1, AICAM2, AICAM3) of the first to third artificial intelligence cameras 121 to 123, based on artificial intelligence. It may include the usage of the artificial intelligence processor and the usage of the main processor according to the processing of tasks.

클러스터 정보(CLSTIF)는 제 1 내지 제 3 인공지능 카메라들(121~123) 중 마스터 노드에 의해 수집되고, 제 1 내지 제 3 인공지능 카메라들(121~123) 전체에 공유될 수 있다. 클러스터 정보(CLSTIF)의 인공지능 프로세서의 사용량 및 메인 프로세서의 사용량을 참조하여, 마스터 노드는 제 1 내지 제 n 노멀 카메라들(131~13n) 각각을 제 1 내지 제 3 인공지능 카메라들(121~123) 중 어느 하나에 할당할 수 있다.Cluster information (CLSTIF) is collected by the master node among the first to third artificial intelligence cameras (121 to 123) and may be shared throughout the first to third artificial intelligence cameras (121 to 123). With reference to the usage of the artificial intelligence processor and the usage of the main processor in the cluster information (CLSTIF), the master node connects each of the first to nth normal cameras (131 to 13n) to the first to third artificial intelligence cameras (121 to 121). 123) can be assigned to any one of the following.

사용자는 사용자 단말기(110)를 통해 클러스터(CLST)의 제 1 내지 제 3 인공지능 카메라들(121~123) 중 어느 하나에 액세스하여 클러스터 정보(CLSTIF)의 적어도 일부를 조회할 수 있다.The user may access any one of the first to third artificial intelligence cameras 121 to 123 of the cluster CLST through the user terminal 110 and query at least part of the cluster information CLSTIF.

도 11은 클러스터를 구성한 후 인공지능 카메라들에 저장 및 공유되는 노멀 카메라 정보를 보여주는 테이블이다. 도 11에서, 설명의 편의를 위해 영상 촬영 시스템에 5개의 노멀 카메라들이 제공되는 것으로 예시된다.Figure 11 is a table showing normal camera information stored and shared with artificial intelligence cameras after forming a cluster. In FIG. 11, for convenience of explanation, it is illustrated that five normal cameras are provided in the image capture system.

클러스터(CLST) 내 제 1 내지 제 3 인공지능 카메라들(121~123)은 노멀 카메라 정보(NRMCAMIF)를 저장 및 공유할 수 있다. 도 1 및 도 11을 참조하면, 노멀 카메라 정보(NRMCAMIF)는 제 1 내지 제 5 노멀 카메라들(131~135)의 식별자들(NRMCAM1~NRMCAM5) 각각에 대응하는 IP 어드레스 및 감지 이벤트 타입을 포함할 수 있다. 실시 예들에서, 노멀 카메라는 인공지능이 아닌 종래의 이벤트 감지 알고리즘들 중 적어도 하나에 기반한 영상 분석을 수행하도록 구성되는 프로세서를 포함할 수 있으며, 노멀 카메라 정보(NRMCAMIF)는 노멀 카메라에 채용된 이벤트 감지 알고리즘의 이벤트 타입에 대한 정보를 더 저장할 수 있다. 예를 들면, 감지 이벤트 타입은 모션 감지, 얼굴 감지, 소리 감지 등을 포함할 수 있다.The first to third artificial intelligence cameras (121 to 123) in the cluster (CLST) can store and share normal camera information (NRMCAMIF). 1 and 11, normal camera information (NRMCAMIF) may include an IP address and a detection event type corresponding to each of the identifiers (NRMCAM1 to NRMCAM5) of the first to fifth normal cameras 131 to 135. You can. In embodiments, the normal camera may include a processor configured to perform image analysis based on at least one of conventional event detection algorithms rather than artificial intelligence, and the normal camera information (NRMCAMIF) may be configured to detect the event employed in the normal camera. Additional information about the event type of the algorithm can be stored. For example, detection event types may include motion detection, face detection, sound detection, etc.

도 12는 노멀 카메라들과 인터랙션할 수 있는 클러스터에 인공지능 카메라를 추가하는 방법의 실시 예를 보여주는 순서도이다.Figure 12 is a flowchart showing an example of a method for adding an artificial intelligence camera to a cluster that can interact with normal cameras.

도 1 및 도 2와 함께 도 12를 참조하면, S310단계에서, 인공지능 카메라(200)는 사용자 단말기(110)로부터 추가적인 인공지능 카메라의 등록 정보를 수신할 수 있다. S320단계에서, 인공지능 카메라(200)는 수신된 등록 정보에 따라 상기 추가적인 인공지능 카메라에 액세스하여 해당 인공지능 카메라를 클러스터(CLST)에 추가한다. 또한, 수신된 등록 정보는 인공지능 카메라(200)를 포함한 클러스터(CLST) 내 인공지능 카메라들에 공유될 수 있다. 예를 들면, 사용자에 의해 입력된 추가적인 인공지능 카메라의 등록 정보가 사용자 단말기(110)를 통해 제 1 인공지능 카메라(121)에 제공되면, 제 1 인공지능 카메라(121)는 제공된 등록 정보를 제 2 및 제 3 인공지능 카메라들(122, 123)에 전송할 수 있다. 제 1 내지 제 3 인공지능 카메라들(121~123) 각각은 제공된 등록 정보에 따라 추가적인 인공지능 카메라에 액세스하고, 제 1 내지 제 3 인공지능 카메라들(121~123) 및 추가적인 인공지능 카메라는 서로의 등록 정보를 공유할 수 있다. 이에 따라, 해당 인공지능 카메라는 클러스터(CLST)에 추가될 수 있다.Referring to FIG. 12 along with FIGS. 1 and 2 , in step S310, the artificial intelligence camera 200 may receive registration information of an additional artificial intelligence camera from the user terminal 110. In step S320, the artificial intelligence camera 200 accesses the additional artificial intelligence camera according to the received registration information and adds the artificial intelligence camera to the cluster (CLST). Additionally, the received registration information can be shared with artificial intelligence cameras in the cluster (CLST) including the artificial intelligence camera 200. For example, when registration information of an additional artificial intelligence camera input by the user is provided to the first artificial intelligence camera 121 through the user terminal 110, the first artificial intelligence camera 121 provides the provided registration information. It can be transmitted to the second and third artificial intelligence cameras (122, 123). Each of the first to third artificial intelligence cameras (121 to 123) accesses an additional artificial intelligence camera according to the provided registration information, and the first to third artificial intelligence cameras (121 to 123) and the additional artificial intelligence camera access each other. You can share registration information. Accordingly, the corresponding artificial intelligence camera can be added to the cluster (CLST).

S330단계에서, 인공지능 카메라(200)는 추가된 인공지능 카메라에 각 노멀 카메라의 등록 정보를 공유할 수 있다. 예를 들면, 제 1 내지 제 3 인공지능 카메라들(121~123)은 노멀 카메라 정보(NRMCAMIF, 도 11 참조)를 추가적인 인공지능 카메라에 공유할 수 있다.In step S330, the artificial intelligence camera 200 may share the registration information of each normal camera with the added artificial intelligence camera. For example, the first to third artificial intelligence cameras 121 to 123 may share normal camera information (NRMCAMIF, see FIG. 11) with additional artificial intelligence cameras.

이와 같이, 클러스터(CLST)의 자원들은 상대적으로 용이하게 확장될 수 있으며, 따라서 별도의 인공지능 기능을 포함하는 서버의 제공 혹은 증설 없이도, 그 자체로 영상을 촬영할 수 있는 인공지능 카메라의 추가를 통해, 영상 촬영에 의한 감시 범위를 넓히면서도 인공지능에 기반한 영상 분석을 지원받을 수 있는 노멀 카메라들의 개수를 확장할 수 있다.In this way, the resources of the cluster (CLST) can be expanded relatively easily, and therefore, without the provision or expansion of a server containing separate artificial intelligence functions, through the addition of an artificial intelligence camera that can capture images by itself. , it is possible to expand the number of normal cameras that can support video analysis based on artificial intelligence while expanding the scope of surveillance through video shooting.

도 13은 본 발명의 실시 예에 따른 클러스터에 포함된 인공지능 카메라에서 노멀 카메라의 영상을 분석하는 방법을 보여주는 순서도이다.Figure 13 is a flowchart showing a method of analyzing images from a normal camera in an artificial intelligence camera included in a cluster according to an embodiment of the present invention.

도 1 및 도 2와 함께 도 13을 참조하면, S410단계에서, 인공지능 카메라(200)에 제 1 내지 제 n 노멀 카메라들(131~13n) 중 어느 하나가 할당될 수 있다. 위에서 설명된 바와 같이, 할당은 클러스터(CLST) 내 제 1 내지 제 3 인공지능 카메라들(121~123) 중 마스터 노드에 의해 수행될 수 있다. 이때, 인공지능 카메라(200)는 마스터 노드일 수 있고, 에이전트 노드일 수도 있다. 노멀 카메라가 할당될 때, S420단계가 수행된다.Referring to FIG. 13 along with FIGS. 1 and 2 , in step S410, any one of the first to nth normal cameras 131 to 13n may be assigned to the artificial intelligence camera 200. As described above, allocation may be performed by a master node among the first to third artificial intelligence cameras 121 to 123 in the cluster (CLST). At this time, the artificial intelligence camera 200 may be a master node or an agent node. When a normal camera is assigned, step S420 is performed.

S420단계에서, 인공지능 카메라(200)는 할당된 노멀 카메라에 액세스하여 할당된 노멀 카메라에 의해 촬영된 영상을 수신한다.In step S420, the artificial intelligence camera 200 accesses the assigned normal camera and receives an image captured by the assigned normal camera.

S430단계에서, 인공지능 카메라(200)는 인공지능 프로세서(270)를 이용하여 수신된 영상을 분석한다.In step S430, the artificial intelligence camera 200 analyzes the received image using the artificial intelligence processor 270.

S440단계에서, 인공지능 카메라(200)는 영상의 분석에 따른 결과 정보를 할당된 노멀 카메라의 식별자와 함께 영상 관리 서버(140)로 전송한다. 인공지능 카메라(200)는 영상의 분석에 따른 결과 정보 및 노멀 카메라의 식별자를 도 5에 도시된 출력 데이터(DOUT)의 제 2 메타 데이터(META2) 필드에 포함시킬 수 있다.In step S440, the artificial intelligence camera 200 transmits the result information according to the analysis of the video to the video management server 140 along with the identifier of the assigned normal camera. The artificial intelligence camera 200 may include result information from video analysis and the identifier of the normal camera in the second metadata (META2) field of the output data (DOUT) shown in FIG. 5.

이와 같이, 인공지능 카메라들(121~123)을 포함하는 클러스터(CLST)를 통해 제 1 내지 제 n 노멀 카메라들(131~13n)의 영상들을 분석함으로써, 각 노멀 카메라는 인공지능 카메라들(121~123) 중 어느 하나에 예를 들면 가용 자원을 참조함으로써 할당될 수 있고, 따라서 제 1 내지 제 n 노멀 카메라들(131~13n)의 영상들에 대한 분석은 별도의 인공지능 기능을 포함하는 서버를 제공하지 않고도 기 제공된 인공지능 카메라들(121~123)을 이용하여 효율적으로 수행될 수 있다. 이에 따라, 별도의 인공지능 기능을 포함하는 서버 없이도, 인공지능에 기반한 영상 분석은 제 1 내지 제 n 인공지능 카메라들(121~123)에 의해 촬영되는 영상들뿐만 아니라 제 1 내지 제 n 노멀 카메라들(131~13n)에 의해 촬영되는 영상들에까지 확장될 수 있다. 따라서, 인공지능에 기반한 영상 분석의 범위를 효율적으로 확장시킬 수 있는 영상 분석 방법이 제공될 수 있다.In this way, by analyzing the images of the first to nth normal cameras (131 to 13n) through the cluster (CLST) including the artificial intelligence cameras (121 to 123), each normal camera is an artificial intelligence camera (121). ~123), for example, by referring to available resources, and therefore analysis of the images of the first to nth normal cameras 131 to 13n can be performed using a server that includes a separate artificial intelligence function. It can be performed efficiently using the artificial intelligence cameras 121 to 123 already provided without providing. Accordingly, without a server containing a separate artificial intelligence function, image analysis based on artificial intelligence can be performed on not only the images captured by the first to nth artificial intelligence cameras 121 to 123, but also the first to nth normal cameras. It can be extended to images captured by fields 131 to 13n. Therefore, an image analysis method that can efficiently expand the scope of image analysis based on artificial intelligence can be provided.

도 14는 도 12의 S420단계의 실시 예를 보여주는 순서도이다.Figure 14 is a flowchart showing an example of step S420 of Figure 12.

도 1 및 도 2와 함께 도 14를 참조하면, S421단계에서, 인공지능 카메라(200)는 할당된 노멀 카메라들(131~131) 중 어느 하나로부터 이벤트 알람 신호를 수신할 수 있다. 이벤트 알람 신호가 수신될 때, S422단계가 수행될 수 있다.Referring to FIG. 14 along with FIGS. 1 and 2 , in step S421, the artificial intelligence camera 200 may receive an event alarm signal from any one of the assigned normal cameras 131 to 131. When an event alarm signal is received, step S422 may be performed.

노멀 카메라는 인공지능이 아닌, 모션 감지, 얼굴 감지, 소리 감지와 같은 종래의 이벤트 감지 알고리즘들을 수행하도록 구성될 수 있으며, 이벤트의 감지에 응답하여 이벤트 알람 신호를 생성할 수 있다. 실시 예들에서, 인공지능 카메라(200)는 노멀 카메라의 할당에 응답하여, 이벤트의 감지에 응답하여 이벤트 알람 신호를 제공해줄 것을 노멀 카메라에 요청할 수 있으며, 노멀 카메라는 인공지능 카메라(200)에 이벤트 알람 신호를 제공할 수 있다. 실시 예들에서, 마스터 노드는 이벤트의 감지에 응답하여 이벤트 알람 신호를 제공해줄 것을 노멀 카메라에 요청할 수 있으며, 노멀 카메라는 마스터 노드에 이벤트 알람 신호를 제공할 수 있다. 이러한 방식에서, 인공지능 카메라(200)가 마스터 노드인 경우, 노멀 카메라로부터 이벤트 알람 신호를 수신할 수 있다. 인공지능 카메라(200)가 에이전트 노드인 경우, 마스터 노드를 통해 이벤트 알람 신호를 수신할 수 있다.A normal camera may be configured to perform conventional event detection algorithms, such as motion detection, face detection, and sound detection, rather than artificial intelligence, and may generate an event alarm signal in response to detection of an event. In embodiments, the artificial intelligence camera 200 may request the normal camera to provide an event alarm signal in response to detection of an event, in response to the assignment of the normal camera, and the normal camera may request the normal camera to provide an event alarm signal to the artificial intelligence camera 200. An alarm signal can be provided. In embodiments, a master node may request a normal camera to provide an event alarm signal in response to detection of an event, and the normal camera may provide an event alarm signal to the master node. In this way, if the artificial intelligence camera 200 is a master node, it can receive an event alarm signal from the normal camera. If the artificial intelligence camera 200 is an agent node, it can receive an event alarm signal through the master node.

노멀 카메라는 이벤트를 감지한 경우, 인공지능(혹은 딥러닝)을 통한 영상 분석을 지원하는 특수 모드로 진입할 수 있다. 예를 들면, 노멀 카메라는 미리 설정된 값들로 내부 설정값들을 변경할 수 있다. 이벤트의 감지는 인공지능을 통한 영상 분석이 필요한 것을 의미하는 바, 인공지능을 통한 영상 분석에 적합하도록 미리 설정된 값들로 설정값들을 변경할 수 있다. 영상 관리 서버(140)로 송신되어 디스플레이를 통해 사용자에게 제공되기에 적합한 영상과 인공지능을 통한 영상 분석에 적합한 영상은 상이할 수 있다. 인공지능을 통한 영상 분석에 적합한 영상을 촬영하도록 노멀 카메라가 설정되어 있는 경우, 영상 관리 서버(140)를 통해 수신되는 영상을 시청하는 사용자는 불편함을 느낄 수 있다. 이러한 이유에서, 노멀 카메라는 평소에는 사용자에게 제공되기에 적합한 영상을 촬영하도록 설정되어 있을 수 있다. 반면, 인공지능 카메라(200)가 사용자에게 제공되기에 적합한 영상을 수신하여 영상 분석을 수행하는 경우, 영상 분석에 적합하도록 영상에 대해 전처리를 수행할 것이 요구된다. 전처리 과정에서 영상에 많은 노이즈들이 발생할 수 있고, 많은 시간이 소요될 수 있다. 이러한 이유에서, 노멀 카메라의 설정값들은 인공지능을 통한 영상 분석에 적합한 값들로 변경되고, 인공지능 카메라(200)는 해당 설정 하에서 촬영된 영상을 노멀 카메라로부터 수신할 수 있다. 이에 따라, 인공지능 카메라(200)는 영상에 대한 전처리을 하지 않거나 줄어든 전처리 과정을 통해 빠르고 정확하게 영상 분석을 수행할 수 있다. 즉, 인공지능 카메라(200)에 적합하게 샤프니스(sharpness) 혹은 노출(exposure) 등의 설정값들이 조절되어, 노멀 카메라의 영상 품질(Image Quality)을 인공지능(혹은 딥러닝)에 적합하도록 할 수 있다. 노멀 카메라는 인공지능 카메라(200)으로부터의 설정값 제어요청에 응답하여 설정값들을 변경할 수 있고, 이벤트의 감지에 응답하여 설정값들을 변경할 수도 있다. 또는, 영상 관리 서버(140)의 제어에 응답하여 설정값들을 변경할 수도 있다. 이러한 노멀 카메라의 특수 모드로의 진입은 S422단계 이전에 수행될 수 있다.When a normal camera detects an event, it can enter a special mode that supports image analysis through artificial intelligence (or deep learning). For example, a normal camera can change its internal settings to preset values. Detection of an event means that image analysis through artificial intelligence is required, and the settings can be changed to preset values to suit image analysis through artificial intelligence. An image suitable for being transmitted to the video management server 140 and provided to a user through a display may be different from an image suitable for image analysis through artificial intelligence. If a normal camera is set to capture images suitable for image analysis through artificial intelligence, a user watching images received through the image management server 140 may feel uncomfortable. For this reason, the normal camera may be set to capture images suitable to be provided to the user. On the other hand, when the artificial intelligence camera 200 receives an image suitable to be provided to a user and performs image analysis, it is required to perform preprocessing on the image to make it suitable for image analysis. During the preprocessing process, a lot of noise may occur in the image and it may take a lot of time. For this reason, the settings of the normal camera are changed to values suitable for image analysis through artificial intelligence, and the artificial intelligence camera 200 can receive images captured under the corresponding settings from the normal camera. Accordingly, the artificial intelligence camera 200 can quickly and accurately perform image analysis without pre-processing the image or through a reduced pre-processing process. In other words, setting values such as sharpness or exposure can be adjusted to suit the artificial intelligence camera 200, making the image quality of the normal camera suitable for artificial intelligence (or deep learning). there is. The normal camera can change setting values in response to a setting value control request from the artificial intelligence camera 200, and can also change setting values in response to detection of an event. Alternatively, the setting values may be changed in response to control of the video management server 140. Entry into this special mode of the normal camera can be performed before step S422.

노멀 카메라는 인공지능을 통한 영상 분석에 필요한 프레임들을 촬영하는 동안에만 특수 모드의 값들로 내부 설정값들을 변경하고, 이후 다시 설정값들을 이전 설정값들으로 복원할 수 있다. 또는, 인공지능 카메라(200)는 인공지능 카메라(200)의 영상 분석이 종료될 때 설정값들을 복원하도록 노멀 카메라를 제어할 수 있다.A normal camera can change its internal settings to the special mode values only while shooting the frames required for video analysis through artificial intelligence, and then restore the settings to their previous settings. Alternatively, the artificial intelligence camera 200 may control the normal camera to restore the settings when the image analysis of the artificial intelligence camera 200 ends.

S422단계에서, 이벤트 알람 신호에 응답하여, 인공지능 카메라(200)는 촬영된 영상의 제공을 노멀 카메라에 요청한다.In step S422, in response to the event alarm signal, the artificial intelligence camera 200 requests the normal camera to provide the captured image.

S423단계에서, 인공지능 카메라(200)는 노멀 카메라로부터 영상을 수신하고, 인공지능 프로세서(270)를 이용하여 수신된 영상을 분석할 수 있다.In step S423, the artificial intelligence camera 200 may receive an image from the normal camera and analyze the received image using the artificial intelligence processor 270.

다른 실시 예로서, 인공지능 카메라(200)는 할당된 노멀 카메라에 상시로 액세스하여 영상을 수신하고, 수신된 영상을 분석할 수도 있다.As another example, the artificial intelligence camera 200 may constantly access the assigned normal camera to receive images and analyze the received images.

인공지능 카메라(200)는 노멀 카메라의 영상을 분석할 때, 딥러닝(혹은 인공지능)에 따른 확률이 임계치 이상이 되는지 여부에 따라 S422단계 및 S423단계를 통해 노멀 카메라로부터 수신하는 영상의 길이를 가변적으로 제어할 수 있다. 인공지능 프로세서(270)는 예를 들면 딥러닝을 통한 영상 분석과 함께, 딥러닝에 따른 확률을 출력할 수 있으며, 이러한 확률이 임계치 이상인 경우 영상 분석이 완료된 것을 의미할 수 있다. 딥러닝에 따른 확률이 임계치 이상이 되는 경우 추가적인 영상 분석이 필요하지 않으므로, 인공지능 카메라(200) 및/또는 메인 프로세서(250)는 딥러닝에 따른 확률이 임계치 이상이 되는지 여부에 따라 노멀 카메라로부터 수신하는 영상의 길이를 가변적으로 조절할 수 있다. 인공지능 카메라(200)는 딥러닝에 따른 확률이 임계치 이상이 되는지 여부에 따라 상대적으로 짧은 길이의 영상을 수신하거나 상대적으로 긴 길이의 영상을 수신할 수 있다. 예를 들면, 인공지능 카메라(200)는 추가적인 영상이 필요한 경우 영상을 추가로 요청하여 수신할 수 있으며, 이러한 경우 추가적인 영상의 길이, 추가적인 영상을 요청하는 횟수 등은 딥러닝에 따른 확률에 따라 가변적으로 조절될 수 있다.When analyzing the image of the normal camera, the artificial intelligence camera 200 determines the length of the image received from the normal camera through steps S422 and S423 depending on whether the probability according to deep learning (or artificial intelligence) is greater than the threshold. It can be controlled variably. For example, the artificial intelligence processor 270 may analyze images through deep learning and output a probability according to deep learning. If this probability is greater than or equal to a threshold, it may mean that image analysis is complete. Since additional image analysis is not required when the probability according to deep learning is greater than the threshold, the artificial intelligence camera 200 and/or the main processor 250 selects the normal camera depending on whether the probability according to deep learning is greater than the threshold. The length of the received video can be variably adjusted. The artificial intelligence camera 200 can receive an image of a relatively short length or an image of a relatively long length depending on whether the probability according to deep learning is greater than or equal to a threshold. For example, if additional images are needed, the artificial intelligence camera 200 can request and receive additional images. In this case, the length of the additional images, the number of times to request additional images, etc. are variable depending on the probability according to deep learning. can be adjusted.

인공지능 카메라(200)가 노멀 카메라로부터 정지 영상을 수신하는 경우, 딥러닝에 따른 확률이 임계치 이상이 되는지 여부에 따라 추가적인 정지 영상을 요청할 수 있고, 인공지능 카메라(200)가 노멀 카메라로부터 동적 영상을 수신하는 경우, 딥러닝에 따른 확률이 임계치 이상이 되는지 여부에 따라 동적 영상을 송신 중단을 요청할 수 있다.When the artificial intelligence camera 200 receives a still image from the normal camera, additional still images may be requested depending on whether the probability according to deep learning is greater than the threshold, and the artificial intelligence camera 200 may receive a dynamic image from the normal camera. When receiving, you can request to stop transmitting dynamic images depending on whether the probability according to deep learning exceeds the threshold.

이와 같이, 인공지능 카메라(200)는 딥러닝에 따른 확률이 임계치 이상이 되는지 여부에 따라 노멀 카메라로부터 수신하는 영상의 길이를 가변적으로 제어할 수 있다. 이에 따라, 노멀 카메라의 설정값들을 변경하거나 복원하는 시간도 빨라질 수 있다.In this way, the artificial intelligence camera 200 can variably control the length of the image received from the normal camera depending on whether the probability according to deep learning is greater than or equal to the threshold. Accordingly, the time to change or restore the settings of the normal camera can also be accelerated.

도 15는 본 발명의 다른 실시 예에 따른 클러스터에 포함된 인공지능 카메라에서 노멀 카메라의 영상을 분석하는 방법을 보여주는 순서도이다.Figure 15 is a flowchart showing a method of analyzing images from a normal camera in an artificial intelligence camera included in a cluster according to another embodiment of the present invention.

도 1 및 도 2와 함께 도 15를 참조하면, S510단계에서, 인공지능 카메라(200)는 다른 인공지능 카메라와 상태 메시지들을 송수신하여 클러스터(CLST) 내 인공지능 카메라들(121~123) 중 비정상인 인공지능 카메라가 존재하는지 여부를 판별한다. 인공지능 카메라들(121~123)은 주기적으로 상태 메시지들을 교환할 수 있다.Referring to FIG. 15 along with FIGS. 1 and 2, in step S510, the artificial intelligence camera 200 transmits and receives status messages with other artificial intelligence cameras to detect abnormalities among the artificial intelligence cameras 121 to 123 in the cluster (CLST). Determine whether an artificial intelligence camera exists. Artificial intelligence cameras 121 to 123 may periodically exchange status messages.

S520단계에서, 인공지능 카메라(200)는 클러스터(CLST) 내 인공지능 카메라가 비정상일 때 S530단계를 수행한다. 이하, 설명의 편의를 위해 인공지능 카메라(200)가 클러스터(CLST)의 마스터 노드라고 가정한다.In step S520, the artificial intelligence camera 200 performs step S530 when the artificial intelligence camera in the cluster (CLST) is abnormal. Hereinafter, for convenience of explanation, it is assumed that the artificial intelligence camera 200 is the master node of the cluster (CLST).

S530단계는 마스터 노드에 의해 수행될 수 있다. S530단계에서, 인공지능 카메라(200)는 비정상인 인공지능 카메라에 할당되었던 노멀 카메라를 다른 인공지능 카메라에 할당할 수 있다. 마스터 노드는 클러스터 정보(CLSTIF, 도 10 참조)의 인공지능 프로세서의 사용량 및 메인 프로세서의 사용량을 참조하여, 해당 노멀 카메라를 제 1 내지 제 3 인공지능 카메라들(121~123) 중 어느 하나에 할당할 수 있다. 이하, 설명의 편의를 위해 해당 노멀 카메라가 인공지능 카메라(200)에 할당된다고 가정한다.Step S530 may be performed by the master node. In step S530, the artificial intelligence camera 200 may assign the normal camera assigned to the abnormal artificial intelligence camera to another artificial intelligence camera. The master node refers to the usage of the artificial intelligence processor and the usage of the main processor in the cluster information (CLSTIF, see FIG. 10) and allocates the normal camera to one of the first to third artificial intelligence cameras 121 to 123. can do. Hereinafter, for convenience of explanation, it is assumed that the corresponding normal camera is assigned to the artificial intelligence camera 200.

S540단계에서, 인공지능 카메라(200)는 할당된 노멀 카메라에 액세스하여 영상을 수신한다. S550단계에서, 인공지능 카메라(200)는 인공지능 프로세서(270)를 이용하여 수신된 영상을 분석한다. S560단계에서, 인공지능 카메라(200)는 영상의 분석에 따른 결과 정보를 해당 노멀 카메라의 식별자와 함께 영상 관리 서버(140)로 전송한다.In step S540, the artificial intelligence camera 200 accesses the assigned normal camera and receives images. In step S550, the artificial intelligence camera 200 analyzes the received image using the artificial intelligence processor 270. In step S560, the artificial intelligence camera 200 transmits the result information according to the analysis of the video to the video management server 140 along with the identifier of the corresponding normal camera.

이와 같이, 클러스터(CLST) 내 비정상인 자원은 상대적으로 용이하게 클러스터(CLST)로부터 배제될 수 있으며, 따라서 인공지능에 기반한 영상 분석은 노멀 카메라의 영상에 대해 안정적으로 수행될 수 있다. 예를 들면, 인공지능에 기반한 영상 분석이 노멀 카메라에 대해 미제공되는 시간은 감소하거나 최소화될 수 있다.In this way, abnormal resources within the cluster (CLST) can be relatively easily excluded from the cluster (CLST), and therefore image analysis based on artificial intelligence can be stably performed on images from normal cameras. For example, the time that AI-based video analysis is not available for normal cameras can be reduced or minimized.

비록 특정 실시 예들 및 적용 례들이 여기에 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정들 및 변형들이 가능하다.Although specific embodiments and application examples are described herein, they are provided only to facilitate a more general understanding of the present invention, and the present invention is not limited to the above embodiments and can be understood by those skilled in the art. Various modifications and variations are possible from this substrate.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Accordingly, the spirit of the present invention should not be limited to the described embodiments, and the scope of the patent claims described later as well as all things that are equivalent or equivalent to the scope of this patent claim shall fall within the scope of the spirit of the present invention. .

100: 영상 촬영 시스템
110: 사용자 단말기
121~123: 제 1 내지 제 3 인공지능 카메라들
CLST: 클러스터
131~13n: 제 1 내지 제 n 노멀 카메라들
140: 영상 관리 서버
250: 메인 프로세서
270: 인공지능 프로세서
100: Video recording system
110: user terminal
121~123: 1st to 3rd artificial intelligence cameras
CLST: cluster
131~13n: 1st to nth normal cameras
140: Video management server
250: main processor
270: Artificial intelligence processor

Claims (17)

네트워크를 통해 서로 통신할 수 있는 인공지능 카메라들 중 어느 하나의 동작 방법에 있어서:
상기 인공지능 카메라들 각각은 딥 러닝 방식을 이용한 영상 분석을 수행하도록 구성되는 인공지능 프로세서를 포함하되,
상기 동작 방법은,
상기 네트워크를 통해 다른 인공지능 카메라와 서로 등록 정보를 교환함으로써, 상기 다른 인공지능 카메라와 함께 상기 영상 분석을 위한 클러스터를 구성하는 단계;
상기 네트워크를 통해 노멀 카메라들에 액세스할 수 있도록, 상기 노멀 카메라들의 등록 정보를 상기 다른 인공지능 카메라와 공유하는 단계;
상기 노멀 카메라들 중 하나를 할당받을 때, 상기 할당된 노멀 카메라에 액세스하여 상기 할당된 노멀 카메라에 의해 촬영된 영상을 수신하는 단계;
상기 인공지능 프로세서를 이용하여 상기 수신된 영상을 분석하는 단계; 및
상기 수신된 영상의 상기 분석에 따른 결과 정보를 상기 할당된 노멀 카메라의 식별자와 함께 상기 네트워크를 통해 외부 장치로 전송하는 단계를 포함하는 동작 방법.
In a method of operating any one of artificial intelligence cameras that can communicate with each other through a network:
Each of the artificial intelligence cameras includes an artificial intelligence processor configured to perform image analysis using a deep learning method,
The operation method is,
exchanging registration information with other artificial intelligence cameras through the network, thereby configuring a cluster for image analysis with the other artificial intelligence cameras;
sharing registration information of the normal cameras with the other artificial intelligence cameras so that the normal cameras can be accessed through the network;
When one of the normal cameras is assigned, accessing the assigned normal camera and receiving an image captured by the assigned normal camera;
Analyzing the received image using the artificial intelligence processor; and
An operating method comprising transmitting result information according to the analysis of the received video to an external device through the network along with the identifier of the assigned normal camera.
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 광학계;
상기 광학계를 통해 수신되는 빛에 따라 생성된 영상을 처리하도록 구성되는 제 1 프로세서;
상기 제 1 프로세서의 제어에 응답하여 동작하되, 딥 러닝 방식에 기반하여 상기 처리된 영상을 분석하도록 구성되는 제 2 프로세서; 및
네트워크를 통한 통신을 제공하는 네트워크 인터페이스를 포함하되,
상기 제 1 프로세서는,
상기 네트워크를 통해 외부 인공지능 카메라와 서로 등록 정보를 교환함으로써, 상기 외부 인공지능 카메라와 함께 영상 분석을 위한 클러스터를 구성하고,
상기 네트워크를 통해 노멀 카메라들에 액세스할 수 있도록, 상기 노멀 카메라들의 등록 정보를 상기 외부 인공지능 카메라와 공유하고,
상기 노멀 카메라들 중 하나를 할당받을 때, 상기 할당된 노멀 카메라에 액세스하여 상기 할당된 노멀 카메라에 의해 촬영된 영상을 수신하고,
상기 제 2 프로세서에 상기 수신된 영상을 분석하도록 커맨드하고,
상기 수신된 영상의 상기 분석에 따른 결과 정보를 상기 할당된 노멀 카메라의 식별자와 함께 상기 네트워크를 통해 외부 장치로 전송하도록 구성되는 카메라.
optical system;
a first processor configured to process an image generated according to light received through the optical system;
a second processor that operates in response to control of the first processor and is configured to analyze the processed image based on a deep learning method; and
Includes a network interface that provides communication over a network,
The first processor,
By exchanging registration information with an external artificial intelligence camera through the network, a cluster for video analysis is formed with the external artificial intelligence camera,
Share the registration information of the normal cameras with the external artificial intelligence camera so that the normal cameras can be accessed through the network,
When one of the normal cameras is assigned, access the assigned normal camera and receive an image captured by the assigned normal camera,
Commanding the second processor to analyze the received image,
A camera configured to transmit result information according to the analysis of the received image to an external device through the network along with an identifier of the assigned normal camera.
삭제delete 삭제delete 삭제delete 삭제delete
KR1020200029565A 2019-03-18 2020-03-10 Camera to analyze video based on artificial intelligence and method of operating thereof KR102664027B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP20772993.0A EP3944628A4 (en) 2019-03-18 2020-03-11 Camera analyzing images on basis of artificial intelligence, and operating method therefor
PCT/KR2020/003391 WO2020189953A1 (en) 2019-03-18 2020-03-11 Camera analyzing images on basis of artificial intelligence, and operating method therefor
US17/475,801 US11979660B2 (en) 2019-03-18 2021-09-15 Camera analyzing images on basis of artificial intelligence, and operating method therefor

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190030457 2019-03-18
KR20190030457 2019-03-18

Publications (2)

Publication Number Publication Date
KR20200111104A KR20200111104A (en) 2020-09-28
KR102664027B1 true KR102664027B1 (en) 2024-05-08

Family

ID=72801164

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200029565A KR102664027B1 (en) 2019-03-18 2020-03-10 Camera to analyze video based on artificial intelligence and method of operating thereof

Country Status (1)

Country Link
KR (1) KR102664027B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102416991B1 (en) * 2021-11-19 2022-07-05 (주)와이즈콘 Video monitoring system using GNSS and method of controlling the same
WO2023182693A1 (en) * 2022-03-24 2023-09-28 메이즈 주식회사 Cafe curation device and cafe curation method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014149082A1 (en) 2013-03-15 2014-09-25 James Carey Self-healing video surveillance system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9918248D0 (en) * 1999-08-04 1999-10-06 Matra Bae Dynamics Uk Ltd Improvements in and relating to surveillance systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014149082A1 (en) 2013-03-15 2014-09-25 James Carey Self-healing video surveillance system
US20170155874A1 (en) 2013-03-15 2017-06-01 James Carey Self-healing video surveillance system

Also Published As

Publication number Publication date
KR20200111104A (en) 2020-09-28

Similar Documents

Publication Publication Date Title
TWI435279B (en) Monitoring system, image capturing apparatus, analysis apparatus, and monitoring method
CN109492536B (en) Face recognition method and system based on 5G framework
CN112001274B (en) Crowd density determining method, device, storage medium and processor
US9277165B2 (en) Video surveillance system and method using IP-based networks
CN102143309B (en) Network camera and system and method for operating the network camera
JP2017537357A (en) Alarm method and device
US10990840B2 (en) Configuring data pipelines with image understanding
US11979660B2 (en) Camera analyzing images on basis of artificial intelligence, and operating method therefor
KR102664027B1 (en) Camera to analyze video based on artificial intelligence and method of operating thereof
CN110569911B (en) Image recognition method, device, system, electronic equipment and storage medium
US8798369B2 (en) Apparatus and method for estimating the number of objects included in an image
JP2014222825A (en) Video processing apparatus and video processing method
WO2020111776A1 (en) Electronic device for focus tracking photographing and method thereof
US20210176430A1 (en) Image capturing apparatus using learned model, information processing apparatus, methods of controlling respective apparatuses, learned model selection system, and storage medium
CN108401247B (en) Method for controlling Bluetooth device, electronic device and storage medium
JP6809114B2 (en) Information processing equipment, image processing system, program
CN112383824A (en) Video advertisement filtering method, device and storage medium
US11064156B2 (en) Camera control method, camera, and surveillance system
JP2019212963A (en) Imaging apparatus, information processing apparatus, information processing method, and program
WO2023080667A1 (en) Surveillance camera wdr image processing through ai-based object recognition
CN112492261A (en) Tracking shooting method and device and monitoring system
CN111800604A (en) Method and device for detecting human shape and human face data based on gun and ball linkage
US20190342525A1 (en) Video summarization systems and methods
KR20230173667A (en) Controlling the shutter value of a surveillance camera through AI-based object recognition
JP2021052324A (en) Image capture device, system, method for controlling image capture device, and program

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant