KR102218255B1 - 갱신 영역 학습을 통한 인공지능 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 - Google Patents

갱신 영역 학습을 통한 인공지능 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 Download PDF

Info

Publication number
KR102218255B1
KR102218255B1 KR1020200124561A KR20200124561A KR102218255B1 KR 102218255 B1 KR102218255 B1 KR 102218255B1 KR 1020200124561 A KR1020200124561 A KR 1020200124561A KR 20200124561 A KR20200124561 A KR 20200124561A KR 102218255 B1 KR102218255 B1 KR 102218255B1
Authority
KR
South Korea
Prior art keywords
image
analysis
region
interest
artificial intelligence
Prior art date
Application number
KR1020200124561A
Other languages
English (en)
Inventor
정안수
Original Assignee
정안수
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정안수 filed Critical 정안수
Priority to KR1020200124561A priority Critical patent/KR102218255B1/ko
Application granted granted Critical
Publication of KR102218255B1 publication Critical patent/KR102218255B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

인공지능(Artificial Intelligence; AI) 기반의 영상 분석 시스템은, 미리 라벨링된 객체를 포함하는 하나 이상의 학습 이미지, 및 분석 대상 이미지를 포함하는 입력 이미지를 수신하도록 구성된 입력 모듈; 상기 하나 이상의 학습 이미지를 이용한 머신러닝(machine learning) 기반의 학습을 통해 분석 모델을 생성하고, 생성된 상기 분석 모델을 이용하여, 상기 분석 대상 이미지 내의 상기 객체에 대한 탐지 결과를 생성하도록 구성된 머신러닝 모듈; 및 상기 분석 대상 이미지 내의 상기 객체에 대한 탐지 결과를 출력하도록 구성된 출력 모듈을 포함한다. 상기 머신러닝 모듈은, 상기 분석 모델을 이용하여 상기 분석 대상 이미지에서 상기 객체에 연관된 갱신이 예측되는 관심 영역을 결정하고, 상기 관심 영역을 결정할 때에 비해 분석 심도를 증가시킨 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성함으로써, 객체 인식의 정확도를 높이고 특정 객체 탐지와 같은 이벤트 발생에 즉각적으로 대응할 수 있도록 구성된다.

Description

갱신 영역 학습을 통한 인공지능 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램{SYSTEM AND METHOD FOR ANALYZING IMAGE BASED ON ARTIFICIAL INTELLIGENCE THROUGH LEARNING OF UPDATED AREAS AND COMPUTER PROGRAM FOR THE SAME}
실시예들은 인공지능(Artificial Intelligence; AI) 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램에 관한 것이다. 보다 상세하게는, 실시예들은 영상 분석에 인공지능 기반의 학습 및 분석 알고리즘을 적용하여, 학습된 영상 갱신 패턴으로부터 향후 변화가 예상되는 관심 영역을 결정하고, 관심 영역에 대한 고심도 분석을 통해 영상으로부터 보안 이벤트의 발생 등을 자동으로 감지하는 기술에 대한 것이다.
최근 4차 산업 혁명이 도래함에 따라, 다양한 분야에 적합한 여러 가지 형태의 맞춤형 인공지능(Artificial Intelligence; AI)이 등장하고 있다. 그러나, 아직 국방과 같이 영상을 기반으로 한 보안이 요구되는 분야에서는 인공지능이 충분히 적용되고 있지 않다. 국방부에서는 국방 분야에 인공지능을 활용하기 위해 각 군의 소요 발굴을 위한 기초 연구 과제들을 수행하고 있으나, 현재까지 대부분의 연구는 단순 보고 목적 또는 실험실 수준에 그치고 있는 실정이다.
영상 감시에 관련된 종래 기술의 일 예로, 등록특허공보 제10-1858691호는 보안시스템에서 영상 이벤트 감지 및 저장 공간 조정 방법 및 이를 이용한 저장 공간 조정 시스템을 개시한다. 그러나, 등록특허공보 제10-1858691호에 개시된 기술을 비롯한 종래 기술은 정해진 알고리즘에 따라 이벤트를 감시하는 것을 개시하고 있을 뿐, 인공지능을 이용하여 영상 내의 객체 인식의 정확도를 제고하거나 이를 보안 이벤트 탐지를 목적으로 활용하는 데에는 인식이 미치지 못하고 있다.
등록특허공보 제10-1858691호
본 발명의 일 측면에 따르면, 영상에 포함된 객체들을 감지 및 추출함에 있어서, 각 객체에 상응하는 이미지의 위치 및 이미지 특성 정보를 자동으로 인식하고 영상에서 향후 변화가 예상되는 영역을 사전에 예측함으로써 객체 인식의 속도와 정확성을 높일 수 있는 인공지능(Artificial Intelligence; AI) 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램을 제공할 수 있다.
일 실시예에 따른 인공지능(Artificial Intelligence; AI) 기반의 영상 분석 시스템은, 미리 라벨링된 객체를 포함하는 하나 이상의 학습 이미지, 및 분석 대상 이미지를 포함하는 입력 이미지를 수신하도록 구성된 입력 모듈; 상기 하나 이상의 학습 이미지를 이용한 머신러닝(machine learning) 기반의 학습을 통해 분석 모델을 생성하고, 생성된 상기 분석 모델을 이용하여, 상기 분석 대상 이미지 내의 상기 객체에 대한 탐지 결과를 생성하도록 구성된 머신러닝 모듈; 및 상기 분석 대상 이미지 내의 상기 객체에 대한 탐지 결과를 출력하도록 구성된 출력 모듈을 포함한다.
상기 머신러닝 모듈은, 상기 분석 모델을 이용하여 상기 분석 대상 이미지에서 상기 객체에 연관된 갱신이 예측되는 관심 영역을 결정하고, 상기 관심 영역을 결정할 때에 비해 분석 심도를 증가시킨 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성하도록 구성된다.
일 실시예에서, 상기 머신러닝 모듈은, 제1 해상도를 가진 상기 분석 대상 이미지에 대한 분석을 통하여 상기 분석 대상 이미지의 일부인 상기 관심 영역을 결정하고, 상기 관심 영역에 상응하며 상기 제1 해상도를 갖는 부분 이미지에 대한 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성하도록 더 구성된다.
일 실시예에 따른 인공지능 기반의 영상 분석 시스템은, 상기 제1 해상도에 비해 큰 제2 해상도를 갖는 상기 입력 이미지로부터 상기 제1 해상도를 가진 상기 분석 대상 이미지를 추출하고, 상기 머신러닝 모듈에 의해 상기 관심 영역이 결정되면, 상기 입력 이미지로부터 상기 제1 해상도를 갖는 상기 관심 영역의 이미지를 추출하여 상기 부분 이미지를 생성하도록 구성된 이미지 처리 모듈을 더 포함한다.
일 실시예에서, 상기 머신러닝 모듈은, 상기 제1 해상도를 갖는 상기 학습 이미지를 이용한 학습을 통하여 상기 관심 영역을 결정하기 위한 제1 분석 모델을 생성하고, 상기 제1 분석 모델을 이용하여 상기 분석 대상 이미지를 분석하도록 구성된 제1 머신러닝부; 및 상기 제1 해상도를 갖는 학습용 부분 이미지를 이용한 학습을 통하여 상기 관심 영역으로부터 상기 객체를 탐지하기 위한 제2 분석 모델을 생성하고, 상기 제2 분석 모델을 이용하여 상기 부분 이미지를 분석하도록 구성된 제2 머신러닝부를 포함한다.
일 실시예에 따른 인공지능 기반의 영상 분석 방법은, 인공지능 기반의 영상 분석 시스템이, 미리 라벨링된 객체를 포함하는 하나 이상의 학습 이미지를 수신하는 단계; 상기 인공지능 기반의 영상 분석 시스템이, 상기 하나 이상의 학습 이미지를 이용한 머신러닝 기반의 학습을 통해 분석 모델을 생성하는 단계; 상기 인공지능 기반의 영상 분석 시스템이, 분석 대상 이미지를 포함하는 입력 이미지를 수신하는 단계; 상기 인공지능 기반의 영상 분석 시스템이, 상기 분석 모델을 이용하여 상기 분석 대상 이미지 내의 상기 객체를 탐지하는 단계; 및 상기 인공지능 기반의 영상 분석 시스템이, 상기 분석 대상 이미지 내의 상기 객체에 대한 상기 탐지 결과를 출력하는 단계를 포함한다.
이때, 상기 객체를 탐지하는 단계는, 상기 인공지능 기반의 영상 분석 시스템이, 상기 분석 모델을 이용하여 상기 분석 대상 이미지에서 상기 객체에 연관된 갱신이 예측되는 관심 영역을 결정하는 단계; 및 상기 인공지능 기반의 영상 분석 시스템이, 상기 관심 영역을 결정할 때에 비해 분석 심도를 증가시킨 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성하는 단계를 포함한다.
일 실시예에서, 상기 관심 영역을 결정하는 단계는, 상기 인공지능 기반의 영상 분석 시스템이, 제1 해상도를 가진 상기 분석 대상 이미지에 대한 분석을 통하여 상기 분석 대상 이미지의 일부인 상기 관심 영역을 결정하는 단계를 포함한다. 또한, 상기 객체에 대한 탐지 결과를 생성하는 단계는, 상기 인공지능 기반의 영상 분석 시스템이, 상기 관심 영역에 상응하며 상기 제1 해상도를 갖는 부분 이미지에 대한 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성하는 단계를 포함한다.
일 실시예에서, 상기 객체를 탐지하는 단계는, 상기 관심 영역을 결정하는 단계 전에, 상기 인공지능 기반의 영상 분석 시스템이, 상기 제1 해상도에 비해 큰 제2 해상도를 갖는 상기 입력 이미지로부터 상기 제1 해상도를 가진 상기 분석 대상 이미지를 추출하는 단계; 및 상기 관심 영역을 결정하는 단계 후에, 상기 인공지능 기반의 영상 분석 시스템이, 상기 입력 이미지로부터 상기 제1 해상도를 갖는 상기 관심 영역의 이미지를 추출하여 상기 부분 이미지를 생성하는 단계를 더 포함한다.
일 실시예에서, 상기 분석 모델을 생성하는 단계는, 상기 인공지능 기반의 영상 분석 시스템이, 상기 제1 해상도를 갖는 상기 학습 이미지를 이용한 학습을 통하여 상기 관심 영역을 결정하기 위한 제1 분석 모델을 생성하는 단계; 및 상기 인공지능 기반의 영상 분석 시스템이, 상기 제1 해상도를 갖는 학습용 부분 이미지를 이용한 학습을 통하여 상기 관심 영역으로부터 상기 객체를 탐지하기 위한 제2 분석 모델을 생성하는 단계를 포함한다. 이때, 상기 관심 영역을 결정하는 단계는, 상기 제1 분석 모델을 이용하여 수행되며, 상기 객체에 대한 탐지 결과를 생성하는 단계는, 상기 제2 분석 모델을 이용하여 수행된다.
일 실시예에 따른 컴퓨터 프로그램은 하드웨어와 결합되어 전술한 실시예들에 따른 인공지능 기반의 영상 분석 방법을 실행하기 위한 것으로서 컴퓨터로 판독 가능한 매체에 저장된 것일 수 있다.
본 발명의 일 측면에 따른 인공지능(Artificial Intelligence; AI) 기반의 영상 분석 시스템 및 방법은, 영상에 포함된 다수의 객체들을 감지 및 추출하고, 각 객체에 상응하는 이미지의 위치 및 이미지 특성 정보를 자동으로 인식하여 그 갱신 패턴을 학습함으로써, 영상에서 향후 변화가 예상되는 관심 영역을 사전에 예측할 수 있다.
본 발명의 일 측면에 따른 인공지능 기반의 영상 분석 시스템 및 방법에 의하면, 단순히 사전에 라벨링된 특정 객체를 탐지하는 방식으로 이미지를 분류하는 종래 기술에서 더 나아가, 학습된 이미지의 변화 패턴으로부터 향후 변화가 예상되는 영역을 미리 결정하여 심도를 높인 분석을 실시함으로써, 객체 인식의 속도와 정확도를 높일 수 있으며, 특정 객체 인식에 따른 이벤트 발생 시 즉각적인 대응이 가능한 이점이 있다.
도 1은 일 실시예에 따른 인공지능(Artificial Intelligence; AI) 기반의 영상 분석 시스템의 개략적인 블록도이다.
도 2a 내지 2c는 일 실시예에 따른 인공지능 기반의 영상 분석 시스템에서 관심 영역에 대한 분석을 수행하는 과정을 설명하기 위한 이미지의 개념도이다.
도 3은 일 실시예에 따른 인공지능 기반의 영상 분석 방법에 의한 분석 모델 생성 과정의 각 단계를 나타내는 순서도이다.
도 4는 일 실시예에 따른 인공지능 기반의 영상 분석 방법에 의해 입력 이미지에 포함된 객체를 탐지하는 과정의 각 단계를 나타내는 순서도이다.
이하에서, 도면을 참조하여 본 발명의 실시예들에 대하여 상세히 살펴본다.
도 1은 일 실시예에 따른 인공지능(Artificial Intelligence; AI) 기반의 영상 분석 시스템의 개략적인 블록도이다.
도 1을 참조하면, 본 실시예에 따른 인공지능 기반의 영상 분석 시스템(3)은 입력 이미지를 수신하고, 입력 이미지에 포함된 임의의 객체에 대한 탐지 결과를 제공하기 위한 것이다. 본 명세서에서 입력 이미지란 정지 화상을 지칭할 수도 있으나, 시계열적으로 연속인 일련의 이미지, 즉, 동영상을 지칭하는 것일 수도 있다. 예를 들어, 입력 이미지는 실시간으로 수신되는 감시 화상과 같은 실시간 영상일 수 있다. 그러나 본 명세서에서 시계열적으로 연속적인 입력 이미지는 반드시 초 또는 분 단위와 같이 실시간에 가까운 작은 주기로 얻어진 이미지만을 지칭하는 것은 아니며, 시간, 일, 월 또는 연 단위와 같이 상대적으로 큰 주기마다 단속적으로 얻어진 이미지들을 지칭하는 것일 수도 있다.
본 명세서에서 입력 이미지로부터 탐지되는 객체는 머신러닝(machine learning)에 기반하여 이미지로부터 탐지 가능한 이미지 내의 임의의 사물, 사람, 차량, 동물, 건물 또는 지형지물 등을 지칭하는 것이며, 특정 종류에 한정되지 않는다. 이하의 본 명세서에서는, 항공 영상 형태의 입력 이미지로부터 특정 객체를 탐지함으로써, 실시예들에 따른 인공지능 기반의 영상 분석 시스템(3)을 국방과 같은 보안 목적의 영상 분석에 활용한 형태를 예시적으로 설명한다. 예를 들어, 입력 이미지는 접경 지역의 촬영 영상 또는 실시간 영상일 수 있으며, 입력 이미지로부터 영상 내의 적대 국가의 인원이나 차량, 건축물 등과 같은 객체를 검출하는 데 인공지능 기반의 영상 분석 시스템(3)이 이용될 수 있다.
그러나, 실시예들에 따른 인공지능 기반의 영상 분석 시스템(3)의 적용 목적 및 이에 적용될 수 있는 이미지의 형태는 전술한 예시에 의해 한정되는 것은 아니다.
일 실시예에서, 인공지능 기반의 영상 분석 시스템(3)은 지도 데이터 서버와 같은 외부 서버(1)로부터 입력 이미지를 수신하도록 구성될 수 있다. 또한 일 실시예에서, 인공지능 기반의 영상 분석 시스템(3)은 사용자 장치(2)로부터 특정 객체에 대한 탐지 요청을 수신하고, 수신된 탐지 요청에 대한 응답으로, 입력 이미지 내의 객체에 대한 탐지 결과를 사용자 장치(2)에 제공할 수 있다. 이상의 동작을 위하여, 인공지능 기반의 영상 분석 시스템(3)은 외부 서버(1) 및/또는 사용자 장치(2)와 유선 및/또는 무선 네트워크를 통하여 통신 가능하게 연결된다. 인공지능 기반의 영상 분석 시스템(3)과 외부 서버(1) 및 사용자 장치(2) 사이의 통신 방법은 유선 및/또는 무선 네트워크를 통하여 객체와 객체가 네트워킹 할 수 있는 모든 통신 방법을 포함할 수 있으며, 유선 통신, 무선 통신, 3G, 4G, 혹은 그 이외의 방법으로 제한되지 않는다.
예를 들어, 인공지능 기반의 영상 분석 시스템(3)과 외부 서버(1) 또는 사용자 장치(2) 사이의 유선 및/또는 무선 네트워크는 LAN(Local Area Network), MAN(Metropolitan Area Network), GSM(Global System for Mobile Network), EDGE(Enhanced Data GSM Environment), HSDPA(High Speed Downlink Packet Access), W-CDMA(Wideband Code Division Multiple Access), CDMA(Code Division Multiple Access), TDMA(Time Division Multiple Access), 블루투스(Bluetooth), 지그비(Zigbee), 와이-파이(Wi-Fi), VoIP(Voice over Internet Protocol), LTE Advanced, IEEE802.16m, WirelessMAN-Advanced, HSPA+, 3GPP Long Term Evolution (LTE), Mobile WiMAX (IEEE 802.16e), UMB (formerly EV-DO Rev. C), Flash-OFDM, iBurst and MBWA (IEEE 802.20) systems, HIPERMAN, Beam-Division Multiple Access (BDMA), Wi-MAX(World Interoperability for Microwave Access) 및 초음파 활용 통신으로 이루어진 군으로부터 선택되는 하나 이상의 통신 방법에 의한 통신 네트워크를 지칭할 수 있으나, 이에 한정되는 것은 아니다.
사용자 장치(2)는 인공지능 기반의 영상 분석 시스템(3)에 입력 이미지에 대한 객체 탐지를 요청하고 결과를 받아보는 등 인공지능 기반의 영상 분석 시스템(3)을 사용하는 사용자의 장치이다. 인공지능 기반의 영상 분석 시스템(3)에는 로그(log) 관리, 사용자 관리, 영상 열람 관리 등의 기능이 구현될 수 있고, 사용자는 사용자 장치(2)를 이용하여 인공지능 기반의 영상 분석 시스템(3)에 접속하고 권한 설정에 따라 탐지 객체의 설정이나 탐지 결과의 열람 등을 수행할 수 있다.
도 1에서는 사용자 장치(2)는 하나의 장치로 도시되었으나, 이는 설명의 편의를 위한 것으로, 실시예들에 따른 인공지능 기반의 영상 분석 시스템(3)을 사용하는 사용자의 실제 수를 제한하는 것이 아니라는 점이 용이하게 이해될 것이다. 또한, 도 1에서 사용자 장치(2)는 노트북 컴퓨터의 형태로 도시되었다. 그러나, 이는 예시적인 것으로서, 사용자 장치(2)는 스마트폰(smartphone) 등 이동 통신 단말기, 개인용 컴퓨터(personal computer), PDA(personal digital assistant), 태블릿(tablet), IPTV(Internet Protocol Television) 등을 위한 셋톱박스(set-top box) 등 임의의 컴퓨팅 장치의 형태로 구현될 수도 있다.
일 실시예에서, 인공지능 기반의 영상 분석 시스템(3)은 입력 모듈(31), 머신러닝 모듈(33) 및 출력 모듈(34)을 포함한다. 또한 일 실시예에서, 인공지능 기반의 영상 분석 시스템(3)은 이미지 처리 모듈(32)을 더 포함한다. 또한 일 실시예에서, 머신러닝 모듈(33)은 저장부(330), 제1 머신러닝부(331) 및 제2 머신러닝부(332)를 포함한다.
실시예들에 따른 인공지능 기반의 영상 분석 시스템(3)과 이에 포함된 각 모듈 또는 부(unit)는, 전적으로 하드웨어이거나, 또는 부분적으로 하드웨어이고 부분적으로 소프트웨어인 측면을 가질 수 있다. 예컨대, 인공지능 기반의 영상 분석 시스템(3)과 이에 포함된 각 모듈 또는 부는 특정 형식 및 내용의 데이터를 처리하거나 또는/또한 전자통신 방식으로 주고받기 위한 하드웨어 및 이에 관련된 소프트웨어를 통칭할 수 있다. 본 명세서에서 "부", "모듈", "장치", "단말기", "서버" 또는 "시스템" 등의 용어는 하드웨어 및 해당 하드웨어에 의해 구동되는 소프트웨어의 조합을 지칭하는 것으로 의도된다. 예를 들어, 하드웨어는 CPU 또는 다른 프로세서(processor)를 포함하는 데이터 처리 기기일 수 있다. 또한, 하드웨어에 의해 구동되는 소프트웨어는 실행중인 프로세스, 객체(object), 실행파일(executable), 실행 스레드(thread of execution), 프로그램(program) 등을 지칭할 수 있다.
또한, 인공지능 기반의 영상 분석 시스템(3)을 구성하는 각각의 요소는 반드시 서로 물리적으로 구분되는 별개의 장치를 지칭하는 것으로 의도되지 않는다. 즉, 도 1의 입력 모듈(31), 이미지 처리 모듈(32), 머신러닝 모듈(33) 및 출력 모듈(34) 등은 인공지능 기반의 영상 분석 시스템(3)을 구성하는 하드웨어를 해당 하드웨어에 의해 수행되는 동작에 따라 기능적으로 구분한 것일 뿐, 반드시 각각의 부가 서로 독립적으로 구비되어야 하는 것이 아니다. 물론, 실시예에 따라서는 입력 모듈(31), 이미지 처리 모듈(32), 머신러닝 모듈(33) 및 출력 모듈(34) 중 하나 이상이 서로 물리적으로 구분되는 별개의 장치로 구현되는 것도 가능하다.
입력 모듈(31)은 미리 라벨링(labeling)된 객체를 포함하는 학습 이미지를 수신하는 기능을 한다. 입력 모듈(31)에 수신된 학습 이미지는 머신러닝 모듈(33)에 의한 학습을 통해 후술하는 머신러닝 분석 모델의 생성에 이용된다. 또한, 입력 모듈(31)은 머신러닝 분석 모듈을 토대로 객체를 탐지하기 위한 미지의 입력 이미지를 수신할 수 있다. 일 실시예에서, 입력 모듈(31)은 지도 데이터 서버와 같은 외부 서버(1)와의 통신을 통하여 학습 이미지 및/또는 입력 이미지를 수신할 수도 있다.
머신러닝 모듈(33)은 입력 모듈(31)에 수신된 학습 이미지를 이용한 머신러닝 기반의 학습을 통해 분석 모델을 생성하고, 분석 모델을 적용하여 입력 이미지 내의 객체를 탐지하는 역할을 한다. 일 실시예에서, 머신러닝 모듈(33)은 생성된 분석 모델을 저장하기 위한 저장부(330)를 포함할 수도 있다. 이때, 머신러닝 모듈(33)은 입력 이미지에 분석 모델을 적용하여 입력 이미지에서 갱신이 예측되는 관심 영역을 먼저 결정하고, 관심 영역에 대해 이전에 비해 심도를 증가시킨 분석을 수행하여 관심 영역 내의 객체에 대한 탐지 결과를 생성할 수도 있다.
이상의 동작을 위하여, 머신러닝 모듈(33)은 관심 영역의 결정을 위한 머신러닝을 수행하도록 구성된 제1 머신러닝부(331)와, 관심 영역에 대한 고심도 분석을 통해 관심 영역 내의 객체를 탐지하도록 구성된 제2 머신러닝부(332)를 포함할 수 있다.
제1 머신러닝부(331)는 학습 이미지들을 이용한 학습을 통하여 과거 이미지에 어떤 특징값이 존재할 경우 해당 특징값과 관련하여 향후에 변화될 가능성이 높은 이미지 내의 영역을 예측하고, 이를 관심 영역으로 결정할 수 있다. 제2 머신러닝부(332)는 학습용 부분 이미지들을 이용한 학습을 통하여, 관심 영역에 해당하는 크기의 이미지에서 사전에 설정된 객체들을 탐지할 수 있다. 제1 머신러닝부(331)와 제2 머신러닝부는 이상의 동작을 위하여 학습을 통해 각각의 머신러닝 분석 모델을 생성하고 저장할 수 있으며, 이를 입력 이미지 또는 입력 이미지로부터 생성된 관심 영역의 부분 이미지에 적용할 수 있다.
일 실시예에서, 이미지 처리 모듈(32)은 입력 이미지를 처리하여 머신러닝 분석 모델의 학습 또는 이에 의한 분석을 위한 이미지로 추출 또는 변환하는 기능을 한다. 구체적으로, 이미지 처리 모듈(32)은 원본 입력 이미지를 특정 해상도로 샘플링(sampling)하여 분석 대상 이미지를 추출하여, 제1 머신러닝부(331)가 분석 대상 이미지로부터 관심 영역을 결정하도록 할 수 있다. 또한, 제1 머신러닝부(331)에 의하여 관심 영역이 결정되면, 이미지 처리 모듈(32)은 원본 입력 이미지에서 관심 영역에 해당하는 부분 이미지를 추출함으로써, 제2 머신러닝부(332)가 부분 이미지로부터 미리 설정된 객체를 탐지할 수 있도록 할 수 있다.
실시예들에 따른 인공지능 기반의 영상 분석 시스템(3)에서 제1 머신러닝부(331), 제2 머신러닝부(332) 및 이미지 처리 모듈(32)의 동작에 대해서는 상세히 후술한다.
출력 모듈(34)은 머신러닝 모듈(33)에 의하여 얻어진 분석 대상 이미지 내의 객체에 대한 탐지 결과를 출력하도록 구성된다. 예를 들어, 출력 모듈(34)은 객체 탐지 결과를 인공지능 기반의 영상 분석 시스템(3)에 구비된 디스플레이 수단(미도시)에 의하여 표시하거나, 또는 객체 탐지 결과를 사용자 장치(2)에서 열람 가능한 데이터의 형태로 사용자 장치(2)에 전송할 수 있다.
도 2a 내지 2c는 일 실시예에 따른 인공지능 기반의 영상 분석 시스템에서 관심 영역에 대한 분석을 수행하는 과정을 설명하기 위한 이미지의 개념도이다.
도 1 및 도 2a를 참조하면, 도 2a는 입력 모듈(31)에 수신되는 입력 이미지(200)를 예시적으로 나타낸 것이다. 입력 이미지는 실시예들에 따른 인공지능 기반의 영상 분석 시스템을 이용하여 객체 탐지를 수행하고자 하는 미지의 이미지를 지칭한다. 예를 들어, 입력 이미지(200)는 탐지하고자 하는 대상 객체(201)가 포함된 항공 사진 등일 수 있다. 도면에는 설명을 위하여 하나의 이미지로 나타내었으나, 입력 이미지는 이와 같은 이미지들이 연속적으로 포함된 영상을 의미할 수도 있다. 이때, 입력 이미지(200)는 이미지 처리 모듈(32)에 의하여 처리되는 후술하는 이미지들에 비해 높은 해상도를 갖는다.
다음으로, 도 1 및 도 2b를 참조하면, 이미지 처리 모듈(32)은 입력 이미지를 처리하여 도 2b에 도시된 것과 같은 분석 대상 이미지(210)를 생성할 수 있다. 분석 대상 이미지(210)는, 입력 이미지를 머신러닝 분석 모델에 적용하기 위해 소정의 기준에 따라 규격화한 것으로, 미리 설정된 해상도를 갖도록 입력 이미지로부터 추출된다. 즉, 분석 대상 이미지(210)는 입력 이미지를 다운 샘플링(down sampling)한 것일 수 있다. 예를 들어, 분석 대상 이미지(210)가 제1 해상도를 갖는다면, 이의 원본인 입력 이미지는 제1 해상도보다 큰 제2 해상도를 가질 수 있다.
도 2b에서는, 분석 대상 이미지(210)의 해상도를 이미지 상에 덧씌워진 격자 형태로 개념적으로 나타내었다. 즉, 도 2b에 도시된 분석 대상 이미지(210)는 이미지의 가로 방향으로 20개의 격자, 이미지의 세로 방향으로 10개 방향의 격자를 포함하는 20×10의 해상도를 갖는다. 그러나, 이는 설명의 편의를 위하여 이미지의 해상도를 정의하는 각 픽셀의 크기를 과장하여 나타낸 것으로, 분석 대상 이미지의 실제 해상도나 분석 대상 이미지의 각 픽셀의 실제 크기나 배치를 나타내는 것이 아니라는 점이 통상의 기술자에게 용이하게 이해될 것이다.
머신러닝 모듈(33)의 제1 머신러닝부(331)는, 분석 대상 이미지(210)와 동일한 해상도를 갖는 것으로서 탐지 대상 객체와 동일한 종류의 객체들이 라벨링되어 있는 학습 이미지들을 이용한 기계 학습을 수행하여 미리 머신러닝 분석 모델을 생성할 수 있다. 또한, 제1 머신러닝부(331)는 이러한 머신러닝 분석 모델을 분석 대상 이미지(210)에 적용하여 분석 대상 이미지(210)에서 탐지 대상 객체(201)에 관련된 갱신이 예측되는 영역인 관심 영역(211)을 결정할 수 있다.
구체적으로, 제1 머신러닝부(331)가 관심 영역을 예측하기 위한 학습 과정은, 시계열적으로 연속인 일련의 학습 이미지를 이용하여 분석 모델을 학습시킴으로써 수행된다. 예를 들어, 이미지에 포함되는 객체들 중 이미 건설이 완료되어 있는 건물이나 도로와 달리, 건설이 진행 중인 건물이나 도로, 이동 중인 차량, 공사장 사이트 등은 주기적으로 이미지를 촬영하면 이미지의 다른 부분에 비해 변화의 수준이 상대적으로 클 것으로 예상할 수 있다. 제1 머신러닝부(331)는, 이러한 학습 이미지들을 이용하여 분석 모델을 학습시키고, 학습된 분석 모델을 이용하여 분석 대상 이미지(210)에서 건설이 진행 중인 건물이나 도로, 이동 중인 차량, 공사장 사이트 등에 해당하는 이미지의 특징값을 갖는 부분을 특정함으로써 탐지 대상 객체(201)에 관련된 관심 영역(211)을 결정할 수 있다.
예를 들어, 일 실시예에서 이상의 과정은 컨볼루션 신경망(Convolution Neural Network; CNN) 알고리즘을 이용하여 수행될 수 있다. 본 방법에 따르면, 제1 머신러닝부(331)는 먼저 학습 이미지의 각 부분을 소정의 크기를 갖는 컨볼루션 커널(kernel) 행렬과 섞음으로써 해당 부분의 2차 이미지인 특징맵(feature map)을 생성할 수 있다. 이때, 학습 이미지가 예를 들어 세로 및 가로 각각 H 및 W개의 픽셀로 이루어진 이미지일 경우, 제1 머신러닝부(331)는 컨볼루션 커널 행렬을 적용하여 이로부터 H×W 보다 작은 L×D의 크기를 가지는 특징맵을 특징값으로 추출할 수 있다. 또한, 이때 하나의 학습 이미지로부터 점차 작은 크기를 가지는 특징맵의 복수 개의 레이어(layer)가 추출될 수 있다.
이때, 학습 이미지로부터 특징값을 추출하기 위한 컨볼루션 커널 행렬은 기계 학습이 가능하므로, 각 학습 이미지로부터 추출된 특징맵과 이에 대하여 라벨링된 정답, 즉, 각 학습 이미지에서 향후 변화되는 부분에 대한 정보를 이용하여, 학습 이미지와 커널 행렬을 섞기 위한 컨볼루션 연산의 파라미터들을 결정할 수 있다. 이상의 과정에 의하여, 학습 이미지가 어떤 특징값을 가지고 있는 경우 향후 이미지의 어느 부분이 갱신될 것이 높은 확률로 예측되는지에 대한 머신러닝 분석 모델을 생성할 수 있다. CNN 알고리즘에 의한 특징맵의 추출 및 머신러닝 연산 과정에 대해서는 통상의 기술자에게 잘 알려져 있으므로, 발명의 요지를 명확하게 하기 위하여 이에 대해서는 자세한 설명을 생략한다.
한편, 실시예들에서 분석 대상 이미지(210)를 분석 모델에 적용하여 결정되는 관심 영역(211)은 반드시 갱신이 예측된 이미지의 특징값이 직접적으로 추출되는 픽셀들만을 지칭하는 것은 아니다. 예를 들어, 건설이 진행 중인 건물이나 공사장 사이트의 경우, 과거의 분석 대상 이미지(210)를 머신러닝 분석 모델에 적용한 결과, 건설이 진행 중인 건물이나 공사장 사이트가 탐지되었다면, 해당 특징값이 추출된 픽셀들 자체가 향후 갱신이 예측되는 관심 영역일 수 있다. 그러나, 건설이 진행 중인 도로나 이동 중인 차량의 경우에는, 분석 대상 이미지(210)에서 해당 특징값이 추출된 바로 그 부분에서 갱신이 예측되기 보다는, 차량의 진행 방향이나 도로 건설의 진행 방향에 따라 다소 이격된 지점에서 향후 갱신이 이루어질 것으로 예측할 수 있다.
따라서, 일 실시예에서 제1 머신러닝부(331)는 이미지에서 분석 모델을 적용하여 건설이 진행 중인 건물이나 도로, 이동 중인 차량, 공사장 사이트 등에 해당하는 특징값이 분류되는 픽셀들을 탐지하되, 분류된 특징값의 종류에 따라 머신러닝 분석 모델에 의해 결정된 관심 영역(211)의 범위를 확장할 수 있다. 분류된 특징값의 종류(즉, 객체의 종류)에 따라 관심 영역(211)를 확장할 것인지의 여부는, 해당 특징값이 상대적으로 정적인 객체(예컨대, 건설 중인 건물, 공사장 사이트 등)에 관련된 것인지 또는 상대적으로 동적인 객체(예컨대, 건설 중인 도로, 이동 중인 차량 등)에 대한 것인지를 기초로 수행될 수 있으며, 이를 위하여 사전에 특징값의 종류에 따른 정적인 객체 및 동적인 객체의 분류 정보가 저장부(330)에 저장될 수 있다.
도 2b를 예로 들면, 머신러닝 분석 모델에 의하여 객체(201)를 탐지한 결과 향후 갱신이 예측되는 부분이 해당 객체(201)와 겹쳐진 4개의 픽셀이라고 가정한다. 이때, 제1 머신러닝부(331)는 인식된 객체(201)의 종류가 정적인 객체인지 또는 동적인 객체인지를 판단하고, 인식된 객체(201)의 종류가 건설 중인 도로, 이동 중인 차량 등과 같이 동적인 객체일 경우, 분석 모델에 의해 갱신 예측 영역인 4개의 픽셀의 상하좌우로 소정의 개수(예컨대, 각 방향 1개씩)의 픽셀들을 더 포함하도록 4×4 형태의 16개 픽셀로 이루어진 관심 영역(211)을 결정할 수 있다.
또 다른 실시예에서, 관심 영역(211)의 범위를 확장할 것인지 여부는 시계열적으로 연속인 일련의 분석 대상 이미지에서 객체(201)에 해당하는 특징값이 탐지된 부분의 변화의 정도를 기준으로 결정될 수도 있다. 예를 들어, 이전 시간 단계의 분석 대상 이미지에서 객체(201)에 해당하는 것으로 분류된 특징값이 {v1, v2, v3, v4}의 행렬로 표시되고, 그 바로 다음의 시간 단계의 분석 대상 이미지에서 객체(201)에 해당하는 것으로 분류된 특징값이 {v5, v6, v7, v8}의 행렬도 표시된다고 가정한다. 이 경우, 제1 머신러닝부(331)는 특징값의 변화에 해당하는 행렬 {(v5-v1), (v6-v2), (v7-v3), (v8-v4)}의 절대값을 변화량으로 연산하고, 변화량의 크기가 미리 설정된 문턱값 이상일 경우 분석 모델에 의해 결정된 갱신 예측 영역보다 영역의 범위를 넓혀 관심 영역(211)을 결정할 수 있다. 또 다른 실시예에서는, 분석 모델에 의해 결정된 갱신 예측 영역에 비해 관심 영역(211)을 얼마나 넓게 할 것인지를 분석 대상 이미지의 특징값의 변화량에 비례하여 결정할 수도 있다.
이상의 과정에 의하여 관심 영역(211)이 결정되면, 제2 머신러닝부(312)는 관심 영역(211)을 대상으로 심도를 높인 분석을 실시하여 관심 영역(201) 내의 객체를 검출할 수 있다. 이때 심도를 높인 분석이란, 분석 대상 이미지(210)에서 이미지의 특징값 분류를 통하여 향후 갱신이 예측되는 관심 영역(211)을 결정할 때에 비하여, 관심 영역(211)에 대해서만 이미지의 해상도를 높인 부분 이미지를 다시 추출하고 이를 머신러닝 분석 모델에 적용함으로써 관심 영역(211) 내의 객체를 탐지하는 것을 의미한다.
즉, 도 1 및 도 2c를 참조하면, 이미지 처리 모듈(32)은 제1 머신러닝부(331)에 의하여 결정된 관심 영역의 위치 정보를 수신하고, 입력 모듈(31)에 수신된 입력 이미지에서 해당 위치 정보를 가지는 영역을 추출함으로써 관심 영역만을 대상으로 하는 부분 이미지(220)를 추출한다. 이때, 부분 이미지(220)에 대해 분석의 심도를 높인 탐지를 수행하기 위하여, 이미지 처리 모듈(32)은 입력 이미지의 관심 영역 부분을, 분석 대상 이미지의 일부일 때에 비해 더 높은 해상도(예컨대, 분석 대상 이미지와 동일한 해상도)로 추출하여 부분 이미지(220)를 생성할 수 있으며, 제2 머신러닝부(332)는 이러한 부분 이미지(220)를 이용하여 관심 영역 내에서 특정 객체를 탐지할 수 있다.
예를 들어, 도 2b에 도시된 분석 대상 이미지(210)는 입력 이미지를 20×10의 해상도로 규격화한 것이었으며, 제1 머신러닝부(331)는 이러한 분석 대상 이미지(210)에서 4×4의 해상도를 갖는 관심 영역(211)을 결정하였다. 이때, 관심 영역(211)에서 객체를 탐지하기 위한 머신러닝 기반 분석에는 4×4 해상도의 이미지를 그대로 이용하는 것이 아니라, 이미지 처리 모듈(32)에 의하여 관심 영역(211)만의 이미지를 다시 고해상도(예컨대, 분석 대상 이미지(210)와 동일한 20×10의 해상도)로 추출하여 이로부터 객체를 탐지하도록 구성된다. 이때 고해상도로 추출되는 부분 이미지는, 관심 영역을 결정하기 위한 분석 대상 이미지(210)와 동일 시점의 이미지일 수도 있으며, 또는 분석 대상 이미지(210) 보다 후에 시계열적으로 연속하는 하나 이상의 시점의 이미지들일 수도 있다.
다음으로, 제2 머신러닝부(332)는 관심 영역(211)만의 부분 이미지(220)를 머신러닝 분석 모델에 적용하여 이미지 내의 객체(201)를 높은 정확도로 탐지한다. 관심 영역(211)만을 추출한 부분 이미지(220) 내에서 객체(201)를 탐지하는 방법은 분석 대상 이미지와 관련하여 전술한 CNN 알고리즘을 이용하여 수행될 수 있으므로, 설명의 중복을 피하기 위하여 자세한 설명은 생략한다. 다만, 관심 영역(211)을 결정하기 위한 머신러닝 분석 모델과 관심 영역(211) 내에서 객체(201)를 탐지하기 위한 머신러닝 분석 모델은 서로 상이하며, 이를 위하여 제2 머신러닝부(332)는 제1 머신러닝부(331)와 별개로 머신러닝 분석 모델에 대한 학습 및 이를 이용한 분석을 수행한다.
이상에서 설명한 본 발명의 실시예들에서는, 입력 이미지를 다운 샘플링한 분석 대상 이미지에서 관심 영역을 우선 결정하고, 관심 영역이 결정되면 관심 영역의 이미지를 입력 이미지에서 다시 고해상도로 추출하여 객체를 탐지하는 방식의 분석을 통하여, 객체 탐지의 속도와 정확도를 높일 수 있다.
도 3은 일 실시예에 따른 인공지능 기반의 영상 분석 방법에 의한 분석 모델 생성 과정의 각 단계를 나타내는 순서도이다. 실시예들에 따른 인공지능 기반의 영상 분석 방법은 본 발명의 실시예들에 따른 인공지능 기반의 영상 분석 시스템을 이용하여 수행될 수 있다.
이하에서는, 설명의 편의를 위하여, 도 1 및 도 3을 참조하여 실시예들에 따른 인공지능 기반의 영상 분석 방법의 분석 모델 생성 과정의 각 단계에 대하여 설명한다.
실시예들에 따른 인공지능 기반의 영상 분석 시스템은, 머신러닝을 통하여 두 가지 종류의 분석 모델을 생성하도록 구성된다. 첫 번째 분석 모델은 이미지 내에서 갱신이 예측되는 관심 영역을 결정하기 위한 분석 모델이며, 두 번째 분석 모델은 관심 영역만을 추출한 부분 이미지에서 탐지 대상 객체를 검출하기 위한 분석 모델이다. 도 3에서 단계 S11, S15, S15 는 관심 영역을 결정하기 위한 첫 번째 분석 모델을 생성하는 과정을 나타내며, 단계 S12, S14, S16은 관심 영역의 부분 이미지에서 객체를 탐지하기 위한 두 번째 분석 모델을 생성하는 과정을 나타낸다.
구체적으로, 인공지능 기반의 영상 분석 시스템(3)의 입력 모듈(31)은 특정 객체를 포함하면서 이미지에서 갱신되는 부분이 라벨링되어 있는 학습 이미지를 수신할 수 있다(S11). 이때 학습 이미지는, 시계열적으로 연속적인 일련의 이미지들을 포함할 수 있으며, 일련의 이미지들 사이의 시간 간격은 초, 분, 시, 일, 월, 연 등 다양할 수 있다.
다음으로, 머신러닝 모듈(33)의 제1 머신러닝부(331)는 학습 이미지를 이용한 머신러닝을 통하여 이미지에서 객체에 관련된 갱신이 예측되는 부분을 분류하기 위한 제1 분석 모델을 생성할 수 있다(S15). 이는, 학습 이미지를 원본 이미지에 비해 더 작은 복수 개의 부분으로 분할하여 분할된 각 부분의 특징값을 추출하고, 추출된 특징값들을 입력값으로 하고 이미지들에서 향후 갱신되는 부분을 정답으로 한 머신러닝을 통하여 향후 갱신이 예측되는 이미지의 특징값을 분류하는 과정을 의미한다. 생성된 제1 분석 모델은 머신러닝 모듈(33)의 저장부(330)에 저장될 수 있다(S17).
한편, 인공지능 기반의 영상 분석 시스템(3)의 입력 모듈(31)은 특정 객체를 포함하면서 어떤 객체인지가 라벨링된 학습용 부분 이미지를 수신할 수 있다(S12). 학습용 부분 이미지는, 제1 분석 모델의 생성에 이용되는 학습 이미지의 일부에 해당하는 것이지만 이를 학습 이미지와 동일한 수준의 높은 해상도로 추출한 것일 수 있다. 또는, 학습용 부분 이미지는 학습 이미지와 상이한 별도의 이미지일 수도 있다.
다음으로, 머신러닝 모듈(33)의 제2 머신러닝부(332)는, 학습용 부분 이미지를 이용한 머신러닝을 통하여 이미지에서 객체에 해당하는 부분을 탐지하기 위한 제2 분석 모델을 생성할 수 있다(S14). 이는, 학습용 부분 이미지를 그에 비해 더 작은 복수 개의 부분으로 분할하여 분할된 각 부분의 특징값을 추출하고, 추출된 특징값을 입력값으로 하고 이미지 내의 객체를 정답으로 한 머신러닝을 통하여 특정 객체에 해당하는 이미지의 특징값을 분류하는 과정을 의미한다. 생성된 제2 분석 모델은 머신러닝 모듈(33)의 저장부(330)에 저장될 수 있다(S17).
도 4는 일 실시예에 따른 인공지능 기반의 영상 분석 방법에 의해 입력 이미지에 포함된 객체를 탐지하는 과정의 각 단계를 나타내는 순서도이다.
도 1 및 도 4를 참조하면, 인공지능 기반의 영상 분석 시스템(3)의 입력 모듈(31)은 먼저 입력 이미지를 수신할 수 있다(S21). 입력 이미지란 탐지하고자 하는 객체의 포함 여부 및 위치가 알려져 있지 않은 미지의 이미지를 지칭한다. 또한, 이때 입력 이미지는 후술하는 분석 대상 이미지 또는 부분 이미지에 비해 높은 해상도를 갖는 것이 바람직하다.
다음으로, 인공지능 기반의 영상 분석 시스템(3)의 이미지 처리 모듈(32)은 입력 이미지를 처리하여 분석 대상 이미지를 생성할 수 있다(S22). 이는, 입력 이미지를 머신러닝 분석 모델에 적용하기 위한 정보의 기준에 따라 규격화하는 것(예컨대, 다운 샘플링 등)을 지칭하는 것으로서, 규격화된 분석 대상 이미지는 원본 입력 이미지에 비해 더 낮은 해상도를 가질 수 있다.
다음으로, 인공지능 기반의 영상 분석 시스템(3)의 머신러닝 모듈(33)의 제1 머신러닝부(331)는 분석 대상 이미지를 제1 분석 모델에 적용하여 분석 대상 이미지 내의 관심 영역을 결정할 수 있다(S23). 이는, 분석 대상 이미지의 각 부분의 특징값을 토대로, 분석 대상 이미지에서 향후 갱신이 예측되는 요소들을 탐지하는 것을 지칭하는 것이다. 예를 들면, 분석 대상 이미지의 각 부분의 특징값을 분류한 결과 건설 중인 건물이나 도로, 이동 중인 차량, 공사장 사이트 등이 있을 경우 이들과 관련된 영역이 관심 영역에 해당될 수 있다.
다음으로, 인공지능 기반의 영상 분석 시스템(3)의 이미지 처리 모듈(32)은 제1 머신러닝부(331)에 의해 결정된 관심 영역의 위치 정보를 토대로, 입력 이미지에서 관심 영역에 해당하는 부분만의 부분 이미지를 생성할 수 있다(S24). 이때 추출되는 부분 이미지는, 분석 대상 이미지의 관심 영역 부분에 해당하지만, 분석 대상 이미지를 크롭(crop)한 것이 아니라 원본 이미지로부터 해당 부분을 다시 추출한 것으로서, 관심 영역에 해당하는 분석 대상 이미지의 일부에 비해서는 더 높은 해상도를 갖는다. 예를 들어, 이미지 처리 모듈(32)은 분석 대상 이미지와 동일한 해상도를 갖도록 관심 영역 부분의 부분 이미지를 생성할 수 있으나, 이에 한정되는 것은 아니다.
다음으로, 다음으로, 인공지능 기반의 영상 분석 시스템(3)의 머신러닝 모듈(33)의 제2 머신러닝부(332)는 이미지 처리 모듈(32)에 의해 생성된 부분 이미지를 제2 분석 모델에 적용함으로써, 부분 이미지 내의 객체의 존재 여부 및/또는 위치에 대한 탐지를 수행할 수 있다(S25).
제2 머신러닝부(332)에 의한 객체 탐지 결과는, 인공지능 기반의 영상 분석 시스템(3)의 출력 모듈(34)에 의하여 출력될 수 있다(S26). 예를 들어, 출력 모듈(34)은 탐지된 객체의 위치를 원본 입력 이미지 상에 오버레이(overlay)되는 형태로 출력할 수 있으나, 객체 탐지 결과를 출력하는 형태는 이에 한정되는 것은 아니다.
이상에서 설명한 실시예들에 따른 인공지능 기반의 영상 분석 방법에 의한 동작은 적어도 부분적으로 컴퓨터 프로그램으로 구현되고 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 실시예들에 따른 인공지능 기반의 영상 분석 방법에 의한 동작을 구현하기 위한 프로그램이 기록되고 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.
이상에서 살펴본 본 발명은 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 청구범위의 기술적 사상에 의해서 정해져야 할 것이다.

Claims (9)

  1. 미리 라벨링된 객체를 포함하는 하나 이상의 학습 이미지, 및 분석 대상 이미지를 포함하는 입력 이미지를 수신하도록 구성된 입력 모듈;
    상기 하나 이상의 학습 이미지를 이용한 머신러닝 기반의 학습을 통해 분석 모델을 생성하고, 생성된 상기 분석 모델을 이용하여, 상기 분석 대상 이미지 내의 상기 객체에 대한 탐지 결과를 생성하도록 구성된 머신러닝 모듈; 및
    상기 분석 대상 이미지 내의 상기 객체에 대한 탐지 결과를 출력하도록 구성된 출력 모듈을 포함하되,
    상기 머신러닝 모듈은,
    상기 분석 모델을 이용하여 상기 분석 대상 이미지에서 상기 객체에 연관된 갱신이 예측되는 관심 영역을 결정하고, 상기 관심 영역을 결정할 때에 비해 분석 심도를 증가시킨 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성하되,
    제1 해상도를 가진 상기 분석 대상 이미지에 대한 분석을 통하여 상기 분석 대상 이미지의 일부인 상기 관심 영역을 결정하고,
    상기 관심 영역에 상응하며 상기 제1 해상도를 갖는 부분 이미지에 대한 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성하도록 구성되며,
    상기 제1 해상도에 비해 큰 제2 해상도를 갖는 상기 입력 이미지로부터 상기 제1 해상도를 가진 상기 분석 대상 이미지를 추출하고, 상기 머신러닝 모듈에 의해 상기 관심 영역이 결정되면, 상기 입력 이미지로부터 상기 제1 해상도를 갖는 상기 관심 영역의 이미지를 추출하여 상기 부분 이미지를 생성하도록 구성된 이미지 처리 모듈을 더 포함하고,
    상기 머신러닝 모듈은,
    상기 분석 대상 이미지에서 상기 객체에 상응하여 탐지된 특징값이 미리 설정된 정적인 객체에 대한 것인지 또는 미리 설정된 동적인 객체에 대한 것인지를 구분하고,
    구분된 상기 특징값의 종류에 기초하여 상기 분석 대상 이미지에서 상기 객체에 연관된 갱신이 예측되는 영역의 크기를 확장할 것인지 여부를 결정함으로써 갱신 영역을 결정하도록 더 구성된 인공지능 기반의 영상 분석 시스템.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 머신러닝 모듈은,
    상기 제1 해상도를 갖는 상기 학습 이미지를 이용한 학습을 통하여 상기 관심 영역을 결정하기 위한 제1 분석 모델을 생성하고, 상기 제1 분석 모델을 이용하여 상기 분석 대상 이미지를 분석하도록 구성된 제1 머신러닝부; 및
    상기 제1 해상도를 갖는 학습용 부분 이미지를 이용한 학습을 통하여 상기 관심 영역으로부터 상기 객체를 탐지하기 위한 제2 분석 모델을 생성하고, 상기 제2 분석 모델을 이용하여 상기 부분 이미지를 분석하도록 구성된 제2 머신러닝부를 포함하는 인공지능 기반의 영상 분석 시스템.
  5. 인공지능 기반의 영상 분석 시스템이, 미리 라벨링된 객체를 포함하는 하나 이상의 학습 이미지를 수신하는 단계;
    상기 인공지능 기반의 영상 분석 시스템이, 상기 하나 이상의 학습 이미지를 이용한 머신러닝 기반의 학습을 통해 분석 모델을 생성하는 단계;
    상기 인공지능 기반의 영상 분석 시스템이, 분석 대상 이미지를 포함하는 입력 이미지를 수신하는 단계;
    상기 인공지능 기반의 영상 분석 시스템이, 상기 분석 모델을 이용하여 상기 분석 대상 이미지 내의 상기 객체를 탐지하는 단계; 및
    상기 인공지능 기반의 영상 분석 시스템이, 상기 분석 대상 이미지 내의 상기 객체에 대한 탐지 결과를 출력하는 단계를 포함하되,
    상기 객체를 탐지하는 단계는,
    상기 인공지능 기반의 영상 분석 시스템이, 상기 분석 모델을 이용하여 상기 분석 대상 이미지에서 상기 객체에 연관된 갱신이 예측되는 관심 영역을 결정하는 단계; 및
    상기 인공지능 기반의 영상 분석 시스템이, 상기 관심 영역을 결정할 때에 비해 분석 심도를 증가시킨 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성하는 단계를 포함하고,
    상기 관심 영역을 결정하는 단계는, 상기 인공지능 기반의 영상 분석 시스템이, 제1 해상도를 가진 상기 분석 대상 이미지에 대한 분석을 통하여 상기 분석 대상 이미지의 일부를 상기 관심 영역으로 결정하는 단계를 포함하며,
    상기 객체에 대한 탐지 결과를 생성하는 단계는, 상기 인공지능 기반의 영상 분석 시스템이, 상기 관심 영역에 상응하며 상기 제1 해상도를 갖는 부분 이미지에 대한 분석을 통하여 상기 관심 영역 내의 상기 객체에 대한 탐지 결과를 생성하는 단계를 포함하고,
    상기 객체를 탐지하는 단계는,
    상기 관심 영역을 결정하는 단계 전에, 상기 인공지능 기반의 영상 분석 시스템이, 상기 제1 해상도에 비해 큰 제2 해상도를 갖는 상기 입력 이미지로부터 상기 제1 해상도를 가진 상기 분석 대상 이미지를 추출하는 단계를 더 포함하며,
    상기 관심 영역을 결정하는 단계 후에, 상기 인공지능 기반의 영상 분석 시스템이, 상기 입력 이미지로부터 상기 제1 해상도를 갖는 상기 관심 영역의 이미지를 추출하여 상기 부분 이미지를 생성하는 단계를 더 포함하고,
    상기 관심 영역을 결정하는 단계는,
    상기 인공지능 기반의 영상 분석 시스템이, 상기 분석 대상 이미지에서 상기 객체에 상응하여 탐지된 특징값이 미리 설정된 정적인 객체에 대한 것인지 또는 미리 설정된 동적인 객체에 대한 것인지를 구분하는 단계; 및
    상기 인공지능 기반의 영상 분석 시스템이, 구분된 상기 특징값의 종류에 기초하여 상기 분석 대상 이미지에서 상기 객체에 연관된 갱신이 예측되는 영역의 크기를 확장할 것인지 여부를 결정하는 단계를 더 포함하는 인공지능 기반의 영상 분석 방법.
  6. 삭제
  7. 삭제
  8. 제5항에 있어서,
    상기 분석 모델을 생성하는 단계는,
    상기 인공지능 기반의 영상 분석 시스템이, 상기 제1 해상도를 갖는 상기 학습 이미지를 이용한 학습을 통하여 상기 관심 영역을 결정하기 위한 제1 분석 모델을 생성하는 단계; 및
    상기 인공지능 기반의 영상 분석 시스템이, 상기 제1 해상도를 갖는 학습용 부분 이미지를 이용한 학습을 통하여 상기 관심 영역으로부터 상기 객체를 탐지하기 위한 제2 분석 모델을 생성하는 단계를 포함하고,
    상기 관심 영역을 결정하는 단계는, 상기 제1 분석 모델을 이용하여 수행되며,
    상기 객체에 대한 탐지 결과를 생성하는 단계는, 상기 제2 분석 모델을 이용하여 수행되는 인공지능 기반의 영상 분석 방법.
  9. 하드웨어와 결합되어 제5항 또는 제8항에 따른 인공지능 기반의 영상 분석 방법을 실행하도록 컴퓨터로 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.
KR1020200124561A 2020-09-25 2020-09-25 갱신 영역 학습을 통한 인공지능 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 KR102218255B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200124561A KR102218255B1 (ko) 2020-09-25 2020-09-25 갱신 영역 학습을 통한 인공지능 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200124561A KR102218255B1 (ko) 2020-09-25 2020-09-25 갱신 영역 학습을 통한 인공지능 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램

Publications (1)

Publication Number Publication Date
KR102218255B1 true KR102218255B1 (ko) 2021-02-19

Family

ID=74687324

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200124561A KR102218255B1 (ko) 2020-09-25 2020-09-25 갱신 영역 학습을 통한 인공지능 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR102218255B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450310A (zh) * 2021-05-31 2021-09-28 四川大学华西医院 一种窄带光成像膀胱镜检图像的分析系统和方法
KR20230053355A (ko) * 2021-10-14 2023-04-21 주식회사 아이뷰테크놀로지 이중영상 카메라 및 인공지능을 이용한 화재 예측 시스템 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110024308A (ko) * 2009-09-01 2011-03-09 한국과학기술원 뉴로-퍼지 시스템과 병렬처리 프로세서를 결합한 컴퓨터 시스템, 이를 이용하여 영상에서 물체를 인식하는 방법 및 장치
JP2011137780A (ja) * 2010-01-04 2011-07-14 Nec Corp 画像診断方法、画像診断装置および画像診断プログラム
KR101858691B1 (ko) 2017-01-10 2018-05-16 주식회사 에스원 보안시스템에서 영상 이벤트 감지 및 저장 공간 조정 방법 및 이를 이용한 저장 공간 조정 시스템
JP2020017136A (ja) * 2018-07-26 2020-01-30 日本電信電話株式会社 物体検出認識装置、方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110024308A (ko) * 2009-09-01 2011-03-09 한국과학기술원 뉴로-퍼지 시스템과 병렬처리 프로세서를 결합한 컴퓨터 시스템, 이를 이용하여 영상에서 물체를 인식하는 방법 및 장치
JP2011137780A (ja) * 2010-01-04 2011-07-14 Nec Corp 画像診断方法、画像診断装置および画像診断プログラム
KR101858691B1 (ko) 2017-01-10 2018-05-16 주식회사 에스원 보안시스템에서 영상 이벤트 감지 및 저장 공간 조정 방법 및 이를 이용한 저장 공간 조정 시스템
JP2020017136A (ja) * 2018-07-26 2020-01-30 日本電信電話株式会社 物体検出認識装置、方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"의료영상 분석을 위한 기계학습", 정보과학회논문지 : 소프트웨어 및 응용 제39권 제3호(pp. 163-174), 2012년 3월 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450310A (zh) * 2021-05-31 2021-09-28 四川大学华西医院 一种窄带光成像膀胱镜检图像的分析系统和方法
KR20230053355A (ko) * 2021-10-14 2023-04-21 주식회사 아이뷰테크놀로지 이중영상 카메라 및 인공지능을 이용한 화재 예측 시스템 및 방법
KR102568169B1 (ko) * 2021-10-14 2023-08-18 주식회사 아이뷰테크놀로지 이중영상 카메라 및 인공지능을 이용한 화재 예측 시스템 및 방법

Similar Documents

Publication Publication Date Title
US11295140B2 (en) Methods and systems for determining object activity within a region of interest
US10614310B2 (en) Behavior recognition
AU2018324122B2 (en) Identification of individuals in a digital file using media analysis techniques
Shidik et al. A systematic review of intelligence video surveillance: Trends, techniques, frameworks, and datasets
CN112560999B (zh) 一种目标检测模型训练方法、装置、电子设备及存储介质
WO2019218824A1 (zh) 一种移动轨迹获取方法及其设备、存储介质、终端
KR101897923B1 (ko) 신경망 학습 모델 기반 추적 객체 추출 서비스 제공 시스템, 이의 방법, 그리고 이 방법을 저장한 컴퓨터 판독 가능 저장 매체
CN112232293B (zh) 图像处理模型训练、图像处理方法及相关设备
Cheng et al. Real-time pedestrian crossing lights detection algorithm for the visually impaired
WO2013101460A2 (en) Clustering-based object classification
CN112052837A (zh) 基于人工智能的目标检测方法以及装置
CN112001375B (zh) 一种火焰检测方法、装置、电子设备及存储介质
KR102218255B1 (ko) 갱신 영역 학습을 통한 인공지능 기반의 영상 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램
US10824935B2 (en) System and method for detecting anomalies in video using a similarity function trained by machine learning
KR102333143B1 (ko) 무인 계수 서비스 제공 시스템
CN112200081A (zh) 异常行为识别方法、装置、电子设备及存储介质
KR102296274B1 (ko) 사용자 학습 기반 딥러닝 객체 인식 서비스 제공 방법
CN112633313B (zh) 一种网络终端的不良信息识别方法及局域网终端设备
KR102143034B1 (ko) 객체의 미래 움직임 예측을 통한 동영상에서의 객체 추적을 위한 방법 및 시스템
CN112784724A (zh) 一种车辆变道检测方法、装置、设备及存储介质
CN110390226B (zh) 人群事件识别方法、装置、电子设备及系统
KR102261187B1 (ko) 머신 러닝에 기반한 감시 영상 분석 시스템 및 그 방법
CN113313098A (zh) 视频处理方法、设备、系统及存储介质
KR101826669B1 (ko) 동영상 검색 시스템 및 그 방법
CN116823884A (zh) 多目标跟踪方法、系统、计算机设备及存储介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant