KR102553519B1

KR102553519B1 - 컴퓨터와 사람의 협업을 통한 동영상 반자동 편집을 위한 인공지능 기반 동영상 편집 추천 방법

Info

Publication number: KR102553519B1
Application number: KR1020210173357A
Authority: KR
Inventors: 송혁; 고민수; 주희영
Original assignee: 한국전자기술연구원
Priority date: 2021-12-07
Filing date: 2021-12-07
Publication date: 2023-07-10
Also published as: WO2023106554A1; KR20230085311A

Abstract

컴퓨터와 사람의 협업을 통한 동영상 반자동 편집을 위한 인공지능 기반 동영상 편집 추천 방법이 제공된다. 본 발명의 실시예에 따른 동영상 편집 추천 방법은, 동영상 콘텐츠를 컷 단위로 분할하고, 분할된 동영상 콘텐츠를 분석하여 상황을 추론하고 이벤트를 탐지하며, 상황 추론 결과, 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천한다. 이에 의해, 인공지능 기반으로 동영상 편집에 필요한 영상 클립들을 자동으로 추천함으로써, 편집 작업의 전단계에 필요한 상당 부분의 작업을 인공지능이 대신하여 주고, 편집자는 보완 작업과 후속 작업만 하면 되므로, 편집에 드는 노력과 시간을 획기적으로 줄일 수 있게 된다.

Description

컴퓨터와 사람의 협업을 통한 동영상 반자동 편집을 위한 인공지능 기반 동영상 편집 추천 방법{AI-based video editing recommendation method for semi-automatic video editing through computer-human collaboration}

본 발명은 동영상 편집 기술에 관한 것으로, 더욱 상세하게는 인공지능을 이용하여 동영상 편집 작업을 경감시키기 위한 방법에 관한 것이다.

현재 동영상 편집은 동영상 자르기, 합치기, 분할 등을 지원하여 주는 편집 툴이나 소프트웨어를 이용하여 편집자가 직접 작업하고 있다. 여기에는 동영상의 내용 파악, 흐름에 따른 배열 작업, 편집 의도에 맞는 부분을 잘라내는 작업, 잘라낸 부분들을 재배열하는 작업, 재배열 이후의 가편집 작업 등이 요구되어, 많은 노력과 시간이 소요된다.

이에 따라, 동영상을 자동으로 편집하여 주기 위한 기술이 제시되고는 있지만, 동영상의 장르나 편집 의도 등이 제대로 반영되지 않은 기계적인 편집이라는 점에서 한계가 있다.

그러므로 컴퓨터에 의한 완전한 자동 편집 보다는 컴퓨터와 사람의 협업에 의한 반자동의 편집이 보다 적합하다는 전제 하에, 이 같은 반자동 편집을 보다 효과적으로 수행하기 위한 방안이 필요하다.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 컴퓨터와 사람의 협업을 통한 동영상 반자동 편집을 위한 인공지능 기반 동영상 편집 추천 방법을 제공함에 있다.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 동영상 편집 추천 방법은, 동영상 콘텐츠를 컷 단위로 분할하는 단계; 분할된 동영상 콘텐츠에서 객체를 검출하는 단계; 검출된 객체를 인식하는 단계; 검출된 객체의 행동을 인지하는 단계; 객체 검출 결과, 객체 인식 결과, 행동 인지 결과로부터 상황을 추론하는 단계; 객체 검출 결과, 객체 인식 결과, 행동 인지 결과로부터 이벤트를 탐지하는 단계; 상황 추론 결과, 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천하는 단계;를 포함한다.

추천 단계는, 동영상 클립들과 함께 동영상 클립들의 순서를 추천할 수 있다.

순서가 추천되는 동영상 클립들은, 동 시간대에 다른 앵글로 촬영된 것들을 포함할 수 있다.

장르 정보는, 편집자가 설정할 수 있다.

장르 정보는, 인공지능 모델을 이용하여 객체 검출 결과, 객체 인식 결과, 행동 인지 결과, 상황 추론 결과 및 이벤트 탐지 결과 중 적어도 하나로부터 추론될 수 있다.

추천 단계는, 편집자의 편집 의도를 더 반영하여, 편집 과정에 필요한 동영상 클립들을 추천할 수 있다. 편집 의도는, 편집자가 설정한 상황 정보와 이벤트 정보를 포함할 수 있다.

추천 단계는, 추천할 동영상 클립들 각각에 전후 동영상을 일정 시간 씩 더 부가하여 추천할 수 있다.

추천된 동영상 클립들에, 편집자가 입력한 추가 정보를 기초로 동영상 클립들을 추가할 수 있다.

한편, 본 발명의 다른 실시예에 따른, 동영상 편집 추천 시스템은, 동영상 콘텐츠를 컷 단위로 분할하는 분할부; 분할된 동영상 콘텐츠에서 객체를 검출하는 검출부; 검출된 객체를 인식하는 인식부; 검출된 객체의 행동을 인지하는 인지부; 객체 검출 결과, 객체 인식 결과, 행동 인지 결과로부터 상황을 추론하는 추론부; 객체 검출 결과, 객체 인식 결과, 행동 인지 결과로부터 이벤트를 탐지하는 탐지부; 상황 추론 결과, 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천하는 추천부;를 포함한다.

한편, 본 발명의 다른 실시예에 따른, 동영상 편집 추천 방법은, 동영상 콘텐츠를 컷 단위로 분할하는 단계; 분할된 동영상 콘텐츠에서 상황을 추론하는 단계; 분할된 동영상 콘텐츠에서 이벤트를 탐지하는 단계; 상황 추론 결과, 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천하는 단계;를 포함한다.

한편, 본 발명의 다른 실시예에 따른, 동영상 편집 추천 시스템은, 동영상 콘텐츠를 컷 단위로 분할하는 분할부; 분할된 동영상 콘텐츠에서 상황을 추론하는 추론부; 분할된 동영상 콘텐츠에서 이벤트를 탐지하는 탐지부; 상황 추론 결과, 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천하는 추천부;를 포함한다.

이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 인공지능 기반으로 동영상 편집에 필요한 영상 클립들을 자동으로 추천함으로써, 편집 작업의 전단계에 필요한 상당 부분의 작업을 인공지능이 대신하여 주고, 편집자는 보완 작업과 후속 작업만 하면 되므로, 편집에 드는 노력과 시간을 획기적으로 줄일 수 있게 된다.

또한, 본 발명의 실시예들에 따르면, 컴퓨터에 의함에도 동영상의 장르와 편집 의도에 부합하는 적정의 영상 클립들이 자동으로 추천되어, 우수한 편집 퀄리티를 보장할 수 있게 된다.

도 1은 본 발명의 일 실시예에 따른 동영상 반자동 편집 시스템의 블럭도,
도 2는 본 발명의 다른 실시예에 따른 동영상 반자동 편집 시스템의 블럭도,
도 3은 본 발명의 또 다른 실시예에 따른 동영상 반자동 편집 시스템의 블럭도, 그리고,
도 4는 본 발명의 또 다른 실시예에 따른 동영상 반자동 편집 시스템의 블럭도이다.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.

본 발명의 실시예에서는 인공지능 기반 동영상 편집 추천 방법을 제시한다. 컴퓨터가 동영상 편집에 사용할 영상 클립들을 편집 순서까지 맞추어 자동으로 추천하여 주면, 편집자가 이를 확인/보완하여 편집을 완성할 수 있도록 하는 방법이다.

도 1은 본 발명의 일 실시예에 따른 동영상 반자동 편집 시스템의 블럭도이다. 본 발명의 실시예에 따른 동영상 반자동 편집 시스템은, 인공지능과 편집자의 협업으로 동영상을 반자동으로 편집할 수 있게 하는 시스템이다.

이와 같은 기능을 수행하는 본 발명의 실시예에 따른 동영상 반자동 편집 시스템은, 도시된 바와 같이, 동영상 입력부(110), 동영상 분할부(115), 객체 검출부(120), 객체 인식부(125), 행동 인지부(130), 상황 추론부(상황), 이벤트 탐지부(140), 동영상 클립 추천부(145), 동영상 클립 추가부(150), 동영상 편집부(155)를 포함하여 구성된다.

동영상 입력부(110)는 편집 대상이 되는 동영상 콘텐츠를 입력받아 동영상 분할부(115)로 전달한다.

동영상 분할부(115)는 동영상 입력부(110)를 통해 전달되는 동영상을 컷(cut) 단위로 분할한다. 참고로, 동영상은 다수의 씬(scene)들로 이루어지는데, 씬은 다수의 샷(shot)들로 이루어지고, 샷은 다수의 컷들로 이루어져 있다. 동영상 분할부(115)는 동영상을 분석하여 컷 단위로 분할하도록 학습된 딥러닝 모델인 동영상 분할 모델을 이용하여 구현할 수 있다.

객체 검출부(120)는 동영상 분할부(115)에서 분할된 동영상 콘텐츠에서 객체를 검출한다. 객체 인식부(125)는 객체 검출부(120)에서 검출된 객체의 종류, 사람의 경우는 얼굴까지 인식한다. 행동 인지부(130)는 객체 검출부(120)에서 검출된 객체의 행동을 인지한다.

객체 검출부(120), 객체 인식부(125) 및 행동 인지부(130)는 모두 딥러닝 모델로 구현가능하다.

상황 추론부(135)는 객체 검출부(120)에 의한 객체 검출 결과, 객체 인식부(125)에 의한 객체 인식 결과 및 행동 인지부(130)에 의한 행동 인지 결과로부터 상황(context)을 추론한다.

상황 추론부(135)는 객체 검출 결과, 객체 인식 결과 및 행동 인지 결과를 분석하여 상황을 추론하도록 학습된 딥러닝 모델인 상황 추론 모델로 구현할 수 있다.

이벤트 탐지부(140)는 객체 검출부(120)에 의한 객체 검출 결과, 객체 인식부(125)에 의한 객체 인식 결과 및 행동 인지부(130)에 의한 행동 인지 결과로부터 이벤트를 탐지한다.

이벤트 탐지부(140)는 객체 검출 결과, 객체 인식 결과 및 행동 인지 결과를 분석하여 이벤트를 탐지하도록 학습된 딥러닝 모델인 이벤트 탐지 모델로 구현할 수 있다.

동영상 클립 추천부(145)는 상황 추론부(135)에 의한 상황 추론 결과와 이벤트 탐지부(140)에 의한 이벤트 탐지 결과 및 장르 정보로부터 동영상 편집 과정에 필요한 동영상 클립들을 추천한다.

추천되는 동영상 클립들은 편집 동영상에 포함되는 것이 적절하다고 동영상 클립 추천부(145)에 의해 판단된 것들이다.

동영상 클립 추천부(145)는 상황 추론 결과, 이벤트 탐지 결과 및 장르 정보를 분석하여 동영상 편집 과정에 필요한 동영상 클립들을 추천하도록 학습된 인공지능 모델인 추천 모델로 구현할 수 있다.

나아가, 동영상 클립 추천부(145)는 추천할 동영상 클립들 각각에 전후 동영상을 일정 시간씩 더 부가하여 추천할 수도 있다.

한편, 동영상 클립 추천부(145)는 동영상 클립들의 순서까지 추천할 수 있다. 즉, 동영상 클립 추천부(145)는 추천하는 동영상 클립들을 내용 흐름에 따라 나열하여 준다.

동영상 콘텐츠는 하나의 카메라로 촬영한 것이 아닌, 다수의 카메라, 즉, 각기 다른 앵글로 촬영된 동영상들이 포함되어 있을 수 있다. 즉, 동 시간대에 다른 앵글로 촬영된 동영상들이 존재한다.

따라서, 동영상 클립 추천부(145)에 의한 동영상 클립 순서 추천은, 동 시간대에 서로 다른 앵글로 촬영된 동영상 클립들이 모두 추천되는 경우에 특히 유용하다.

한편, 동영상 클립 추천부(145)로 입력되는 장르 정보는 편집자가 직접 설정/입력 한다.

동영상 클립 추가부(150)는 편집자의 추가 정보를 기초로, 동영상 클립들을 추가로 추천한다. 동영상 클립 추가부(150)에 의해 추가되는 동영상 클립들은 편집자의 입력한 추가 정보를 쿼리로 검색한 것들이다. 검색에는 상황 추론부(135)에 의한 추론 결과와 이벤트 탐지부(140)에 의한 이벤트 탐지 결과가 참조된다.

추가 정보는 편집자가 동영상 클립 추천부(145)에 의해 추천된 동영상 클립들을 보고, 부족하다고 생각되어 추가하고자 하는 상황과 이벤트에 대한 정보를 말한다.

동영상 클립 추가부(150)는 추가로 추천하는 동영상 클립들과 동영상 클립 추천부(145)에 의해 기추천된 동영상 클립들을 시간 순서에 맞게 자동으로 배열한다.

동영상 편집부(155)는 동영상 클립 추천부(145)에 의해 추천되고 동영상 클립 추가부(150)에 의해 추가된 동영상 클립들을 편집하여 편집자가 편집 동영상을 완성하도록 하여 주는 편집 툴 또는 편집 프로그램이다.

도 2는 본 발명의 다른 실시예에 따른 동영상 반자동 편집 시스템의 블럭도이다. 본 발명의 실시예에 따른 동영상 반자동 편집 시스템은, 도 1에 제시된 시스템에서 장르 추론부(160)가 추가되었다는 점에서 차이가 있다.

장르 추론부(160)는 객체 검출부(120)에 의한 객체 검출 결과, 객체 인식부(125)에 의한 객체 인식 결과 및 행동 인지부(130)에 의한 행동 인지 결과, 상황 추론부(135)에 의한 상황 추론 결과 및 이벤트 탐지부(140)에 의한 이벤트 탐지 결과를 분석하여 동영상 콘텐츠의 장르를 추론하도록 학습된 인공지능 모델이다.

도 1에 도시된 시스템의 경우 동영상 콘텐츠의 장르를 편집자가 설정/입력하였지만, 본 발명의 실시예에 따른 동영상 반자동 편집 시스템은 동영상 콘텐츠의 장르 추론이 자동으로 수행된다는 점에서 차이가 있다.

도 3은 본 발명의 또 다른 실시예에 따른 동영상 반자동 편집 시스템의 블럭도이다. 본 발명의 실시예에 따른 동영상 반자동 편집 시스템은, 동영상 클립 추천부(145)의 입력에 편집자의 편집 의도가 더 포함된다는 점에서, 도 1에 도시된 시스템과 차이가 있다.

편집 의도는 편집자가 비중을 두고 있는 상황 정보와 이벤트 정보를 말한다. 이에 따라, 동영상 클립 추천부(145)는 동영상 편집 과정에 필요한 동영상 클립들을 추천함에 있어, 편집 의도까지 분석하게 된다.

도 4는 본 발명의 또 다른 실시예에 따른 동영상 반자동 편집 시스템의 블럭도이다. 본 발명의 실시예에 따른 동영상 반자동 편집 시스템은, 동영상 클립 추천부(145)의 전단에 선별부(165)가 추가된다는 점에서, 도 1에 제시된 시스템과 차이가 있다.

선별부(165)는 상황 추론부(135)에 의한 상황 추론 결과들과 이벤트 탐지부(140)에 의한 이벤트 탐지 결과들 중 편집자의 편집 의도에 부합하는 상황 추론 결과와 이벤트 탐지 결과만을 선별하여 동영상 클립 추천부(145)로 전달한다.

이에 따라, 동영상 클립 추천부(145)에서 편집자의 편집 의도에 부합하지 않는 동영상 클립이 추천되는 것을 사전에 배제할 수 있다.

지금까지, 컴퓨터와 사람의 협업을 통한 동영상 반자동 편집을 위한 인공지능 기반 동영상 편집 추천 방법에 대해 바람직한 실시예를 들어 상세히 설명하였다.

동영상 편집자가 동영상을 편집하여 제작함에 있어, 필요한 영상 클립들을 분석하여 추출하는 단순 작업을 인공지능이 대신하여 동영상 편집 시간을 줄이는 방법이다.

한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

110 : 동영상 입력부
115 : 동영상 분할부
120 : 객체 검출부
125 : 객체 인식부
130 : 행동 인지부
135 : 상황 추론부
140 : 이벤트 탐지부
145 : 동영상 클립 추천부
150 : 동영상 클립 추가부
155 : 동영상 편집부

Claims

동영상 콘텐츠를 컷 단위로 분할하는 단계;
분할된 동영상 콘텐츠에서 객체를 검출하는 단계;
검출된 객체를 인식하는 단계;
검출된 객체의 행동을 인지하는 단계;
객체 검출 결과, 객체 인식 결과, 행동 인지 결과로부터 상황을 추론하는 단계;
객체 검출 결과, 객체 인식 결과, 행동 인지 결과로부터 이벤트를 탐지하는 단계;
상황 추론 결과들 및 이벤트 탐지 결과들 중 편집자의 편집 의도에 부합하는 상황 추론 결과와 이벤트 탐지 결과만을 선별하는 단계;
선별된 상황 추론 결과와 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천하는 제1 추천단계;
추천된 동영상 클립들에, 편집자가 입력한 추가 정보를 기초로 동영상 클립들을 추가로 추천하는 제2 추천단계;
추천된 동영상 클립들을 편집자가 편집하여 편집 동영상을 완성하도록 하여 주는 편집 툴을 제공하는 단계;를 포함하고,
편집 의도는,
편집자가 설정한 상황 정보와 이벤트 정보를 포함하며,
제2 추천단계는,
편집자의 입력한 추가 정보를 쿼리로, 상황 추론 결과들 및 이벤트 탐지 결과들를 참조하여 검색한 동영상 클립들을 추가로 추천하며,
추가 정보는,
편집자가 추가하고자 하는 상황과 이벤트에 대한 정보로, 제1 추천단계에 의해 추천된 동영상 클립들을 본 편집자에 의해 입력되는 것을 특징으로 하는 동영상 편집 추천 방법.
청구항 1에 있어서,
제1 추천 단계는,
동영상 클립들과 함께 동영상 클립들의 순서를 추천하는 것을 특징으로 하는 동영상 편집 추천 방법.
청구항 2에 있어서,
순서가 추천되는 동영상 클립들은,
동 시간대에 다른 앵글로 촬영된 것들을 포함하는 것을 특징으로 하는 동영상 편집 추천 방법.
청구항 1에 있어서,
장르 정보는,
편집자가 설정하는 것을 특징으로 하는 동영상 편집 추천 방법.
청구항 1에 있어서,
장르 정보는,
인공지능 모델을 이용하여 객체 검출 결과, 객체 인식 결과, 행동 인지 결과, 상황 추론 결과 및 이벤트 탐지 결과 중 적어도 하나로부터 추론되는 것을 특징으로 하는 동영상 편집 추천 방법.
삭제
삭제
청구항 1에 있어서,
제1 추천 단계는,
추천할 동영상 클립들 각각에 전후 동영상을 일정 시간 씩 더 부가하여 추천하는 것을 특징으로 하는 동영상 편집 추천 방법.
삭제
동영상 콘텐츠를 컷 단위로 분할하는 분할부;
분할된 동영상 콘텐츠에서 객체를 검출하는 검출부;
검출된 객체를 인식하는 인식부;
검출된 객체의 행동을 인지하는 인지부;
객체 검출 결과, 객체 인식 결과, 행동 인지 결과로부터 상황을 추론하는 추론부;
객체 검출 결과, 객체 인식 결과, 행동 인지 결과로부터 이벤트를 탐지하는 탐지부;
상황 추론 결과들 및 이벤트 탐지 결과들 중 편집자의 편집 의도에 부합하는 상황 추론 결과와 이벤트 탐지 결과만을 선별하는 선별부;
선별된 상황 추론 결과와 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천하는 추천부;
추천된 동영상 클립들에, 편집자가 입력한 추가 정보를 기초로 동영상 클립들을 추가로 추천하는 추가부;
추천된 동영상 클립들을 편집자가 편집하여 편집 동영상을 완성하도록 하여 주는 편집 툴을 제공하는 편집부;를 포함하고,
편집 의도는,
편집자가 설정한 상황 정보와 이벤트 정보를 포함하며,
추가부는,
편집자의 입력한 추가 정보를 쿼리로, 상황 추론 결과들 및 이벤트 탐지 결과들를 참조하여 검색한 동영상 클립들을 추가로 추천하며,
추가 정보는,
편집자가 추가하고자 하는 상황과 이벤트에 대한 정보로, 추천부에 의해 추천된 동영상 클립들을 본 편집자에 의해 입력되는 것을 특징으로 하는 동영상 편집 추천 시스템.
동영상 콘텐츠를 컷 단위로 분할하는 단계;
분할된 동영상 콘텐츠에서 상황을 추론하는 단계;
분할된 동영상 콘텐츠에서 이벤트를 탐지하는 단계;
상황 추론 결과들 및 이벤트 탐지 결과들 중 편집자의 편집 의도에 부합하는 상황 추론 결과와 이벤트 탐지 결과만을 선별하는 단계;
선별된 상황 추론 결과와 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천하는 제1 추천단계;
추천된 동영상 클립들에, 편집자가 입력한 추가 정보를 기초로 동영상 클립들을 추가로 추천하는 제2 추천단계;
추천된 동영상 클립들을 편집자가 편집하여 편집 동영상을 완성하도록 하여 주는 편집 툴을 제공하는 단계;를 포함하고,
편집 의도는,
편집자가 설정한 상황 정보와 이벤트 정보를 포함하며,
제2 추천단계는,
편집자의 입력한 추가 정보를 쿼리로, 상황 추론 결과들 및 이벤트 탐지 결과들를 참조하여 검색한 동영상 클립들을 추가로 추천하며,
추가 정보는,
편집자가 추가하고자 하는 상황과 이벤트에 대한 정보로, 제1 추천단계에 의해 추천된 동영상 클립들을 본 편집자에 의해 입력되는 것을 특징으로 하는 동영상 편집 추천 방법.
동영상 콘텐츠를 컷 단위로 분할하는 분할부;
분할된 동영상 콘텐츠에서 상황을 추론하는 추론부;
분할된 동영상 콘텐츠에서 이벤트를 탐지하는 탐지부;
상황 추론 결과들 및 이벤트 탐지 결과들 중 편집자의 편집 의도에 부합하는 상황 추론 결과와 이벤트 탐지 결과만을 선별하는 선별부;
선별된 상황 추론 결과와 이벤트 탐지 결과 및 장르 정보로부터 편집 과정에 필요한 동영상 클립들을 추천하는 추천부;
추천된 동영상 클립들에, 편집자가 입력한 추가 정보를 기초로 동영상 클립들을 추가로 추천하는 추가부;
추천된 동영상 클립들을 편집자가 편집하여 편집 동영상을 완성하도록 하여 주는 편집 툴을 제공하는 편집부;를 포함하고,
편집 의도는,
편집자가 설정한 상황 정보와 이벤트 정보를 포함하며,
추가부는,
편집자의 입력한 추가 정보를 쿼리로, 상황 추론 결과들 및 이벤트 탐지 결과들를 참조하여 검색한 동영상 클립들을 추가로 추천하며,
추가 정보는,
편집자가 추가하고자 하는 상황과 이벤트에 대한 정보로, 추천부에 의해 추천된 동영상 클립들을 본 편집자에 의해 입력되는 것을 특징으로 하는 동영상 편집 추천 시스템.