KR20240049179A - 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치 및 그 방법 - Google Patents
복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치 및 그 방법 Download PDFInfo
- Publication number
- KR20240049179A KR20240049179A KR1020230132327A KR20230132327A KR20240049179A KR 20240049179 A KR20240049179 A KR 20240049179A KR 1020230132327 A KR1020230132327 A KR 1020230132327A KR 20230132327 A KR20230132327 A KR 20230132327A KR 20240049179 A KR20240049179 A KR 20240049179A
- Authority
- KR
- South Korea
- Prior art keywords
- processor
- image
- movement
- electronic device
- responsive
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000010801 machine learning Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 3
- 230000004044 response Effects 0.000 description 12
- 238000000605 extraction Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000001339 gustatory effect Effects 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/617—Upgrading or updating of programs or applications for camera control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/144—Movement detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Processing Or Creating Images (AREA)
Abstract
복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치 및 그 방법에 관한 것이다. 본 개시에 따른 전자 장치는, 영상을 포함하는 메모리, 및 메모리와 전기적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 상기 영상에 포함된 연속되는 복수의 프레임 간 비교에 기반하여 적어도 하나의 객체의 움직임을 식별하고, 상기 움직임의 크기가 임계 값 이상인 상기 적어도 하나의 객체를 적어도 하나의 대상체로 선별하고, 상기 적어도 하나의 대상체 각각에 대응하는 입력 조작을 식별하고, 상기 적어도 하나의 대상체 각각을 상기 식별된 입력 조작에 연결하여, 반응형 영상을 생성할 수 있다.
Description
본 개시는 반응형 영상을 생성하는 전자 장치 및 그 방법에 관한 것이다. 보다 상세하게는, 본 개시는 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치 및 그 방법에 관한 것이다.
최근 영상촬영기술이 매우 발전하고 있다. 캠코더, 디지털카메라뿐만 아니라 스마트폰 등의 이동단말기도 높은 해상도의 영상을 촬영할 수 있다. 또한, 360도 카메라, 3D 영상 카메라 등이 등장하고 있다.
영상은 영상촬영장치에 의해 촬영되어 특정한 포맷으로 저장되고, 재생 가능한 단말기에 의해 재생된다. 영상 재생은 시청자와 상호작용(Interaction)이 없이 일방적으로 시간순서대로 제공된다. 즉, 시청자는 재생되는 영상을 통해 시각적인 감각만을 느낄 수 있다.
본 개시는 영상에 포함된 복수의 프레임 간 비교에 기반하여 적어도 하나의 대상체의 움직임을 식별하고, 적어도 하나의 대상체를 대응하는 입력 조작과 연결하여 반응형 영상을 생성하기 위한 사용자 인터페이스를 제공하는 전자 장치를 제공하고자 한다.
본 개시가 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 기술적 과제를 달성하기 위한 본 개시에 따른 전자 장치는, 영상을 포함하는 메모리, 및 메모리와 전기적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 상기 영상에 포함된 연속되는 복수의 프레임 간 비교에 기반하여 적어도 하나의 객체의 움직임을 식별하고, 상기 움직임의 크기가 임계 값 이상인 상기 적어도 하나의 객체를 적어도 하나의 대상체로 선별하고, 상기 적어도 하나의 대상체 각각에 대응하는 입력 조작을 식별하고, 상기 적어도 하나의 대상체 각각을 상기 식별된 입력 조작에 연결하여, 반응형 영상을 생성할 수 있다.
또한, 상술한 기술적 과제를 달성하기 위한 본 개시에 따른 복수의 프레임 간 비교에 기반하여 반응형 영상을 방법은 영상에 포함된 연속되는 복수의 프레임 간 비교에 기반하여 적어도 하나의 객체의 움직임을 식별하는 단계, 상기 움직임의 크기가 임계 값 이상인 상기 적어도 하나의 객체를 적어도 하나의 대상체로 선별하는 단계, 상기 적어도 하나의 대상체 각각에 대응하는 입력 조작을 식별하는 단계, 및 상기 적어도 하나의 대상체 각각을 상기 식별된 입력 조작에 연결하여, 반응형 영상을 생성하는 단계를 포함할 수 있다.
이 외에도, 본 개시를 구현하기 위한 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.
본 개시의 전술한 과제 해결 수단에 의하면, 영상에 등장하는 적어도 하나의 객체의 움직임을 분석하여 반응형 영상의 생성을 위한 사용자 인터페이스를 제공함으로써, 반응형 영상에 대한 사용자의 접근성을 개선하고 직관적인 사용자 경험을 제공할 수 있다.
본 개시의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 개시에 따른 전자 장치의 구성을 도시한 블록도이다.
도 2는 본 개시에 따른 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치의 동작을 설명하기 위한 흐름도이다.
도 3은 본 개시에 따른, 특징점에 기반한 반응형 영상의 생성 과정을 도시한 것이다.
도 4는 본 개시예에 따른 반응형 영상을 생성하기 위한 사용자 인터페이스를 도시한 것이다.
도 5는 본 개시에 따른 머신 러닝 모델을 이용한 반응형 영상의 생성 과정을 도시한 것이다.
도 2는 본 개시에 따른 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치의 동작을 설명하기 위한 흐름도이다.
도 3은 본 개시에 따른, 특징점에 기반한 반응형 영상의 생성 과정을 도시한 것이다.
도 4는 본 개시예에 따른 반응형 영상을 생성하기 위한 사용자 인터페이스를 도시한 것이다.
도 5는 본 개시에 따른 머신 러닝 모델을 이용한 반응형 영상의 생성 과정을 도시한 것이다.
본 개시 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 개시가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 개시가 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 '부, 모듈, 부재, 블록'이라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시예들에 따라 복수의 '부, 모듈, 부재, 블록'이 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 부재, 블록'이 복수의 구성요소들을 포함하는 것도 가능하다.
또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다. 각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.
첨부된 도면들을 참고하여 본 개시의 작용 원리 및 실시예들을 설명하기에 앞서, 몇몇 용어를 아래와 같이 설명하기로 한다.
콘텐츠(contents 또는 content)는, 시각적으로 제공되는 각종 콘텐츠, 가령 동영상, 정지영상, 홀로그램 등을 포함할 수 있으며, 청각적, 미각적, 후각적 등으로 제공되는 다양한 콘텐츠를 포함할 수 있으나, 실시예가 이에 한정되는 것은 아니다. 또한, 콘텐츠는 가상 현실(VR, virtual reality)에서 제공될 수도 있으나, 실시예가 이에 한정되는 것은 아니다.
콘텐츠에 포함된 오브젝트(대상체)는, 콘텐츠의 일부에 포함되거나 또는 콘텐츠 전체를 포함할 수 있는데, 가령, 콘텐츠가 영상인 경우, 영상의 전체 프레임 또는 일부 프레임 내에 위치하는 다양한 객체(objects)를 포함할 수 있으며, 영상 자체를 의미할 수도 있다.
반응형 콘텐츠는, 콘텐츠에 포함된 오브젝트의 '반응(reation, feedback 등)을 트리거하는 명령'(입력 조작이라 할 수 있는데, 가령, 터치 조작, 사운드 명령, 모션 명령, 등을 포함하여 예약된 명령)이 입력되는 경우, 이에 대응하는 오브젝트와 관련된 다양한 콘텐츠를 포함할 수 있다. 이하에서는 본 개시에 따른 반응형 콘텐츠가 반응형 영상인 것으로 가정하여 설명하며, 본 개시에 따른 반응형 콘텐츠의 종류가 영상인 것으로 한정하진 않는다.
여기서, 반응은 명령(입력 조작)에 따라 오브젝트의 무브먼트, 오브젝트의 형상/모양 변경, 특정 이벤트 발생, 및/또는 콘텐츠 내 변동 발생 등을 포함할 수 있으나, 실시예가 이에 한정되는 것은 아니다.
반응형 영상은 영상을 시청하는 사용자(즉, 시청자)에 의한 명령(가령, 터치 조작)에 상응하는 형태로 영상이 재생되는 영상을 의미한다. 예를 들어, 반응형 영상은, 사용자에 의해 특정한 물체(예를 들어, 베개)를 만지는 형태의 사용자 조작이 터치스크린에 가해지면, 물체를 만지는 움직임이 재생되는 영상을 의미할 수 있다. 또한, 예를 들어, 반응형 영상은, 사용자에 의해 특정한 물체를 누르는 형태의 사용자 조작이 터치스크린에 가해지면, 물체가 눌려지는 움직임과 사용자 조작 이후에 다시 복원되는 움직임이 재생되는 영상을 의미할 수 있다.
콘텐츠에 포함된 오브젝트의 '반응을 트리거하기 위한 명령'(입력 조작)은, 반응형 영상을 제공하는 컴퓨터의 입력 수단을 통해 수신되는 콘텐츠에 대한 사용자 조작을 포함할 수 있다. 예를 들어, 상기 사용자 조작은 마우스 또는 터치스크린과 같은 입력수단을 통해 콘텐츠 내 특정한 지점 또는 영역에 입력될 수 있는 조작(예를 들어, 클릭 조작, 드래그 조작, 특정 시간 이상의 접촉터치 조작, 포스터치 조작(즉, 터치스크린 또는 터치패드에 특정압력을 가하는 터치조작) 등)을 포함할 수 있다. 또한, 예를 들어, 상기 사용자 조작은, 컴퓨터(또는 단말기)가 구비하는 센서(예를 들어, 가속도센서, 자이로센서 등)를 입력 수단으로 하여 획득될 수 있는 단말기 자체의 배치 상태 또는 움직임 등을 포함할 수 있다. 콘텐츠가 VR 콘텐츠인 경우, 반응을 트리거하기 위한 명령은 착용한 단말의 움직임 센싱 또는 조이스틱 같은 단말의 조작에 의해 수행될 수 있으나, 실시예가 이에 한정되는 것은 아니다.
이하에서는, 반응형 영상을 생성하는 방법을 설명하기로 한다. 반응형 영상의 생성은 장치(일 예로, 컴퓨터)의 프로세서에 의해 수행되는 것으로 상정하여 설명하기로 한다.
프로세서(1410)는 하나 이상의 원본 영상에 포함된 오브젝트의 반응을 트리거하기 위한 명령을 결정할 수 있다. 여기서, 원본 영상은 기초 영상이라고 할 수 있으며, 원본 영상은 반응형으로 구현되지 않은 콘텐츠일 수 있다. 가령, 원본 영상은 촬영 콘텐츠일 수 있고, 공간 상의 오브젝트의 위치 별 프레임을 저장한 복수의 프레임 조합을 포함할 수 있다. 원본 영상은 통신을 통해 수집한 콘텐츠일 수 있고, 입체적 콘텐츠일 수 있으며, VR 콘텐츠일 수 있으나, 실시예가 이에 한정되는 것은 아니다.
프로세서(1410)는 원본 영상의 프레임 구간을 지정하는 입력을 수신할 수 있는데, 프레임 구간은 원본 영상의 전체 프레임 중에서 반응형으로 구현될 특정 구간을 포함할 수 있다. 사용자로부터 다양한 방식을 통해 프레임 구간이 설정될 수 있다. 실시예에서, 프로세서(1410)는 사용자로부터 원본 영상의 시작 프레임(즉, 반응형 영상으로 제작될 시간 영역의 최초 프레임)부터 최종 프레임(즉, 반응형 영상으로 제작될 시간 영역의 마지막 프레임)까지 선택받을 수 있다. 또한, 실시예에서, 사용자로부터 시간 구간을 지정받을 수도 있다.
프로세서(1410)는 반응형 영상에 연결되어, 오브젝트의 반응을 트리거하기 위한 명령을 사용자로부터 직접 수신할 수 있다. 예를 들어, 상기 프로세서(1410)는 터치스크린을 구비한 디바이스인 경우, 사용자로부터 특정한 입력조작을 입력받는 과정을 제공하고, 해당 과정에서 터치스크린 상에 움직이는 오브젝트를 따라서 특정한 명령을 수신할 수 있다.
또한, 프로세서(1410)는 반응형 영상에 연결될 명령 유형을 사용자로부터 선택받고, 해당 명령 유형을 대신할 수 있는 조작을 수신할 수 있다. 예를 들어, 터치스크린을 보유한 디바이스에서 반응형 영상을 생성하면서, 터치스크린을 구비하지 않은 장치인 컴퓨터(VR 장치도 포함)를 이용하는 경우, 컴퓨터는 터치스크린에 대한 터치조작을 대신하는 마우스 조작을 수신하여 즉, 반응형 영상을 생성할 수 있다.
오브젝트의 반응을 트리거하기 위한 명령은 프레임 구간 내 포함된 오브젝트의 무브먼트와 일치하거나 오브젝트의 움직임에 상응할 수 있다. 오브젝트의 반응을 트리거하기 위한 명령이 입력되도록 설정되는 위치 또는 영역은 프레임 구간에 포함된 프레임 내 오브젝트의 움직임에 대응하는 영역에 해당할 수 있다.
프로세서(1410)는 오브젝트와 오브젝트의 반응을 트리거하기 위한 명령을 연결하기 위해, 원본 영상의 지정된 프레임 구간 내 각각의 프레임 전체 영역 또는 특정 영역에 가상 레이어를 생성하는 방식을 적용할 수 있다. 가상 레이어는 화면상에 시각적으로는 표현되지 않으면서 사용자의 입력을 수신할 수 있는, 원본 영상을 구성하는 프레임 위에 겹쳐지는 레이어를 의미할 수 있다.
프로세서(1410)는 오브젝트의 반응을 트리거하기 위한 명령이 프레임 상의 특정영역(즉, 프레임 구간 내 오브젝트가 움직이는 경로)을 움직이는 조작(예를 들어, 마우스 조작을 통해 마우스 커서 이동 또는 터치스크린 상의 제1 지점에서 제2 지점으로의 드래그 조작)인 경우, 특정한 개수의 세부셀로 구성된 가상 레이어를 프레임 상에 생성할 수 있다.
또한, 프로세서(1410)는 프레임 구간에 대응하여 복수의 세부셀로 구성된 가상 레이어를 생성할 수 있다. 프로세서(1410)는 프레임 구간 내 포함되는 프레임 개수를 산출하고, 프레임 구간 내 프레임 개수를 세부셀의 개수로 적용할 수 있으며, 각각의 세부셀에 프레임 구간 내 각각의 프레임을 차례대로 매칭할 수 있다.
예를 들어, 프로세서(1410)는, n개의 프레임이 오브젝트의 반응을 트리거하기 위한 명령에 따라 변동적으로 재생(즉, 조작 재생)되도록 콘텐츠를 생성하고자 하는 경우, 특정 영역을 n개의 세부셀로 분할할 수 있다.
그 후, 프로세서(1410)는 분할된 각각의 세부셀에 각각의 프레임을 매칭하여서, 특정한 세부셀이 선택 또는 지정되는 경우에 매칭된 프레임이 제공되도록 할 수 있다. 즉, 특정한 방향으로 물체(가령, 손)가 움직이고 물체의 이동경로를 따라 가상 레이어가 생성되는 경우, 프로세서(1410)는 물체가 움직이기 시작하는 제1 지점의 세부셀부터 순서대로 프레임 구간 내 각각의 프레임에 매칭할 수 있다.
또한, 프로세서(1410)는 가상 레이어를 구성하는 복수의 세부셀을 상이한 크기 또는 간격으로 생성할 수 있다. 원본 영상 내 프레임 구간에서 오브젝트가 움직이는 속도가 변하는 경우, 가상 레이어를 동일한 크기의 세부셀로 분할하면 프레임 상의 오브젝트의 위치와 세부셀의 위치가 맞지 않을 수 있다. 따라서, 프로세서(1410)는 오브젝트의 움직임에 부합하도록 세부셀의 크기 또는 간격을 상이하게 할 수 있다. 즉, 동영상 콘텐츠 재생 시에 동일한 시간 간격으로 속도가 변하면서 움직이는 오브젝트의 프레임을 획득하므로, 빠르게 움직이는 구간에서는 연속되는 프레임 내 오브젝트 위치의 간격이 크고 느린 구간에서는 연속되는 프레임 내 오브젝트 위치의 간격이 좁게 된다. 따라서, 프로세서(1410)는 이러한 프레임 내 오브젝트 간격에 부합하게 복수의 세부셀을 생성하여야 사용자가 입력하는 입력조작(오브젝트의 반응을 트리거하기 위한 명령)의 위치와 프레임 내의 오브젝트 위치가 매칭될 수 있다.
또한, 프로세서(1410)는 가상 레이어의 길이를 결정할 수 있다. 실시예에서, 프로세서(1410)는 프레임 구간 내 각 오브젝트(또는 오브젝트의 특정한 특징점)의 위치를 파악하여, 오브젝트가 움직이는 경로를 인식할 수 있으며, 프로세서(1410)는 해당 경로를 포함하는 길이로 가상 레이어를 형성할 수 있다. 또한, 프로세서(1410)는 가상 레이어 및 세부셀의 형태를 결정할 수 있다.
반응형 영상은 촬영되어 미리 저장된 콘텐츠일 수 있고, 원본 영상에 부가 콘텐츠를 추가 또는 합성한 콘텐츠일 수 있다. 가령, 반응형 영상은 동영상, 정지영상, 홀로그램 등을 포함할 수 있으며, 부가 콘텐츠는 원본 영상을 재생할 때, 함께 재생되어 원본 영상을 반응형 영상으로 만들어 줄 수 있다.
또한, 반응형 영상은 다중 반응형 영상을 포함할 수 있는데, 다중 반응형 영상은, 콘텐츠를 시청하는 사용자(즉, 시청자)의 특정한 입력 조작에 상응하는 형태로 콘텐츠가 변화되거나 재생되는 것을 의미할 수 있다. 예를 들어, 촬영된 원본 영상의 특정한 움직임에 대응되는 사용자의 입력 조작이 연결되어, 사용자의 조작에 따라 해당 영상 내의 물체가 움직이는 것과 같이 재생되는 영상을 의미할 수 있다.
실시예에서, 압축 영상은 기초 영상을 반응형 영상으로 구현하기 위해 최소 움직임 단위로 압축된 영상을 의미한다. 예를 들어, 기초 영상에 동일한 움직임이 반복적으로 포함된 경우, 압축 영상은 반복되는 움직임을 삭제하고 하나만 남긴 것이다. 또한, 예를 들어, 기초 영상에 제1 위치에서 제2 위치로의 움직임과 제2 위치에서 제1 위치로의 움직임을 모두 포함하는 경우, 압축 영상은 제1 위치에서 제2 위치로 움직이는 기초 영상만으로 남기고, 제2 위치에서 제1 위치로의 움직임은 남겨진 기초 영상을 역방향으로 재생할 수 있다.
또한, 다중 반응형 영상 생성 파일은, 복수의 기초 영상이 압축되어 생성된 것으로 사용자의 조작에 따라 여러 동작을 재생할 수 있는 콘텐츠 파일이거나, 하나 이상의 기초 영상과 함께 재생됨에 따라 다중 반응형 영상으로 구현할 수 있는 메타데이터를 의미한다. 실시예에서, 프로세서(1410)는 중복을 허락하더라도 압축 영상을 생성하지 않고, 반응형 영상을 생성할 수 있다.
실시예에서, 프로세서(1410)는 압축 영상을 사용하지 않고, 반복되는 움직임도 삭제하지 않고 모두 그대로 사용하여, 기초 영상(기초 영상이 반응형 영상일 수도 있음)에서 반응형 영상을 생성하거나 출력할 수 있다.
이하에서는, 본 개시에 따른 다중 반응형 영상의 생성 방법을 설명하기로 하며, 콘텐츠가 영상인 경우를 가정한다.
프로세서(1410)는 기초 영상을 획득할 수 있다. 기초 영상은 사용자의 조작에 따른 반응형으로 구현하고자 하는 오브젝트의 움직임을 포함하는 원본 영상일 수 있다. 반응형 영상 제작자(예를 들어, 컨텐츠 공급자 또는 개인 사용자)는 반응형으로 구현하고자 하는 동작이 포함된 영상을 촬영할 수 있다.
실시예에서, 프로세서(1410)는 사용자로부터 동일한 오브젝트의 여러 움직임에 대한 영상을 획득한 후 다중 반응형 영상의 형태로 생성할 수 있다. 예를 들어, 제어모듈(1500)(190)는 오브젝트가 사용자의 손인 경우, 사용자의 검지손가락을 펼친 상태에서 여러 방향으로 움직이거나 구부리는 복수의 영상을 획득할 수 있다.
또한, 특정한 조작에 따른 반응으로 본인의 머리를 상하좌우로 회전하거나 얼굴 표정 변화가 제공되는 반응형 영상을 제작하고자 하는 경우, 사용자는 원하는 고개 움직임과 표정들이 모두 포함된 영상을 촬영할 수 있다.
또한, 사용자에 의해 입력되는 조작에 따라 물풍선이 터지거나 바닥에서 튀어져 올라오는 반응형 영상을 생성하고자 하는 경우, 사용자는 동일한 색상 및 크기의 물풍선을 떨어뜨려서 터지는 제1 영상과 물풍선이 터지지 않고 튀어오르는 제2 영상을 순차적으로 촬영할 수 있다.
또한, 특정한 움직임을 수행한 후 기존 움직임의 반복이 아닌 상이한 사건이 발생하는 하나의 기초 영상을 획득할 수 있다. 즉, 프로세서(1410)는 오브젝트에 대해 복수의 사건이 발생하는 영상을 기초 영상으로 획득할 수 있다.
프로세서(1410)는 기초 영상을 기반으로 압축 영상을 생성할 수 있다. 압축 영상은 반응형으로 사용자의 조작에 따른 구현하고자 하는 오브젝트의 움직임만을 포함하는 것일 수 있다. 실시예에서, 압축 영상 대신 중복을 허용하는 영상도 적용될 수도 있다.
프로세서(1410)는 압축 영상에 대한 다중 반응형 영상 생성조건을 수신할 수 있다. 상기 다중 반응형 영상 생성조건은 상기 압축 영상에서 생성 가능한 반응에 대응하는 복수의 조작입력일 수 있다.
프로세서(1410)는 압축 영상의 스택 구조를 생성할 수 있는데, 각 추출영역(가령, 제1추출영역 및 제2추출영역)은 상이한 사건에 대한 복수의 스텍을 포함할 수 있다. 예를 들어, 실선으로 표현되는 제1 스텍과 점선으로 표현되는 제2 스텍을 각 추출영역에 포함할 수 있다. 프로세서(1410)는 사용자로부터 각 추출영역에 최초 조작이 입력되는 위치를 기반으로 제1스텍과 제2스텍 중에서 실행되는 스텍을 결정하는 것으로 구현될 수 있다.
또한, 각 추출영역 내 제1 사건과 제2사건은 중첩되는 픽셀을 포함할 수 있고, 프로세서(1410)는 제1사건에 대한 스텍과 제2사건에 대한 스텍 중에서 중첩되는 픽셀 중 하나만 남길 수 있다. 압축 영상이 특정 추출영역 내의 중첩 픽셀에 대한 데이터를 하나만 포함하더라도, 사용자의 다음 조작(예를 들어, 터치조작의 움직임 방향 또는 가해지는 압력세기의 변화)에 따라 제1사건과 제2사건 중 하나의 스텍이 결정될 수 있다. 이를 통해, 컴퓨터는 최소한의 데이터만으로 압축 영상을 생성할 수 있다.
이하에서, 본 개시의 일 실시 예에 따른 반응형 영상을 생성하기 위한 사용자 인터페이스(User Interface)에 대하여 설명한다. 반응형 영상은 상술된 다중형 반응형 영상 및 다차원 반응형 영상을 포함할 수 있다.
도 1은 본 개시에 따른 전자 장치의 구성을 도시한 블록도이다. 전자 장치는 본 명세서의 컴퓨터의 일 예시로 이해될 수 있다.
일 실시 예에서, 전자 장치(1400)는 프로세서(1410), 메모리(1420), 사용자 입력부(1430), 및/또는 디스플레이부(1440)를 포함할 수 있다. 도 14에 도시된 구성요소들은 본 개시에 따른 전자 장치(1400)를 구현하는데 있어서 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 전자 장치(1400)는 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.
일 실시 예에서, 프로세서(1410)는 본 장치 내의 구성요소들의 동작을 제어하기 위한 알고리즘 또는 알고리즘을 재현한 프로그램에 대한 데이터를 저장하는 메모리, 및 메모리에 저장된 데이터를 이용하여 전술한 동작을 수행하는 적어도 하나의 프로세서로 구현될 수 있다. 이때, 메모리와 프로세서는 각각 별개의 칩으로 구현될 수 있다. 또는, 메모리와 프로세서는 단일 칩으로 구현될 수도 있다.
또한, 프로세서(1410)는 이하에서 설명되는 본 개시에 따른 다양한 실시 예들을 본 장치 상에서 구현하기 위하여, 위에서 살펴본 구성요소들을 중 어느 하나 또는 복수를 조합하여 제어할 수 있다.
일 실시 예에서, 메모리(1420)는 본 장치의 다양한 기능을 지원하는 데이터와, 프로세서(1410)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 음악 파일, 정지영상, 동영상 등)을 저장할 있고, 본 장치에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 본 장치의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다.
이러한, 메모리(1420)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), SSD 타입(Solid State Disk type), SDD 타입(Silicon Disk Drive type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(random access memory; RAM), SRAM(static random access memory), 롬(read-only memory; ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크 및 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 또한, 메모리(1420)는 본 장치와는 분리되어 있으나, 유선 또는 무선으로 연결된 데이터베이스가 될 수도 있다.
일 실시 예에서, 메모리(1420)는 반응형 영상의 생성을 위한 영상을 포함할 수 있다. 예를 들어, 영상은 연속되는 복수의 프레임으로 구성될 수 있다.
일 실시 예에서, 메모리(1420)는 머신 러닝 모델(1425)을 포함할 수 있다. 머신 러닝 모델(1425)은 심층 신경망 네트워크(Deep Neural Network)에 기반한 딥러닝(Deep Learning) 방식을 이용할 수 있다. 예를 들어, 머신 러닝 모델(1425)은 컨볼루션 뉴럴 네트워크(Convolution Neural Network, CNN) 방식에 기반할 수 있다.
일 실시 예에서, 사용자 입력부(1430)는 사용자로부터 정보를 입력받기 위한 것으로서, 사용자 입력부를 통해 정보가 입력되면, 프로세서(1410)는 입력된 정보에 대응되도록 본 장치의 동작을 제어할 수 있다. 이러한, 사용자 입력부(1430)는 하드웨어식 물리 키(예를 들어, 본 장치의 전면, 후면 및 측면 중 적어도 하나에 위치하는 버튼, 돔 스위치 (dome switch), 조그 휠, 조그 스위치 등) 및 소프트웨어식 터치 키를 포함할 수 있다. 일 예로서, 터치 키는, 소프트웨어적인 처리를 통해 터치스크린 타입의 디스플레이부 상에 표시되는 가상 키(virtual key), 소프트 키(soft key) 또는 비주얼 키(visual key)로 이루어지거나, 상기 터치스크린 이외의 부분에 배치되는 터치 키(touch key)로 이루어질 수 있다. 한편, 상기 가상키 또는 비주얼 키는, 다양한 형태를 가지면서 터치스크린 상에 표시되는 것이 가능하며, 예를 들어, 그래픽(graphic), 텍스트(text), 아이콘(icon), 비디오(video) 또는 이들의 조합으로 이루어질 수 있다.
일 실시 예에서, 디스플레이부(1440)는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써, 터치 스크린을 구현할 수 있다. 이러한 터치 스크린은, 본 장치와 사용자 사이의 입력 인터페이스를 제공하는 사용자 입력부로써 기능함과 동시에, 본 장치와 사용자 간에 출력 인터페이스를 제공할 수 있다. 즉, 사용자 입력부(1430) 및 디스플레이부(1440)는 서로 통합되어 터치스크린으로 구현될 수 있다.
디스플레이부(1440)는 본 장치에서 처리되는 정보를 표시(출력)한다. 예를 들어, 디스플레이부 디스플레이부(1440)는 본 장치에서 구동되는 응용 프로그램(일 예로, 어플리케이션)의 실행화면 정보, 또는 이러한 실행화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다.
일 실시 예에서, 디스플레이부(1440)는 입력수단으로 이용될 수 있다. 예를 들어, 사용자는 디스플레이부(1440)를 통해 영상 내 특정한 지점 또는 영역에 입력될 수 있는 조작(예를 들어, 클릭 조작, 드래그 조작, 특정 시간 이상의 접촉터치 조작, 포스터치 조작(즉, 터치스크린 또는 터치패드에 특정압력을 가하는 터치조작) 등)와 같은 입력조작을 수행할 수 있다.
일 실시 예에서, 프로세서(1410)는 메모리(1420)에 저장된 영상에 기반하여 반응형 영상을 생성할 수 있다. 프로세서(1410)는 영상에 포함된 복수의 프레임 간 비교에 기반하여 적어도 하나의 대상체의 움직임을 식별할 수 있다. 적어도 하나의 대상체의 움직임을 식별하는 방법에 대하여 후술한다.
일 실시 예에서, 프로세서(1410)는 식별된 적어도 하나의 대상체의 움직임을 대응하는 입력조작과 연결하여 반응형 영상을 생성할 수 있다. 구체적으로, 프로세서(1410)는 적어도 하나의 대상체의 움직임 각각을 입력조작과 연결하여 적어도 하나의 재생 유형을 생성할 수 있다. 적어도 하나의 재생 유형은 반응형 영상(예: 다중 반응형 영상)을 구성할 수 있다. 예를 들어, 전자 장치(1400)가 사용자로부터 반응형 영상의 일 화면에 포함된 대상체에 대한 입력 조작을 수신하면, 프로세서(1410)는 입력 조작에 대응하는 재생 유형을 재생할 수 있다. 이 경우, 입력 조작은 식별된 대상체의 움직임에 연결된 입력 조작인 것으로 이해될 수 있다.
일 실시 예에서, 프로세서(1410)는 반응형 영상을 생성하기 위한 사용자 인터페이스를 제공할 수 있다. 예를 들어, 프로세서(1410)는 디스플레이부(1440)를 통해, 사용자 인터페이스를 표시할 수 있다. 사용자 인터페이스는 영상으로부터 생성된 적어도 하나의 재생 유형을 포함할 수 있다. 프로세서(1410)는 사용자가 선택한 재생 유형에 기반하여 반응형 영상을 생성할 수 있다.
도 1에 도시된 구성 요소들의 성능에 대응하여 적어도 하나의 구성요소가 추가되거나 삭제될 수 있다. 또한, 구성 요소들의 상호 위치는 시스템의 성능 또는 구조에 대응하여 변경될 수 있다는 것은 당해 기술 분야에서 통상의 지식을 가진 자에게 용이하게 이해될 것이다.
한편, 도 1에서 도시된 각각의 구성요소는 소프트웨어 및/또는 Field Programmable Gate Array(FPGA) 및 주문형 반도체(ASIC, Application Specific Integrated Circuit)와 같은 하드웨어 구성요소를 의미한다.
도 2는 본 개시의 일 실시예에 따른 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치의 동작을 설명하기 위한 흐름도이다. 도 2에서, 전자 장치(1400)의 동작은 실질적으로 프로세서(1410)에 의해 수행되는 것으로 이해될 수 있다.
동작 1510에서, 전자 장치(1400)의 프로세서(1410)는 영상에 포함된 연속되는 복수의 프레임 간 비교에 기반하여 적어도 하나의 객체의 움직임을 식별할 수 있다.
일 실시 예에서, 프로세서(1410)는 영상의 제1 프레임에 포함된 적어도 하나의 객체를 식별할 수 있다. 프로세서(1410)는 적어도 하나의 객체를 식별하기 위하여 제1 프레임의 특징점을 추출하거나 머신 러닝 모델(1425)을 이용할 수 있다. 제1 프레임의 특징점은 적어도 하나의 객체에 대한 것으로 이해될 수 있다.
일 실시 예에서, 프로세서(1410)는 제1 프레임을 제1 프레임에 연속되는 제2 프레임과 비교하여 적어도 하나의 객체의 움직임을 식별할 수 있다. 이와 같이, 프로세서(1410)는 영상에 포함된 복수의 프레임 전부에 대하여 연속되는 프레임 간 비교를 통해 적어도 하나의 객체의 움직임을 식별할 수 있다. 프로세서(1410)는 적어도 하나의 객체의 움직임을 식별하기 위하여 각각의 프레임으로부터 추출된 특징점을 이용하거나, 머신 러닝 모델(1425)을 이용할 수 있다. 동작 1510에서 프로세서(1410)의 구체적인 동작은 후술한다.
동작 1520에서, 프로세서(1410)는 움직임의 크기가 임계 값 이상인 적어도 하나의 객체를 적어도 하나의 대상체로 선별할 수 있다. 일 실시 예에서, 프로세서(1410)는 객체가 화면 상에서 이동한 거리의 총합을 움직임의 크기로 계산할 수 있다. 예를 들어, 프로세서(1410)는 이하의 수학식 1에 기반하여 움직임의 크기를 계산할 수 있다.
일 실시 예에서, 프로세서(1410)는 각각의 객체에 대한 움직임의 크기를 임계 값과 비교할 수 있다. 프로세서(1410)는 움직임의 크기가 임계 값 미만인 객체를 무시할 수 있다. 프로세서(1410)는 움직임의 크기가 임계 값 이상인 객체를 대상체로 선별할 수 있다.
동작 1530에서, 프로세서(1410)는 적어도 하나의 대상체 각각에 대응하는 입력 조작을 식별할 수 있다. 일 실시 예에서, 프로세서(1410)는 적어도 하나의 대상체 각각의 움직임의 유형을 판단하고 움직임의 유형에 대응하는 입력 조작을 식별할 수 있다. 예를 들어, 대상체가 아래에서 위로 이동하는 경우, 프로세서(1410)는 대상체의 움직임을 아래에서 위 방향의 스와이핑 입력에 대응시킬 수 있다. 예를 들어, 대상체가 원거리에서 근거리로 이동하여 영상 내에서 크기가 커지는 경우, 프로세서(1410)는 대상체의 움직임을 핀치 아웃(pinch out) 입력에 대응시킬 수 있다.
동작 1540에서, 프로세서(1410)는 적어도 하나의 대상체 각각을 식별된 입력 조작에 연결하여, 반응형 영상을 생성할 수 있다. 보다 구체적으로, 프로세서(1410)는 적어도 하나의 대상체 및 적어도 하나의 대상체의 움직임와 연결된 입력 조작으로 구성된 재생 유형을 생성할 수 있다. 프로세서(1410)는 생성된 재생 유형에 기반하여 반응형 영상을 생성할 수 있다. 일 실시 예에서, 프로세서(1410)는 반응형 영상을 생성하기 위한 사용자 인터페이스를 통해 적어도 하나의 재생 유형을 제공하고, 사용자가 선택한 재생 유형에 기반하여 반응형 영상을 생성할 수 있다.
일 실시 예에서, 프로세서(1410)는 생성된 반응형 영상을 디스플레이부(1440)를 통해 표시할 수 있다. 프로세서(1410)는 반응형 영상의 대상체에 대한 입력조작을 수신하여 지정된 재생 유형을 재생할 수 있다. 예를 들어, 대상체에 대한 핀치 아웃 입력을 수신하는 경우, 프로세서(1410)는 대상체의 크기가 커지는 재생 유형을 재생할 수 있다.
도 3은 본 개시의 일 실시 예에 따른, 특징점에 기반한 반응형 영상의 생성 과정을 도시한 것이다.
일 실시 예에서, 영상(1600)은 복수의 프레임을 포함할 수 있다. 영상(1600)에는 적어도 하나의 객체(1602, 1604, 1606)가 등장할 수 있다.
참조 번호 1610은 복수의 프레임 중 일부 프레임(1612, 1614)에 대한 비교 동작을 나타낸 것이다. 제N+1 프레임(1614)은 제N 프레임(1612)에 연속되는 프레임으로 이해될 수 있다. 참조 번호 1610에는 2개의 프레임이 도시되었으나, 참조 번호 1610에서의 프로세서(1410)의 동작은 복수의 프레임에 포함된 모든 프레임에 대하여 수행되는 것으로 이해될 수 있다.
일 실시 예에서, 프로세서(1410)는 제1 프레임(1612)과 제2 프레임(1614)의 특징점을 추출할 수 있다. 특징점은 적어도 하나의 객체(1602, 1604, 1606)에 대한 것으로 이해될 수 있다. 프로세서(1410)는 제1 프레임(1612)과 제2 프레임(1614)의 특징점 차이에 기반하여 적어도 하나의 객체(1602, 1604, 1606)의 움직임을 식별할 수 있다. 예를 들어, 프로세서(1410)는 객체(1602)에 대한 특징점의 위치 변화에 기반하여, 객체(1602)가 좌측 상단으로 이동하였음을 식별할 수 있다. 예를 들어, 프로세서(1410)는 객체(1604)에 대한 특징점의 위치 변화에 기반하여, 객체(1604)가 좌측 하단으로 이동하였음을 식별할 수 있다. 예를 들어, 프로세서(1410)는 객체(1606)에 대한 특징점의 위치 변화에 기반하여, 객체(1606)가 좌측 하단으로 이동하였음을 식별할 수 있다.
일 실시 예에서, 프로세서(1410)는 동작 1620에서, 참조 번호 1610에서 식별된 적어도 하나의 객체(1602, 1604, 1606)의 움직임의 크기를 수집할 수 있다. 예를 들어, 움직임의 크기는 적어도 하나의 객체(1602, 1604, 1606)가 화면 상에서 이동한 거리의 총합으로 계산될 수 있다.
일 실시 예에서, 프로세서(1410)는 동작 1630에서, 적어도 하나의 객체(1602, 1604, 1606)의 움직임을 임계 값과 비교할 수 있다. 프로세서(1410)는 움직임이 임계 값보다 객체를 대상체로 식별할 수 있다. 예를 들어, 객체(1602, 1606)의 움직임은 임계 값보다 크고, 객체(1604)의 움직임은 임계 값보다 낮을 수 있다. 프로세서(1410)는 객체(1602, 1606)를 적어도 하나의 대상체로 선별할 수 있다.
일 실시 예에서, 프로세서(1410)는 적어도 하나의 대상체의 움직임의 유형에 대응하는 입력 조작을 식별할 수 있다. 프로세서(1410)는 적어도 하나의 대상체의 움직임 각각을 입력 조작에 연결하여 적어도 하나의 재생 유형(1602, 1604)을 생성할 수 있다. 예를 들어, 재생 유형(1640)은 객체(1602)의 움직임에 대응할 수 있다. 재생 유형(1640)에서의 입력조작은 오른쪽에서 왼쪽으로의 스와이핑 동작일 수 있다. 예를 들어, 재생 유형(1645)은 객체(1606)의 움직임에 대응할 수 있다. 재생 유형(1645)에서의 입력조작은 좌측 하단으로의 스와이핑 동작일 수 있다.
일 실시 예에서, 프로세서(1410)는 반응형 영상을 생성하기 위한 사용자 인터페이스를 제공할 수 있다(동작 1650). 프로세서(1410)는 사용자 인터페이스를 통해 재생 유형(1640, 1645)을 제공하고, 재생 유형(1640, 1645)에 대한 사용자의 선택에 기반하여 반응형 영상(1660)을 생성할 수 있다. 사용자 인터페이스에 대한 설명은 도 4에 대한 설명에 의해 참조될 수 있다.
도 4는 본 개시의 일 실시예에 따른 반응형 영상을 생성하기 위한 사용자 인터페이스를 도시한 것이다.
프로세서(1410)는 디스플레이부(1440)를 통해, 반응형 영상 생성을 위한 사용자 인터페이스 화면(1700)을 제공할 수 있다. 프로세서(1410)는 사용자 입력에 응답하여 화면(1710)과 같이, 메모리(1420)에 저장된 영상에 대한 자동 인식을 수행할 수 있다. 자동 인식은 도 2에서와 같이, 반응형 영상을 생성하기 위한 일련의 동작으로 이해될 수 있다.
프로세서(1410)는 화면(1720)에서와 같이, 영상을 통해 식별된 적어도 하나의 재생 유형을 표시할 수 있다. 예를 들어, 화면(1720)은 적어도 하나의 대상체(예: 유리병 입구)의 움직임을 아래에서 위로 스와이핑하는 입력조작에 연결한 재생 유형을 지시할 수 있다. 프로세서(1410)는 화면(1720)에서 사용자의 입력을 수신하여 반응형 영상을 생성할 재생 유형을 식별할 수 있다. 프로세서(1410)는 화면(1730)에서와 같이, 사용자가 선택한 재생 유형을 표시하고, 이에 기반하여 반응형 영상을 생성할 수 있다.
도 5는 본 개시의 일 실시예에 따른 머신 러닝 모델을 이용한 반응형 영상의 생성 과정을 도시한 것이다.
일 실시 예에서, 반응형 영상을 생성하기 위한 영상은 복수의 프레임(1800, 1802, 1804, 1806, 1808, 1810, 1812)을 포함할 수 있다. 프로세서(1410)는 재생 유형을 생성하기 위하여 머신 러닝 모델(1425)을 이용할 수 있다. 머신 러닝 모델(1425)은 대상체의 움직임을 포함하는 영상 데이터 베이스를 이용하여 학습될 수 있다. 예를 들어, 머신 러닝 모델(1425)은 영상에 포함되는 적어도 하나의 대상체의 움직임을 식별하기 위한 딥 러닝 모델일 수 있다.
일 실시 예에서, 프로세서(1410)는 머신 러닝 모델(1425)을 이용하여 제1 프레임(1800)에서의 적어도 하나의 객체(1602, 1604, 1606)의 위치를 식별할 수 있다. 머신 러닝 모델(1425)은 연속되는 복수의 프레임에서 적어도 하나의 객체(1602, 1604, 1606)의 움직임을 식별할 수 있다. 머신 러닝 모델(1425)은 식별된 적어도 하나의 객체(1602, 1604, 1606)의 움직임 중 움직임의 크기가 임계 값보다 높은 객체를 대상체로 식별할 수 있다.
일 실시 예에서, 머신 러닝 모델(1425)은 제3 프레임(1804) 내지 제6 프레임(1810)에서의 객체(1602)의 움직임을 감지하고, 객체(1602)를 대상체로 식별할 수 있다. 프로세서(1410)는 객체(1602)의 움직임을 좌측 상단으로의 스와이핑 입력과 연결하여 제1 재생 유형(1820)을 생성할 수 있다.
일 실시 예에서, 머신 러닝 모델(1425)은 제4 프레임(1806) 내지 제5 프레임(1808)에서의 객체(1606)의 움직임을 감지하고, 객체(1606)를 대상체로 식별할 수 있다. 프로세서(1410)는 객체(1606)의 움직임을 좌측 하단으로의 스와이핑 입력과 연결하여 제2 재생 유형(1830)을 생성할 수 있다.
일 실시 예에서, 프로세서(1410)는 사용자 인터페이스를 통해 제1 재생 유형(1820) 및 제2 재생 유형(1830)을 제공할 수 있다. 프로세서(1410)는 사용자 선택에 기반하여 제1 재생 유형(1820) 또는 제2 재생 유형(1830) 중 적어도 하나를 포함하는 반응형 영상을 생성할 수 있다.
한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.
컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다.
이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자는 본 개시의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 본 개시가 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.
Claims (10)
- 전자 장치에 있어서,
영상을 포함하는 메모리; 및
상기 메모리와 전기적으로 연결된 프로세서;를 포함하고,
상기 프로세서는,
상기 영상에 포함된 연속되는 복수의 프레임 간 비교에 기반하여 적어도 하나의 객체의 움직임을 식별하고,
상기 움직임의 크기가 임계 값 이상인 상기 적어도 하나의 객체를 적어도 하나의 대상체로 선별하고,
상기 적어도 하나의 대상체 각각에 대응하는 입력 조작을 식별하고,
상기 적어도 하나의 대상체 각각을 상기 식별된 입력 조작에 연결하여, 반응형 영상을 생성하는, 전자 장치. - 제1 항에 있어서,
상기 반응형 영상은, 다중 반응형 영상인, 전자 장치. - 제2 항에 있어서,
상기 프로세서는,
상기 적어도 하나의 대상체 및 상기 적어도 하나의 대상체 각각에 연결된 입력 조작에 기반하여 적어도 하나의 재생 유형을 생성하고,
상기 적어도 하나의 재생 유형을 사용자 인터페이스를 통해 제공하는, 전자 장치. - 제3 항에 있어서,
상기 프로세서는,
상기 사용자 인터페이스를 통해 사용자 입력을 수신하고,
상기 사용자 입력에 의해 선택된 재생 유형에 기반하여 상기 반응형 영상을 생성하는, 전자 장치. - 제4 항에 있어서,
상기 프로세서는,
상기 복수의 프레임의 특징점을 추출하고,
상기 특징점의 위치 변화에 기반하여, 상기 적어도 하나의 객체의 움직임을 식별하는, 전자 장치. - 제4 항에 있어서,
상기 메모리는, 머신 러닝 모델을 포함하고,
상기 프로세서는,
상기 머신 러닝 모델을 이용하여 상기 복수의 프레임에서 상기 적어도 하나의 객체를 식별하고, 상기 복수의 프레임 간 상기 적어도 하나의 객체의 움직임을 감지하는, 전자 장치. - 제6 항에 있어서,
상기 프로세서는,
상기 머신 러닝 모델을 이용하여 상기 복수의 프레임 중 상기 적어도 하나의 객체의 움직임이 감지된 적어도 하나의 프레임을 상기 재생 유형으로 추출하는, 전자 장치. - 제7 항에 있어서,
디스플레이를 더 포함하고,
상기 프로세서는,
상기 적어도 하나의 객체가 상기 디스플레이 상에서 이동한 거리의 총합을 상기 움직임의 크기로 계산하는, 전자 장치. - 전자 장치에 의해 수행되는 방법에 있어서,
영상에 포함된 연속되는 복수의 프레임 간 비교에 기반하여 적어도 하나의 객체의 움직임을 식별하는 단계;
상기 움직임의 크기가 임계 값 이상인 상기 적어도 하나의 객체를 적어도 하나의 대상체로 선별하는 단계;
상기 적어도 하나의 대상체 각각에 대응하는 입력 조작을 식별하는 단계; 및
상기 적어도 하나의 대상체 각각을 상기 식별된 입력 조작에 연결하여, 반응형 영상을 생성하는 단계를 포함하는, 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 방법. - 컴퓨터와 결합되어, 제9항의 방법을 실행시키기 위한 프로그램이 저장된 컴퓨터 판독 가능한 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2023/015417 WO2024076202A1 (ko) | 2022-10-07 | 2023-10-06 | 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치 및 그 방법 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20220128759 | 2022-10-07 | ||
KR1020220128759 | 2022-10-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240049179A true KR20240049179A (ko) | 2024-04-16 |
Family
ID=90882461
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230132326A KR20240049178A (ko) | 2022-10-07 | 2023-10-05 | 반응형 영상에 대한 입력조작의 의도 및 감정에 기반하여 반응형 영상을 재생하는 전자 장치 및 그 방법 |
KR1020230132329A KR20240049181A (ko) | 2022-10-07 | 2023-10-05 | 백그라운드 이미지를 이용하여 플리커 현상을 제거한 반응형 영상 제공 장치 및 방법 |
KR1020230132328A KR20240049180A (ko) | 2022-10-07 | 2023-10-05 | 사용자 제스처 기반 반응형 영상 생성 장치 및 방법 |
KR1020230132325A KR20240049177A (ko) | 2022-10-07 | 2023-10-05 | 반응형 영상을 생성하기 위한 사용자 인터페이스를 제공하는 전자 장치 및 그 방법 |
KR1020230132327A KR20240049179A (ko) | 2022-10-07 | 2023-10-05 | 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치 및 그 방법 |
KR1020230132330A KR20240049182A (ko) | 2022-10-07 | 2023-10-05 | 조작패턴 기반 반응형 영상 재생 장치 및 방법 |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230132326A KR20240049178A (ko) | 2022-10-07 | 2023-10-05 | 반응형 영상에 대한 입력조작의 의도 및 감정에 기반하여 반응형 영상을 재생하는 전자 장치 및 그 방법 |
KR1020230132329A KR20240049181A (ko) | 2022-10-07 | 2023-10-05 | 백그라운드 이미지를 이용하여 플리커 현상을 제거한 반응형 영상 제공 장치 및 방법 |
KR1020230132328A KR20240049180A (ko) | 2022-10-07 | 2023-10-05 | 사용자 제스처 기반 반응형 영상 생성 장치 및 방법 |
KR1020230132325A KR20240049177A (ko) | 2022-10-07 | 2023-10-05 | 반응형 영상을 생성하기 위한 사용자 인터페이스를 제공하는 전자 장치 및 그 방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230132330A KR20240049182A (ko) | 2022-10-07 | 2023-10-05 | 조작패턴 기반 반응형 영상 재생 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (6) | KR20240049178A (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170020269A (ko) | 2015-08-13 | 2017-02-22 | 이철우 | 반응형 영상 생성방법 및 생성프로그램 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100594973B1 (ko) | 2004-12-09 | 2006-06-30 | 삼성전자주식회사 | 플리커 현상 방지를 위한 영상기록재생장치 및영상기록재생방법 |
US10304276B2 (en) | 2012-06-07 | 2019-05-28 | Universal City Studios Llc | Queue management system and method |
KR101608145B1 (ko) | 2014-08-11 | 2016-04-01 | 서장원 | 터치입력에 반응하는 3d 인터랙티브 무비 뷰어를 이용한 동영상 재생 방법 |
-
2023
- 2023-10-05 KR KR1020230132326A patent/KR20240049178A/ko unknown
- 2023-10-05 KR KR1020230132329A patent/KR20240049181A/ko unknown
- 2023-10-05 KR KR1020230132328A patent/KR20240049180A/ko unknown
- 2023-10-05 KR KR1020230132325A patent/KR20240049177A/ko unknown
- 2023-10-05 KR KR1020230132327A patent/KR20240049179A/ko not_active Application Discontinuation
- 2023-10-05 KR KR1020230132330A patent/KR20240049182A/ko unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170020269A (ko) | 2015-08-13 | 2017-02-22 | 이철우 | 반응형 영상 생성방법 및 생성프로그램 |
Also Published As
Publication number | Publication date |
---|---|
KR20240049178A (ko) | 2024-04-16 |
KR20240049177A (ko) | 2024-04-16 |
KR20240049180A (ko) | 2024-04-16 |
KR20240049182A (ko) | 2024-04-16 |
KR20240049181A (ko) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102225802B1 (ko) | 반응형 영상 생성방법 및 생성프로그램 | |
JP6516477B2 (ja) | ユーザ生成コンテンツをオーサリングするためのシステム及び方法 | |
KR102363554B1 (ko) | 다중 반응형영상 제작방법, 다중 반응형영상 메타데이터 생성방법, 인간 행동을 이해하기 위한 상호 작용 데이터 분석 방법 및 이를 이용한 프로그램 | |
WO2022267760A1 (zh) | 按键功能执行方法、装置、设备及存储介质 | |
KR102701874B1 (ko) | 다차원 반응형 영상 생성장치, 방법 및 프로그램, 및 다차원 반응형 영상 재생방법 및 프로그램 | |
KR101608145B1 (ko) | 터치입력에 반응하는 3d 인터랙티브 무비 뷰어를 이용한 동영상 재생 방법 | |
US11995304B2 (en) | Method and program for producing multi reactive video, and generate meta data to make multi reactive video, and analyze into interaction data to understand human act | |
KR20240049179A (ko) | 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치 및 그 방법 | |
WO2024076202A1 (ko) | 복수의 프레임 간 비교에 기반하여 반응형 영상을 생성하는 전자 장치 및 그 방법 | |
KR101944454B1 (ko) | 정보처리프로그램 및 정보처리방법 | |
WO2024076200A1 (ko) | 반응형 영상을 생성하기 위한 사용자 인터페이스를 제공하는 전자 장치 및 그 방법 | |
WO2024076201A1 (ko) | 반응형 영상에 대한 입력조작의 의도 및 감정에 기반하여 반응형 영상을 재생하는 전자 장치 및 그 방법 | |
JP4429349B2 (ja) | 記録装置と記録装置のためのプログラム | |
KR102456134B1 (ko) | 발표자 참여형 3d 콘텐츠 생성 방법, 장치 및 시스템 | |
WO2024076206A1 (ko) | 조작패턴 기반 반응형 영상 재생 장치 및 방법 | |
KR101595663B1 (ko) | 터치입력에 반응하는 3d 인터랙티브 무비 뷰어를 이용하여 동영상을 재생하면서 애니메이션을 추가하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |