KR102655049B1 - 비디오 처리 방법, 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체 - Google Patents

비디오 처리 방법, 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체 Download PDF

Info

Publication number
KR102655049B1
KR102655049B1 KR1020237019199A KR20237019199A KR102655049B1 KR 102655049 B1 KR102655049 B1 KR 102655049B1 KR 1020237019199 A KR1020237019199 A KR 1020237019199A KR 20237019199 A KR20237019199 A KR 20237019199A KR 102655049 B1 KR102655049 B1 KR 102655049B1
Authority
KR
South Korea
Prior art keywords
image
style
image area
area
target
Prior art date
Application number
KR1020237019199A
Other languages
English (en)
Other versions
KR20230093337A (ko
Inventor
슈연 양
Original Assignee
베이징 지티아오 네트워크 테크놀로지 컴퍼니, 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 지티아오 네트워크 테크놀로지 컴퍼니, 리미티드 filed Critical 베이징 지티아오 네트워크 테크놀로지 컴퍼니, 리미티드
Publication of KR20230093337A publication Critical patent/KR20230093337A/ko
Application granted granted Critical
Publication of KR102655049B1 publication Critical patent/KR102655049B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/802D [Two Dimensional] animation, e.g. using sprites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/012Head tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • G06V40/175Static expression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Processing Or Creating Images (AREA)
  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Studio Circuits (AREA)
  • Traffic Control Systems (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

비디오 처리 방법, 비디오 처리 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체에 관한 것이다. 비디오 처리 방법은: 초기 이미지를 디스플레이하는 단계(S10) - 상기 초기 이미지는 제1 스타일 이미지를 포함함 -; 제1 트리거 이벤트에 응답하여, 이미지 전환 애니메이션을 디스플레이하는 단계, 이미지 전환 애니메이션은 초기 이미지에서 타겟 이미지로 전환하는 동적 프로세스를 제시하기 위해 사용되고, 타겟 이미지는 제2 스타일 이미지(S20)를 포함하고, 및 이미지 전환 애니메이션 디스플레이의 완료에 응답하여, 타겟 이미지를 디스플레이하는 단계(S30)를 포함하고, 이미지 전환 애니메이션의 전환 이미지는 제1 이미지 영역, 제2 이미지 영역 및 제3 이미지 영역을 포함하고, 및 제1 이미지 영역은 동적 프로세스 동안 위치 이동 및 시분할 방식으로 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 위치 이동 프로세스 동안 형상이 변화된다. 이 방법을 통해 사용자가 다양한 이미지 스타일의 비디오 클립을 준비하는 복잡성을 줄일 수 있으며, 서로 다른 이미지 스타일의 비디오 클립 간 전환이 더 매끄럽고 새로운 비디오 클립 전환 모드가 제공되어 사용자 경험을 향상시킨다.

Description

비디오 처리 방법, 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체
본 개시의 실시예들은 비디오 처리 방법(video processing method) 및 장치(apparatus), 전자 디바이스(electronic device) 및 컴퓨터 판독가능 저장 매체(computer-readable storage medium)에 관한 것이다.
이 출원은 2020년 12월 30일에 출원된 중국 특허 출원 번호 202011609158.0의 우선권을 주장한다. 중국 특허 출원의 전체 개시 내용은 본 출원의 일부로서 본 명세서에 참조로 포함된다.
과학 기술과 경제의 급속한 발전으로, 비디오 애플리케이션(video application)은 점차 사람들의 삶에 들어왔고, 심지어 삶의 일부가 되었다. 예를 들어, 사용자는 언제 어디서나 비디오를 촬영하고, 촬영한 비디오를 소셜 네트워크 사이트에 공유하여, 자신의 삶을 공유하고 사회적 상호 작용을 하며, 비디오를 통해 삶의 재미를 높일 수 있다.
한국 특허출원공개번호 제22016-0012909호(2016년 2월 3일 공개)에는 애니메이션 이미지를 재생하는 전자 장치의 제어 방법이 개시되어 있다.
요약 부분은 개념을 간략히 소개하기 위해 제공되고, 개념에 대해서는 추후 상세 설명 부분에서 자세히 설명한다. 요약 섹션은 청구된 기술 솔루션의 핵심 기능 또는 필수 기능을 식별하기 위한 것이 아니며 청구된 기술 솔루션의 범위를 제한하기 위한 것이 아니다.
본 개시의 적어도 하나의 실시예는, 비디오 처리 방법(video processing method)을 제공하고, 이 방법은: 초기 이미지(initial image)를 디스플레이(displaying)하는 단계 - 초기 이미지는 제1 스타일 이미지(first style image)를 포함하고, 제1 스타일 이미지는 캡쳐된 이미지(captured image)에 기초하여 획득된 이미지임 -; 제1 트리거링 이벤트(first triggering event)에 응답하여 이미지 전환 애니메이션(image switching animation)을 디스플레이하는 단계 - 이미지 전환 애니메이션은 초기 이미지에서 타겟 이미지(target image)로 전환하는 동적 프로세스(dynamic process)를 보여주기 위해 사용되고, 타겟 이미지는 제2 스타일 이미지(second style image)를 포함하고, 제2 스타일 이미지는 캡쳐된 이미지를 기반으로 획득된 이미지고, 제1 스타일 이미지와 제2 스타일 이미지는 서로 다른 스타일의 이미지임 -; 및 이미지 전환 애니메이션 디스플레이의 완료에 응답하여, 타겟 이미지(target image)를 디스플레이하는 단계를 포함하고, 이미지 전환 애니메이션의 전환 이미지(switching image)는 제1 이미지 영역(first image area), 제2 이미지 영역(a second image area) 및 제3 이미지 영역(third image area)을 포함하고, 제1 이미지 영역은 제2 이미지 영역과 제3 이미지 영역 사이에 위치되고, 제1 이미지 영역은 동적 프로세스 동안 위치 이동(position movement)을 통해 시분할 방식으로 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 위치 이동 중에 형상 변화(shape change)를 겪고, 제1 이미지 영역은 전환 자료(switching material)를 디스플레이 데 사용되고, 제2 이미지 영역은 초기 이미지의 일부를 디스플레이하는 데 사용되고, 초기 이미지의 일부는 제2 이미지 영역이 위치되는 위치에 있고, 제3 이미지 영역은 타겟 이미지의 일부를 디스플레이하는 데 사용되고, 타겟 이미지의 일부는 제3 이미지 영역이 위치된 위치에 있다.
예를 들어, 본 개시 내용의 실시예에 의해 제공되는 비디오 처리 방법에서, 제1 트리거링 이벤트는: 제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 캡쳐된 이미지의 타겟 객체에 의해 미리설정된(preset) 팔다리 동작(limb action)을 제시하는(presenting) 단계, 검출되어 획득된 제1 스타일 이미지 또는 미리설정된 음성을 수신함에 기초하여 캡쳐된 이미지에서 타겟 객체에 의해 미리설정된 얼굴 동작(facial action)을 제시하는 단계 중 적어도 하나를 포함한다.
예를 들어, 본 개시의 일 실시예에서 제공하는 비디오 처리 방법에서, 동적 프로세스 동안 제1 이미지 영역의 위치 이동(position movement)의 변위 속도(displacement speed) 및 제1 이미지 영역의 형상 변화의 변형 속도(deformation speed)는 제1 트리거링 이벤트에 기초하여 결정된다.
예를 들어, 본 개시의 일 실시예에서 제공하는 비디오 처리 방법에서, 제1 트리거링 이벤트가, 제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 캡쳐된 이미지의 타겟 객체에 의해 미리설정된 팔다리 동작을 제시하는 단계를 포함하는 경우, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 미리설정된 팔다리 동작의 동작 범위에 기초하여 결정되고; 제1 트리거링 이벤트가, 제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 캡쳐된 이미지의 타겟 객체에 의해 미리설정된 팔다리 동작을 제시하는 단계를 포함하는 경우, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 미리설정된 얼굴 동작의 변형 진폭에 기초하여 결정되고; 및 제1 트리거링 이벤트가 미리설정된 음성을 수신하는 단계를 포함하는 경우, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 미리설정된 음성의 속도, 미리설정된 음성의 음량 또는 미리설정된 음성의 내용 중 적어도 하나에 기초하여 결정된다.
예를 들어, 본 개시의 일 실시예에서 제공하는 비디오 처리 방법에서, 제1 스타일 이미지는 제1 스타일 이미지가 획득된 것에 기초한 캡쳐된 이미지고, 제2 스타일 이미지는 제2 스타일 이미지를 획득한 것에 기초한 캡쳐된 이미지 상에 스타일 트랜스퍼(style transfer)를 수행하여 획득된 이미지다.
예를 들어, 본 개시의 일 실시예에서 제공하는 비디오 처리 방법에서, 제2 스타일 이미지는 제2 스타일 이미지를 획득한 캡쳐된 이미지를 스타일 트랜스퍼 모델(style transfer model)에 입력하여 스타일 트랜스퍼 모델로부터 출력한 이미지고; 및 스타일 트랜스퍼 모델은 샘플 이미지(sample image)를 통해 기계 학습 모델을 훈련함으로써 획득되고, 샘플 이미지는 원본 이미지와 트랜스퍼 이미지(transfer image)를 포함하고, 원본 이미지(original image)는 샘플 객체(sample object)를 촬영하여 획득된 이미지고, 트랜스퍼 이미지는 샘플 객체에 스타일 생성을 수행하여 획득된 이미지다.
예를 들어, 본 개시의 일 실시예에서 제공하는 비디오 처리 방법에서, 비디오 처리 방법은, 이미지 전환 애니메이션의 디스플레이 프로세스 동안 발생하는 제2 트리거링 이벤트에 응답하여, 동적 프로세스를 중지하도록 제어하고 동적 프로세스가 중지되는 순간에 대응하는 이미지 전환 애니메이션의 이미지를 디스플레이하는 단계를 더 포함한다.
예를 들어, 본 개시의 일 실시예에서 제공하는 비디오 처리 방법에서, 초기 이미지(initial image)는 제1 미리설정된 이미지(first preset image)를 더 포함하고, 제1 미리설정된 이미지는 제1 스타일 이미지(first style image)를 둘러싸고; 및 타겟 이미지는 제2 미리설정된 이미지를 더 포함하고, 제2 미리설정된 이미지는 제2 스타일 이미지를 둘러싼다.
예를 들어, 본 개시의 일 실시예에서 제공하는 비디오 처리 방법에서, 이미지 전환 애니메이션은 제1 캔버스 레이어, 제2 캔버스 레이어, 제3 캔버스 레이어에 이미지 렌더링을 수행하여 디스플레이되고, 제2 캔버스 레이어는 제1 캔버스 레이어보다 디스플레이 측(display side)에 더 가깝고, 제3 캔버스 레이어는 제2 캔버스 레이어보다 디스플레이 측에 더 가깝고; 전환 자료는 제3 캔버스 레이어 상에 렌더링되고, 제2 이미지 영역이 위치된 위치의 초기 이미지의 일부가 제2 캔버스 레이어에 렌더링되고, 및 제3 이미지 영역이 위치된 위치에 있는 타겟 이미지의 일부는 제1 캔버스 레이어에 렌더링되고; 및 렌더링 및 디스플레이되지 않은 제1 캔버스 레이어, 제2 캔버스 레이어 및 제3 캔버스 레이어의 영역은 투명하다.
본 개시의 적어도 하나의 실시예는, 비디오 처리 장치(video processing apparatus)을 제공하고, 이 장치는: 초기 이미지를 디스플레이하도록 구성된 디스플레이 유닛(display unit), 초기 이미지는 제1 스타일 이미지(first style image)를 포함하고, 제1 스타일 이미지는 캡쳐된 이미지를 기반으로 획득된 이미지고; 및 제1 트리거링 이벤트에 응답하여 이미지 전환 애니메이션을 디스플레이하도록 구성된 전환 유닛, 이미지 전환 애니메이션은 초기 이미지에서 타겟 이미지(target image)로 전환하는 동적 프로세스(dynamic process)를 보여주기 위해 사용되고, 타겟 이미지는 제2 스타일 이미지(second style image)를 포함하고, 제2 스타일 이미지는 캡쳐된 이미지를 기반으로 획득된 이미지고, 및 제1 스타일 이미지와 제2 스타일 이미지는 서로 다른 스타일의 이미지고, 디스플레이 유닛은 이미지 전환 애니메이션의 디스플레이의 완료에 응답하여 타겟 이미지를 디스플레이하도록 더 구성되고, 이미지 전환 애니메이션의 전환 이미지(switching image)는 제1 이미지 영역(first image area), 제2 이미지 영역(a second image area) 및 제3 이미지 영역(third image area)을 포함하고, 제1 이미지 영역은 제2 이미지 영역과 제3 이미지 영역 사이에 위치되고, 제1 이미지 영역은 동적 프로세스 동안 위치 이동을 통해 시분할 방식으로 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 위치 이동 중에 형상 변화(shape change)를 겪고, 제1 이미지 영역은 전환 자료를 디스플레이 데 사용되고, 제2 이미지 영역은 초기 이미지의 일부를 디스플레이하는 데 사용되고, 초기 이미지의 일부는 제2 이미지 영역이 위치되는 위치에 있고, 제3 이미지 영역은 타겟 이미지의 일부를 디스플레이하는 데 사용되고, 타겟 이미지의 일부는 제3 이미지 영역이 위치된 위치에 있다.
본 개시의 적어도 하나의 실시예는 전자 디바이스(lectronic device)를 제공하고, 전자 디바이스는: 프로세서(processor); 및 하나 이상의 컴퓨터 프로그램 모듈(computer program module)을 포함하는 메모리(memory)를 포함하고, 하나 이상의 컴퓨터 프로그램 모듈은 메모리에 저장되고 프로세서에 의해 실행되도록 구성되고, 및 하나 이상의 컴퓨터 프로그램 모듈은 본 개시의 실시예 중 어느 하나에 의해 제공되는 비디오 처리 방법을 구현하기 위한 명령들(instructions)을 포함한다.
본 개시의 적어도 하나의 실시예는 컴퓨터 판독가능 저장 매체(computer-readable storage medium)를 제공하고, 컴퓨터 판독가능 저장 매체는 비휘발성 컴퓨터 판독가능 명령들을 저장하도록 구성되고, 비휘발성 컴퓨터 판독가능 명령들이 컴퓨터에 의해 실행되는 경우, 본 개시의 실시예 중 어느 하나에 의해 제공되는 비디오 처리 방법이 구현된다.
본 개시의 실시예의 기술적 해결책을 보다 명확하게 설명하기 위해, 실시예의 도면은 다음에서 간략하게 설명될 것이다; 설명된 도면은 본 개시의 일부 실시예에만 관련되며 따라서 본 개시를 제한하지 않는다는 것은 명백하다.
도 1a는 본 개시의 적어도 하나의 실시예에 의해 제공되는 비디오 처리 방법의 흐름도이다;
도 1b는 도 1a의 단계 S10을 통해 초기 이미지를 디스플레이하는 개략도이다;
도 1c는 본 개시의 적어도 일 실시예에서 제공하는 이미지 전환 애니메이션의 전환 이미지의 개략도이다;
도 1d는 본 개시의 적어도 하나의 실시예에 의해 제공되는 타겟 이미지의 개략도이다;
도 2는 본 개시의 적어도 일 실시예에 의해 제공되는 다른 비디오 처리 방법의 흐름도이다;
도 3은 본 개시의 적어도 하나의 실시예에 의해 제공되는 동적 프로세스 정지의 순간에 대응하는 이미지 전환 애니메이션의 이미지의 개략도이다;
도 4는 본 개시 내용의 적어도 하나의 실시예에 의해 제공되는 이미지 전환 애니메이션의 렌더링 레이어(rendering layer)의 개략도이다;
도 5는 본 개시의 적어도 하나의 실시예에 의해 제공되는 위치 이동 프로세스 동안 위치 이동 및 형상 변화를 겪는 제1 이미지 영역의 원리의 개략도이다;
도 6a는 본 개시의 적어도 일 실시예에 의해 제공되는 다른 비디오 처리 방법의 흐름도이다;
도 6b는 본 개시 내용의 적어도 하나의 실시예에 의해 제공되는 비디오 처리 방법을 달성하기 위한 링크의 개략도이다;
도 6c는 본 개시의 적어도 하나의 실시예에 의해 제공되는 초기화의 흐름도이다;
도 7은 본 개시 내용의 적어도 하나의 실시예에 의해 제공되는 비디오 처리 장치의 개략적인 블록도이다;
도 8a는 본 개시의 적어도 하나의 실시예에 의해 제공되는 전자 디바이스의 개략적인 블록도이다;
도 8b는 본 개시의 적어도 하나의 실시예가 제공하는 다른 전자 디바이스의 개략적인 블록도이다; 및
도 9는 본 개시의 적어도 하나의 실시예에 의해 제공되는 컴퓨터 판독가능 저장 매체의 개략도이다.
본 개시의 실시예의 목적, 기술 방안 및 이점을 명확하게 하기 위해, 본 개시의 실시예와 관련된 도면과 관련하여 실시예의 기술적 해결책을 명확하고 완전하게 이해할 수 있는 방식으로 설명한다. 분명히, 설명된 실시예들은 본 개시의 실시예들의 전부가 아니라 일부일 뿐이다. 본 명세서에 기술된 실시예에 기초하여, 당업자는 임의의 독창적인 작업 없이 본 개시의 범위 내에 있어야 하는 다른 실시예(들)를 얻을 수 있다.
본 개시의 방법 실시예에서 설명된 다양한 단계는 상이한 순서로 실행되고 및/또는 병렬로 실행될 수 있음을 이해해야 한다. 또한, 방법 실시예는 추가 단계를 포함하고/하거나 도시된 단계를 생략할 수 있다. 본 개시의 범위는 이와 관련하여 제한되지 않는다.
본 명세서에서 사용되는 용어 "포함하는" 및 그의 변형은 개방형, 즉 "포함하지만 이에 제한되지 않는"이다. "에 기초하는(based on)"이라는 용어는 "적어도 부분적으로 기초하는(based at least in part on)"을 의미한다. "일 실시예"라는 용어는 "적어도 하나의 실시예"를 의미하고; "다른 실시예"라는 용어는 "적어도 하나의 추가적인 실시예"를 의미하고; "일부 실시예"라는 용어는 "적어도 일부 실시예"를 의미한다. 다른 용어에 대한 관련 정의는 다음 설명에서 설명한다.
본 개시에서 언급된 "제1" 및 "제2"와 같은 개념은 단지 상이한 장치, 모듈 또는 유닛을 구별하기 위해 사용되며, 이들 장치, 모듈 또는 유닛에 의해 수행되는 기능의 순서 또는 상호관계 독립성을 제한하는 데 사용되지 않음에 유의해야 한다.
본 명세서에서 언급된 "하나(a)" 및 "복수(a plurality of)"의 변형은 도식적이고 비제한적이며, 문맥상 명확하게 나타내지 않는 한, "하나 이상"으로 이해되어야 한다는 것이 당업자에 의해 이해되어야 한다.
본 발명자는 비디오 애플리케이션을 사용하는 과정에서 사용자가 종종 복수의 상이한 이미지 스타일을 갖는 비디오를 얻기를 원하고 비디오가 복수의 상이한 이미지 스타일을 갖는 비디오 클립을 포함한다는 것을 발견하였다. 관련 기술에서, 사용자가 복수의 상이한 이미지 스타일을 가진 비디오를 얻기를 원한다면, 종종 상이한 이미지 스타일을 가진 비디오 클립을 별도로 준비한 다음, 비디오 편집 소프트웨어에 의해 이러한 상이한 이미지 스타일을 가진 비디오 클립을 하나의 비디오로 결합해야 한다.
위의 관련 기술은 사용자가 미리 비디오 클립을 준비해야 할 뿐만 아니라, 한 이미지 스타일의 비디오 클립에서 다른 이미지 스타일의 비디오 클립으로 전환하는 프로세스가 비교적 경직되고 매끄럽지 않아 사용자 경험을 감소시킨다.
본 개시의 적어도 하나의 실시예는 비디오 처리 방법, 비디오 처리 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체를 제공한다. 비디오 처리 방법은: 초기 이미지(initial image)를 디스플레이(displaying)하는 단계 - 초기 이미지는 제1 스타일 이미지(first style image)를 포함하고, 제1 스타일 이미지는 캡쳐된 이미지(captured image)에 기초하여 획득된 이미지임 -; 제1 트리거링 이벤트(first triggering event)에 응답하여, 이미지 전환 애니메이션(image switching animation)을 디스플레이하는 단계 - 이미지 전환 애니메이션은 초기 이미지에서 타겟 이미지(target image)로 전환하는 동적 프로세스(dynamic process)를 보여주기 위해 사용되고, 타겟 이미지는 제2 스타일 이미지(second style image)를 포함하고, 제2 스타일 이미지는 캡쳐된 이미지를 기반으로 획득된 이미지고, 및 제1 스타일 이미지와 제2 스타일 이미지는 서로 다른 스타일의 이미지임 -; 및 이미지 전환 애니메이션 디스플레이의 완료에 응답하여, 타겟 이미지를 디스플레이하는 단계를 포함한다. 이미지 전환 애니메이션의 전환 이미지(switching image)는 제1 이미지 영역(first image area), 제2 이미지 영역(a second image area) 및 제3 이미지 영역(third image area)을 포함하고, 제1 이미지 영역은 제2 이미지 영역과 제3 이미지 영역 사이에 위치되고, 제1 이미지 영역은 동적 프로세스 동안 위치 이동을 통해 시분할 방식으로 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 위치 이동 중에 형상 변화(shape change)를 겪고, 제1 이미지 영역은 전환 자료를 디스플레이 데 사용되고, 제2 이미지 영역은 초기 이미지의 일부를 디스플레이하는 데 사용되고, 초기 이미지의 일부는 제2 이미지 영역이 위치되는 위치에 있고, 제3 이미지 영역은 타겟 이미지의 일부를 디스플레이하는 데 사용되고, 타겟 이미지의 일부는 제3 이미지 영역이 위치된 위치에 있다. 이 비디오 처리 방법은 다양한 이미지 스타일로 비디오 클립을 준비하는 사용자의 복잡성을 줄이고, 다양한 이미지 스타일의 비디오 클립 간 전환을 더 매끄럽게 만들고, 비디오 클립을 전환하는 새로운 방법을 제공하고, 및 사용자 경험을 개선할 수 있다.
본 개시의 실시예에 의해 제공되는 비디오 처리 방법은 적어도 부분적으로 적절한 전자 디바이스에 적용될 수 있음에 유의해야 한다. 예를 들어, 일부 실시예에서, 비디오 처리 방법은 전자 디바이스에 설치된 애플리케이션 또는 클라우드 서버로부터 다운로드된 설치되지 않은 애플리케이션(예를 들어, 업계에 존재하는 작은 프로그램, 빠른 애플리케이션 등)을 통해 로컬에서 구현될 수 있다. 전자 디바이스(electronic device)는 개인용 컴퓨터(personal computer), 모바일 단말기(mobile terminals) 등을 포함할 수 있다. 이동 단말기는 휴대폰, 태블릿, 웨어러블 전자 디바이스, 스마트 홈 장치 등일 수 있다. 예를 들어, 일부 실시예에서, 비디오 처리 방법은 또한 서버를 통해 구현될 수 있거나 비디오 처리 방법의 일부 단계는 서버(예를 들어, 클라우드 서버)를 통해 구현될 수 있고 다른 단계는 전자 디비이스를 통해 로컬로 구현될 수 있다. 예를 들어, 전자 디바이스는 처리된 비디오를 획득하기 위해 네트워크(예를 들어, 무선 또는 유선 통신 네트워크)를 통해 서로 통신할 수 있다.
도 1a는 본 개시의 적어도 하나의 실시예에 의해 제공되는 비디오 처리 방법의 흐름도이다.
도 1a를 참조하면, 방법은 단계 S10~S30을 포함한다.
단계 S10: 초기 이미지를 디스플레이하고, 초기 이미지는 제1 스타일 이미지를 포함한다.
단계 S20: 제1 트리거링 이벤트에 응답하여 이미지 전환 애니메이션을 디스플레이하고, 이미지 전환 애니메이션은 초기 이미지에서 타겟 이미지로의 전환의 동적 프로세스를 보여주는 데 사용된다. 타겟 이미지는 제2 스타일 이미지를 포함한다.
단계 S30: 이미지 전환 애니메이션 디스플레이의 완료에 응답하여, 타겟 이미지를 디스플레이한다.
예를 들어, 이미지 전환 애니메이션에서 전환 이미지는 제1 이미지 영역, 제2 이미지 영역 및 제3 이미지 영역을 포함하고, 제1 이미지 영역은 제2 이미지 영역과 제3 이미지 영역 사이에 위치된다. 제1 이미지 영역은 동적 프로세스 동안 위치 이동을 통해 시분할 방식으로 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 위치 이동 중에 형상 변화(shape change)를 겪고, 제1 이미지 영역은 전환 자료를 디스플레이 데 사용되고, 제2 이미지 영역은 초기 이미지의 일부를 디스플레이하는 데 사용되고, 초기 이미지의 일부는 제2 이미지 영역이 위치되는 위치에 있고, 제3 이미지 영역은 타겟 이미지의 일부를 디스플레이하는 데 사용되고, 타겟 이미지의 일부는 제3 이미지 영역이 위치된 위치에 있다.
이 방법은 다양한 이미지 스타일로 비디오 클립을 준비하는 사용자의 복잡성을 줄이고, 이미지 전환 애니메이션을 통하여 다양한 이미지 스타일의 비디오 클립 간 전환을 더 매끄럽게 만들고, 비디오 클립을 전환하는 새로운 방법을 제공하고 사용자 경험을 향상시킨다.
단계 S10에 대해, 본 개시의 일부 실시예에서, 제1 스타일 이미지는 캡쳐된 이미지에 기초하여 획득된 이미지다. 예를 들어, 캡쳐된 이미지는 서로 다른 시점에 촬영 디바이스에 의해 캡쳐되는 이미지일 수 있다. 서로 다른 시점에 촬영 디바이스에 의해 촬영된 이미지가 상이할 수 있으므로, 서로 다른 시점에서 획득된 초기 이미지와 서로 다른 시점에서 초기 이미지를 기반으로 획득한 타겟 이미지도 다를 수 있다. 예를 들어, 촬영 디바이스(shooting device)는 카메라일 수 있다.
예를 들어, 제1 스타일 이미지는 실시간 캡쳐된 이미지일 수 있고, 이는 이미지 촬영 장치에 의해 실시간으로 촬영되어 디스플레이 화면에 디스플레이되는 이미지일 수 있다. 예를 들어, 이미지 촬영 장치(image shooting apparatus)는 전술한 촬영 디바이스일 수 있고, 이는 카메라일 수 있다. 디스플레이 화면에 실시간으로 디스플레이되는 이미지는 원본 실사 이미지와 같이 이미지 촬영 장치에서 실시간으로 처리되지 않은 실사 이미지거나, 디스플레이 화면(display screen)에 실시간으로 디스플레이되는 이미지는 촬영 장치에서 캡쳐된 실사 이미지에 실시간 필터링, 스무딩, 필링 등의 처리를 가한 제1 스타일의 이미지일 수도 있다.
물론, 본 개시의 다른 실시예에서 제1 스타일 이미지는 촬영 장치에서 실시간으로 촬영한 이미지가 아닐 수도 있다. 예를 들어, 제1 스타일 이미지는 로컬 메모리에서 직접 획득하거나 클라우드에서 다운로드한 캡쳐된 이미지일 수 있다.
일부 실시예에서, 초기 이미지는 제1 스타일 이미지뿐만 아니라 제1 미리설정된 이미지를 포함하고, 제1 미리설정된 이미지는 제1 스타일 이미지를 둘러쌀 수 있다. 제1 미리설정된 이미지는 지도, 동적 이미지(dynamic image) 등일 수 있다.
도 1b는 도 1a의 단계 S10을 통해 초기 이미지를 디스플레이하는 개략도이다.
예를 들어, 도 1b에 도시된 바와 같이 초기 이미지(initial image)(100)는 전자 디바이스의 디스플레이 화면에 디스플레이될 수 있다. 초기 이미지(100)는 제1 스타일 이미지(first style image)(101)(점선 안)와 제1 미리설정된 이미지(102)(점선 안)를 포함할 수 있다.
제1 스타일 이미지(101)는 예를 들어, 타겟 객체를 촬영하는 촬영 장치에 의해 획득된 캡쳐된 이미지일 수 있다. 제1 미리설정된 이미지(102)는 예를 들어 달력 지도(calendar map)일 수 있다. 예를 들어, 비디오 촬영 장치를 이용하여 실시간으로 비디오를 촬영하는 경우, 다수의 초기 이미지가 순차적으로 디스플레이 화면에 실시간으로 디스플레이된다.
단계 S20에 대해, 제1 트리거링 이벤트는 예를 들어, 제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 캡쳐된 이미지의 타겟 객체에 의해 미리설정된(preset) 팔다리 동작(limb action)을 제시하는(presenting) 단계, 검출되어 획득된 제1 스타일 이미지 또는 미리설정된 음성을 수신함에 기초하여 캡쳐된 이미지에서 타겟 객체에 의해 미리설정된 얼굴 동작(facial action)을 제시하는 단계 중 적어도 하나를 포함한다.
미리설정된 팔다리 동작은 예를 들어 타겟 객체의 팔다리가 디스플레이 화면 상에서 미끄러지거나 이미지 촬영 장치의 시야 내에서 미끄러지는 것일 수 있다. 팔다리는 예를 들어 사용자의 머리, 손 등일 수 있다. 미리설정된 얼굴 동작은 예를 들어, 사용자의 입 모양의 변형이나 눈 깜박임 등일 수 있다.
예를 들어, 비디오에서 팔다리 동작을 검출하는 것, 즉 동작 검출(action detection)를 위해 다양한 방법이 사용될 수 있다. 동작 검출 작업(action detection task)은 객체 검출 작업(object detection task)과 유사하며 둘 다 먼저 타겟을 찾은 다음 타겟을 식별해야 한다. 대표적인 방법은, 다중-스테이지 네트워크(multi-stage network)(SCNN), 시간적 유닛 리그래션 네트워크(Temporal Unit Regression Network)(TURN), 시간적 동작 그루핑(Temporal Action Grouping)(TAG), 컨벤셔널-드-컨볼루셔널 네트워크(CDC)Convolutional-De-Convolutional Network) 방법, 구조적 세그먼트 네트워크(Structured Segment Network)(SSN), 케스케이드 바운더리 리그래션 네트워크(Cascaded Boundary Regression Network)(CBR) 등을 포함한다. 본 개시의 실시예는 특정한 동작 검출 방법(action detection method)에 제한되지 않는다.
제1 트리거링 이벤트에 대한 응답으로, 이미지 전환 애니메이션을 통해 초기 이미지에서 타겟 이미지로 전환되는 동적 프로세스를 보여주기 위해 이미지 전환 애니메이션이 디스플레이된다. 이미지 전환 애니메이션은, 예를 들어, 복수의 순차적인 전환 이미지를 포함할 수 있다. 전환 이미지들(switching images) 중 적어도 하나는 예를 들어, 제1 이미지 영역, 제2 이미지 영역 및 제3 이미지 영역을 포함할 수 있다. 제1 이미지 영역은 제2 이미지 영역과 제3 이미지 영역 사이에 위치된다. 제1 이미지 영역은 전환 자료(switching material)를 디스플레이하는 데 사용되고, 제2 이미지 영역은 초기 이미지의 일부를 디스플레이하는 데 사용되고, 초기 이미지의 일부는 제2 이미지 영역이 위치된 위치에 있고, 제3 이미지 영역은 타겟 이미지의 일부를 디스플레이하는 데 사용되고, 타겟 이미지의 일부는 제3 이미지 영역이 위치된 위치에 있다.
도 1c는 본 개시 내용의 적어도 하나의 실시예에 의해 제공되는 이미지 전환 애니메이션에서 전환 이미지의 개략도이다.
도 1c에 도시된 전환 이미지는 이미지 전환 애니메이션에서 이미지 전환의 한 프레임일 뿐이고, 이미지 전환 애니메이션은 서로 다른 전환 이미지의 복수의 프레임으로 구성된 애니메이션일 수 있음을 이해해야 한다. 또한, 도 1c는 예시일 뿐이고 본 개시의 실시예에 제한적인 영향을 미치지 않는다.
도 1c에 도시된 바와 같이, 전환 이미지는 제1 이미지 영역(first image area)(103), 제2 이미지 영역(second image area)(104) 및 제3 이미지 영역(third image area)(105)을 포함할 수 있다. 제1 이미지 영역(103)은 제2 이미지 영역(104)과 제3 이미지 영역(105) 사이에 위치된다.
제1 이미지 영역(103)은 전환 자료를 디스플레이하는 데 사용된다. 도 1c에 도시된 바와 같이, 전환 자료는 예를 들어 백색 단색 채우기 이미지(white solid fill image)일 수 있다. 물론, 전환 자료는 패턴이 있는 이미지일 수도 있다. 도 1c에 도시된 전환 자료는 단지 예일 뿐이고, 전환 자료는 백색 단색 채우기 이미지(white solid fill image)만 될 수 있음을 의미하지는 않다.
제2 이미지 영역(104)은 초기 이미지의 일부를 디스플레이하는 데 사용되고, 초기 이미지의 일부는 제2 이미지 영역(104)이 위치된 위치에 있다. 초기 이미지는 예를 들어 실시간 캡처에 의해 획득될 수 있다. 도 1b에 도시된 바와 같이, 예를 들어, 제2 이미지 영역(104)이 위치된 위치의 초기 이미지(100)의 일부가 타겟 객체의 정수리, 타겟 객체가 위치된 부분적 환경이 형성하는 배경 및 달력 지도일 수 있다. 따라서, 제2 이미지 영역(104)이 위치된 위치의 초기 이미지(100)의 일부를 디스플레이 하는 제2 이미지 영역(104)은, 타겟 객체의 정수리, 타겟 객체가 위치된 부분적 환경이 형성하는 배경 및 달력 지도를 디스플레이하는 단계를 포함할 수 있다.
제3 이미지 영역(105)은 타겟 이미지의 일부를 디스플레이하는 데 사용되고, 타겟 이미지의 일부는 제3 이미지 영역(105)이 위치된 위치에 있다. 타겟 이미지는 제2 스타일 이미지를 포함한다. 제2 스타일 이미지는 캡쳐된 이미지를 기반으로 획득한 이미지고, 제1 스타일 이미지와 제2 스타일 이미지는 서로 다른 스타일의 이미지다. 본 개시의 일부 실시예에서, 제2 스타일 이미지는 캡쳐된 이미지에 스타일 트랜스퍼를 수행함으로써 획득된 이미지다. 캡쳐된 이미지는 예를 들어, 이미지 촬영 장치에 의해 실시간으로 캡쳐되는 이미지일 수 있다.
본 개시의 일부 실시예에서, 제2 스타일 이미지는, 제2 스타일 이미지가 획득된 것을 기준으로 캡쳐된 이미지를 스타일 트랜스퍼 모델에 입력하고 스타일 트랜스퍼 모델로부터 출력함으로써 획득된 이미지다. 예를 들어, 제2 스타일 이미지는 캡쳐된 이미지에 스타일 트랜스퍼를 수행한 이미지일 수 있고, 캡쳐된 이미지는 촬영 장치에서 타겟 객체를 촬영하여 획득한 이미지일 수 있다. 예를 들어, 제2 스타일 이미지를 획득한 캡쳐된 이미지는 스타일 트랜스퍼 모델에 입력되어 스타일 트랜스퍼 모델로부터 출력되는 홍콩 만화 스타일(Hong-Kong-comics style)의 이미지를 획득할 수 있다.
스타일 트랜스퍼 모델은 샘플 이미지를 통해 기계 학습 모델을 훈련함으로써 획득된 것으로, 샘플 이미지는 원본 이미지와 트랜스퍼 이미지를 포함하고, 원본 이미지(original image)는 샘플 객체(sample object)를 촬영하여 획득된 이미지고, 트랜스퍼 이미지는 샘플 객체에 스타일 생성을 수행하여 획득된 이미지다.
트랜스퍼 이미지는 예를 들어 홍콩 만화풍의 이미지, 유화풍의 이미지 또는 스케치 이미지일 수 있다. 예를 들어, 기계 학습 모델의 입력으로 원본 이미지를 사용하고 기계 학습 모델의 출력으로 트랜스퍼 이미지를 사용하여, 스타일 트랜스퍼 모델을 학습할 수 있다.
예를 들어, 제2 스타일 이미지를 획득한 캡쳐된 이미지는 스타일 트랜스퍼 모델에 입력되어 스타일 트랜스퍼 모델로부터 출력되는 홍콩 만화 스타일(Hong-Kong-comics style)의 이미지(즉, 제2 스타일 이미지)를 획득할 수 있다.스타일 트랜스퍼 모델로부터 출력된 이미지가 갖는 스타일은 사용자의 선택에 따라 결정될 수 있다. 예를 들어, 사용자는 애플리케이션에서 "유화 스타일", "중국 전통 회화 스타일" 등을 선택할 수 있고, 따라서 스타일 트랜스퍼 모델은 캡쳐된 이미지의 스타일을 트랜스퍼하여 유화 스타일, 중국 전통 회화 스타일 등으로 제2 스타일 이미지를 출력한다. 이 경우, 복수의 스타일 트랜스퍼 모델이 사용될 수 있고, 다양한 스타일 트랜스퍼 모델에 의해 출력되는 이미지는 서로 다른 스타일을 갖는다. 따라서, 사용자의 선택에 기초하여, 캡쳐된 이미지는 대응하는 스타일 이미지를 획득하기 위해, 대응하는 스타일 트랜스퍼 모델에 입력하게 된다.
제3 이미지 영역(105)이 제3 이미지 영역(105)이 위치된 위치에 타겟 이미지의 일부를 디스플레이할 때, 제2 이미지 영역(104)이 제2 이미지 영역(104)이 위치된 위치에 초기 이미지의 일부를 디스플레이하고, 이때, 초기 이미지와 타겟 이미지를 동시에 획득하고, 초기 이미지의 스타일과 타겟 이미지의 스타일이 다르다는 것에 유의해야 한다. 즉, 초기 이미지와 타겟 이미지는 모두 실시간 캡쳐된 이미지를 기반으로 획득된 서로 다른 스타일의 이미지일 수 있다.
도 1c에 도시된 바와 같이, 제3 이미지 영역(105)은 예를 들어, 제3 이미지 영역(105)이 위치된 위치에 타겟 이미지의 일부를 디스플레이할 수 있다. 예를 들어, 도 1d에 도시된 바와 같이, 제3 이미지 영역(105)이 위치된 위치의 타겟 이미지의 일부는 타겟 객체의 얼굴 좌측 하단 부분과 머리카락 꼬리를 포함할 수 있고, 및 따라서 이미지의 이 부분은 전환 이미지의 제3 이미지 영역(105)에 디스플레이된다.
본 개시의 일부 실시예에서, 제1 이미지 영역(103)은 동적 프로세스 동안 위치 이동을 통해 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 위치 이동 중에 형상 변화(shape change)를 겪는다. 이미지 전환 애니메이션 시작 시, 전환 이미지는 제2 이미지 영역만 가질 수 있고, 즉, 디스플레이 화면에는 제1 스타일 이미지가 디스플레이되고 제2 스타일 이미지는 디스플레이되지 않음에 유의해야 한다. 예를 들어, 제1 이미지 영역은 왼쪽 하단 모서리에서 오른쪽 위로 이동할 수 있고, 제1 이미지 영역은 위치 이동에 의해 전체 이미지 영역을 덮을 수 있다. 그리고 제1 이미지 영역의 위치 이동 중에, 제1 이미지 영역의 형상이 변경된다. 예를 들어, 제1 이미지 영역은 플리핑 패턴에 따라 위치 이동 및 형상 변화를 수행하여 이미지 전환 애니메이션이 플리핑 효과를 나타낼 수 있다. 이하에서는 이미지 전환 애니메이션의 렌더링 레이어(rendering layer)와 위치 이동 시 제1 이미지 영역의 위치 이동 및 형상 변화의 원리가 도 4 및 도 5와 결합하여 설명되고, 자세한 내용은 여기서 반복하지 않는다.
제1 이미지 영역도 좌측 상단에서 우측 하단으로 이동하거나, 우측 상단에서 좌측 하단으로 이동할 수도 있음을 유의해야 한다. 요컨대, 본 개시은 제1 이미지 영역의 이동 방식을 제한하지 않는다.
예를 들어 단계 S30의 경우, 이미지 전환 애니메이션의 전체 이미지 영역이 동적 프로세스 중 위치 이동을 통해 시분할 방식으로 덮일 때 (예를 들어, 시분할 방식으로 덮는다는 것은 전체 이미지 영역을 동시에 덮는 것이 아니라 다른 순간에 다른 부분을 덮는 것을 의미할 수 있음), 이미지 전환 애니메이션 디스플레이가 완료된다.
본 개시의 일부 실시예에서, 이미지 전환 애니메이션의 디스플레이가 완료되면, 예를 들어, 이미지 전환 애니메이션의 완료 시점에 대응하는 타겟 이미지가 디스플레이 화면에 디스플레이될 수 있다.
본 개시의 일부 실시예에서, 예를 들어, 이미지 전환 애니메이션의 디스플레이가 완료된 경우, 이미지 촬영 장치가 계속해서 실시간으로 비디오를 캡쳐하면, 디스플레이 화면은 제2 스타일 이미지와 함께 복수의 순차적인 타겟 이미지를 실시간으로 디스플레이할 수 있다.
도 1d는 본 개시의 적어도 하나의 실시예에 의해 제공되는 타겟 이미지의 개략도이다.
예를 들어, 도 1d에 도시된 바와 같이, 타겟 이미지(target image)(200)가 디스플레이 화면에 디스플레이될 수 있다. 타겟 이미지(200)는 제2 스타일 이미지(106)(점선 박스 내) 및 제2 미리설정된 이미지(107)를 포함할 수 있다. 본 개시의 일부 실시예에서, 타겟 이미지는 제2 스타일 이미지(106)를 포함할 뿐만 아니라, 제2 미리설정된 이미지(107)(점선 박스 외부)를 포함하고, 제2 미리설정된 이미지(107)가 제2 스타일 이미지를 둘러쌀 수 있다. 제2 미리설정된 이미지는 예를 들어 질감, 동적 이미지 등일 수 있다. 제2 미리설정된 이미지는 제1 미리설정된 이미지와 동일하거나 제1 미리설정된 이미지와 다를 수 있다.
제2 스타일 이미지(106)는 예를 들어, 촬영 장치를 통해 타겟 객체를 촬영하여 획득한 캡쳐된 이미지에 스타일 트랜스퍼를 통해 획득한 이미지일 수 있다. 예를 들어, 실시간 캡쳐된 이미지를 스타일 트랜스퍼 모델에 입력하여 홍콩 만화 스타일의 이미지를 얻을 수 있다.
제2 미리설정된 이미지(107)는 예를 들어 달력 지도일 수 있다. 도 1d 및 도 1b에 도시된 바와 같이, 제2 미리설정된 이미지(107)와 제1 미리설정된 이미지(102)는 상이할 수 있고, 예를 들어, 제2 미리설정된 이미지(107)와 제1 미리설정된 이미지(102)는 서로 다른 날짜, 즉 캘린더 맵의 날짜가 변경된 캘린더 맵일 수 있다.
이미지 전환 애니메이션 시작 시, 전환 이미지는 제2 이미지 영역만 가질 수 있고, 즉, 제1 스타일 이미지가 디스플레이되고, 제2 스타일 이미지는 디스플레이되지 않음에 유의해야 한다. 이미지 전환 애니메이션이 끝나면 전환 이미지는 제3 이미지 영역만 가질 수 있고, 즉, 제2 스타일 이미지가 디스플레이되고 제1 스타일 이미지는 디스플레이되지 않는다.
본 발명의 일부 실시예에서, 동적 프로세스 동안 제1 이미지 영역의 위치 이동(position movement)의 변위 속도(displacement speed) 및 제1 이미지 영역의 형상 변화의 변형 속도(deformation speed)는 제1 트리거링 이벤트에 기초하여 결정된다. 즉, 제1 트리거링 이벤트에 따라, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도를 결정한다. 본 실시예는 이미지 전환 애니메이션의 변위 속도 및 변형 속도를 제어하는 방법을 제공함으로써, 비디오 처리 방법의 재미를 높이고, 비디오 처리 방법의 기능성을 풍부하게 하고, 사용자 경험을 향상시킨다.
본 개시의 일부 실시예에서, 제1 트리거링 이벤트가, 제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 캡쳐된 이미지에서 타겟 객체에 의해 미리설정된 팔다리 동작을 제시하는 단계를 포함하는 경우, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 미리설정된 팔다리 동작의 진폭에 기초하여 결정된다.
예를 들어, 제1 트리거링 이벤트가 캡쳐된 이미지에서 타겟 객체의 손가락 슬라이딩이 검출되는 것을 포함한다면, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 손가락의 슬라이딩 거리에 기초하여 결정될 수 있다. 예를 들어, 일부 예들에서, 손가락의 슬라이딩 거리가 길수록 동적 프로세스에서 위치 이동의 변위 속도 및 제1 이미지 영역의 형상 변화의 변형 속도가 빨라진다.
본 개시의 일부 실시예에서, 제1 트리거링 이벤트가, 제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 캡쳐된 이미지에서 타겟 객체에 의해 미리설정된 얼굴 동작을 제시하는 단계를 포함하는 경우, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 미리설정된 얼굴 동작의 변형 진폭에 기초하여 결정된다. 예를 들어, 일부 예들에서, 미리설정된 얼굴 동작의 변형 진폭이 클수록, 동적 프로세스 동안 위치 이동의 변위 속도와 제1 이미지 영역의 형상 변화의 변형 속도가 빠르다.
예를 들어, 제1 트리거링 이벤트가 캡쳐된 이미지에서 타겟 객체에 의한 미소하지 않음에서 미소로 변경되는 얼굴 동작이 검출되는 것을 포함하는 경우, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 입(mouth)의 변형 진폭에 기초하여 결정될 수 있다.
본 개시의 일부 실시예에서, 제1 트리거링 이벤트가 미리설정된 음성 수신을 포함하는 경우, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 미리설정된 음성의 속도, 미리설정된 음성의 음량 또는 미리설정된 음성의 내용 중 적어도 하나에 기초하여 결정된다.
예를 들어, 제1 트리거링 이벤트가 "과거를 청산하고, 미래를 환영하라"라는 미리설정된 음성을 수신하는 경우, 동적 프로세스 동안 제1 이미지 영역의 위치 이동의 변위 속도 및 형상 변화의 변형 속도는 수신된 미리설정된 음성 "과거를 청산하고, 미래를 환영하라"의 속도에 기초하여 결정될 수 있다. 예를 들어, 일부 예들에서, 미리설정된 음성의 속도가 빠를수록, 위치 이동의 변위 속도 및 동적 프로세스에서 제1 이미지 영역의 형상 변화의 변형 속도가 빨라질 수 있다.
도 2는 본 개시의 적어도 일 실시예에서 제공하는 다른 비디오 처리 방법의 흐름도이다.
도 2에 도시된 바와 같이, 비디오 처리 방법은 전술한 실시예들에 기초하여 단계 S40을 포함할 수도 있다. 단계 S40은 예를 들어, 단계 S20 이후 및 단계 S30 이전에 실행될 수 있다.
단계 S40: 이미지 전환 애니메이션의 디스플레이 프로세서 동안 발생하는 제2 트리거링 이벤트에 응답하여, 동적 프로세스를 중지하도록 제어하고 동적 프로세스가 중지되는 순간에 대응하는 이미지 전환 애니메이션의 이미지를 디스플레이한다.
제2 트리거링 이벤트는, 예를 들어, 검출된 캡쳐된 이미지에서 타겟 객체에 의해 입력된 타겟 객체에 의해 팔다리 동작 일시중지(pause limb action), 얼굴 동작 일시중지(pause facial action) 또는 음성 중 적어도 하나를 제시하는 것을 포함할 수 있다.
팔다리 동작 일시중지는 예를 들어 타겟 객체에 의해 디스플레이 화면을 향한 손가락을 통한 클릭 동작일 수 있다. 얼굴 동작 일시중지는, 예를 들어 타겟 객체에 의해 혀를 내미는 동작일 수 있다. 음성 입력은 예를 들어 "멈춤"이라는 음성이 입력될 수 있다.
도 3은 본 개시의 적어도 하나의 실시예에 의해 제공되는 동적 프로세스 정지(dynamic process stopping)의 순간에 대응하는 이미지 전환 애니메이션의 이미지의 개략도이다.
도 3에 도시된 바와 같이, 예를 들어, 이미지 전환 애니메이션은 전환 이미지(switching image)(300)를 디스플레이한다. 제2 트리거링 이벤트의 발생에 대응하여 이미지 전환 애니메이션이 정지되도록 제어하고 전환 이미지(300)를 디스플레이한다.
본 개시의 일부 실시예에서, 이미지 전환 애니메이션의 동적 프로세스가 중지되는 경우, 전환 이미지(300)에 일시중지 디스플레이기 키(pause indicator key)(301)가 디스플레이될 수 있다.
제1 트리거링 이벤트가 미리설정된 팔다리 동작을 포함하고 제2 트리거링 이벤트가 팔다리 동작 일시중지를 포함하는 경우, 미리설정된 팔다리 동작 및 팔다리 동작 일시중지는 다른 팔다리 동작일 수 있으므로, 팔다리 동작에 따라 이미지 전환 애니메이션을 디스플레이할지 현재 재생 중인 이미지 전환 애니메이션을 일시 중지할지 여부를 결정할 수 있다. 물론, 미리설정된 팔다리 동작과 팔다리 동작 일시정지도 같은 팔다리 동작일 수 있다. 예를 들어, 이미지 전환 애니메이션이 재생되지 않는 상태에서 팔다리 동작이 검출되면, 해당 팔다리 동작을 미리설정된 팔다리 동작으로 판단하고 이미지 전환 애니메이션을 디스플레이할 수 있다. 이미지 전환 애니메이션 재생 중 팔다리 동작이 검출되면, 팔다리 동작이 일시정지 동작인 것으로 판단할 수 있다. 마찬가지로, 제1 트리거링 이벤트가 미리결정된 얼굴 동작을 포함하고 제2 트리거링 이벤트가 일시중지 얼굴 동작을 포함하는 경우, 미리결정된 얼굴 동작 및 얼굴 동작 일시중지는 서로 다른 얼굴 동작이거나 동일한 얼굴 동작일 수 있다.
도 4는 본 개시의 적어도 하나의 실시예에 의해 제공되는 이미지 전환 애니메이션의 렌더링 레이어의 개략도이다.
도 4에 도시된 바와 같이, 제1 캔버스 레이어(first canvas layer)(401), 제2 캔버스 레이어(second canvas layer)(402) 및 제3 캔버스 레이어(third canvas layer)(403)에 이미지 렌더링을 수행하여 이미지 전환 애니메이션을 디스플레이한다. 제2 캔버스 레이어(402)는 제1 캔버스 레이어(401)보다 디스플레이 측에 더 가깝고, 제3 캔버스 레이어(403)는 제2 캔버스 레이어(402)보다 디스플레이 측(display side)에 더 가깝다. 여기서, 디스플레이 측(display side)이란, 예를 들어 이미지 전환 애니메이션을 디스플레이하는 장치의 디스플레이 화면이 사용자를 향하는 쪽을 말한다.
전환 자료는 제3 캔버스 레이어 상에 렌더링되고, 제2 이미지 영역이 위치된 위치의 초기 이미지 부분이 제2 캔버스 레이어에 렌더링되고, 및 제3 이미지 영역이 위치된 위치에 있는 타겟 이미지의 일부는 제1 캔버스 레이어에 렌더링된다. 렌더링 및 디스플레이되지 않은 제1 캔버스 레이어, 제2 캔버스 레이어 및 제3 캔버스 레이어의 영역은 투명하다.
예를 들어, 도 1b~도 1d에 도시된 시나리오에서, 전환 자료((switching material))(103)는 제3 캔버스 레이어(403) 상에 렌더링되고, 제2 이미지 영역(104)이 위치된 위치에 있는 초기 이미지의 일부는 제2 캔버스 레이어(402) 상에 렌더링되고, 제3 이미지 영역(105)이 위치된 위치에 있는 타겟 이미지의 일부는 제1 캔버스 레이어(401)에 렌더링된다.
도 5는 본 개시의 적어도 하나의 실시예에 의해 제공되는 위치 이동 프로세스 동안 위치 이동 및 형상 변화를 겪는 제1 이미지 영역의 원리의 개략도이다.
도 5에 도시된 바와 같이, 이 원리의 개략도에서, 제1 이미지(500)의 한 모서리 D가 위로 뒤집히고, 모서리 D가 위로 뒤집힌 후 점 C의 위치로 떨어지면, 선분 AB는 모서리 D를 뒤집음으로써 형성된 주름일 수 있다. 점 C, 점 A, 점 B의 좌표를 계산할 수 있으므로, 제1 이미지 영역(501), 제2 이미지 영역(502) 및 제3 이미지 영역(503)이 얻어진다. 제2 이미지 영역(502)은 제2 이미지 영역(502)이 위치된 위치에 초기 이미지의 일부를 디스플레이한다. 제3 이미지 영역(503)은 제3 이미지 영역(503)이 위치된 위치에 타겟 이미지의 일부를 디스플레이한다.
본 개시의 일 실시예에서, 예를 들어, 시간에 따라 변하는 점 C의 좌표는 페이지 플리핑 커브(page flipping curve)에 의해 획득될 수 있다. 예를 들어, 페이지 플리핑 커브는 당업자가 피팅을 통해 얻을 수 있다. 예를 들어, 점 C의 시작점과 점 C의 끝점이 결정되어, 시작점과 끝점 및 플리핑 각도에 따라 페이지 플리핑 곡선이 맞춰질 수 있다. 점 A와 점 B의 좌표는, 예를 들어 점 A, 점 B, 점 C의 위치 관계를 통해 계산될 수 있다.
도 6a는 본 개시의 적어도 일 실시예에 의해 제공되는 다른 비디오 처리 방법의 흐름도이다.
도 6a에 도시된 바와 같이, 비디오 처리 방법의 흐름도는 단계 S602~S607을 포함할 수 있다.
단계 S602: 디스플레이 화면에 실제 개인 스타일(real personal style)의 초기 이미지를 디스플레이한다. 실제 개인 스타일의 초기 이미지가 제1 스타일 이미지다. 예를 들어, 도 1을 참조하여 전술한 S10 단계가 수행될 수 있고, 여기서는 반복되지 않다.
단계 S603: 웃는 동작(smiling action)이 검출되는지 여부를 결정한다. 웃는 동작이 검출되면, S604 단계로 진행하여 웃는 동작이 검출되고, 즉 제1 트리거링 이벤트가 검출된다. 웃는 동작이 검출되지 않으면, S607 단계로 진행한다.
단계 S604: 웃는 동작을 검출한 것에 응답하여, 실시간 실제 개인 이미지에 따라 홍콩 만화 스타일의 타겟 이미지를 실시간으로 생성한다. 이때, 디스플레이 화면에 디스플레이되는 이미지는 홍콩 만화 스타일의 타겟 이미지 일부와 실제 개인 스타일의 초기 이미지 일부를 포함한다.
단계 S605: 페이지 넘기기 효과(page flipping effect)를 디스플레이하고, 페이지 넘기기 효과는 상술한 이미지 전환 애니메이션이다. 예를 들어, 도 1a를 참조하여 전술한 S20 단계가 수행될 수 있고, 여기서는 반복하지 않는다.
단계 S606: 페이지 넘기기 효과 디스플레이가 완료된 경우, 타겟 이미지를 홍콩 만화 스타일로 디스플레이한다. 예를 들어, 도 1a를 참조하여 전술한 S30 단계가 수행될 수 있고, 여기서는 반복되지 않는다.
단계 S607: 실제 개인 스타일로 이미지를 디스플레이한다. 웃는 동작이 검출되지 않으면, 실제 개인 스타일의 이미지가 디스플레이된다.
도 6b는 본 개시 내용의 적어도 하나의 실시예에 의해 제공되는 비디오 처리 방법을 달성하기 위한 링크의 개략도이다.
도 6b에 도시된 바와 같이, 이 링크는 소품 패키지(prop package), 렌더링 툴킷(rendering toolkit), 비디오 편집기(video editor) 및 운영 체제(operating system)를 포함할 수 있다.
예를 들어, 소품 패키지(prop package)는 소품(prop)이 가지는 기능을 구현하기 위해 사용되는 프로그램 패키지일 수 있다. 이 소품에는 페이지 넘기기 효과를 디스플레이하는 등의 기능이 있다.
렌더링 툴킷은, 예를 들어 소품에 의해 처리된 비디오를 렌더링하고 렌더링된 결과를 비디오 편집기로 전송할 수 있다. 예를 들어, 비디오 편집기는 운영 체제에서 실행되는 애플리케이션을 통해 페이지 넘기기 효과를 디스플레이하기 위해 처리된 비디오가 운영 체제와 호환되도록 렌더링된 결과를 편집 및 처리할 수 있다.
본 개시의 일부 실시예에서, 비디오 처리 방법은 캡처 종료 명령 또는 캡처 일시중지 명령 수신에 응답하여 비디오 처리 파라미터를 초기화하는(initializing) 단계를 더 포함할 수 있다.
도 6c는 본 개시의 적어도 하나의 실시예에 의해 제공되는 초기화의 흐름도이다.
도 6c에 도시된 바와 같이, 초기화 동작은 S620~S670 단계를 포함할 수 있다.
단계 S620: 촬영 개시 여부를 결정한다. 촬영 시작이란, 예를 들어, 사용자가 촬영 버튼을 클릭하여 촬영 모드로 진입하는 것을 의미할 수 있다.
촬영이 시작되지 않으면, S630 단계로 진행한다. 촬영이 시작되면, S670~S680 단계로 진행한다.
단계 S630: 촬영 상태가 촬영 종료인지 촬영 일시정지인지 결정한다.
촬영 상태가 촬영 종료 또는 촬영 일시정지인 경우 S640~S680 단계로 진행한다. 촬영 상태가 촬영 종료 또는 촬영 일시 정지가 아니면 S680 단계로 진행한다.
단계 S640: 소품 패키지 및 렌더링 툴킷을 재설정하기 위해 초기화 메시지를 전송하여, 소품 패키지 및 렌더링 툴킷의 비디오 처리 파리미터를 초기화한다.
단계 S650: 비디오 편집기를 재설정한다. 예를 들어, 비디오 편집기의 비디오 처리 파리미터가 초기화될 수 있다.
단계 S660: 애플리케이션을 재설정한다. 예를 들어, 애플리케이션은 실제 개인 스타일로 이미지를 디스플레이하는 상태로 재설정될 수 있다.
단계 S670: 촬영 상태를 업데이트한다. 예를 들어, 단계 S620이 "예"이면 촬영 상태로 진입하고, 제1 트리거링 이벤트에 대응하여 페이지 넘기기 효과를 디스플레이한다. S620 단계가 "아니오"이고 S630 단계가 "예"이면, S640~S660 단계를 수행한 후, 촬영을 일시정지하거나 촬영을 종료하도록 촬영 상태를 업데이트한다.
도 7은 본 개시의 적어도 하나의 실시예에 의해 제공되는 비디오 처리 장치의 개략적인 블록도이다.
예를 들어, 도 7에 도시된 바와 같이, 비디오 처리 장치(video processing apparatus)(700)는 디스플레이 유닛(display unit)(710) 및 전환 유닛(switching unit)(720)을 포함한다.
디스플레이 유닛(710)은 초기 이미지를 디스플레이하도록 구성된다. 예를 들어, 초기 이미지는 제1 스타일 이미지를 포함하고, 제1 스타일 이미지는 캡쳐된 이미지를 기반으로 획득된 이미지다. 디스플레이 유닛(710)은, 예를 들어 위의 도 1a을 참조하여 S10 단계를 수행할 수 있다.
전환 유닛(switching unit)(720)은 제1 트리거링 이벤트에 응답하여 이미지 전환 애니메이션을 디스플레이하도록 구성된다. 이미지 전환 애니메이션은 초기 이미지에서 타겟 이미지로 전환하는 동적 프로세스를 보여주기 위해 사용된다. 예를 들어, 타겟 이미지는 제2 스타일 이미지를 포함하고, 제2 스타일 이미지는 캡쳐된 이미지에 기초하여 획득된 이미지다. 제1 스타일 이미지와 제2 스타일 이미지는 서로 다른 스타일의 이미지다. 전환 유닛(720)은, 예를 들어 위의 도 1a를 참조하여 S20 단계를 수행할 수 있다.
디스플레이 유닛(710)은 이미지 전환 애니메이션의 디스플레이 완료에 응답하여 타겟 이미지를 디스플레이하도록 더 구성된다. 디스플레이 유닛(710)은, 예를 들어 위의 도 1a를 참조하여 S30 단계를 수행할 수도 있다.
이미지 전환 애니메이션의 전환 이미지(switching image)는 제1 이미지 영역(first image area), 제2 이미지 영역(a second image area) 및 제3 이미지 영역(third image area)을 포함하고, 제1 이미지 영역은 제2 이미지 영역과 제3 이미지 영역 사이에 위치되고, 제1 이미지 영역은 동적 프로세스 동안 위치 이동을 통해 시분할 방식으로 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 위치 이동 중에 형상 변화(shape change)를 겪고, 제1 이미지 영역은 전환 자료를 디스플레이 데 사용되고, 제2 이미지 영역은 초기 이미지의 일부를 디스플레이하는 데 사용되고, 초기 이미지의 일부는 제2 이미지 영역이 위치되는 위치에 있고, 제3 이미지 영역은 타겟 이미지의 일부를 디스플레이하는 데 사용되고, 타겟 이미지의 일부는 제3 이미지 영역이 위치된 위치에 있다.
예를 들어, 디스플레이 유닛(710) 및 전환 유닛(720)은 하드웨어, 소프트웨어, 펌웨어 또는 이들의 조합일 수 있다. 예를 들어, 디스플레이 유닛(710) 및 전환 유닛(720)은 전용 또는 범용 회로, 칩 또는 장치일 수 있거나, 프로세서 및 메모리의 조합일 수 있다. 위에서 언급한 각 유닛의 구체적인 구현 형상에 대해 본 개시의 실시예는 이를 제한하지 않는다.
본 개시의 실시예에서 비디오 처리 장치(700)의 각 유닛은 전술한 비디오 처리 방법의 각 단계에 대응한다는 점에 유의해야 한다. 비디오 처리 장치(700)의 특정 기능에 대해서는 비디오 처리 방법의 관련 설명을 참조하고 자세한 내용은 여기서 반복하지 않는다. 도 7에 도시된 비디오처리장치(700)의 구성요소 및 구조는 예시일 뿐 제한적이지 않다. 비디오 처리 장치(700)는 필요에 따라 다른 구성요소 및 구조를 더 포함할 수 있다.
본 개시의 적어도 하나의 실시예는 또한 전자 디바이스를 제공하고, 전자 디바이스는 프로세서 및 메모리를 포함하고, 메모리는 하나 이상의 컴퓨터 프로그램 모듈(computer program module)을 포함한다. 하나 이상의 컴퓨터 프로그램 모듈은 메모리에 저장되고 프로세서에 의해 실행되도록 구성되고, 하나 이상의 컴퓨터 프로그램 모듈은 전술한 비디오 처리 방법을 구현하기 위한 명령들(instructions)을 포함한다. 이 전자 디바이스는 다양한 이미지 스타일로 비디오 클립을 준비하는 사용자의 복잡성을 줄이고, 다양한 이미지 스타일의 비디오 클립 간 전환을 더 매끄럽게 만들고, 비디오 클립을 전환하는 새로운 방법을 제공하고, 사용자 경험을 개선할 수 있다.
도 8a는 본 개시의 일부 실시예에 의해 제공되는 전자 디바이스의 개략적인 블록도이다. 도 8a에 도시된 바와 같이, 전자 디바이스(electronic device)(800)는 프로세서(processor(810) 및 메모리(memory)(820)를 포함한다. 메모리(820)는 비휘발성 컴퓨터 판독가능 명령들(non-volatile computer-readable instructions)(예를 들어, 하나 이상의 컴퓨터 프로그램 모듈)을 저장하는 데 사용된다. 프로세서(810)는 비휘발성 컴퓨터 판독가능 명령들을 실행하는 데 사용되고, 비휘발성 컴퓨터 판독가능 명령들이 프로세서(810)에 의해 실행되는 경우 전술한 비디오 처리 방법이 실행된다. 메모리(820)와 프로세서(810)는 버스 시스템 및/또는 다른 형태의 연결 메커니즘(미도시)을 통해 상호 연결될 수 있다.
예를 들어, 프로세서(810)는 중앙 처리 장치(CPU), 그래픽 처리 장치(GPU), 또는 데이터 처리 및/또는 프로그램 실행 능력을 가진 다른 형상의 처리 장치일 수 있다. 예를 들어 중앙 처리 장치(CPU)는 X86 또는 암(ARM) 아키텍처일 수 있다. 프로세서(810)는 원하는 기능을 수행하도록 전자 디바이스(800)의 다른 구성요소를 제어할 수 있는 범용 또는 전용 프로세서일 수 있다.
예를 들어, 메모리(820)는 하나 이상의 컴퓨터 프로그램 제품(computer program products)의 임의의 조합을 포함할 수 있고, 컴퓨터 프로그램 제품은 휘발성 메모리 및/또는 비휘발성 메모리와 같은 다양한 형상의 컴퓨터 판독가능 저장 매체를 포함할 수 있다. 휘발성 메모리는, 예를 들면, 램(RAM) 및/또는 캐시 등을 포함할 수 있다. 비휘발성 메모리는 예를 들어, 리드 온리 메모리(Read-Only Memory)(ROM), 하드디스크, 삭제가능 프로그래머블 리드 온리 메모리(Erasable Programmable Read-Only Memory)(EPROM), 포터블 컴팩드 디스크 리드온리 메모리(Portable Compact Disc Read-Only Memory)(CD-ROM), USB 메모리, 플래시 메모리 등을 포하할 수 있다. 하나 이상의 컴퓨터 프로그램 모듈은 컴퓨터 판독가능 저장 매체(computer-readable storage medium)에 저장될 수 있고, 프로세서(810)는 전자 디바이스(800)의 다양한 기능을 수행하기 위해 하나 이상의 컴퓨터 프로그램 모듈을 실행할 수 있다. 또한, 컴퓨터 판독가능 저장 매체에는 다양한 애플리케이션, 다양한 데이터, 그리고 애플리케이션에서 사용 및/또는 생성되는 다양한 데이터가 저장될 수 있다.
본 개시의 실시예에서 전자 디바이스(800)의 구체적인 기능 및 기술적 효과는 비디오 처리 방법에 대한 설명을 참조할 수 있고, 여기서는 상세한 설명을 반복하지 않는다.
도 8b는 본 개시의 일부 실시예에 의해 제공되는 다른 전자 디바이스의 개략적인 블록도이다. 전자 디바이스(900)는 예를 들어, 본 개시의 실시예에 의해 제공되는 비디오 처리 방법을 구현하는 데 적합하다. 전자 디바이스(900)는 단말 장치(terminal device 등일 수 있다. 도 9에 도시된 전자 디바이스(900)는 도 8b는 예시일 뿐이고 본 개시의 실시예의 기능 및 사용 범위에 어떠한 제한도 부과하지 않는다.
도 8b에 도시된 바와 같이, 전자 디바이스 900은 처리 장치(예를 들어, 중앙 처리 장치, 그래픽 프로세서 등)를 포함할 수 있고, 이는 리드 온리 메모리(read-only memory)(ROM)(920)에 저장된 프로그램 또는 저장 장치(980)로부터 랜덤 액세스 메모리(random-access memory)(RAM)(930)으로 로드된 프로그램에 따라 다양한 적절한 동작 및 프로세스를 수행할 수 있다. RAM(930)에는 전자 디바이스(900)의 동작에 필요한 각종 프로그램 및 데이터도 저장된다. 처리 장치(910), ROM(920) 및 RAM(930)은 버스(940)를 통해 서로 연결된다. 입/출력(I/O) 인터페이스(interface)(950)도 버스(bus)(940)에 연결된다.
일반적으로, 다음의 장치들이 I/O 인터페이스(950)에 연결될 수 있고: 예를 들어, 터치 스크린, 터치패드, 키보드, 마우스, 카메라, 마이크, 가속도계, 자이로스코프 등을 포함하는 입력 장치(960); 예를 들어 액정 디스플레이(LCD), 스피커, 바이브레이터 등을 포함하는 출력 장치(output apparatus)(970); 예를 들어, 자기 테이프, 하드 드라이브 등을 포함하는 저장 장치(storage apparatus)(980); 그리고 통신 장치(communication apparatus)(990). 통신 장치(990)는 전자 디바이스(900)가 다른 전자 디바이스와 무선 또는 유선 통신을 수행하여 데이터를 교환하도록 할 수 있다. 비록 도 8b는 다양한 장치를 갖는 전자 디바이스(900)를 도시하지만, 모든 도시된 장치를 구현하거나 가질 필요는 없으며, 전자 디바이스(900)는 대안적으로 더 많거나 더 적은 장치를 구현하거나 가질 수 있음을 이해해야 한다.
예를 들어, 본 개시의 실시예에 따르면, 위의 비디오 처리 방법은 컴퓨터 소프트웨어 프로그램으로 구현될 수 있다. 예를 들어, 본 개시의 실시예는 비휘발성 컴퓨터 판독가능 매체에 실린 컴퓨터 프로그램을 포함하는 컴퓨터 프로그램 제품을 포함한다. 컴퓨터 프로그램은 전술한 비디오 처리 방법을 실행하기 위한 프로그램 코드를 포함한다. 이러한 실시예에서, 컴퓨터 프로그램은 통신 장치(communication apparatus)(990)를 통해 네트워크로부터 다운로드되어 설치되거나, 저장 장치(storage apparatus)(980)로부터 설치되거나, ROM(920)으로부터 설치될 수 있다. 컴퓨터 프로그램이 처리 장치(910)에 의해 실행되면, 본 개시의 실시예에서 제공하는 비디오 처리 방법에서 정의된 기능이 구현될 수 있다.
본 개시의 적어도 하나의 실시예는 또한 비휘발성 컴퓨터 판독가능 명령들을 저장하기 위한 컴퓨터 판독가능 저장 매체를 제공하며, 컴퓨터 판독가능 저장 매체는 비휘발성 컴퓨터 판독가능 명령들을 저장하도록 구성되고, 비휘발성 컴퓨터 판독가능 명령은 컴퓨터에 의해 실행되고, 컴퓨터는 위에서 설명한 비디오 처리 방법을 달성한다. 이 컴퓨터 판독가능 저장 매체를 사용하면 다양한 이미지 스타일의 비디오 클립을 준비하는 사용자의 복잡성을 줄이고 다양한 이미지 스타일의 비디오 클립 간 전환을 원활하게 할 수 있고 비디오 클립을 전환하는 새로운 방법을 제공하고 사용자 경험을 향상시킬 수 있다.
도 9는 본 개시의 일부 실시예에 의해 제공되는 저장 매체의 개략도이다. 도 9에 도시된 바와 같이, 저장 매체(storage medium)(1000)는 비휘발성 컴퓨터 판독가능 명령들(non-volatile computer-readable instructions)(1010)을 저장하는 데 사용된다. 예를 들어, 비휘발성 컴퓨터 판독가능 명령들(1010)이 컴퓨터에 의해 실행될 때, 전술한 비디오 처리 방법에 따른 하나 이상의 단계가 실행될 수 있다.
예를 들어, 저장 매체(1000)는 상술한 전자 디바이스(800)에 적용될 수 있다. 예를 들어, 저장 매체(1000)는 도 8a에 도시된 전자 디바이스(800)의 메모리(820)일 수 있다. 예를 들어, 저장 매체(1000)에 대한 설명은 도 8a에 도시된 전자 디바이스(800)의 메모리(820)에 대한 설명을 참조할 수 있으므로, 세부 사항은 여기에서 반복되지 않는다.
본 개시의 맥락에서, 컴퓨터 판독가능 매체는 명령 실행 시스템, 장치, 장치에 의해 또는 명령 실행 시스템, 장치 또는 장치와 조합하여 사용하기 위한 프로그램을 포함하거나 저장할 수 있는 유형의 매체일 수 있음에 유의해야 한다. 컴퓨터 판독가능 매체는 컴퓨터 판독가능 신호 매체, 컴퓨터 판독가능 저장 매체, 또는 위 두 가지의 조합일 수 있다. 컴퓨터 판독가능 저장 매체는 예를 들어 시스템, 장치 또는 전기, 자기, 빛, 전자기, 적외선 또는 반도체, 또는 이들의 조합일 수 있지만 이에 제한되지 않다. 컴퓨터 판독가능 저장 매체의 보다 구체적인 예는, 하나 이상의 와이어와의 전기적 연결, 휴대용 컴퓨터 디스크, 하드 드라이브, 랜덤 액세스 메모리(Random Access Memory)(RAM), 리드 온리 메모리(Read-Only Memory)(ROM), 삭제가능 프로그래머블 리드 온리 메모리(erasable programmable read-only memory)(EPROM 또는 플래시 메모리), 광섬유, 휴대용 컴팩트 디스크 읽기 전용 메모리(CD-ROM), 광학 저장 장치, 자기 저장 장치 또는 이들의 적절한 조합을 포함할 수 있으나, 이에 제한되지 않는다. 본 개시에서, 컴퓨터 판독가능 매체는 명령 실행 시스템, 장치 또는 장치에 의해 또는 조합되어 사용될 수 있는 프로그램을 포함하거나 저장하는 모든 유형의 매체일 수 있다. 본 개시에서 컴퓨터 판독가능 신호 매체(computer-readable signal media)는 컴퓨터 판독가능 프로그램 코드가 실린 베이스밴드 또는 반송파의 일부로 전파되는 데이터 신호를 포함할 수 있다. 전파된 데이터 신호는 전자기 신호, 광학 신호 또는 이들의 적절한 조합을 포함하지만 이에 제한되지 않는 다양한 형상를 취할 수 있다. 컴퓨터 판독가능 신호 매체는 명령 실행 시스템, 장치 또는 장치에 의해 또는 이들과 조합하여 사용하기 위한 프로그램을 전송, 전파 또는 전송할 수 있는 컴퓨터 판독가능 저장 매체 이외의 임의의 컴퓨터 판독가능 매체일 수도 있다. 컴퓨터 판독가능 매체에 포함된 프로그램 코드는 와이어, 광 케이블, RF(무선 주파수) 등 또는 이들의 적절한 조합을 포함하지만 이에 제한되지 않는 임의의 적절한 매체를 사용하여 전송될 수 있다.
일부 구현에서 클라이언트와 서버는 하이퍼텍스트 트랜스퍼 프로토콜(Hypertext Transfer Protocol)(HTTP)과 같은 현재 알려지거나 미래에 개발될 네트워크 프로토콜을 사용하여 통신할 수 있고 디지털 데이터 통신의 모든 형태 또는 매체(예를 들어, 통신 네트워크)와 상호 연결할 수 있다. 통신 네트워크의 예에는 근거리 통신망("LAN"), 광역 통신망("WAN"), 인터넷(예를 들어, 인터넷) 및 종단 간 네트워크(예를 들어, 애드혹 종단 간 네트워크), 현재 알려지거나 미래에 개발될 모든 네트워크를 포함한다.
상술한 컴퓨터 판독가능 매체는 상술한 전자 디바이스에 포함될 수 있고; 또는 전자 디바이스에 조립되지 않고 별도로 존재할 수도 있다.
본 개시에서 동작들을 실행하기 위한 컴퓨터 프로그램 코드들은 하나 이상의 프로그래밍 언어 또는 이들의 조합으로 기록될 수 있다. 프로그래밍 언어(programming language)는 자바(Java), 스몰톡(Smalltalk), C++와 같은 객체 지향 프로그래밍 언어를 포함하지만 이에 제한되지 않으며, 또한 "C" 또는 유사한 프로그래밍 언어와 같은 기존의 절차적 프로그래밍 언어도 포함한다. 프로그램 코드는 사용자 컴퓨터에서 완전히 실행되거나, 사용자 컴퓨터에서 부분적으로 실행되거나, 독립 실행형 소프트웨어 패키지로 실행되거나, 사용자 컴퓨터에서 부분적으로 실행되고 원격 컴퓨터에서 부분적으로 실행되거나, 원격 컴퓨터 또는 서버에서 완전히 실행될 수 있다. 원격 컴퓨터와 관련된 경우에서, 원격 컴퓨터는 로컬 에리어 네트웍(Local Area Network)(LAN) 또는 광역 네트웍(Wide Area Network)(WAN)을 포함하는 임의의 유형의 네트워크를 통해 사용자의 컴퓨터에 연결될 수 있거나, 외부 컴퓨터(예를 들어, 인터넷을 통해 연결되는 인터넷 서비스 제공자를 사용하여)에 연결될 수 있다.
첨부된 도면에서의 흐름도 및 블록도는 본 개시의 다양한 실시예에 따른 시스템, 방법 및 컴퓨터 프로그램 제품의 아키텍처, 기능 및 조작을 설명한다. 이 점에서, 플로우 차트 또는 블록도에서의 각각의 블록은 지정된 논리 기능(들)을 구현하기 위한 하나 이상의 실행가능 코드를 포함하는 모듈, 프로그램 세그먼트 또는 명령(instruction)의 일부를 나타낼 수 있다. 일부 대안적인 구현에서, 블록에 표시된 기능은 첨부된 도면에 표시된 것과 다른 순서로 발생할 수도 있음에 유의해야 한다. 예를 들어, 두 개의 연속된 표시된 블록이 실제로 병렬로 실행될 수 있으며, 때로는 관련된 기능에 따라 반대 순서로 실행될 수도 있다. 또한 블록도 및/또는 순서도의 각 블록, 블록도 및/또는 순서도의 블록 조합은 지정된 기능 또는 작업을 수행하는 전용 하드웨어 기반 시스템의 사용에 의해 구현될 수 있거나 전용 하드웨어 및 컴퓨터 명령의 조합의 사용에 의해 구현될 수 있음을 유의해야 한다.
본 개시의 실시예에서 설명된 포함된 유닛은 소프트웨어 또는 하드웨어를 통해 구현될 수 있다. 어떤 경우에, 유닛의 이름이 유닛 자체에 대한 제한을 구성하지 않다.
여기서 기술된 기능은 하나 이상의 하드웨어 로직 컴포넌트에 의해 적어도 부분적으로 실행될 수 있다. 예를 들어, 비제한적으로, 사용될 수 있는 예시적인 유형의 하드웨어 로직 컴포넌트는 다음을 포함한다: 필드 프로그램머블 게이트 어레이(Field Programmable Gate Array)(FPGA), 애플리케이션 특정 집적 회로(Application Specific Integrated Circuit)(ASIC), 애플리케이션 특정 표준 제품(Application Specific Standard Product)(ASSP), 온칩시스템(On Chip System)(SOC), 컴플랙스 프로그래머블 로직 장치(Complex Programmable Logic Device)(CPLD) 등.
다음 진술에 유의해야 한다:
(1) 본 발명의 실시예와 관련된 첨부 도면은 본 발명의 실시예와 관련된 구조만을 포함하고, 다른 구조(들)는 공통 디자인(들)을 참조할 수 있다.
(2) 상충하지 않는 경우, 본 개시의 실시예와 실시예의 특징은 새로운 실시예를 획득하기 위해 서로 조합할 수 있다.
이상에서 설명한 것은 본 개시의 구체적인 구현예에 불과하며, 본 개시의 보호 범위가 이에 제한되는 것은 아니다. 따라서, 본 개시의 보호범위는 청구범위의 보호범위에 근거하여야 한다.

Claims (12)

  1. 비디오 처리 방법에서,
    상기 방법은,
    초기 이미지를 디스플레이하는 단계,
    타겟 객체의 제1 트리거링 이벤트의 검출에 응답하여, 이미지 전환 애니메이션을 디스플레이하는 단계,
    상기 이미지 전환 애니메이션 디스플레이의 완료에 응답하여, 타겟 이미지를 디스플레이하는 단계
    를 포함하고,
    상기 초기 이미지는,
    제1 스타일 이미지를 포함하고,
    상기 제1 스타일 이미지는,
    실시간으로 촬영한 상기 타겟 객체의 캡쳐된 이미지에 기초하여 획득된 이미지고,
    상기 이미지 전환 애니메이션은,
    상기 초기 이미지에서 상기 타겟 이미지로 전환하는 동적 프로세스를 보여주기 위해 사용되고,
    상기 타겟 이미지는,
    제2 스타일 이미지를 포함하고,
    상기 제2 스타일 이미지는,
    실시간으로 촬영한 상기 타겟 이미지의 캡쳐된 이미지에 기초하여 획득된 이미지고,
    상기 제1 스타일 이미지와 상기 제2 스타일 이미지는,
    서로 다른 스타일의 이미지고,
    상기 이미지 전환 애니메이션의 전환 이미지는,
    제1 이미지 영역, 제2 이미지 영역 및 제3 이미지 영역을 포함하고,
    상기 제1 이미지 영역은,
    상기 제2 이미지 영역과 상기 제3 이미지 영역 사이에 위치되고,
    상기 제1 이미지 영역은,
    상기 동적 프로세스 동안 위치 이동을 통해 시분할 방식으로 상기 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 상기 위치 이동 중에 형상 변화를 겪고,
    상기 위치 이동에서의 상기 형상 변화는,
    상기 초기 이미지에서 모서리를 접어서 생긴 주름과 상기 모서리가 접힌 위치에 따라 획득되고,
    상기 제1 이미지 영역은,
    전환 자료를 디스플레이하는 데 사용되고,
    상기 제2 이미지 영역은,
    상기 초기 이미지의 일부를 디스플레이하는 데 사용되고,
    상기 초기 이미지의 상기 일부는,
    상기 제2 이미지 영역이 위치되는 위치에 있고,
    상기 제3 이미지 영역은,
    상기 타겟 이미지의 일부를 디스플레이하는 데 사용되고,
    상기 타겟 이미지의 상기 일부는,
    상기 제3 이미지 영역이 위치된 위치에 있고,
    상기 제2 이미지 영역이 위치되는 상기 위치에서 상기 초기 이미지의 상기 일부와 상기 제3 이미지 영역이 위치되는 상기 위치에서 상기 타겟 이미지의 상기 일부는,
    상기 타겟 객체를 동시에 촬영함으로써 획득되는
    방법.
  2. 제1항에 있어서,
    상기 제1 트리거링 이벤트는,
    제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 상기 캡쳐된 이미지의 상기 타겟 객체에 의해 미리설정된 팔다리 동작을 제시하는(presenting) 단계,
    검출되어 획득된 제1 스타일 이미지 또는 미리설정된 음성을 수신함에 기초하여 상기 캡쳐된 이미지의 상기 타겟 객체에 의해 미리설정된 얼굴 동작(facial action)을 제시하는 단계
    중 적어도 하나를 포함하는
    방법.
  3. 제2항에 있어서,
    상기 동적 프로세스 동안 상기 제1 이미지 영역의 상기 위치 이동의 변위 속도 및 상기 제1 이미지 영역의 상기 형상 변화의 변형 속도는,
    상기 제1 트리거링 이벤트에 기초하여 결정되는
    방법.
  4. 제3항에 있어서,
    상기 제1 트리거링 이벤트가, 상기 제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 상기 캡쳐된 이미지의 타겟 객체에 의해 미리설정된 팔다리 동작을 제시하는 단계를 포함하는 경우,
    상기 동적 프로세스 동안 상기 제1 이미지 영역의 상기 위치 이동의 상기 변위 속도 및 상기 형상 변화의 상기 변형 속도는,
    상기 미리설정된 팔다리 동작의 동작 범위에 기초하여 결정되고;
    상기 제1 트리거링 이벤트가, 상기 제1 스타일 이미지가 검출되어 획득되는 것에 기초하여 상기 캡쳐된 이미지의 상기 타겟 객체에 의해 미리설정된 얼굴 동작을 제시하는 단계를 포함하는 경우,
    상기 동적 프로세스 동안 상기 제1 이미지 영역의 상기 위치 이동의 상기 변위 속도 및 상기 형상 변화의 상기 변형 속도는,
    상기 미리설정된 얼굴 동작의 변형 범위에 기초하여 결정되고; 및
    상기 제1 트리거링 이벤트가, 상기 미리설정된 음성을 수신하는 단계를 포함하는 경우,
    상기 동적 프로세스 동안 상기 제1 이미지 영역의 상기 위치 이동의 상기 변위 속도 및 상기 형상 변화의 상기 변형 속도는,
    상기 미리설정된 음성의 속도, 상기 미리설정된 음성의 음량 또는 상기 미리설정된 음성의 내용 중 적어도 하나에 기초하여 결정되는
    방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 스타일 이미지는,
    상기 제1 스타일 이미지가 획득된 것에 기초한 상기 캡쳐된 이미지고,
    상기 제2 스타일 이미지는,
    상기 제2 스타일 이미지가 획득된 것에 기초한 상기 캡쳐된 이미지 상에 스타일 트랜스퍼를 수행하여 획득된 이미지인
    방법.
  6. 제5항에 있어서,
    상기 제2 스타일 이미지는,
    상기 제2 스타일 이미지가 획득된 것에 기초하여 상기 캡쳐된 이미지를 스타일 트랜스퍼 모델에 입력하고, 상기 스타일 트랜스퍼 모델로부터 출력함으로써 획득된 이미지고, 및
    상기 스타일 트랜스퍼 모델은,
    샘플 이미지를 통해 기계 학습 모델을 훈련함으로써 획득되고,
    상기 샘플 이미지는,
    원본 이미지와 트랜스퍼 이미지를 포함하고,
    상기 원본 이미지는,
    샘플 객체를 촬영하여 획득된 이미지고, 및
    상기 트랜스퍼 이미지는,
    상기 샘플 객체에 스타일 생성을 수행하여 획득된 이미지인
    방법.
  7. 제1항에 있어서,
    상기 이미지 전환 애니메이션의 디스플레이 프로세서 동안 발생하는 제2 트리거링 이벤트에 응답하여,
    상기 동적 프로세스를 중지하도록 제어하고 상기 동적 프로세스가 중지되는 순간에 대응하는 상기 이미지 전환 애니메이션의 이미지를 디스플레이하는
    방법.
  8. 제1항에 있어서,
    상기 초기 이미지는,
    제1 미리설정된 이미지
    를 더 포함하고,
    상기 제1 미리설정된 이미지는,
    상기 제1 스타일 이미지를 둘러싸고,
    상기 타겟 이미지는,
    제2 미리설정된 이미지를 더 포함하고,
    상기 제2 미리설정된 이미지는,
    상기 제2 스타일 이미지를 둘러싸는
    방법.
  9. 제1항에 있어서,
    상기 이미지 전환 애니메이션은,
    제1 캔버스 레이어, 제2 캔버스 레이어, 제3 캔버스 레이어에 이미지 렌더링을 수행하여 디스플레이되고,
    상기 제2 캔버스 레이어는,
    상기 제1 캔버스 레이어보다 디스플레이 측에 더 가깝고,
    상기 제3 캔버스 레이어는,
    상기 제2 캔버스 레이어보다 상기 디스플레이 측에 더 가깝고,
    상기 전환 자료는,
    상기 제3 캔버스 레이어에 렌더링되고,
    상기 제2 이미지 영역이 위치된 상기 위치의 상기 초기 이미지 상기 일부는,
    상기 제2 캔버스 레이어에 렌더링되고,
    상기 제3 이미지 영역이 위치된 상기 위치에 있는 상기 타겟 이미지의 상기 일부는,
    상기 제1 캔버스 레이어에 렌더링되고; 및
    렌더링 및 디스플레이되지 않은 상기 제1 캔버스 레이어, 상기 제2 캔버스 레이어 및 상기 제3 캔버스 레이어의 영역은,
    투명한
    방법.
  10. 비디오 처리 장치에 있어서,
    초기 이미지를 디스플레이하도록 구성된 디스플레이 유닛, 및
    타겟 객체의 제1 트리거링 이벤트의 검출에 응답하여, 이미지 전환 애니메이션을 디스플레이하도록 구성된 전환 유닛
    을 포함하고,
    상기 초기 이미지는,
    제1 스타일 이미지를 포함하고,
    상기 제1 스타일 이미지는,
    실시간으로 촬영한 상기 타겟 객체의 캡쳐된 이미지에 기초하여 획득된 이미지고,
    상기 이미지 전환 애니메이션은,
    상기 초기 이미지에서 타겟 이미지로 전환하는 동적 프로세스를 보여주기 위해 사용되고,
    상기 타겟 이미지는,
    제2 스타일 이미지를 포함하고,
    상기 제2 스타일 이미지는,
    실시간으로 촬영한 상기 타겟 객체의 캡쳐된 이미지에 기초하여 획득된 이미지고,
    상기 제1 스타일 이미지와 상기 제2 스타일 이미지는,
    서로 다른 스타일의 이미지고,
    상기 디스플레이 유닛은,
    상기 이미지 전환 애니메이션의 디스플레이의 완료에 응답하여 상기 타겟 이미지를 디스플레이하도록 더 구성되고,
    상기 이미지 전환 애니메이션의 전환 이미지는,
    제1 이미지 영역, 제2 이미지 영역 및 제3 이미지 영역을 포함하고,
    상기 제1 이미지 영역은,
    상기 제2 이미지 영역과 상기 제3 이미지 영역 사이에 위치되고, 상기 제1 이미지 영역은,
    상기 동적 프로세스 동안 위치 이동을 통해 시분할 방식으로 상기 이미지 전환 애니메이션의 전체 이미지 영역을 커버하고, 상기 위치 이동 중에 형상 변화를 겪고, 및
    상기 위치 이동에서의 상기 형상 변화는,
    상기 초기 이미지에서 모서리를 접어서 생긴 주름과 상기 모서리가 접힌 위치에 따라 획득되고,
    상기 제1 이미지 영역은,
    전환 자료를 디스플레이하는 데 사용되고,
    상기 제2 이미지 영역은,
    상기 초기 이미지의 일부를 디스플레이하는 데 사용되고,
    상기 초기 이미지의 상기 일부는,
    상기 제2 이미지 영역이 위치되는 위치에 있고,
    상기 제3 이미지 영역은,
    상기 타겟 이미지의 일부를 디스플레이하는 데 사용되고,
    상기 타겟 이미지의 상기 일부는,
    상기 제3 이미지 영역이 위치된 위치에 있고, 및
    상기 제2 이미지 영역이 위치되는 상기 위치에서 상기 초기 이미지의 상기 일부와 상기 제3 이미지 영역이 위치되는 상기 위치에서 상기 타겟 이미지의 상기 일부는,
    상기 타겟 객체를 동시에 촬영함으로써 획득되는
    비디오 처리 장치.
  11. 전자 디바이스에 있어서,
    프로세서; 및
    하나 이상의 컴퓨터 프로그램 모듈을 포함하는 메모리
    를 포함하고,
    상기 하나 이상의 컴퓨터 프로그램 모듈은,
    상기 메모리에 저장되고 상기 프로세서에 의해 실행되도록 구성되고, 및
    상기 하나 이상의 컴퓨터 프로그램 모듈은,
    제1항에 따른 상기 비디오 처리 방법을 구현하기 위한 명령들을 포함하는
    전자 디바이스.
  12. 컴퓨터 판독가능 저장 매체에 있어서,
    상기 컴퓨터 판독가능 저장 매체는,
    비휘발성 컴퓨터 판독가능 명령들을 저장하도록 구성되고,
    상기 비휘발성 컴퓨터 판독가능 명령들이 컴퓨터에 의해 실행되는 경우, 제1항에 따른 비디오 처리 방법이 구현되는
    컴퓨터 판독가능 저장 매체.
KR1020237019199A 2020-12-30 2021-11-25 비디오 처리 방법, 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체 KR102655049B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011609158.0A CN112764845B (zh) 2020-12-30 2020-12-30 视频处理方法及装置、电子设备和计算机可读存储介质
CN202011609158.0 2020-12-30
PCT/CN2021/133179 WO2022142906A1 (zh) 2020-12-30 2021-11-25 视频处理方法及装置、电子设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
KR20230093337A KR20230093337A (ko) 2023-06-27
KR102655049B1 true KR102655049B1 (ko) 2024-04-04

Family

ID=75697586

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237019199A KR102655049B1 (ko) 2020-12-30 2021-11-25 비디오 처리 방법, 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체

Country Status (7)

Country Link
US (1) US11954781B2 (ko)
EP (1) EP4242840A4 (ko)
JP (1) JP7395070B1 (ko)
KR (1) KR102655049B1 (ko)
CN (1) CN112764845B (ko)
AU (1) AU2021415514A1 (ko)
WO (1) WO2022142906A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112764845B (zh) * 2020-12-30 2022-09-16 北京字跳网络技术有限公司 视频处理方法及装置、电子设备和计算机可读存储介质
CN114428573B (zh) * 2021-12-30 2024-03-08 北京字跳网络技术有限公司 特效图像处理方法、装置、电子设备及存储介质
CN115086745B (zh) * 2022-06-30 2024-01-23 北京字跳网络技术有限公司 一种直播视频处理方法、装置、设备及介质
CN115484488B (zh) * 2022-08-23 2023-08-04 惠州拓邦电气技术有限公司 一种动画控制方法、装置及电器
CN118119919A (zh) * 2022-09-30 2024-05-31 京东方科技集团股份有限公司 显示装置以及显示方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110825286A (zh) 2019-10-30 2020-02-21 北京字节跳动网络技术有限公司 图像处理方法、装置和电子设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655766B (zh) * 2008-08-22 2012-03-28 鸿富锦精密工业(深圳)有限公司 可体现电子文档翻页效果的电子装置及其方法
JP2012027687A (ja) 2010-07-23 2012-02-09 Casio Comput Co Ltd 画像処理装置及びプログラム
CN101923435B (zh) 2010-08-24 2012-11-21 福州瑞芯微电子有限公司 电子书模拟真实翻页效果的方法
US9922439B2 (en) * 2014-07-25 2018-03-20 Samsung Electronics Co., Ltd. Displaying method, animation image generating method, and electronic device configured to execute the same
CN105404489A (zh) * 2015-11-30 2016-03-16 天脉聚源(北京)科技有限公司 切换显示图像的方法和装置
DK179948B1 (en) * 2017-05-16 2019-10-22 Apple Inc. Recording and sending Emoji
US10318889B2 (en) 2017-06-26 2019-06-11 Konica Minolta Laboratory U.S.A., Inc. Targeted data augmentation using neural style transfer
EP3782124A1 (en) * 2018-04-18 2021-02-24 Snap Inc. Augmented expression system
CN108765278B (zh) 2018-06-05 2023-04-07 Oppo广东移动通信有限公司 一种图像处理方法、移动终端及计算机可读存储介质
CN109035374B (zh) * 2018-07-13 2023-06-02 Vidaa(荷兰)国际控股有限公司 颜色渐变动画效果的实现方法及装置
DK201970530A1 (en) * 2019-05-06 2021-01-28 Apple Inc Avatar integration with multiple applications
CN110135349A (zh) 2019-05-16 2019-08-16 北京小米智能科技有限公司 识别方法、装置、设备及存储介质
CN111277893B (zh) * 2020-02-12 2021-06-25 北京字节跳动网络技术有限公司 视频处理方法、装置、可读介质及电子设备
CN111738910A (zh) * 2020-06-12 2020-10-02 北京百度网讯科技有限公司 一种图像处理方法、装置、电子设备和存储介质
CN112764845B (zh) * 2020-12-30 2022-09-16 北京字跳网络技术有限公司 视频处理方法及装置、电子设备和计算机可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110825286A (zh) 2019-10-30 2020-02-21 北京字节跳动网络技术有限公司 图像处理方法、装置和电子设备

Also Published As

Publication number Publication date
JP7395070B1 (ja) 2023-12-08
CN112764845A (zh) 2021-05-07
JP2023552591A (ja) 2023-12-18
EP4242840A1 (en) 2023-09-13
CN112764845B (zh) 2022-09-16
AU2021415514A1 (en) 2023-06-29
EP4242840A4 (en) 2024-05-15
US11954781B2 (en) 2024-04-09
KR20230093337A (ko) 2023-06-27
US20230316625A1 (en) 2023-10-05
WO2022142906A1 (zh) 2022-07-07

Similar Documents

Publication Publication Date Title
KR102655049B1 (ko) 비디오 처리 방법, 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체
WO2020186935A1 (zh) 虚拟对象的显示方法、装置、电子设备和计算机可读存储介质
JP7422876B2 (ja) 拡張現実に基づいた表示方法及び装置、並びに記憶媒体
JP2024505995A (ja) 特殊効果展示方法、装置、機器および媒体
US11587280B2 (en) Augmented reality-based display method and device, and storage medium
WO2019100932A1 (zh) 一种运动控制方法及其设备、存储介质、终端
JP7467780B2 (ja) 画像処理方法、装置、デバイス及び媒体
JP2023510443A (ja) ラベリング方法及び装置、電子機器並びに記憶媒体
JP7427786B2 (ja) 拡張現実に基づく表示方法、機器、記憶媒体及びプログラム製品
WO2022151687A1 (zh) 合影图像生成方法、装置、设备、存储介质、计算机程序及产品
JP7134558B2 (ja) 情報処理プログラム、情報処理装置、情報処理システムおよび情報処理方法
US20240163392A1 (en) Image special effect processing method and apparatus, and electronic device and computer readable storage medium
RU2801917C1 (ru) Способ и устройство для отображения изображений на основе дополненной реальности и носитель для хранения информации
US20230368452A1 (en) Interactive virtual graphics with physical objects
WO2023185968A1 (zh) 相机功能页面切换方法、装置、电子设备及存储介质
WO2022042570A1 (zh) 图像处理方法及装置
KR101439212B1 (ko) 단말 장치 및 이를 이용한 토킹 헤드 표시 방법
CN116778062A (zh) 一种视频播放方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant