CN112468728B - 一种视频合成方法、设备及计算机可读存储介质 - Google Patents

一种视频合成方法、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN112468728B
CN112468728B CN202011354362.2A CN202011354362A CN112468728B CN 112468728 B CN112468728 B CN 112468728B CN 202011354362 A CN202011354362 A CN 202011354362A CN 112468728 B CN112468728 B CN 112468728B
Authority
CN
China
Prior art keywords
video
fixed area
vector
frame
fixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011354362.2A
Other languages
English (en)
Other versions
CN112468728A (zh
Inventor
何小虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Xindatong Information Technology Co ltd
Original Assignee
Hunan Xindatong Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Xindatong Information Technology Co ltd filed Critical Hunan Xindatong Information Technology Co ltd
Priority to CN202011354362.2A priority Critical patent/CN112468728B/zh
Publication of CN112468728A publication Critical patent/CN112468728A/zh
Application granted granted Critical
Publication of CN112468728B publication Critical patent/CN112468728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2621Cameras specially adapted for the electronic generation of special effects during image pickup, e.g. digital cameras, camcorders, video cameras having integrated special effects capability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种视频合成方法、设备及计算机可读存储介质,其中,该方法包括:在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域;当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面;对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量;当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频。实现了一种背景环绕主体旋转特效的视频拍摄方案,节省了视频处理时间,降低了操作难度,提升了用户体验。

Description

一种视频合成方法、设备及计算机可读存储介质
技术领域
本发明涉及移动通信领域,尤其涉及一种视频合成方法、设备及计算机可读存储介质。
背景技术
现有技术中,随着智能终端设备的不断发展,基于智能终端设备拍摄短视频也越来越受到用户的广泛使用,在目前短视频风靡时代,如何拍摄创意短视频成为用户急切需要的功能。但是,现阶段大多数短视频的特效处理方案需要依赖短视频应用提供,短视频应用提供的特效方案较为单一且无法满足用户的进一步需求,例如,针对背景旋转的视频特效,一般的短视频应用无法提供,若用户需要实现这一类的特效,则需要借助专业的图形图像处理软件进行相应的处理,给用户带来较高的实现成本和操作难度,用户体验不佳。
发明内容
为了解决现有技术中的上述技术缺陷,本发明提出了一种视频合成方法,该方法包括:
在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域;
当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面;
对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量;
当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频。
可选地,所述在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域,包括:
在所述视频拍摄的预览界面接收用于启动旋转视频拍摄的触控指令;
根据所述触控指令在所述预览界面内生成勾画的提示性信息,同时,在所述预览界面内接收闭合的所述触控轨迹。
可选地,所述在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域,还包括:
根据所述触控轨迹确定对应的框选区域;
识别所述框选区域的相邻像素,得到与所述框选区域对应的所述固定区域。
可选地,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,包括:
对所述固定区域的像素进行三维建模;
根据所述三维建模确定坐标信息。
可选地,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,还包括:
根据所述坐标信息确定所述固定区域之外的所述非固定区域;
分别获取所述第一帧画面和实施第二帧画面。
可选地,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,还包括:
确定预设的图形模型,其中,所述图形模型包括模型矩阵、视图矩阵以及投影矩阵;
根据所述固定区域的第一帧画面以及所述图形模型构建所述三维图形。
可选地,所述对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量,包括:
对分割的所述特征区域进行编号,并根据所述编号对视频数据进行逐帧处理;
通过所述图形模型计算所述固定区域和所述非固定区域的最佳值,并根据所述最佳值计算所视频数据中每一帧画面向量,得到所述第一向量和所述第二向量。
可选地,所述当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频,包括:
确定所述第一向量和所述第二向量反馈的数值;
根据所述数值对所述视频数据进行合成,生成所述非固定区域围绕所述固定区域旋转的拍摄视频。
本发明还提出了一种视频合成设备,该设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上任一项所述的视频合成方法的步骤。
本发明还提出了一种计算机可读存储介质,该计算机可读存储介质上存储有视频合成程序,视频合成程序被处理器执行时实现如上述任一项所述的视频合成方法的步骤。
实施本发明的视频合成方法、设备及计算机可读存储介质,通过在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域;当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面;对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量;当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频。实现了一种背景环绕主体旋转的特效视频拍摄方案,节省了用户的视频处理时间,降低了操作难度,提升了用户体验。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明涉及的一种移动终端的硬件结构示意图;
图2是本发明实施例提供的一种通信网络系统架构图;
图3是本发明视频合成方法第一实施例的流程图;
图4是本发明视频合成方法第二实施例的图形变换流程图;
图5是本发明视频合成方法第二实施例的矩阵变换流程图;
图6是本发明视频合成方法第二实施例的第一图形变换过程详解图;
图7是本发明视频合成方法第二实施例的第二图形变换过程详解图;
图8是本发明视频合成方法第二实施例的图形变换关系图。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
请参阅图1,其为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(CodeDivision Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access,时分同步码分多址)、FDD-LTE(Frequency DivisionDuplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(Time DivisionDuplexing-Long Term Evolution,分时双工长期演进)等。
WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
为了便于理解本发明实施例,下面对本发明的移动终端所基于的通信网络系统进行描述。
请参阅图2,图2为本发明实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务204。
具体地,UE201可以是上述终端100,此处不再赘述。
E-UTRAN202包括eNodeB2021和其它eNodeB2022等。其中,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。
EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PCRF(Policy andCharging Rules Function,政策和资费功能实体)2036等。其中,MME2031是处理UE201和EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。
IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。
虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本发明不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统等,此处不做限定。
基于上述移动终端硬件结构以及通信网络系统,提出本发明方法各个实施例。
实施例一
图3是本发明视频合成方法第一实施例的流程图。一种视频合成方法,该方法包括:
S1、在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域;
S2、当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面;
S3、对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量;
S4、当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频。
具体的,在本实施例中,考虑到用户在拍摄创意视频,例如,将拍摄主体固定背景围绕主体转动的短片时,往往会因为抖动合成效果不好或者需要运用多台硬件设备按照时序拍照才能完成此类短片拍照,给用户带来较高的实现成本和操作难度,为了解决上述问题,本实施例只需用户在一台终端上,按滑动轨迹任意选取想要固定的图像或像素范围,然后,按照实际场景任意变动背景,最终即可自适应地合成体验较好的上述特效短片。
具体的,在本实施例中,以手机的相机拍摄为例进行说明,用户根据提示性的交互画面进行初始操作,例如,在相机预览界面用手指勾画选取固定区域像素,终端根据用户选取的区域或帧画面进行判断,计算出需要固定区域像素进行三维建模,并进行坐标判断哪些场景是属于非固定区域,通过分割对比进行运算,得到两个区域的关键向量,根据不同向量反馈的数值进行最终合成和运算,获得一个围绕固定区域旋转或移动的短视频片段。
可以看出,本实施例提供了一种方便于用户拍摄围绕固定像素区域变化的动态视频,其中,图形变换和切换算法对于用户来说是黑盒的状态,复杂算法都在后台根据用户操作对应运行,用户只需要进行简单操作,选中想要固定像素区域即可拍摄出很多创意短片,从而较大地提升用户体验。
本实施例的有益效果在于,通过在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域;当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面;对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量;当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频。实现了一种背景环绕主体旋转的特效视频拍摄方案,节省了用户的视频处理时间,降低了操作难度,提升了用户体验。
实施例二
基于上述实施例,可选地,所述在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域,包括:
在所述视频拍摄的预览界面接收用于启动旋转视频拍摄的触控指令;
根据所述触控指令在所述预览界面内生成勾画的提示性信息,同时,在所述预览界面内接收闭合的所述触控轨迹。
可选地,所述在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域,还包括:
根据所述触控轨迹确定对应的框选区域;
识别所述框选区域的相邻像素,得到与所述框选区域对应的所述固定区域。
可选地,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,包括:
对所述固定区域的像素进行三维建模;
根据所述三维建模确定坐标信息。
可选地,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,还包括:
根据所述坐标信息确定所述固定区域之外的所述非固定区域;
分别获取所述第一帧画面和实施第二帧画面。
可选地,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,还包括:
确定预设的图形模型,其中,所述图形模型包括模型矩阵、视图矩阵以及投影矩阵;
根据所述固定区域的第一帧画面以及所述图形模型构建所述三维图形。
可选地,所述对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量,包括:
对分割的所述特征区域进行编号,并根据所述编号对视频数据进行逐帧处理;
通过所述图形模型计算所述固定区域和所述非固定区域的最佳值,并根据所述最佳值计算所视频数据中每一帧画面向量,得到所述第一向量和所述第二向量。
可选地,所述当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频,包括:
确定所述第一向量和所述第二向量反馈的数值;
根据所述数值对所述视频数据进行合成,生成所述非固定区域围绕所述固定区域旋转的拍摄视频。
具体的,在本实施例中,将通过图像变换流程、图形变换过程的坐标系和单位、变换应用,三个方面对本方案的图像处理流程进行详解。
首先,关于图形变换流程。参考图4,其中,可以用照相机拍摄照片来模拟图形变换的过程,如果要对某个物体拍摄,过程如下:准备物体,把物体放置在某个合适的位置,这个过程就是模型变换(model transform);准备照相机,把照相机移动到准备拍摄的位置,这个过程就是视图变换(view transform);设置相机的焦距,或者调整缩放比例,这个过程就是投影变换(projection transform);对结果图形进行拉伸或者挤压,确定最终照片的大小,这个过程就是视口变换(viewport transform)。其中,模型变换、视图变换、投影变换是本实施例在着色器里定义和实现的,而视口变换则由图形库自动完成。其中,涉及到的矩阵变换的流程可以参考图5。
然后,关于图形变换过程的坐标系和单位。分别参考图6和图7,由图6的流程详解可以看出,在投影变换之后的处理过程,还需要将得到的齐次裁剪坐标做透视除法(除以w),做剪切和视口/深度范围变换,光栅化等处理。其中,用户/着色器变换(也即,具体详述的模型变换、视图变换和投影变换)可以参考图7的流程详解。
最后,关于变换应用。参考图8,在本实施例所提供一个三维处理方案中浏览一个三维物体时候,总是会提供给用户平移、缩放和旋转的交互操作,而这正是模型变换的内容。在图形学的范畴当中,平移变换、旋转变换属于刚体变换,缩放和旋转属于线性变换,刚体变换和线性变换又属于仿射变换,而仿射变换也可以看成投影变换的一种。也即,本实施例所利用的上述图形变换,本质上可以看成是同一种变换,在数学上,可以使用矩阵来描述这种变换,并且,为了兼容各种变换的特殊性,会在三维的基础上再加一维,使用四维的向量和矩阵。四维向量表述一个点(x,y,z,w)等价于三维向量(x/w,y/w,z/w),也即,前述所提到的齐次坐标。
具体的,在本实施例中,对于空间某个点v0(x0,y0,z0,1),经过空间图像变换后得到新的点v1(x1,y1,z1,1),那么存在这样一个4行4列的矩阵M:
Figure BDA0002802210120000131
满足:
M*V0=V1M*V0=V1
展开这个式子,有式(1):
Figure BDA0002802210120000132
Figure BDA0002802210120000133
通过以上算法,即可求得各种不同图形变换矩阵。
综上所述,本实施例的模型矩阵M,视图矩阵V,投影矩阵P,同时作用于物体的顶点,使得最终的物体能被看见或者进行UI操作。逐顶点的操作可以将其放入到顶点着色器。一般而言,先进行模型变换,再进行视图变换,最后进行投影变换:
v1=P*V*M*v0v1=P*V*M*v0
根据矩阵乘法的结合律:
v1=(P*V*M)*v0v1=(P*V*M)*v0
上述P*V*M矩阵合并得到的模型视图投影矩阵(model view projectionmatrix),简称为MVP矩阵。在实际使用过程中,只需要将这个MVP矩阵传入到顶点着色器,即可根据设置的矩阵得到想要的渲染效果。
在本实施例中,利用以上模型,通过UI操作先框选固定区域,通过图形模型算法对该区域进行固定360度拍摄,获取一个固定的三维图形。选区之外的背景像素进行另外的像素融合形成动态的画面,最终通过后期合并形成一个围绕主题旋转的短视频。
实施例三
基于上述实施例,本发明还提出了一种视频合成设备,该设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上任一项所述的视频合成方法的步骤。
需要说明的是,上述设备实施例与方法实施例属于同一构思,其具体实现过程详细见方法实施例,且方法实施例中的技术特征在设备实施例中均对应适用,这里不再赘述。
实施例四
基于上述实施例,本发明还提出了一种计算机可读存储介质,该计算机可读存储介质上存储有视频合成程序,视频合成程序被处理器执行时实现如上述任一项所述的视频合成方法的步骤。
需要说明的是,上述介质实施例与方法实施例属于同一构思,其具体实现过程详细见方法实施例,且方法实施例中的技术特征在介质实施例中均对应适用,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (8)

1.一种视频合成方法,其特征在于,所述方法包括:
在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域;
当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面;
对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量;
当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频;
所述对所述第一帧画面和所述第二帧画面进行特征区域分割,分别得到所述固定区域对应的第一向量和所述非固定区域的第二向量,包括:
对分割的所述特征区域进行编号,并根据所述编号对视频数据进行逐帧处理;
通过所述图形模型计算所述固定区域和所述非固定区域的最佳值,并根据所述最佳值计算所述视频数据中每一帧画面向量,得到所述第一向量和所述第二向量;
所述当所述视频拍摄结束后,根据所述第一向量和所述第二向量合成所述非固定区域围绕所述固定区域旋转的拍摄视频,包括:
确定所述第一向量和所述第二向量反馈的数值;
根据所述数值对所述视频数据进行合成,生成所述非固定区域围绕所述固定区域旋转的拍摄视频。
2.根据权利要求1所述的视频合成方法,其特征在于,所述在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域,包括:
在所述视频拍摄的预览界面接收用于启动旋转视频拍摄的触控指令;
根据所述触控指令在所述预览界面内生成勾画的提示性信息,同时,在所述预览界面内接收闭合的所述触控轨迹。
3.根据权利要求2所述的视频合成方法,其特征在于,所述在视频拍摄的预览界面获取勾画的触控轨迹,并根据所述触控轨迹确定相应的固定区域,还包括:
根据所述触控轨迹确定对应的框选区域;
识别所述框选区域的相邻像素,得到与所述框选区域对应的所述固定区域。
4.根据权利要求3所述的视频合成方法,其特征在于,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,包括:
对所述固定区域的像素进行三维建模;
根据所述三维建模确定坐标信息。
5.根据权利要求4所述的视频合成方法,其特征在于,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,还包括:
根据所述坐标信息确定所述固定区域之外的所述非固定区域;
分别获取所述第一帧画面和实施第二帧画面。
6.根据权利要求5所述的视频合成方法,其特征在于,所述当所述视频拍摄开始后,根据所述固定区域的第一帧画面以及预设的图形模型构建三维图形,同时,收集所述固定区域之外的非固定区域的第二帧画面,还包括:
确定预设的图形模型,其中,所述图形模型包括模型矩阵、视图矩阵以及投影矩阵;
根据所述固定区域的第一帧画面以及所述图形模型构建所述三维图形。
7.一种视频合成设备,其特征在于,所述设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的视频合成方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频合成程序,所述视频合成程序被处理器执行时实现如权利要求1至6中任一项所述的视频合成方法的步骤。
CN202011354362.2A 2020-11-27 2020-11-27 一种视频合成方法、设备及计算机可读存储介质 Active CN112468728B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011354362.2A CN112468728B (zh) 2020-11-27 2020-11-27 一种视频合成方法、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011354362.2A CN112468728B (zh) 2020-11-27 2020-11-27 一种视频合成方法、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112468728A CN112468728A (zh) 2021-03-09
CN112468728B true CN112468728B (zh) 2022-09-30

Family

ID=74808828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011354362.2A Active CN112468728B (zh) 2020-11-27 2020-11-27 一种视频合成方法、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112468728B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110716201A (zh) * 2019-09-10 2020-01-21 中国人民解放军空军工程大学 一种基于发射脉冲周期时延设计的空间旋转目标视频isar成像方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5390108A (en) * 1991-05-24 1995-02-14 Forensic Technology Wai Inc. Computer automated bullet analysis apparatus
US8941723B2 (en) * 2010-08-26 2015-01-27 Blast Motion Inc. Portable wireless mobile device motion capture and analysis system and method
CN108038820B (zh) * 2017-11-14 2021-02-02 影石创新科技股份有限公司 一种实现子弹时间拍摄效果的方法、装置及全景相机
CN112543858A (zh) * 2018-04-20 2021-03-23 夏尔特银斯公司D.B.A.涡流光学 具有直接有源分划板瞄准的观察光学镜
CN108683865A (zh) * 2018-04-24 2018-10-19 长沙全度影像科技有限公司 一种用于子弹时间特效的背景替换系统及方法
WO2020145668A1 (ko) * 2019-01-08 2020-07-16 삼성전자주식회사 3차원 컨텐츠의 처리 및 전송 방법
CN111060023B (zh) * 2019-12-12 2020-11-17 天目爱视(北京)科技有限公司 一种高精度3d信息采集的设备及方法
CN111314783B (zh) * 2020-02-17 2022-06-07 广州酷旅旅行社有限公司 视频处理的方法、装置和计算机存储介质
CN111986296B (zh) * 2020-08-20 2024-05-03 叠境数字科技(上海)有限公司 一种用于子弹时间的cg动画合成方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110716201A (zh) * 2019-09-10 2020-01-21 中国人民解放军空军工程大学 一种基于发射脉冲周期时延设计的空间旋转目标视频isar成像方法

Also Published As

Publication number Publication date
CN112468728A (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
CN107948530B (zh) 一种图像处理方法、终端及计算机可读存储介质
CN108156374B (zh) 一种图像处理方法、终端及可读存储介质
CN110072061B (zh) 一种交互式拍摄方法、移动终端及存储介质
CN108280136B (zh) 一种多媒体对象预览方法、设备及计算机可读存储介质
CN107133939A (zh) 一种照片合成方法、设备及计算机可读存储介质
CN111327840A (zh) 一种多帧特效视频获取方法、终端及计算机可读存储介质
CN108459799B (zh) 一种图片的处理方法、移动终端及计算机可读存储介质
CN111654628B (zh) 一种视频拍摄方法、设备及计算机可读存储介质
CN109194874A (zh) 拍照方法、装置、终端及计算机可读存储介质
CN109739602A (zh) 一种移动终端壁纸设置方法及装置、移动终端及存储介质
CN112995467A (zh) 图像处理方法、移动终端及存储介质
CN109710159B (zh) 一种柔性屏响应方法、设备及计算机可读存储介质
CN108055463A (zh) 图像处理方法、终端及存储介质
CN111866388B (zh) 一种多重曝光拍摄方法、设备及计算机可读存储介质
CN112511741A (zh) 一种图像处理方法、移动终端以及计算机存储介质
CN111885307A (zh) 一种景深拍摄方法、设备及计算机可读存储介质
CN112184722A (zh) 图像处理方法、终端及计算机存储介质
CN108282608B (zh) 多区域对焦方法、移动终端及计算机可读存储介质
CN110717964A (zh) 场景建模方法、终端及可读存储介质
CN112965680A (zh) 一种投屏方法、发起投屏的设备及存储介质
CN112135045A (zh) 一种视频处理方法、移动终端以及计算机存储介质
CN112598758A (zh) 一种图像处理方法、移动终端以及计算机存储介质
CN111787234A (zh) 一种拍摄控制方法、设备及计算机可读存储介质
CN112468728B (zh) 一种视频合成方法、设备及计算机可读存储介质
CN112532838B (zh) 一种图像处理方法、移动终端以及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220908

Address after: Room 1122, Qingqingjiayuan, No. 301, Shuangyong Road, Sifangping Street, Kaifu District, Changsha City, Hunan Province 410000

Applicant after: HUNAN XINDATONG INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 1801, building 2, Chongwen Park, Nanshan Zhiyuan, No. 3370, Liuxian Avenue, Fuguang community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong 518000

Applicant before: NUBIA TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant