CN112585646A - 用于对媒体执行编辑操作的方法与系统 - Google Patents
用于对媒体执行编辑操作的方法与系统 Download PDFInfo
- Publication number
- CN112585646A CN112585646A CN201980055044.5A CN201980055044A CN112585646A CN 112585646 A CN112585646 A CN 112585646A CN 201980055044 A CN201980055044 A CN 201980055044A CN 112585646 A CN112585646 A CN 112585646A
- Authority
- CN
- China
- Prior art keywords
- media
- attribute
- edit
- target
- compatible
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000012545 processing Methods 0.000 claims description 88
- 238000012546 transfer Methods 0.000 claims description 69
- 238000013527 convolutional neural network Methods 0.000 claims description 23
- 230000000694 effects Effects 0.000 description 87
- 238000010586 diagram Methods 0.000 description 53
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Multimedia (AREA)
- Processing Or Creating Images (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
提供了用于对媒体执行编辑操作的方法和系统。一种方法包括接收至少一个参考媒体和至少一个目标媒体,识别至少一个参考媒体的至少一个主编辑属性,以及执行兼容性检查以确定至少一个目标媒体与至少一个参考媒体的至少一个主编辑属性的兼容性。基于兼容性检查的结果,从至少一个主编辑属性中选择至少一个兼容编辑属性,并且将至少一个兼容编辑属性从至少一个参考媒体传送到至少一个目标媒体。
Description
技术领域
本公开总体上涉及处理媒体领域,并且更具体地,涉及基于对兼容编辑属性的选择来对媒体执行编辑操作。
背景技术
当前,存在可用于对媒体应用增强媒体美学的编辑属性(例如,各种效果/颜色、照片的艺术纹理、趣味贴纸等)的若干媒体编辑应用程序。
发明内容
技术问题
现有的媒体编辑应用程序具有其自己的编辑属性集以供选择。因此,当用户需要对新的媒体应用类似的编辑属性时,用户必须下载特定的媒体编辑应用程序并遵循用于对新的媒体应用类似的编辑属性的特定步骤。
此外,如果对媒体应用多个编辑属性(例如,效果、背景模糊、对比度等)以产生令人愉快的效果,并且用户想要对另一媒体重新创建相同的效果,则用户必须记住并在期望媒体上执行相同的步骤。这可能导致用户必须执行复杂的编辑操作。此外,由于复杂的编辑操作,所以用户可能不能对期望媒体创建类似的效果。
此外,当用户想要用通过社交媒体接收的现有内容重新创建类似的记忆时,用户可能不知道可对期望媒体创建这种效果的媒体编辑应用程序。此外,业余者或普通用户在技术上可能不知道要对媒体执行的复杂的编辑操作。
此外,现有的媒体编辑应用程序使用户能够仅执行有限的操作,诸如,将纹理从一个媒体传送到另一个媒体并查看在图像上执行的编辑操作的列表。
问题的解决方案
本公开旨在解决上述问题和缺点,并且提供至少下述的优点。
根据本公开的一个方面,提供了一种方法,该方法包括由接收单元接收至少一个参考媒体和至少一个目标媒体,其中,至少一个参考媒体包括至少一个经编辑部分;由处理引擎识别至少一个参考媒体的至少一个主编辑属性;由处理引擎执行兼容性检查,以确定至少一个目标媒体与至少一个参考媒体的至少一个主编辑属性的兼容性;由处理引擎基于兼容性检查的结果从至少一个主编辑属性中选择至少一个兼容编辑属性;以及由编辑传送引擎将所选择的至少一个兼容编辑属性从至少一个参考媒体传送到至少一个目标媒体。
根据本公开的另一方面,提供了一种电子装置,该电子装置包括配置为接收至少一个参考媒体和至少一个目标媒体的接收单元,其中,至少一个参考媒体包括至少一个经编辑部分。电子装置还包括处理引擎,处理引擎配置为识别至少一个参考媒体的至少一个主编辑属性,执行兼容性检查以确定至少一个目标媒体与至少一个参考媒体的至少一个主编辑属性的兼容性,以及基于兼容性检查的结果从至少一个主编辑属性中选择至少一个兼容编辑属性。此外,电子装置还包括编辑传送引擎,编辑传送引擎配置为将所选择的至少一个兼容编辑属性从至少一个参考媒体传送到至少一个目标媒体。
有益效果
本公开的一个方面是提供用于通过将兼容编辑属性从参考媒体传送到目标媒体来编辑目标媒体的方法和/或设备。
本公开的一个方面是提供用于选择参考媒体的兼容编辑属性以用于编辑目标媒体的方法和/或设备。
附图说明
本公开的某些实施方式的上述和其它方面、特征和优点将根据结合附图的以下描述变得显而易见,在附图中:
图1是根据实施方式的、用于对媒体执行编辑操作的系统;
图2A是示出根据实施方式的、用于选择参考媒体的兼容属性以编辑目标媒体的处理引擎的各个单元的框图;
图2B是示出根据实施方式的、用于对目标媒体应用兼容编辑属性的编辑传送引擎的各个单元的框图;
图3是示出根据实施方式的、用于对媒体执行编辑操作的方法的流程图;
图4A是示出根据实施方式的、用于选择参考媒体的主编辑属性的方法的流程图;
图4B是示出根据实施方式的、用于对目标媒体执行兼容性检查的方法的流程图;
图5是示出根据实施方式的、用于对媒体执行编辑操作的电子装置的各个模块的框图;
图6示出了根据实施方式的、包括用于确定参考媒体的编辑属性的卷积神经网络(CNN)的编辑分类器单元;
图7示出了根据实施方式的、用于选择参考媒体的兼容编辑属性并对目标媒体应用参考媒体的兼容编辑属性的处理引擎和编辑传送引擎;
图8A示出了根据实施方式的、用于将纹理属性从参考媒体传送到目标媒体的纹理单元;
图8B示出了根据实施方式的、用于将模板属性从参考媒体传送到目标媒体的模板单元;
图8C示出了根据实施方式的、用于将效果属性从参考媒体传送到目标媒体的效果单元;
图9A是示出根据实施方式的、选择参考媒体的一个或多个兼容编辑属性以编辑目标媒体的图;
图9B是示出根据实施方式的、选择参考媒体的一个或多个兼容编辑属性以编辑目标媒体的图;
图9C是示出根据实施方式的、选择参考媒体的一个或多个兼容编辑属性以编辑目标媒体的图;
图10是示出根据实施方式的、将兼容编辑属性从参考媒体传送到目标媒体的流程图;
图11A是示出根据实施方式的、选择参考媒体的至少一个主编辑属性的图;
图11B是示出根据实施方式的、选择参考媒体的至少一个主编辑属性的图;
图12A是示出根据实施方式的、对目标媒体执行的兼容性检查过程的图;
图12B是示出根据实施方式的、对目标媒体执行的兼容性检查过程的图;
图13A是示出根据实施方式的、将兼容编辑属性从参考媒体传送到目标媒体的图;
图13B是示出根据实施方式的、将兼容编辑属性从参考媒体传送到目标媒体的图;
图13C是示出根据实施方式的、将兼容编辑属性从参考媒体传送到目标媒体的图;
图14是示出根据实施方式的、控制从参考媒体传送到目标媒体的兼容编辑属性的级别的图;
图15A是示出根据实施方式的、将至少一个(或多个)兼容编辑属性从参考媒体仅传送到目标媒体的特定部分的图;
图15B是示出根据实施方式的、将至少一个(或多个)兼容编辑属性从参考媒体仅传送到目标媒体的特定部分的图;
图16是示出根据实施方式的、在将兼容编辑属性从参考媒体传送到目标媒体的同时存储所得到的中间帧的图;
图17是示出根据实施方式的、将兼容编辑属性从存在于第一电子装置上的参考媒体传送到存在于第二电子装置上的目标媒体的图;
图18是示出根据实施方式的、将兼容编辑属性从参考图像传送到目标视频的图;
图19是示出根据实施方式的、将兼容编辑属性从参考图像传送到相机预览帧的图;
图20是示出根据实施方式的、从社交媒体中选择参考媒体的图;
图21是示出根据实施方式的、将面部美化属性从参考媒体传送到目标媒体的图;
图22是示出根据实施方式的、将兼容编辑属性从多个参考媒体传送到目标媒体的图;以及
图23是示出根据实施方式的、接收用于将兼容编辑属性从参考媒体传送到目标媒体的用户选择的输入的图。
具体实施方式
参考附图描述本公开的各种实施方式。然而,本公开的各种实施方式不限于特定实施方式,并且应了解,可对本文中所描述的实施方式进行各种修改、等同和/或替代。关于附图的描述,可用类似的附图标记来标记类似的组件。
本文的实施方式公开了用于对媒体执行编辑操作的方法和系统。
实施方式的一个目的是通过将兼容编辑属性从参考媒体传送到目标媒体来编辑目标媒体。
实施方式的另一个目的是选择参考媒体的兼容编辑属性,以用于编辑目标媒体。
根据实施方式的方法包括接收参考媒体和目标媒体,其中,参考媒体包括至少一个媒体和媒体的至少一个编辑部分。此外,该方法包括识别参考媒体的一个或多个主编辑属性。另外,该方法包括执行兼容性检查,以确定目标媒体与一个或多个参考媒体的一个或多个主编辑属性的兼容性。基于兼容性检查的结果,从参考媒体的一个或多个主属性中选择兼容编辑属性。此外,该方法包括将兼容编辑属性从参考媒体传送到目标媒体。
图1是根据实施方式的、用于对媒体执行编辑操作的系统100。该系统包括电子装置102、网络104和外部源106。电子装置102可以是,但不限于,移动电话、智能电话、平板电脑、平板手机、个人数字助理(PDA)、膝上型电脑、计算机、可穿戴装置、物联网(IoT)装置、车辆信息娱乐系统、医疗装置、相机或支持媒体编辑的任何其它装置。媒体的示例可以是,但不限于,图像、视频、图形交换格式(GIF)、动画等。
电子装置102可通过网络104与外部源106进行通信,以用于接收媒体。网络的示例可以是,但不限于,因特网、有线网络和无线网络(Wi-Fi网络、蜂窝网络、Wi-Fi热点、BluetoothTM、ZigbeeTM和近场通信(NFC))。外部源106可包括媒体。外部源106的示例可以是,但不限于,电子装置、相机、服务器、数据库、云存储器、社交媒体和网站。电子装置102包括接收单元108、处理引擎110、编辑传送引擎112、显示单元114和存储单元116。
接收单元108可配置为从用户接收至少两个媒体,用于执行编辑操作。至少两个媒体可存在于电子装置100中或可从一个或多个外部源106获取。至少两个媒体包括参考媒体(从其复制编辑操作的媒体)和目标媒体(对其应用编辑操作的媒体)。参考媒体包括已经被编辑(先前被编辑或正在被实时编辑)的至少一个部分。
接收单元108可接收来自用户的输入,用于对目标媒体启动编辑操作。输入的示例可以是,但不限于,示意动作(注视、隔空示意动作、触摸、敲击、点击、按压、扫动、保持、拖放和拖动)、语音命令、使用手写笔(S-pen)执行的示意动作、装置弯曲角度和敲击两个装置(NFC/蓝牙)。
处理引擎110可配置为处理参考媒体,用于识别参考媒体的编辑类/属性。编辑属性可以是,但不限于,纹理属性、效果属性、模板属性和自拍。效果属性的示例可以是像素级变化,例如但不限于,破碎效果、温度变化、亮度和对比度。模板属性的示例可以是,但不限于,静态贴纸、表情、趣味镜头和拼贴。自拍的示例可以是,但不限于,脸部美化水平、瘦身系列、大眼睛效果和动画贴纸。
处理引擎110可根据参考媒体的编辑属性来确定主编辑属性。在确定主编辑属性之后,处理引擎110可对目标媒体执行兼容性检查,以确定目标媒体与参考媒体的主编辑属性的兼容性。基于兼容性检查的结果,处理引擎110可基于兼容性检查的结果从主编辑属性中选择兼容编辑属性。
编辑传送引擎112可配置为通过对目标媒体应用/传送参考媒体的兼容编辑属性来编辑目标媒体。显示单元114可配置为在电子装置100的显示屏上显示经编辑的目标媒体。
存储单元116可配置为存储参考媒体、目标媒体、参考媒体的主编辑属性和兼容编辑属性,以及经编辑的目标媒体。存储单元116可以是文件服务器、数据服务器、服务器、云和存储器中的至少一个。存储器可包括一个或多个计算机可读存储介质和非易失性存储元件,例如磁硬盘、光盘、软盘、闪存、电可编程存储器(EPROM)或电可擦除和可编程(EEPROM)存储器的形式。此外,在一些示例中,存储器可被认为是非暂时性存储介质。术语“非暂时性”可表示存储介质不是以载波或传播信号实现的。然而,术语“非暂时性”不应被解释为意味着存储器是不可移动的。在一些示例中,存储器可配置为存储比存储器更大量的信息。在某些示例中,非暂时性存储介质可存储可随时间改变(例如,在随机存取存储器(RAM)或高速缓存中)的数据。
图1示出了系统100的组件,但是在其它实施方式中,系统100可包括另外的组件,或者更少的组件。此外,组件的标签或名称仅用于说明目的,而不限制实施方式的范围。一个或多个组件可组合在一起,以在系统100中执行相同或基本上类似的功能。
2A是示出根据实施方式的、用于选择参考媒体的兼容属性以编辑目标媒体的处理引擎110的各个单元的框图。处理引擎110包括编辑分类器单元202、属性过滤器单元204、兼容性检查单元206和属性选择单元208。
编辑分类器单元202可配置为确定参考媒体的编辑属性。编辑属性可被分类为预定义的属性,例如但不限于,纹理属性、模板属性、效果属性和自拍。编辑分类器单元202还可添加在参考媒体中检测到的所有编辑,从而扩展属性分类。
编辑分类器单元202可使用特征提取技术、CNN或任何其它机器学习网络来识别参考媒体的编辑属性。考虑用于识别参考媒体的编辑属性的CNN,可进一步解释本文中的实施方式,但是对于本领域的普通技术人员来说,可使用任何其它形式的特征提取技术来识别编辑属性是显而易见的。CNN可基于特征提取网络,例如但不限于,视觉几何组(VGG16)神经网络和Inception。此外,CNN可包括深度学习算法。
在从接收单元202接收到参考媒体时,编辑分类器单元202将参考媒体馈送到CNN。CNN可分析参考媒体的部分以及参考媒体的部分中的至少一个,以识别参考媒体的编辑属性。
编辑分类器单元202还可配置为计算参考媒体的编辑属性的概率以及参考媒体的部分中的至少一个的编辑属性的概率。编辑分类器单元202可使用CNN来计算编辑属性的概率。编辑分类器单元202可使用CNN的softmax函数,该函数可表示N个不同的可能结果(编辑属性的概率)上的概率分布。
属性过滤器单元204可配置为根据参考媒体的编辑属性来确定主编辑属性。属性过滤器单元204分析参考媒体的编辑属性的概率,以确定参考媒体的主编辑属性。例如,当纹理属性的概率和模板属性的概率等于或高于效果属性的概率时,属性过滤器单元204确定纹理属性和模板属性可以是主编辑属性。在另一个示例中,当纹理属性的概率高于模板属性的概率和效果属性的概率时,属性过滤器单元204确定纹理属性可以是主编辑属性。在又一示例中,当纹理属性的概率、模板属性的概率和效果属性的概率相同时,属性过滤器单元204确定纹理属性、模板属性和效果属性可以是主编辑属性。
兼容性检查单元206可配置为对目标媒体执行兼容性检查。兼容性检查单元206可从接收单元108接收目标媒体,并处理目标媒体的至少一个部分,以识别目标媒体的源属性。源属性可以是,但不限于,纹理、模板、效果、和自拍。兼容性检查单元206可基于与目标媒体相关联的元数据来选择目标媒体的用于处理的至少一个部分。兼容性检查单元206可在从接收单元108接收选择输入时选择目标媒体的用于处理的部分。可从用户接收指示目标图像的用于处理的部分的选择输入。
兼容性检查单元206将源属性与参考媒体的主编辑属性进行比较,以确定目标媒体或目标媒体的部分中的一个部分中的至少一个与主编辑属性的兼容性。此外,基于目标媒体的兼容性,兼容性检查单元206可将权重值分配给主编辑属性。较高的权重值指示目标媒体与参考媒体的主编辑属性更兼容。较低的权重值指示目标媒体与参考媒体的主编辑属性不太兼容。
考虑这样一种场景,其中模板属性(即,脸部贴纸)和纹理属性是参考媒体的主编辑属性。兼容性检查单元206将目标媒体的源属性与参考媒体的模板属性和纹理属性进行比较。基于比较结果,兼容性检查单元206确定目标媒体具有主要纹理并且目标媒体不包含模板属性(即,用于贴面部贴纸的面部)。因此,兼容性检查单元206将较低的权重值分配给模板属性,并将较高的权重值分配给纹理属性。
属性选择单元208可配置为从参考媒体的主编辑属性中选择兼容编辑属性。属性选择单元208基于分配给主编辑属性的权重值来选择兼容编辑属性。兼容编辑属性可以是主编辑属性,目标媒体的部分中的至少一个可与该主编辑属性兼容。例如,纹理属性和模板属性可被确定为参考媒体的主编辑属性。此外,纹理属性可具有较高的权重值,并且模板属性可具有较低的权重值。因此,属性选择单元208可选择纹理属性作为参考媒体的兼容编辑属性。
考虑另一个示例,其中参考媒体的效果属性被确定为主编辑属性,并且目标媒体具有许多暗像素。因此,可为效果属性分配较低的权重值。在这种情况下,属性选择单元208可不选择用于编辑作为目标媒体的媒体的兼容编辑属性,因为效果属性被确定为与效果属性不兼容。因此,可识别至少一个相关编辑属性以应用于目标媒体,而不是对目标媒体执行选择的编辑操作的盲复制(即,在没有兼容性比较的情况下复制)。
图2A示出了处理引擎110的组件,但在其它实施方式中,处理引擎110可包括附加的组件或更少的组件。此外,单元的标签或名称仅用于说明的目的,而不限制实施方式的范围。可将一个或多个单元组合在一起,以在处理引擎110中执行相同或基本类似的功能。
图2B是示出根据实施方式的、用于对目标媒体应用兼容编辑属性的编辑传送引擎112的各个单元的框图。编辑传送引擎112将兼容编辑属性从参考媒体传送到目标媒体的兼容部分和兼容目标媒体中的至少一个。编辑传送引擎112可从用户接收指定目标媒体的可应用兼容编辑属性的部分的输入(即,涂鸦或不规则标记)。例如,编辑传送引擎112响应于确定纹理属性、模板属性和效果属性中的至少一个可以是兼容编辑属性,可将纹理属性、模板属性和效果属性中的至少一个应用到目标媒体的部分中的至少一个上。
编辑传送引擎112可使用合适的通信技术(诸如,NFC、蓝牙、Wi-Fi、BluetoothTM低能量(BLE))将存在于第一电子装置上的参考媒体的兼容编辑属性传送到存在于第二电子装置上的目标媒体。
编辑传送引擎112包括纹理单元210、模板单元212和效果单元214。纹理单元210可配置为将参考媒体的纹理属性应用到目标媒体的部分和整个目标媒体中的至少一个上。纹理单元210使用自动编码器神经网络、纹理样式校准器和自动解码器的组合,用于将参考媒体的纹理属性传送到目标媒体的部分和整个目标媒体中的至少一个。
模板单元212可配置为将模板属性应用到目标媒体的部分和整个目标媒体中的至少一个上。模板单元212使用图像分割方法来提取与参考媒体的模板属性相关联的掩膜(例如,面部、表情、贴纸等)。模板单元212将模板属性与存储在本地模板数据库和云模板数据库中的至少一个中的模板进行匹配。基于成功的匹配,模板单元212将模板属性传送到目标媒体的部分和整个目标媒体中的至少一个。
效果单元214可配置为将效果属性应用到目标媒体的部分和整个目标媒体中的至少一个上。效果单元214可使用颜色转换算法和图像过滤器效果算法来模仿和复制从参考媒体到目标媒体的像素级颜色变化。
图2B示出了编辑传送引擎112的组件,但是应当理解,编辑传送引擎112可包括附加的组件或更少的组件。此外,组件的标签或名称仅用于说明目的,而不限制实施方式的范围。可将一个或多个组件组合在一起,以在编辑传送引擎112中执行相同或基本类似的功能。
图3是示出根据实施方式的、用于对媒体执行编辑操作的方法的流程图300。
在步骤302处,该方法包括由电子装置102的接收单元108接收参考媒体和目标媒体。参考媒体可包括先前被编辑的、媒体的部分和媒体中的至少一个。在步骤304处,该方法包括由电子装置102的处理引擎110识别参考媒体的主编辑属性。
在步骤306处,该方法包括由处理引擎110执行兼容性检查,以确定目标媒体与主编辑属性的兼容性。在步骤308处,该方法包括由处理引擎110基于兼容性检查的结果,从主编辑属性中选择一个或多个兼容编辑属性。处理引擎110可基于分配给主编辑属性的权重值来选择兼容编辑属性。权重值可基于兼容性检查的结果而被分配给(多个)主编辑属性。
在步骤310处,该方法包括由编辑传送引擎112将兼容编辑属性从参考媒体传送到目标媒体。编辑传送引擎112可将兼容编辑属性传送到目标媒体的特定部分。特定部分可以是目标图像的与参考媒体的主编辑属性兼容的部分。
方法和流程图300中的各种行动、动作、块或步骤可以以所呈现的顺序、以不同的顺序或同时执行。此外,在不脱离本公开的范围的情况下,可省略、添加、修改或跳过行动、动作、块或步骤中的一些。
图4A是示出根据实施方式的、用于选择参考媒体的主编辑属性的方法的流程图400a。
在步骤402处,该方法包括由处理引擎110确定参考媒体或参考媒体的部分中的至少一个部分中的至少一个的编辑属性。在步骤404处,该方法包括由处理引擎110计算参考媒体或参考媒体的部分中的至少一个部分中的至少一个的编辑属性的概率。处理引擎110使用CNN来确定编辑属性和编辑属性的概率。
在步骤406处,该方法包括由处理引擎110分析编辑属性的概率以确定参考媒体的主编辑属性。处理引擎110选择具有较高概率的编辑属性作为参考媒体的主编辑属性。
方法和流程图400a中的各种行动、动作、块或步骤可以以所呈现的顺序、以不同的顺序或同时执行。此外,在不脱离本公开的范围的情况下,可省略、添加、修改或跳过行动、动作、块或步骤中的一些。
图4B是示出根据实施方式的、用于对目标媒体执行兼容性检查的方法的流程图400b。
在步骤408处,该方法包括由处理引擎110处理目标媒体的至少一个部分,以确定源属性。在步骤410处,该方法包括由处理引擎110将源属性与目标媒体的主编辑属性进行比较,以确定目标媒体的部分中的至少一个与主编辑属性的兼容性。
在步骤412处,该方法包括由处理引擎110基于目标媒体的部分和目标媒体中的至少一个与主编辑属性的兼容性,将权重值分配给主编辑属性。当目标媒体的部分中的至少一个与主编辑属性兼容时,处理引擎110将较高的权重值分配给主编辑属性。当目标媒体的部分中的至少一个与主编辑属性不兼容时,处理引擎110将较低的权重值分配给主编辑属性。
方法和流程图400b中的各种行动、动作、块或步骤可以以所呈现的顺序、以不同的顺序或同时执行。此外,在不脱离本公开的范围的情况下,可省略、添加、修改或跳过行动、动作、块或步骤中的一些。
图5是示出根据实施方式的、用于对目标媒体执行编辑操作的电子装置102的各个模块的框图。本公开的实施方式允许电子装置102通过智能地选择参考媒体的兼容编辑属性来编辑媒体。电子装置102可包括处理引擎110和编辑传送引擎112,处理引擎110用于选择参考媒体的兼容编辑属性,编辑传送引擎112用于将参考媒体的兼容编辑属性传送到目标媒体。
如图5所示,处理引擎110的编辑分类器单元202接收参考媒体/预编辑媒体和目标媒体。编辑分类器单元202确定存在于参考媒体和参考媒体的部分中的至少一个中的编辑属性(即,纹理属性、模板属性和效果属性)。此外,编辑分类器单元202计算编辑属性的概率。
处理引擎110的属性过滤器单元204可基于所计算的编辑属性的概率,根据参考媒体的编辑属性确定主编辑属性。属性过滤器单元204还可对目标媒体执行兼容性检查,以确定目标媒体与主编辑属性的兼容性。基于兼容性检查的结果,属性过滤器单元204可根据主编辑属性来确定兼容编辑属性。
编辑传送引擎112可将兼容编辑属性从参考媒体传送到目标媒体。因此,只有相关的编辑属性可被应用于目标媒体。
图6示出了根据实施方式的、包括CNN的编辑分类器单元202,用于确定参考媒体的编辑属性。编辑分类器单元202可使用CNN,用于确定参考媒体(或目标媒体)的编辑属性。编辑分类器单元202向CNN提供参考媒体。CNN可包括特征学习映射和分类部分。CNN可使用一系列卷积层(Conv)和激活映射层(Relu)来学习参考媒体的编辑属性/特征。此外,CNN可使用完全连接(FC)层和Sofmax分类器将编辑属性分类为预定义属性,诸如,纹理属性、模板属性和效果属性。此外,CNN可计算参考媒体的编辑属性的概率。
图7示出了根据实施方式的、用于选择参考媒体的兼容编辑属性并对目标媒体应用参考媒体的兼容编辑属性的处理引擎110和编辑传送引擎112。处理引擎110的编辑分类器单元202向属性过滤器单元204提供关于参考媒体和目标媒体的编辑属性的概率的信息。
在接收到关于编辑属性的概率的信息时,属性过滤器单元204可确定主编辑属性。主编辑属性可以是纹理属性、模板属性和效果属性中的至少一个。在确定主编辑属性之后,兼容性检查单元206可检查目标媒体相对于主编辑属性的兼容性。基于兼容性检查的结果,属性选择单元208可从主编辑属性中选择兼容编辑属性。兼容编辑属性可以是纹理属性、模板属性和效果属性中的至少一个。
例如,如果兼容编辑属性被确定为纹理属性,则纹理单元210对目标媒体应用纹理属性。如果兼容编辑属性被确定为模板属性,则模板单元212对目标媒体应用模板属性。类似地,如果兼容属性被确定为效果属性,则效果单元214可对目标媒体应用效果属性。
图8A示出了根据实施方式的、用于将纹理属性从参考媒体传送到目标媒体的纹理单元210。纹理单元210可使用自动编码器神经网络、纹理样式校准器和自动解码器来将参考媒体的纹理属性应用到目标媒体上。自动编码器神经网络和自动解码器可包括Conv和Relu。
图8B示出了根据实施方式的、用于将模板属性从参考媒体传送到目标媒体的模板单元212。模板单元212可使用Conv和Relu来提取参考媒体的模板掩膜。此外,模板单元212可使用模式匹配方法将所提取的模板掩膜与模板数据库进行匹配。基于成功匹配,模板单元212可将提取的模板掩膜应用于目标媒体。
图8C示出了根据实施方式的、用于将效果属性从参考媒体传送到目标媒体的效果单元214。效果单元214可使用颜色转换算法执行如模仿和复制从参考媒体到目标媒体的像素级颜色变化的行动。效果单元还可应用图像过滤效果算法,以对目标媒体应用效果属性。
图9A、图9B和图9C是示出根据各种实施方式的、选择用于编辑目标媒体的参考媒体的兼容编辑属性的图。
图9A是示出选择纹理属性作为用于编辑目标媒体的兼容编辑属性的图。如图9A所示,处理引擎110的编辑分类器单元202接收参考媒体并识别参考媒体的编辑属性。编辑属性可以是纹理属性、模板属性和效果属性。此外,编辑分类器单元202计算参考媒体的编辑属性的概率。例如,纹理属性的概率可以是0.85,模板属性的概率可以是0.01,以及效果属性的概率可以是0.05。因为纹理属性的概率高于模板属性的概率和效果属性的概率,所以处理引擎110的属性过滤器单元204选择纹理属性作为主编辑属性。
此外,处理引擎110的兼容性检查单元206可检查目标媒体与纹理属性的兼容性。兼容性检查单元206可确定目标媒体与纹理属性单元兼容。因此,兼容性检查单元206可将较高的权重值分配给纹理属性。
处理引擎110的属性选择单元208可选择纹理属性作为兼容编辑属性,因为纹理属性具有更高的权重值。因此,编辑传送引擎112的纹理单元210可将纹理属性从参考媒体传送到目标媒体。
图9B是示出选择效果属性和模板属性作为用于编辑目标媒体的兼容编辑属性的图。如图9B所示,处理引擎110的编辑分类器单元202接收参考媒体并识别参考媒体的编辑属性。编辑属性可以是纹理属性、模板属性和效果属性。此外,编辑分类器单元202计算参考媒体的编辑属性的概率。例如,纹理属性的概率可以是0.1、模板属性的概率可以是0.4以及效果属性的概率可以是0.4。属性过滤器单元204选择模板属性和效果属性作为主编辑属性,因为模板属性的概率和效果属性的概率等于或高于纹理属性的概率。
此外,处理引擎110的兼容性检查单元206可检查目标媒体与模板属性和效果属性的兼容性。兼容性检查单元206可确定目标媒体与模板属性和效果属性兼容。因此,兼容性检查单元206可将较高的权重值分配给模板属性和效果属性。
处理引擎110的属性选择单元208可基于权重值选择模板属性和效果属性作为兼容编辑属性。因此,模板单元212和效果单元214可分别将模板属性和效果属性从参考媒体传送到目标媒体。
图9C是示出选择效果属性作为用于编辑目标媒体的兼容编辑属性的图。如图9C所示,编辑分类器单元202接收参考媒体并识别参考媒体的编辑属性。编辑属性可以是纹理属性、模板属性和效果属性。此外,编辑分类器单元202计算参考媒体的编辑属性的概率。例如,纹理属性的概率可以是0.1、模板属性的概率可以是0.4以及效果属性的概率可以是0.4。属性过滤器单元204选择模板属性和效果属性作为主编辑属性,因为模板属性的概率和效果属性的概率等于或高于纹理属性的概率。
此外,兼容性检查单元206可检查目标媒体与模板属性和效果属性的兼容性。兼容性检查单元206可确定目标媒体与效果属性兼容并且与模板属性不兼容。因此,兼容性检查单元206可将较高的权重值分配给效果属性,而将较低的权重值分配给模板属性。
属性选择单元208可基于较高的权重值来选择效果属性作为兼容编辑属性。因此,效果单元214可将效果属性从参考媒体传送到目标媒体。
图10是示出根据实施方式的、将兼容编辑属性从参考媒体传送到目标媒体的流程图。如图10所示,在步骤1001处,处理引擎110选择参考媒体。在步骤1002处,处理引擎110选择目标媒体。在步骤1003处,处理引擎110识别参考媒体的主编辑属性。在步骤1004处,处理引擎110检查主编辑属性是否是可清楚识别的。响应于确定主编辑属性不是可清楚识别的(1004:否),处理引擎110停止对目标媒体执行编辑操作,并且不进行到步骤1005。
响应于确定主编辑属性是可清楚识别的(1004:是),在步骤1005处,处理引擎110处理目标媒体并识别源属性。处理引擎110还可将源属性与主编辑属性进行比较;基于目标媒体与主编辑属性的兼容性而将权重值分配给主编辑属性;以及基于分配给主编辑属性的权重值而选择主编辑属性作为兼容编辑属性。
在选择兼容编辑属性之后,在步骤1006中,编辑传送引擎112将兼容编辑属性从参考媒体转换到目标媒体。在步骤1007中,编辑的目标媒体作为帧输出显示在电子装置的显示屏上。
图11A和图11B是示出根据各种实施方式的、选择参考媒体的主编辑属性的图。处理引擎110可使用CNN来识别参考媒体的主编辑属性。例如,如图11A所示,处理引擎110将效果属性(颜色效果)识别为参考媒体中的主编辑属性。因此,只能将颜色信息转换到目标媒体。
在另一示例中,如图11B所示,处理引擎110将效果属性(即,颜色效果)和模板属性识别为参考媒体中的主编辑属性。因此,效果属性和模板属性可被应用于目标媒体上。
图12A和图12B是示出根据实施方式的、对目标媒体执行的兼容性检查过程的图。处理引擎110可对目标媒体执行兼容性检查,以确定目标媒体与参考媒体的主编辑属性的兼容性。如图12A所示,处理引擎110从参考媒体中识别效果属性(即,向面部添加兔子耳朵和胡须)和模板属性作为主编辑属性。此外,处理引擎110对目标媒体执行兼容性检查,以确定与效果属性和模板属性的兼容性。基于兼容性检查,处理引擎110确定目标媒体可与效果属性兼容,并且目标媒体不能与模板属性兼容。因此,处理引擎110选择效果属性作为可应用于目标媒体的兼容编辑属性。
如图12B所示,处理引擎110将纹理属性识别为参考媒体的主编辑属性。处理引擎110检查目标媒体与纹理属性的兼容性。目标媒体可能与纹理属性不兼容,因为目标媒体已经具有纹理属性。处理引擎110不选择用于应用在目标媒体上的兼容编辑属性。因此,可在不应用任何编辑属性的情况下显示目标媒体。
图13A、图13B和图13C是示出根据各种实施方式的、将兼容编辑属性从参考媒体传送到目标媒体的图。
图13A是示出将纹理属性从参考图像传送到目标图像的图。处理引擎110将参考图像的艺术纹理(即,纹理属性)识别为兼容编辑属性。编辑传送引擎112通过对目标图像应用参考图像的艺术纹理来编辑目标图像。
图13B是示出将效果属性从参考图像传送到目标图像的图。处理引擎110将参考图像的效果属性(颜色效果)识别为兼容编辑属性。编辑传送引擎112通过将参考图像的效果属性(即,颜色效果)应用于目标图像来编辑目标图像。
图13C是示出将模板属性从参考图像传送到目标图像的图。处理引擎110将参考图像的模板属性(即,贴纸)识别为兼容编辑属性。编辑传送引擎112通过将参考图像的模板属性(即,贴纸)应用于目标图像来编辑目标图像。
图14是示出根据实施方式的、控制从参考媒体传送到目标媒体的兼容编辑属性的级别的图。编辑传送引擎112可将兼容编辑属性从参考图像复制到目标图像。一旦兼容编辑属性已被复制到目标图像,显示单元114就可在电子装置的显示屏上显示滑块。用户可使用滑块来改变应用在目标图像上的兼容编辑属性的级别。
图15A和图15B是示出根据各种实施方式的、将兼容编辑属性从参考媒体仅传送到目标媒体的特定部分的图。编辑传送引擎112可将兼容编辑属性应用于目标图像中的特定感兴趣区域(ROI)/部分,或者应用于完整的图像上。
编辑传送引擎112可从用户接收指定目标图像中的特定ROI(可替代地,整个目标图像可被指定为ROI)的输入(触摸、标记或涂鸦),用于执行编辑操作。根据从用户接收的输入,编辑传送引擎112可将兼容编辑属性应用于目标图像中的特定ROI中的至少一个,诸如,目标图像的前景和图像的背景,如图15A所示。
此外,编辑传送引擎112可将参考图像的兼容编辑属性应用于目标图像中的特定兼容ROI,如图15B所示。
图16是示出根据实施方式的、在将兼容编辑属性从参考媒体传送到目标媒体的同时存储所得到的中间帧的图。
如果一个或多个编辑属性(例如,纹理或颜色)被识别,则处理引擎110可使用户能够选择将每个中间帧保存和/或呈现为图形交换格式(GIF)文件或视频文件,其中,每个帧可拍摄每个编辑结果。最终的帧可具有如图16所示的组合效果。用户可丢弃或保存经编辑的目标媒体。
图17是示出根据实施方式的、将兼容编辑属性从存在于第一电子装置上的参考媒体传送到存在于第二装置上的目标媒体的图。例如,参考媒体存在于第一电子装置上,并且目标媒体存在于第二电子装置上。第一电子装置的编辑传送引擎112使用诸如NFC的通信机制来将编辑操作(例如,兼容编辑属性)传送到存在于第二电子装置上的目标媒体。
图18是示出根据实施方式的、将兼容编辑属性从参考图像传送到目标视频的图。兼容编辑属性可从参考图像传送到目标视频。处理引擎110可将视频序列转换为与参考图像的兼容编辑属性/样式相匹配。处理引擎110可接收指示需要传送到目标视频的参考图像的编辑属性的用户输入。
图19是示出根据实施方式的、将兼容编辑属性从参考图像传送到相机预览帧的图。如图19所示,用户可从由存储单元116提供的喜欢的数据库中选择具有独特样式的图像(例如,媒体),其中,用户已经在存储单元116中添加了一些图像作为喜欢的图像。此外,用户可选择样式(例如,兼容编辑属性)以应用于相机中的预览帧。编辑传送引擎112可将由用户选择的样式传送到预览帧。在将样式传送到预览帧之后,预览/目标图像可由相机拍摄。目标图像可包括用户选择的样式。
图20是示出根据实施方式的、从社交媒体中选择参考媒体的图。用户可从外部源106(诸如,各种社交媒体平台)下载多个图像。多个图像可存储在存储单元116中。此外,用户可从多个图像中选择参考图像和目标图像,用于对目标图像应用参考图像的编辑属性。处理引擎110可将参考图像的纹理属性确定为兼容编辑属性。在选择兼容编辑属性之后,编辑传送引擎112可将纹理属性(例如,兼容编辑属性)从参考图像传送到目标图像。
图21是示出根据实施方式的、将面部美化属性从参考媒体传送到目标媒体的图。编辑传送引擎112可将自拍属性从参考图像传送到目标图像。例如,用户可选择存在于参考图像中的对脸部应用的美化作为兼容编辑属性。根据用户选择,编辑传送引擎112可对存在于目标图像中的面部应用美化,如图21所示。
图22是示出根据实施方式的、将兼容编辑属性从多个参考媒体传送到目标媒体的图。电子装置可对目标图像的不同部分应用不同的编辑属性。例如,用户可选择第一参考图像和第二参考图像。此外,用户可从第一参考媒体中选择编辑属性/样式(即,纹理属性)作为第一编辑属性。用户可能想要将第一编辑属性应用于目标图像的背景。此外,用户可从第二参考图像中选择编辑属性(即,效果属性)作为第二编辑属性。用户可选择第二编辑属性,以应用于目标图像的前景。
根据用户选择,编辑传送引擎112可将第一编辑属性(即,纹理属性)应用于目标图像的背景,并将第二编辑属性(即,效果属性)应用于目标图像的前景,如图22所示。因此,可将不同的编辑属性/样式应用于目标图像的前景和背景。
图23是示出根据实施方式的、接收用于将兼容编辑属性从参考媒体传送到目标媒体的用户选择的输入的图。如图23所示,用户可拍摄图像并选择所拍摄的图像作为参考图像。此外,用户可选择参考图像的一个或多个颜色(即,效果属性)作为编辑属性,其可在拍摄后续图像时被应用于后续图像。编辑传送引擎112可在拍摄时将参考图像(即,先前图像)的颜色转换至图像。因此,所拍摄的图像可包括来自先前拍摄的图像的颜色效果。
现有相机特征的不同相机选项/模式可被组合到用户喜欢的模式/选项中。
可提供简单的步骤,以将不同的媒体选项(诸如,面部美化、效果、贴纸和拼贴)组合为使用参考媒体的一步拍摄选项。
步骤和编辑时间可减少到单个步骤,以将编辑操作从参考媒体传送到目标媒体。
可利用深度学习算法来选择参考媒体的编辑属性,并将所选择的编辑属性应用于目标媒体。
可能不需要安装多个应用程序来应用编辑。
本公开的实施方式可通过运行在至少一个硬件装置上并执行网络管理功能以控制元件的至少一个软件程序来实现。图1和图2中所示的元件可以是硬件装置或硬件装置和软件模块的组合中的至少一个。
本公开描述了用于对媒体执行编辑操作的方法和系统。因此,应当理解,保护范围被扩展到这样的程序,并且除了其中具有消息的计算机可读装置之外,这样的计算机可读存储装置可包含程序代码装置,用于当程序在服务器或移动装置或任何合适的可编程装置上运行时实现该方法的一个或多个步骤。
该方法可通过以超高速集成电路硬件描述语言(VHDL)或另一种编程语言编写的软件程序来实现,或者与该软件程序一起实现。该软件程序可通过运行VHDL的一个或多个装置或者在至少一个硬件装置上运行的多个软件模块来实现。该装置可以是能够被编程的任何类型的便携式装置。该装置还可包括硬件装置,诸如,专用集成电路(ASIC),或者硬件和软件的组合,诸如,ASIC和现场可编程门阵列(FPGA),或者至少一个微处理器和其中具有软件模块的至少一个存储器。本文中描述的方法可部分地以硬件实现以及部分地以软件实现。可替代地,该方法可在使用多个中央处理单元(CPU)的不同硬件装置上实现。
虽然已经参考本公开的某些实施方式具体示出和描述了本公开,但是本领域的普通技术人员将理解,在不脱离由所附权利要求及其等同方案限定的本发明的精神和范围的情况下,可在其中进行形式和细节上的各种改变。
Claims (14)
1.用于对媒体执行编辑操作的方法,所述方法包括:
由接收单元接收至少一个参考媒体和至少一个目标媒体,其中,所述至少一个参考媒体包括至少一个经编辑部分;
由处理引擎识别所述至少一个参考媒体的至少一个主编辑属性;
由所述处理引擎执行兼容性检查,以确定所述至少一个目标媒体与所述至少一个参考媒体的所述至少一个主编辑属性的兼容性;
由所述处理引擎基于所述兼容性检查的结果从所述至少一个主编辑属性中选择至少一个兼容编辑属性;以及
由编辑传送引擎将所选择的至少一个兼容编辑属性从所述至少一个参考媒体传送到所述至少一个目标媒体。
2.根据权利要求1所述的方法,其中,识别所述至少一个主编辑属性包括:
确定所述至少一个参考媒体的至少一个部分的至少一个编辑属性;
计算所述至少一个参考媒体的所述至少一个部分的所述至少一个编辑属性的概率;以及
通过分析所述至少一个参考媒体的所述至少一个部分的所述至少一个编辑属性的所述概率来识别所述至少一个参考媒体的所述至少一个主编辑属性。
3.根据权利要求2所述的方法,其中,使用卷积神经网络(CNN)来识别所述至少一个主属性。
4.根据权利要求1所述的方法,其中,执行所述兼容性检查包括:
处理所述至少一个目标媒体的至少一个部分,以确定至少一个源属性;
将所述至少一个源属性与所述至少一个主编辑属性进行比较,以确定所述至少一个目标媒体的所述至少一个部分与所述至少一个参考媒体的所述至少一个主编辑属性的兼容性;以及
基于所述至少一个目标媒体的所述至少一个部分与所述至少一个参考媒体的所述至少一个主编辑属性的兼容性,将权重值分配给所述至少一个主编辑属性。
5.根据权利要求4所述的方法,其中,所述权重值用于选择所述至少一个参考媒体的所述至少一个兼容编辑属性。
6.根据权利要求4所述的方法,还包括分析与所述至少一个目标媒体相关联的至少一条元数据,以选择所述至少一个目标媒体的所述至少一个部分进行处理。
7.根据权利要求4所述的方法,还包括从至少一个用户接收至少一个输入,以选择所述至少一个目标媒体的所述至少一个部分进行处理。
8.用于对媒体执行编辑操作的电子装置,所述电子装置包括:
接收单元,配置为接收至少一个参考媒体和至少一个目标媒体,其中,所述至少一个参考媒体包括至少一个经编辑部分;
处理引擎,配置为:
识别所述至少一个参考媒体的至少一个主编辑属性;
执行兼容性检查,以确定所述至少一个目标媒体与所述至少一个参考媒体的所述至少一个主编辑属性的兼容性;以及
基于所述兼容性检查的结果,从所述至少一个主编辑属性中选择至少一个兼容编辑属性;以及
编辑传送引擎,配置为将所选择的至少一个兼容编辑属性从所述至少一个参考媒体传送到所述至少一个目标媒体。
9.根据权利要求8所述的电子装置,其中,所述处理引擎还配置为:
确定所述至少一个参考媒体的至少一个部分和所述至少一个参考媒体中的至少一个的至少一个编辑属性;
计算所述至少一个参考媒体的所述至少一个部分和所述至少一个参考媒体中的至少一个的所述至少一个编辑属性的概率;以及
通过分析所述至少一个参考媒体的所述至少一个部分和所述至少一个参考媒体中的至少一个的所述至少一个编辑属性的所述概率来识别所述至少一个参考媒体的所述至少一个主编辑属性。
10.根据权利要求9所述的电子装置,其中,使用卷积神经网络(CNN)来识别所述至少一个主属性。
11.根据权利要求8所述的电子装置,其中,所述处理引擎配置为:
处理所述至少一个目标媒体的至少一个部分,以确定至少一个源属性;
将所述至少一个源属性与所述至少一个主编辑属性进行比较,以确定所述至少一个目标媒体的所述至少一个部分与所述至少一个参考媒体的所述至少一个主编辑属性的兼容性;以及
基于所述至少一个目标媒体的所述至少一个部分与所述至少一个参考媒体的所述至少一个主编辑属性的兼容性,将权重值分配给所述至少一个主编辑属性。
12.根据权利要求11所述的电子装置,其中,所述权重值用于选择所述至少一个参考媒体的所述至少一个兼容编辑属性。
13.根据权利要求11所述的电子装置,其中,所述处理引擎还配置为分析与所述至少一个目标媒体相关联的至少一条元数据,以选择所述至少一个目标媒体的所述至少一个部分进行处理。
14.根据权利要求11所述的电子装置,其中,所述处理引擎还配置为接收来自至少一个用户的至少一个输入,以选择所述至少一个目标媒体的所述至少一个部分进行处理。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN201741043112 | 2018-09-03 | ||
IN201741043112 | 2018-09-03 | ||
PCT/KR2019/011061 WO2020050550A1 (en) | 2018-09-03 | 2019-08-29 | Methods and systems for performing editing operations on media |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112585646A true CN112585646A (zh) | 2021-03-30 |
Family
ID=69642466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980055044.5A Pending CN112585646A (zh) | 2018-09-03 | 2019-08-29 | 用于对媒体执行编辑操作的方法与系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11232616B2 (zh) |
EP (1) | EP3803797A4 (zh) |
CN (1) | CN112585646A (zh) |
WO (1) | WO2020050550A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11790950B2 (en) * | 2020-01-14 | 2023-10-17 | Robert Salem Abraham | Film-making using style transfer |
US20230005108A1 (en) * | 2021-06-30 | 2023-01-05 | Palo Alto Research Center Incorporated | Method and system for replacing scene text in a video sequence |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140104295A1 (en) * | 2012-10-17 | 2014-04-17 | Disney Enterprises, Inc. | Transfusive image manipulation |
US20180082407A1 (en) * | 2016-09-22 | 2018-03-22 | Apple Inc. | Style transfer-based image content correction |
WO2018075927A1 (en) * | 2016-10-21 | 2018-04-26 | Google Llc | Stylizing input images |
CN108463997A (zh) * | 2015-11-10 | 2018-08-28 | 诺基亚通信公司 | 支持众包视频 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000070531A2 (en) * | 1999-05-17 | 2000-11-23 | The Foxboro Company | Methods and apparatus for control configuration |
US6919903B2 (en) * | 2001-03-02 | 2005-07-19 | Mitsubishi Electric Research Laboratories, Inc. | Texture synthesis and transfer for pixel images |
US7065249B2 (en) * | 2002-07-25 | 2006-06-20 | Microsoft Corp. | System and method for image editing |
US7231087B2 (en) * | 2002-10-30 | 2007-06-12 | Metrica, Inc. | Matching binary templates against range map derived silhouettes for object pose estimation |
US20050227217A1 (en) * | 2004-03-31 | 2005-10-13 | Wilson Andrew D | Template matching on interactive surface |
WO2007065157A2 (en) * | 2005-12-01 | 2007-06-07 | Future Health, Inc. | Method of efficiently and effectively providing unique and/or multiple office management services in one system and a method and system for automatically selecting educational, marketing and other business-related items to be provided to a client |
JP4289414B2 (ja) * | 2007-03-27 | 2009-07-01 | セイコーエプソン株式会社 | 画像変形のための画像処理 |
JP4930298B2 (ja) * | 2007-09-11 | 2012-05-16 | セイコーエプソン株式会社 | 画像領域の指定 |
US8929877B2 (en) * | 2008-09-12 | 2015-01-06 | Digimarc Corporation | Methods and systems for content processing |
US8849853B2 (en) * | 2009-07-30 | 2014-09-30 | Intellectual Ventures Fund 83 Llc | Method for matching artistic attributes of a template and secondary images to a primary image |
US20110029562A1 (en) * | 2009-07-30 | 2011-02-03 | Whitby Laura R | Coordinating user images in an artistic design |
US9009339B2 (en) * | 2010-06-29 | 2015-04-14 | Echostar Technologies L.L.C. | Apparatus, systems and methods for accessing and synchronizing presentation of media content and supplemental media rich content |
US20120328168A1 (en) * | 2011-01-31 | 2012-12-27 | Andrea Dailey | System and Method for Yearbook Creation |
JP2013126059A (ja) * | 2011-12-14 | 2013-06-24 | Sharp Corp | コンテンツ再生システム、テレビジョン受信装置、同プログラム及び同プログラムを記憶した記録媒体 |
US9143659B2 (en) * | 2012-01-08 | 2015-09-22 | Gary Shuster | Clothing and body covering pattern creation machine and method |
US9232218B2 (en) * | 2012-03-01 | 2016-01-05 | Connesta | System and method for data insertion in video stream |
US9285971B2 (en) * | 2012-06-20 | 2016-03-15 | Google Inc. | Compartmentalized image editing system |
US9569100B2 (en) * | 2012-07-22 | 2017-02-14 | Magisto Ltd. | Method and system for scribble based editing |
JP5955170B2 (ja) * | 2012-09-06 | 2016-07-20 | キヤノン株式会社 | 表示制御装置、表示制御方法、及びプログラム |
JP2014085796A (ja) | 2012-10-23 | 2014-05-12 | Sony Corp | 情報処理装置およびプログラム |
WO2015009968A2 (en) * | 2013-07-19 | 2015-01-22 | Google Inc. | Face template balancing |
KR101492060B1 (ko) | 2013-08-20 | 2015-02-12 | 전자부품연구원 | 동영상의 일괄 컬러 변환 방법 및 그 기록매체 |
WO2016004330A1 (en) * | 2014-07-03 | 2016-01-07 | Oim Squared Inc. | Interactive content generation |
KR101653812B1 (ko) * | 2014-12-05 | 2016-09-05 | 연세대학교 산학협력단 | 감성 효과 생성을 위한 인물 영상 처리 장치 및 그 방법 |
EP3249873B1 (en) * | 2015-02-15 | 2018-09-12 | Huawei Technologies Co., Ltd. | Media presentation guide method based on hyper text transport protocol media stream and related device |
US20160284381A1 (en) * | 2015-03-25 | 2016-09-29 | Cyberlink Corp. | Systems and Methods for Quick Decision Editing of Media Content |
US10733587B2 (en) * | 2015-04-30 | 2020-08-04 | Google Llc | Identifying consumers via facial recognition to provide services |
US20170024363A1 (en) * | 2015-06-21 | 2017-01-26 | Dan Tocchini | System and Method for Dynamic Predictive Analytics for Pattern Search and Publishing Engine |
US10311366B2 (en) * | 2015-07-29 | 2019-06-04 | Adobe Inc. | Procedurally generating sets of probabilistically distributed styling attributes for a digital design |
US10055895B2 (en) * | 2016-01-29 | 2018-08-21 | Snap Inc. | Local augmented reality persistent sticker objects |
US11068741B2 (en) * | 2017-12-28 | 2021-07-20 | Qualcomm Incorporated | Multi-resolution feature description for object recognition |
-
2019
- 2019-08-29 CN CN201980055044.5A patent/CN112585646A/zh active Pending
- 2019-08-29 WO PCT/KR2019/011061 patent/WO2020050550A1/en unknown
- 2019-08-29 EP EP19857989.8A patent/EP3803797A4/en active Pending
- 2019-09-03 US US16/559,101 patent/US11232616B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140104295A1 (en) * | 2012-10-17 | 2014-04-17 | Disney Enterprises, Inc. | Transfusive image manipulation |
CN108463997A (zh) * | 2015-11-10 | 2018-08-28 | 诺基亚通信公司 | 支持众包视频 |
US20180082407A1 (en) * | 2016-09-22 | 2018-03-22 | Apple Inc. | Style transfer-based image content correction |
WO2018075927A1 (en) * | 2016-10-21 | 2018-04-26 | Google Llc | Stylizing input images |
Non-Patent Citations (1)
Title |
---|
YI-HSUAN TSAI等: "Sky is Not the Limit: Semantic-Aware Sky Replacement", ACM TRANSACTIONS ON GRAPHICS, vol. 35, no. 4, 28 July 2016 (2016-07-28), pages 1 - 7 * |
Also Published As
Publication number | Publication date |
---|---|
US11232616B2 (en) | 2022-01-25 |
EP3803797A1 (en) | 2021-04-14 |
WO2020050550A1 (en) | 2020-03-12 |
EP3803797A4 (en) | 2021-08-18 |
US20200074709A1 (en) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11783461B2 (en) | Facilitating sketch to painting transformations | |
US11410457B2 (en) | Face reenactment | |
US11195283B2 (en) | Video background substraction using depth | |
US10440276B2 (en) | Generating image previews based on capture information | |
AU2017254848B2 (en) | Image matting using deep learning | |
US10593023B2 (en) | Deep-learning-based automatic skin retouching | |
CN110503703B (zh) | 用于生成图像的方法和装置 | |
EP3714431B1 (en) | Image transformation by fusion | |
US20180260975A1 (en) | Illumination estimation from a single image | |
CN107820020A (zh) | 拍摄参数的调整方法、装置、存储介质及移动终端 | |
US20200175729A1 (en) | Deep learning based virtual hair dyeing method and method for providing virual hair dyeing service using the same | |
US20220230323A1 (en) | Automatically Segmenting and Adjusting Images | |
US11087137B2 (en) | Methods and systems for identification and augmentation of video content | |
KR102308889B1 (ko) | 영상 하이라이트 검출 방법 및 이를 수행하기 위한 컴퓨팅 장치 | |
CN108898082B (zh) | 图片处理方法、图片处理装置及终端设备 | |
US12008811B2 (en) | Machine learning-based selection of a representative video frame within a messaging application | |
CN112150347A (zh) | 从有限的修改后图像集合中学习的图像修改样式 | |
CN115242983B (zh) | 拍摄方法、电子设备及可读存储介质 | |
CN110619325B (zh) | 一种文本识别方法及装置 | |
CN108769537A (zh) | 一种拍照方法、装置、终端及可读存储介质 | |
WO2023230936A1 (zh) | 图像分割模型的训练方法、图像分割方法和装置 | |
US11232616B2 (en) | Methods and systems for performing editing operations on media | |
WO2024088269A1 (zh) | 文字识别方法、装置、电子设备及介质 | |
CN114627211A (zh) | 视频名片生成方法、装置、计算机设备和存储介质 | |
WO2022110059A1 (zh) | 视频处理、景别识别方法、终端设备和拍摄系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |