CN116112779A - 拍摄效果的推荐、装置、存储介质及电子设备 - Google Patents
拍摄效果的推荐、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN116112779A CN116112779A CN202310161334.6A CN202310161334A CN116112779A CN 116112779 A CN116112779 A CN 116112779A CN 202310161334 A CN202310161334 A CN 202310161334A CN 116112779 A CN116112779 A CN 116112779A
- Authority
- CN
- China
- Prior art keywords
- shooting effect
- category label
- user
- determining
- recommending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000694 effects Effects 0.000 title claims abstract description 170
- 238000000034 method Methods 0.000 claims abstract description 56
- 238000004590 computer program Methods 0.000 claims abstract description 14
- 238000004891 communication Methods 0.000 claims description 10
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000004936 stimulating effect Effects 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2621—Cameras specially adapted for the electronic generation of special effects during image pickup, e.g. digital cameras, camcorders, video cameras having integrated special effects capability
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种拍摄效果的推荐、装置、计算机程序产品、非暂时性计算机可读存储介质及电子设备。该方法包括:获取目标视频,目标视频由用户拍摄得到;从目标视频出提取至少一个图像帧;对至少一个图像帧进行图像识别,得到相应的类别标签;根据类别标签,确定相应的拍摄效果并推荐给用户。本公开的实施例能够提高视频拍摄效果的易用性,提高视频的观赏度和趣味性。并有利于激发用户拍摄的欲望。
Description
技术领域
本公开总体上涉及计算机技术领域,更具体地涉及一种拍摄效果的推荐方法、装置、计算机程序产品、非暂时性计算机可读存储介质及电子设备。
背景技术
本部分旨在介绍本领域的一些方面,其可以与下面描述的和/或要求保护的本公开的各个方面相关。相信本部分有助于提供背景信息以便于更好地理解本公开的各个方面。因此,应该理解的是这些陈述应该从这个角度来理解,而不是作为对现有技术的承认。
在拍摄视频时,用户可以在视频中添加滤镜、贴纸或者音乐等拍摄效果,以增加视频的丰富性和趣味性。
在现有的技术方案中,拍摄效果通常需要用户自行选择和应用,在使用上不够方便。
因此,有必要提出一种拍摄效果的推荐方案,以减轻或者解决上述至少一个技术问题。
发明内容
本公开的目的在于提供一种拍摄效果的推荐方法、装置、计算机程序产品、非暂时性计算机可读存储介质及电子设备,以提高视频拍摄效果的易用性。
根据本公开的第一方面,提供了一种拍摄效果的推荐方法,包括:获取目标视频,所述目标视频由用户拍摄得到;从所述目标视频出提取至少一个图像帧;对所述至少一个图像帧进行图像识别,得到相应的类别标签;根据所述类别标签,确定相应的拍摄效果并推荐给用户。
根据本公开的第二方面,提供了一种拍摄效果的推荐装置,包括:获取模块,用于获取目标视频,所述目标视频由用户拍摄得到;提取模块,用于从所述目标视频出提取至少一个图像帧;识别模块,用于对所述至少一个图像帧进行图像识别,得到相应的类别标签;推荐模块,用于根据所述类别标签,确定相应的拍摄效果并推荐给用户。
根据本公开的第三方面,提供了一种计算机程序产品,包括程序代码指令,当所述程序产品由计算机执行时,所述程序代码指令使所述计算机执行根据本公开的第一方面所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非暂时性计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开的第一方面所述的方法。
根据本公开的第五方面,提供了一种电子设备,包括:处理器,与所述处理器进行电子通信的存储器;以及指令,所述指令存储在所述存储器中并且可由所述处理器执行以使所述电子设备执行根据本公开的第一方面所述的方法。
本公开的实施例通过对目标视频的图像帧进行识别得到类别标签,并给予类别标签推荐相应的拍摄效果,有利于提高视频拍摄效果的易用性,提高视频的观赏度和趣味性。并有利于激发用户拍摄的欲望。
应当理解,本部分所描述的内容并不旨在标识所要求保护的发明内容的关键或必要特征,也不旨在单独地用于确定所要求保护的发明内容的范围。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1示出了根据本公开的拍摄效果的推荐方法的一个实施例的系统架构图;
图2示出了根据本公开的拍摄效果的推荐方法的一个实施例的流程图;
图3A-图3C示出了根据本公开的拍摄效果的推荐方法的其他实施例的流程图;
图3D根据本公开的拍摄效果的推荐方法的一个具体例子的流程图;
图4示出了根据本公开的实施例的拍摄效果的推荐装置的示例性框图;
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意图。
具体实现方式
下文将参考附图更全面地描述本公开。然而,本公开可以以多种替代形式来体现,并且不应被解释为限于本文描述的实施例。因此,尽管本公开易于进行各种修改和替代形式,但是其具体实施例在附图中以示例的方式示出,并将在本文详细描述。然而,应当理解,这种方式并不旨在将本公开限制于所公开的特定形式,相反,本公开覆盖了落入由权利要求所限定的本公开的精神和范围内的所有修改方案、等同方案和替代方案。
应当理解,尽管本文可以用术语第一、第二等描述各种元素,但是这些元素不应该被这些术语所限制。这些术语仅用于区分一个元素和另一个元素。例如,第一元素可以被称为第二元素,并且类似地,第二元素可以被称为第一元素,而不脱离本公开的教导。
本文结合框图和/或流程图描述了一些示例,其中每个框表示包括用于实现指定逻辑功能的一个或多个可执行指令的电路元件、模分块或代码的部分。还应该注意的是,在其他实现方式中,框中所述的功能可以不按所述的顺序发生。例如,根据所涉及的功能,连续示出的两个框实际上可以实质上同时执行,或者这些框有时可以以相反的顺序执行。
本文提到的“根据……实施例”或“在..实施例中”意味着结合实施例描述的特定特征、结构或特性可以被包括在本公开的至少一个实现方式中。本文中不同地方出现的短语“根据...实施例”或“在...实施例中”不一定都指同一实施例,也不一定是与其他实施例相互排斥的单独或替代实施例。
图1示出了可以应用本公开的拍摄效果的推荐方法、装置、终端设备和存储介质的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如语音交互类应用、视频会议类应用、短视频社交类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有麦克风和扬声器的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层4)播放器、便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如,服务器105可以是对终端设备101、102、103发送的拍摄效果的推荐请求进行处理的后台服务器。
在一些情况下,本公开所提供的拍摄效果的推荐可以由终端设备101、102、103执行,相应地,拍摄效果的推荐装置也可以设置于终端设备101、102、103中,这时,系统架构100可以不包括服务器105。
在一些情况下,本公开所提供的拍摄效果的推荐可以由服务器105执行,相应地,拍摄效果的推荐装置也可以设置于服务器105中,这时,系统架构100可以不包括终端设备101、102、103。
在一些情况下,本公开所提供的拍摄效果的推荐可以由终端设备101、102、103和服务器105共同执行,相应地,拍摄效果的推荐装置也可以分别设置于终端设备101、102、103和服务器105中。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示出了根据本公开的拍摄效果的推荐方法的一个实施例的流程图。该实施例中的方法可以由图1中的终端设备实施,或者由图1中的服务器实施,或者由图1中的终端设备和服务器共同实施。
如图2所示,该方法200包括以下步骤:
步骤210,获取目标视频,目标视频由用户拍摄得到。
本实施例中的方法,可以应用于视频直播场景,也可以应用于非直播场景,例如视频投稿场景。
本实施例中,可以在用户拍摄视频的过程中,基于用户已拍摄的视频,推荐拍摄效果,并应用于用户的后续拍摄。上述用户已拍摄的视频,即为目标视频。
步骤220,从目标视频出提取至少一个图像帧。
本实施例中,图像帧的数目可以是一个或者多个。示例性地,可以获取目标视频中的关键帧,作为提取的图像帧。
步骤230,对至少一个图像帧进行图像识别,得到相应的类别标签。
本实施例中,可以利用图像识别算法,对提取的图像帧进行图像识别处理。示例性地,可以采用基于opencv(一种跨平台计算机视觉库)的图像识别算法,对提取的图像帧进行图像识别处理。
本实施例中,图像帧的识别结果是图像帧所含信息的类别标签。示例性地,类别标签例如是“人物”、“风景”、“动物”、“植物”等。
在提取多个图像帧的情况下,可以根据每个图像帧的类别标签,确定最终的类别标签。示例性地,可以取多个图像帧的类别标签的并集,作为最终的类别标签。或者,可以从多个图像帧的类别标签中选取置信度最高的一个或者多个类别标签,作为最终的类别标签。
步骤240,根据类别标签,确定相应的拍摄效果并推荐给用户。
本实施例中,可以按照设定算法,确定类别标签对应的拍摄效果。
本实施例中,拍摄效果可以包括滤镜、特效和声音中的至少一种。上述滤镜,例如是通过改变图像的亮度、对比度等参数实现特定的视觉效果。上述特效,例如是通过在图像中增加贴图、改变人脸形状等方式来实现图像的趣味效果。上述音乐,例如是可添加到视频中的背景音乐或者特定音效等。
在可选的实施例中,可以先获取至少一个候选拍摄效果,再根据类别标签,确定每个候选拍摄效果的推荐分数,最后根据每个候选拍摄效果的推荐分数,从候选拍摄效果中确定出目标拍摄效果并推荐给用户。示例性地,可以选取推荐分数最高的一个或者多个拍摄效果作为目标拍摄效果。示例性地,可以预先设定每个候选拍摄效果对应的类别标签。对于特定的一个候选拍摄效果,如果该候选拍摄效果与识别出的一个类别标签相对应,则可以将该类别标签的置信度作为该候选拍摄效果的推荐分数;如果该候选拍摄效果与识别出的多个类别标签相对应,则可以将多个类别标签的置信度之和作为该候选拍摄效果的推荐分数。
上述候选拍摄效果,可以由运营人员管理和维护,例如运营人员可以设置当前流行或者最新的拍摄滤镜,作为候选拍摄效果。候选拍摄效果还可是是用户曾经使用过的拍摄效果,或者由系统自动生成的拍摄效果。可选地,可以将由运营人员管理和维护的候选拍摄效果,以一定的比例插入类别标签对应的候选拍摄效果中。可选地,如果由运营人员管理和维护的候选拍摄效果与类别标签相匹配,则优先将其确定为目标拍摄效果并推荐给用户,无论其推荐分数为何值。
在可选的实施例中,可以在目标拍摄效果的推荐分数大于第一分数阈值(例如,表示“非常推荐”)并且数目为一个的情况下,在当前拍摄中直接应用目标拍摄效果。可以在目标拍摄效果的推荐分数大于第一分数阈值(例如,表示“非常推荐”)并且数目为为多个的情况下,或者在目标拍摄效果的推荐分数大于第二分数阈值并且小于第一分数阈值(例如,表示“比较推荐”)的情况下,向用户提供交互界面,并响应与用户在推荐交互界面的操作(例如选择操作或者确认操作)应用目标拍摄效果。
本实施例中,通过对目标视频的图像帧进行识别得到类别标签,并给予类别标签推荐相应的拍摄效果,有利于提高视频拍摄效果的易用性,提高视频的观赏度和趣味性。并有利于激发用户拍摄的欲望。
图3A示出了根据本公开的拍摄效果的推荐方法的另一实施例的流程图。如图3A所示,该方法310包括以下步骤:
步骤311,获取目标视频和目标视频对应的音频数据。
目标视频对应的音频数据用于确定拍摄时的声音环境。示例性地,音频数据可以通过从目标视频中提取音频获得,或者,音频数据可以通过获取麦克风采集的声音数据获得。
步骤312,从目标视频出提取至少一个图像帧。
步骤312可以参见上文对步骤220的描述。
步骤313,对至少一个图像帧进行图像识别,得到相应的类别标签。
步骤313可以参见上文对步骤230的描述。
步骤314,根据目标视频数据对应的音频数据,对类别标签进行修正。
对类别标签进行修正,例如是对当前类别标签进行增加、修改或者删除。
在可选的实施例中,可以根据音频数据确定环境音量,在环境音量大于设定第一阈值的情况下,在当前类别标签中增加“嘈杂”标签。在环境音量小于第二设定阈值的情况下,在当前类别标签中增加“安静”标签。
在可选的实施例中,可以将根据音频数据的音频内容确定的类别标签,并根据由音频内容确定的类别标签和由目标视频确定的类别标签确定最终的类别标签。示例性地,可以对音频内容进行声音种类的识别,判断是人声、风声、音乐还是动物叫声等。对于人声,可以进行语音识别,以确定音频内容中的关键词,例如“风景”、“高效”或者“购物”等。
在可选的实施例中,在将由音频数据确定的类别标签和由目标视频确定的类别标签进行融合时,如果二者一致(例如均为“搞笑”标签),则可以提高该类别标签的推荐分数,示例性地,可以将基于音频数据的推荐分数和基于目标视频的推荐分数相加,得到该类别标签的推荐分数。
在可选的实施例中,在将由音频数据确定的类别标签和由目标视频确定的类别标签进行融合时,可以设置二者的优先级高低,以便指定优先采用由音频数据确定的类别标签,还是优先采用由目标视频确定类别标签。
步骤315,根据修正后的类别标签,确定相应的拍摄效果并推荐给用户。
示例性地,可以在当前标签包含“嘈杂”标签的情况下,不向用户推荐声音效果。可以在当前标签包含“安静”标签的情况下,向用户推荐声音效果,例如特定的音乐。
图3B示出了根据本公开的拍摄效果的推荐方法的另一实施例的流程图。如图3B所示,该方法320包括以下步骤:
步骤321,获取目标视频和目标视频对应的摄像头信息。
目标视频对应的摄像头信息用于表示终端设备的前/后置摄像头的启用状态,进而表示目标视频是由终端设备的前置摄像仪拍摄还是由终端设备的后置摄像头拍摄。
步骤322,从目标视频出提取至少一个图像帧。
步骤322可以参见上文对步骤220的描述。
步骤323,对至少一个图像帧进行图像识别,得到相应的类别标签。
步骤323可以参见上文对步骤230的描述。
步骤324,根据目标视频数据对应的摄像头信息,对类别标签进行修正。
对类别标签进行修正,例如是对当前类别标签进行增加、修改或者删除。示例性地,在当前类别标签为“人物”,并且目标视频对应的摄像头信息表示前置摄像头开启的情况下,可以进一步将“人物”标签修改为“自拍”标签,以表示当前拍摄场景为用户自拍。
步骤325,根据修正后的类别标签,确定相应的拍摄效果并推荐给用户。
示例性地,可以在当前标签包含“自拍”标签的情况下,向用户提供“人脸遮挡”、“人脸变形”或者“美颜”等拍摄效果。
图3C示出了根据本公开的拍摄效果的推荐方法的另一实施例的流程图。如图3C所示,该方法330包括以下步骤:
步骤331,获取目标视频和用户拍摄的历史视频的描述信息。
用户拍摄的历史视频,可以是存储在本地的视频,也可以是上传至服务器的视频。历史视频的描述信息,例如是历史视频的标题、简介或者类别标签。
步骤332,从目标视频出提取至少一个图像帧。
步骤332可以参见上文对步骤220的描述。
步骤333,对至少一个图像帧进行图像识别,得到相应的类别标签。
步骤333可以参见上文对步骤230的描述。
步骤334,根据用户拍摄的历史视频的描述信息,对类别标签进行修正。
对类别标签进行修正,例如是对当前类别标签进行增加、修改或者删除。示例性地,在用户拍摄的历史视频的描述信息包含“搞笑”关键字的情况下,可以在当前类别标签中增加“搞笑”标签。
步骤335,根据修正后的类别标签,确定相应的拍摄效果并推荐给用户。
示例性地,可以在当前标签包含“搞笑”标签的情况下,向用户提供搞笑贴图、搞笑音效或者轻快音乐等拍摄效果。
在可选的实施例中,可以同时根据目标视频对应的音频数据、目标视频对应的摄像头信息和用户拍摄的历史视频的描述信息对类别标签进行修正,以提高类别标签的准确性,进而提升拍摄效果推荐的准确性。
图3D根据本公开的拍摄效果的推荐方法的一个具体例子的流程图。如图3D所示,终端设备先获取目标视频、音频数据和摄像头信息(这里称为特征信息),即执行步骤341,再在将上述特征信息发送至服务器,即执行步骤342。服务器先从目标视频中提取至少一个图像帧,再对至少一个图像帧进行图像识别,得到类别标签,之后根据音频数据、摄像头信息和(自身存储的)历史视频的描述信息对类别标签进行修正,最后根据修正后类别标签,确定拍摄效果,即执行步骤343-346。确定拍摄效果后,服务器将拍摄效果发送至终端设备,即执行步骤347。终端设备最终在拍摄中应用上述拍摄效果,即执行步骤348。
图4示出了根据本公开的实施例的拍摄效果的推荐装置的示例性框图。如图4所示,该拍摄效果的推荐装置400包括:获取模块410,用于获取目标视频,上述目标视频由用户拍摄得到;提取模块420,用于从上述目标视频出提取至少一个图像帧;识别模块430,用于对上述至少一个图像帧进行图像识别,得到相应的类别标签;推荐模块440,用于根据上述类别标签,确定相应的拍摄效果并推荐给用户。
应当理解,图4中所示装置400的各个模块可以与参考图2描述的方法200中的各个步骤相对应。由此,上面针对方法200描述的操作、特征和优点同样适用于装置400及其所包括的模块。为了简洁起见,某些操作、特征和优点在此不再赘述。
在可选的实施例中,获取模块410还用于:获取上述目标视频对应的音频数据。推荐模块440还用于:根据上述目标视频数据对应的音频数据,对上述类别标签进行修正;根据修正后的上述类别标签,确定相应的拍摄效果并推荐给用户。
在可选的实施例中,获取模块410还用于:获取上述目标视频对应的摄像头信息。推荐模块440还用于:根据上述目标视频数据对应的摄像头信息,对上述类别标签进行修正;根据修正后的上述类别标签,确定相应的拍摄效果并推荐给用户。
在可选的实施例中,获取模块410还用于:获取用户拍摄的历史视频的描述信息。推荐模块440还用于:根据上述历史视频的描述信息,对上述类别标签进行修正;根据修正后的上述类别标签,确定相应的拍摄效果并推荐给用户。
在可选的实施例中,推荐模块440还用于:获取至少一个候选拍摄效果;根据上述类别标签,确定每个上述候选拍摄效果的推荐分数;根据每个上述候选拍摄效果的推荐分数,从上述候选拍摄效果中确定出目标拍摄效果并推荐给用户。
在可选的实施例中,推荐模块440还用于:在上述目标拍摄效果的推荐分数大于第一分数阈值并且数目为一个的情况下,在当前拍摄中直接应用上述目标拍摄效果;在上述目标拍摄效果的推荐分数大于第一分数阈值并且数目为多个的情况下,或者在上述目标拍摄效果的推荐分数大于第二分数阈值并且小于第一分数阈值的情况下,向用户提供交互界面,并响应与用户在上述推荐交互界面的操作应用上述目标拍摄效果。
在可选的实施例中,上述拍摄效果包括滤镜、特效和声音中的至少一种。
在可选的实施例中,上述候选拍摄效果包括由运营人员管理和维护的候选拍摄效果。推荐模块440还用于:在上述由运营人员管理和维护的候选拍摄效果与上述类别标签相匹配的情况下,将上述由运营人员管理和维护的候选拍摄效果确定为目标拍摄效果并推荐给用户。
在可选的实施例中,推荐模块440还用于:根据上述音频数据,确定相应的类别标签;将根据上述音频数据确定的类别标签,与根据上述目标视频确定的类别标签进行匹配;根据匹配结果,调整相应的类别标签的推荐分数。
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。参见图5,现将描述可以作为本公开的服务器或客户端的电子设备500的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。如图5所示,电子设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。设备500中的多个部件连接至I/O接口505,包括:输入单元706,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如拍摄效果的推荐方法。例如,在一些实施例中,拍摄效果的推荐方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的拍摄效果的推荐方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行拍摄效果的推荐方法。
结合本文公开的方面所描述的各种说明性逻辑、逻辑块、模块、电路和算法过程可以实现为电子硬件、计算机软件或两者的组合。硬件和软件的可互换性已经在功能方面进行了一般性描述,并且在上述各种说明性组件、块、模块、电路和过程中进行了说明。这种功能是以硬件还是软件实现取决于特定的应用和对整个系统的设计限制。
用于实现结合本文公开的方面所描述的各种说明性逻辑、逻辑块、模块和电路的硬件和数据处理装置可以用通用单芯片或多芯片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑器件、分立门或晶体管逻辑、分立硬件组件或被设计成执行本文所描述的功能的其任意组合来实现或执行。通用处理器可以是微处理器或任何常规处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如DSP和微处理器的组合、多个微处理器、一个或多个与DSP内核结合的微处理器、或者任何其他这样的配置。在一些方面中,特定的过程和方法可以由特定于给定功能的电路来执行。
在一个或多个方面,所描述的功能可以在硬件、数字电子电路、计算机软件、固件(包括本说明书中公开的结构及其等同结构)或其任意组合中实现。本说明书中所描述的主题的方面也可以实现为一个或多个计算机程序,即计算机程序指令的一个或多个模块,该一个或多个计算机程序被编码在计算机存储介质上用于由数据处理装置执行或控制数据处理装置的操作。
如果以软件实现,该功能可以作为一个或多个指令或代码存储或传输到计算机可读介质上。本文公开的方法或算法的过程可以在处理器可执行的软件模块中实现,该软件模块可以驻留在计算机可读介质上。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括能够将计算机程序从一个地方传送到另一个地方的任何介质。存储介质可以是可由计算机访问的任何可用介质。作为示例而非限制,此计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁存储设备,或者可以用于以指令或数据结构的形式存储所需的程序代码并且可以由计算机访问的任何其他介质。此外,任何连接都可以被恰当地称为计算机可读介质。本文使用的盘(Disk)和盘(disc)包括高密度光盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘和蓝光光盘,其中盘(Disk)通常磁性地复制数据,而盘(disc)用激光光学地复制数据。以上的组合也应该包括在计算机可读介质的范围内。附加地,方法或算法的操作可以作为机器可读介质和计算机可读介质上的代码和指令的一个或任意组合或集合,其可以被结合到计算机程序产品中。
本公开中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、设备实施例、计算机可读存储介质实施例、以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (13)
1.一种拍摄效果的推荐方法,包括:
获取目标视频,所述目标视频由用户拍摄得到;
从所述目标视频出提取至少一个图像帧;
对所述至少一个图像帧进行图像识别,得到相应的类别标签;
根据所述类别标签,确定相应的拍摄效果并推荐给用户。
2.根据权利要求1所述的方法,其中,在所述根据所述类别标签,确定相应的拍摄效果并推荐给用户之前,所述方法还包括:
获取所述目标视频对应的音频数据;以及
所述根据所述类别标签,确定相应的拍摄效果并推荐给用户,包括:
根据所述目标视频数据对应的音频数据,对所述类别标签进行修正;
根据修正后的所述类别标签,确定相应的拍摄效果并推荐给用户。
3.根据权利要求1所述的方法,其中,在所述根据所述类别标签,确定相应的拍摄效果并推荐给用户之前,所述方法还包括:
获取所述目标视频对应的摄像头信息;以及
所述根据所述类别标签,确定相应的拍摄效果并推荐给用户,包括:
根据所述目标视频数据对应的摄像头信息,对所述类别标签进行修正;
根据修正后的所述类别标签,确定相应的拍摄效果并推荐给用户。
4.根据权利要求1所述的方法,其中,在所述根据所述类别标签,确定相应的拍摄效果并推荐给用户之前,所述方法还包括:
获取用户拍摄的历史视频的描述信息;以及
所述根据所述类别标签,确定相应的拍摄效果并推荐给用户,包括:
根据所述历史视频的描述信息,对所述类别标签进行修正;
根据修正后的所述类别标签,确定相应的拍摄效果并推荐给用户。
5.根据权利要求1所述的方法,其中,所述根据所述类别标签,确定相应的拍摄效果并推荐给用户,包括:
获取至少一个候选拍摄效果;
根据所述类别标签,确定每个所述候选拍摄效果的推荐分数;
根据每个所述候选拍摄效果的推荐分数,从所述候选拍摄效果中确定出目标拍摄效果并推荐给用户。
6.根据权利要求5所述的方法,其中,所述从所述候选拍摄效果中确定出目标拍摄效果并推荐给用户,包括:
在所述目标拍摄效果的推荐分数大于第一分数阈值并且数目为一个的情况下,在当前拍摄中直接应用所述目标拍摄效果;
在所述目标拍摄效果的推荐分数大于第一分数阈值并且数目为多个的情况下,或者在所述目标拍摄效果的推荐分数大于第二分数阈值并且小于第一分数阈值的情况下,向用户提供交互界面,并响应与用户在所述推荐交互界面的操作应用所述目标拍摄效果。
7.根据权利要求1所述方法,其中,所述拍摄效果包括滤镜、特效和声音中的至少一种。
8.根据权利要求5所述的方法,其中,所述候选拍摄效果包括由运营人员管理和维护的候选拍摄效果;以及
所述根据所述类别标签,确定相应的拍摄效果并推荐给用户,还包括:
在所述由运营人员管理和维护的候选拍摄效果与所述类别标签相匹配的情况下,将所述由运营人员管理和维护的候选拍摄效果确定为目标拍摄效果并推荐给用户。
9.根据权利要求2所述的方法,其中,所述根据所述目标视频数据对应的音频数据,对所述类别标签进行修正,包括:
根据所述音频数据的音频内容,确定相应的类别标签;
根据由所述音频内容确定的类别标签和由所述目标视频确定的类别标签,确定最终的类别标签。
10.一种拍摄效果的推荐装置,包括:
获取模块,用于获取目标视频,所述目标视频由用户拍摄得到;
提取模块,用于从所述目标视频出提取至少一个图像帧;
识别模块,用于对所述至少一个图像帧进行图像识别,得到相应的类别标签;
推荐模块,用于根据所述类别标签,确定相应的拍摄效果并推荐给用户。
11.一种计算机程序产品,包括程序代码指令,当所述程序产品由计算机执行时,所述程序代码指令使所述计算机执行权利要求1-9中的至少一项所述的方法。
12.一种存储有计算机指令的非暂时性计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中的至少一项所述的方法。
13.一种电子设备,包括:
处理器,
与所述处理器进行电子通信的存储器;以及
指令,所述指令存储在所述存储器中并且可由所述处理器执行以使所述电子设备执行根据权利要求1-9中的至少一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310161334.6A CN116112779A (zh) | 2023-02-23 | 2023-02-23 | 拍摄效果的推荐、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310161334.6A CN116112779A (zh) | 2023-02-23 | 2023-02-23 | 拍摄效果的推荐、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116112779A true CN116112779A (zh) | 2023-05-12 |
Family
ID=86258007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310161334.6A Pending CN116112779A (zh) | 2023-02-23 | 2023-02-23 | 拍摄效果的推荐、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116112779A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013128251A (ja) * | 2011-12-19 | 2013-06-27 | Nikon Corp | 撮像装置およびプログラム |
CN110177219A (zh) * | 2019-07-01 | 2019-08-27 | 百度在线网络技术(北京)有限公司 | 视频的模板推荐方法和装置 |
WO2020020156A1 (zh) * | 2018-07-23 | 2020-01-30 | 腾讯科技(深圳)有限公司 | 一种视频处理方法及装置、终端设备、服务器及存储介质 |
CN112214636A (zh) * | 2020-09-21 | 2021-01-12 | 华为技术有限公司 | 音频文件的推荐方法、装置、电子设备以及可读存储介质 |
WO2021143008A1 (zh) * | 2020-01-19 | 2021-07-22 | 深圳市商汤科技有限公司 | 类别标注方法及装置、电子设备、存储介质和计算机程序 |
CN113727025A (zh) * | 2021-08-31 | 2021-11-30 | 荣耀终端有限公司 | 一种拍摄方法、设备、存储介质和程序产品 |
CN113727012A (zh) * | 2020-08-27 | 2021-11-30 | 荣耀终端有限公司 | 一种拍摄方法及终端 |
US20220086337A1 (en) * | 2020-09-11 | 2022-03-17 | International Business Machines Corporation | Recommending location and content aware filters for digital photographs |
CN114697539A (zh) * | 2020-12-31 | 2022-07-01 | 深圳市万普拉斯科技有限公司 | 拍照推荐方法、装置、电子设备以及存储介质 |
-
2023
- 2023-02-23 CN CN202310161334.6A patent/CN116112779A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013128251A (ja) * | 2011-12-19 | 2013-06-27 | Nikon Corp | 撮像装置およびプログラム |
WO2020020156A1 (zh) * | 2018-07-23 | 2020-01-30 | 腾讯科技(深圳)有限公司 | 一种视频处理方法及装置、终端设备、服务器及存储介质 |
CN110177219A (zh) * | 2019-07-01 | 2019-08-27 | 百度在线网络技术(北京)有限公司 | 视频的模板推荐方法和装置 |
WO2021143008A1 (zh) * | 2020-01-19 | 2021-07-22 | 深圳市商汤科技有限公司 | 类别标注方法及装置、电子设备、存储介质和计算机程序 |
CN113727012A (zh) * | 2020-08-27 | 2021-11-30 | 荣耀终端有限公司 | 一种拍摄方法及终端 |
US20220086337A1 (en) * | 2020-09-11 | 2022-03-17 | International Business Machines Corporation | Recommending location and content aware filters for digital photographs |
CN112214636A (zh) * | 2020-09-21 | 2021-01-12 | 华为技术有限公司 | 音频文件的推荐方法、装置、电子设备以及可读存储介质 |
CN114697539A (zh) * | 2020-12-31 | 2022-07-01 | 深圳市万普拉斯科技有限公司 | 拍照推荐方法、装置、电子设备以及存储介质 |
CN113727025A (zh) * | 2021-08-31 | 2021-11-30 | 荣耀终端有限公司 | 一种拍摄方法、设备、存储介质和程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111164601B (zh) | 情感识别方法、智能装置和计算机可读存储介质 | |
CN109145784B (zh) | 用于处理视频的方法和装置 | |
CN110602554B (zh) | 封面图像确定方法、装置及设备 | |
CN111415677B (zh) | 用于生成视频的方法、装置、设备和介质 | |
US11670015B2 (en) | Method and apparatus for generating video | |
CN111263227B (zh) | 一种多媒体播放方法、装置、存储介质以及终端 | |
US11257293B2 (en) | Augmented reality method and device fusing image-based target state data and sound-based target state data | |
WO2020024484A1 (zh) | 用于输出数据的方法和装置 | |
CN111432233A (zh) | 用于生成视频的方法、装置、设备和介质 | |
WO2022134698A1 (zh) | 视频处理方法及装置 | |
CN108920640A (zh) | 基于语音交互的上下文获取方法及设备 | |
EP4390725A1 (en) | Video retrieval method and apparatus, device, and storage medium | |
CN112634413B (zh) | 生成模型和生成3d动画的方法、装置、设备和存储介质 | |
CN113810729B (zh) | 直播氛围特效匹配方法、装置、设备及介质 | |
CN112102157A (zh) | 视频换脸方法、电子设备和计算机可读存储介质 | |
WO2023151424A1 (zh) | 视频的音画面播放速率调整方法及装置 | |
CN113610953A (zh) | 一种信息处理方法、装置及计算机可读存储介质 | |
CN111259245A (zh) | 作品推送方法、装置及存储介质 | |
CN114222077A (zh) | 视频处理方法、装置、存储介质及电子设备 | |
WO2024066549A1 (zh) | 一种数据处理方法及相关设备 | |
KR102460595B1 (ko) | 게임 방송에서의 실시간 채팅 서비스 제공 방법 및 장치 | |
CN116112779A (zh) | 拍摄效果的推荐、装置、存储介质及电子设备 | |
CN113923477A (zh) | 视频处理方法、装置、电子设备以及存储介质 | |
CN114331906A (zh) | 图像增强方法和装置、存储介质和电子设备 | |
CN111784787B (zh) | 图像生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |