CN117692762A - 拍摄方法及电子设备 - Google Patents
拍摄方法及电子设备 Download PDFInfo
- Publication number
- CN117692762A CN117692762A CN202310748245.1A CN202310748245A CN117692762A CN 117692762 A CN117692762 A CN 117692762A CN 202310748245 A CN202310748245 A CN 202310748245A CN 117692762 A CN117692762 A CN 117692762A
- Authority
- CN
- China
- Prior art keywords
- frames
- electronic device
- frame
- highlight
- preview
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 230000033001 locomotion Effects 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 27
- 230000015654 memory Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 20
- 230000004044 response Effects 0.000 description 18
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 230000009191 jumping Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 241000282412 Homo Species 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 101001045744 Sus scrofa Hepatocyte nuclear factor 1-beta Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000743799 Calamagrostis Species 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 210000003423 ankle Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000001513 elbow Anatomy 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000001624 hip Anatomy 0.000 description 1
- 238000012966 insertion method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000002832 shoulder Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Landscapes
- Studio Devices (AREA)
Abstract
本申请提供拍摄方法及电子设备。该方法提供了电子设备获取精彩视频的方式。电子设备可以在摄像头对准目标场景的情况下,对预览流进行分析,从预览流中确定多个精彩帧。然后电子设备可以根据确定的精彩帧生成图像质量较高的精彩照片,并对精彩照片插帧,进而生成视频。这样用户无需手动操作,就可以得到清晰、生动的精彩视频,提高用户的拍摄体验。
Description
技术领域
本申请涉及终端技术领域,尤其涉及拍摄方法及电子设备。
背景技术
日常生活中常会出现一些美好、精彩的瞬间。人们会使用带有摄像头的电子设备拍摄照片或是视频,以记录下美好、精彩的瞬间。用户将摄像头对准目标场景后,电子设备会将目标场景的预览画面实时显示在显示屏上。当用户按下快门键时,电子设备可以生成预览画面对应的照片,并对照片进行存储。
发明内容
本申请提供了拍摄方法及电子设备,电子设备可以在摄像头对准目标场景时,对预览流进行分析,然后电子设备可以使用精彩帧识别方法从预览流中识别多个精彩帧。然后电子设备可以生成精彩帧对应的拍照帧,并对拍照帧进行插帧处理。最后电子设备可以使用精彩帧对应的拍照帧以及在上述拍照帧中插入的图像帧生成清晰、生动的视频。
第一方面,本申请提供了一种拍摄方法,该方法应用于电子设备,电子设备包括摄像头,该方法包括:电子设备利用预览流在显示屏上显示预览画面,预览流包括多张预览帧;电子设备从多张预览帧中识别出多张精彩帧,精彩帧中运动物体处于预设运动;电子设备获取多张精彩帧各自对应的原始图像;电子设备对多张精彩帧各自对应的原始图像处理,生成多张拍照帧,拍照帧的分辨率大于预览帧的分辨率;电子设备保存视频到图库,该视频包括多张拍照帧。
其中,电子设备中的摄像头对准目标场景后,电子设备会通过预览流在显示屏上显示目标场景的预览画面。其中预览画面是电子设备对预览流中的预览帧送显后显示的。预览流中可以包括多张预览帧,电子设备可以从预览流中的预览帧中识别出精彩帧。精彩帧的图像内容中运动物体处于预设运动。运动物体可以是人、动物、植物或是其他无生命物体等等。电子设备可以根据精彩帧的索引获取精彩帧对应的原始图像。该原始图像是摄像头采集到的,未经处理器处理的图像。该精彩帧对应的原始图像是指该原始图像经过处理器(例如图像信号处理器)处理后可以得到该精彩帧。电子设备得到精彩帧对应的原始图像后,可以对该精彩帧对应的原始图像进行处理,生成该精彩帧对应的拍照帧。需要说明的是,电子设备可以通过预览流得到多个精彩帧,电子设备对多个精彩帧处理后可以得到多张拍照帧。由于电子设备对原始图像处理生成预览帧时使用了下采样算法,所以预览帧的分辨率较低。而电子设备在生成拍照帧时,相比生成预览帧会使用更多的图像增强算法,这使得拍照帧相比预览帧的分辨率更高,图像质量也更高。电子设备可以根据多张精彩帧对应的拍照帧生成视频,并将视频保存到图库中。
电子设备可以在用户将摄像头对准目标场景后,提取多个精彩帧。然后电子设备可以生成精彩帧对应的拍照帧,并根据上述拍照帧生成视频。用户无需手动点击快门键就可以获得生动、清晰的视频,这样可以减少用户操作的繁琐性,提高用户的拍摄体验。
结合第一方面,在一些实施例中,视频还包括多张拍照帧之间的一张或多张插入帧,在连续两个拍照帧之间的插入帧中,运动物体所处的位置落在第一运动轨迹上,第一运动轨迹是运动物体在连续两个拍照帧中的像素移动形成的运动轨迹。
其中,电子设备根据精彩帧对应的拍照帧生成的视频中,除了包含多张拍照帧,还包括电子设备在拍照帧之间插入的一张或多张图像帧。电子设备在拍照帧之间插入的图像帧也可以称作插入帧。电子设备在生成插入帧时,也可以使用图像增强算法对插入帧进行处理。由于电子设备中的摄像头在采集原始图像时,还会保存每个原始图像的时间戳,电子设备可以根据拍照帧对应的原始图像的时间戳,按照时间先后顺序对拍照帧进行排列。然后电子设备可以在相邻拍照帧之间插入一张或多张插入帧。示例性地,电子设备可以确定运动物体在连续两个拍照帧中的像素移动形成的运动轨迹,上述运动轨迹可以称为第一运动轨迹。然后电子设备可以生成多张插入帧,插入帧的图像中该运动物体处在第一运动轨迹上。并且插入帧可以按照插入帧图像内容中该运动物体所处的位置离第一运动轨迹起点由近到远排列。
也即是说,电子设备可以根据拍照帧的图像中运动物体的运动轨迹生成多张插入帧。进而,电子设备可以根据拍照帧和多张插入帧生成视频。由于插入帧中运动物体的位置能够反应运动物体在相邻拍照帧之间的状态,因此电子设备根据拍照帧和插入帧生成的视频会更加连贯和流畅。
结合第一方面,在一些实施例中,每两个相邻拍照帧之间的插入帧的数量相同。
也即是说,电子设备在每两个相邻拍照帧之间可以插入相同数量的插入帧。这样在电子设备生成的视频中,插入帧在每两个精彩帧对应拍照帧之间过渡的时间长度是相等的。
结合第一方面,在一些实施例中,多张拍照帧包括相邻的第一拍照帧和第二拍照帧、相邻的第三拍照帧和第四拍照帧,第一拍照帧和第二拍照帧之间插入K1张插入帧,第三拍照帧和第四拍照帧之间插入K2张插入帧,其中K1、K2为正整数,K1小于K2。
也即是说,电子设备在每两个相邻拍照帧之间插入的插入帧的数量可以不相同。这样,在电子设备生成的视频中,插入帧在每两个精彩帧对应拍照帧之间过渡的时间长度是不相等的。
结合第一方面,在一些实施例中,第三拍照帧和第四拍照帧的精彩程度高于第一拍照帧和第二拍照帧的精彩程度。
其中,电子设备可以根据每个精彩帧的图像内容确定精彩帧的精彩程度。电子设备可以在精彩程度较高的精彩帧对应的拍照帧之间插入更多的插入帧,这样在上述两个拍照帧之间的插入帧的过渡时间更长,视频中这两个拍照帧之间的过渡也会更加流畅。用户可以观看到更有侧重点的视频。
结合第一方面,在一些实施例中,电子设备从多张预览帧中识别出多张精彩帧,包括:电子设备识别多张预览帧中运动物体的关键点,运动物体的关键点用于表示运动物体的姿态;电子设备可以根据运动物体的关键点识别多张精彩帧,精彩帧中运动物体的姿态与第一模板匹配。
电子设备可以识别预览帧中运动物体的关键点。不同类型运动物体的关键点可以不同,例如,对于人和动物等,关键点可以是人和动物的骨骼点,对于无生命物体的关键点可以是物体轮廓上的一个或多个点。电子设备中可以存储有第一模板,第一模板中包括运动物体在特定运动下的关键点。电子设备可以将预览帧中运动物体的关键点和第一模板中运动物体在特定运动下的关键点匹配。例如,电子设备可以计算预览帧中运动物体的关键点和第一模板中运动物体在特定运动下的关键点的相似度。当上述相似度高于第一阈值时,电子设备可以将该预览帧识别为精彩帧。可选的,电子设备还可以存储有第二阈值,当上述相似度高于第二阈值时,电子设备可以确认该精彩帧的精彩程度较高。电子设备可以在精彩程度较高的精彩帧对应的拍照帧之间插入数量更多的图像帧。
其中,第一模板可以是由用户选择的。参考图5C所示的实施例,电子设备可以接收用户对拍摄场景选项的选择操作,响应于该操作电子设备可以选中该拍摄场景选项对应的第一模板。或者,第一模板还可以是电子设备基于第一拍摄场景从多个模板中选择的,多个模板各自对应不同的拍摄场景,第一拍摄场景可以是预览画面中呈现的拍摄场景。电子设备可以在摄像头对准目标拍摄场景后,对拍摄场景进行识别。进而电子设备可以选择拍摄场景对应的第一模板识别预览帧中的精彩帧。
结合第一方面,在一些实施例中,电子设备从多张预览帧中识别出多张精彩帧,包括:电子设备确定多张预览帧各自的文字描述,文字描述用于描述预览帧表达的内容;电子设备根据文字描述从多张预览帧中选择出多张精彩帧,多张精彩帧的文字描述中存在第一关键词,第一关键词用于描述预设运动。
电子设备可以识别预览帧的文字描述,上述文字描述用于描述预览帧的图像所表达的内容。其中,电子设备可以通过机器学习的方法识别预览帧的文字描述。电子设备中可以获取精彩帧对应的一个或多个关键词,其中包括第一关键词。当预览帧的文字描述中包含该第一关键词时,电子设备可以将该预览帧识别为精彩帧。其中第一关键词可以描述运动物体的预设运动,例如“跳起”、“投篮”、“吹蜡烛”等等。
结合第一方面,在一些实施例中,电子设备可以将两张精彩帧之间的预览帧也作为精彩帧。也即是说,电子设备在通过预览帧中运动物体的关键点,或是预览帧的文字描述等方法识别出精彩帧后,还可以将两精彩帧之间的预览帧都作为精彩帧。
结合第一方面,在一些实施例中,电子设备可以将精彩帧相邻的前Y1张预览帧和/或后Y2张预览帧也作为精彩帧,其中Y1和Y2为正整数。也即是说,电子设备在通过预览帧中运动物体的关键点,或是预览帧的文字描述等方法识别出精彩帧后,还可以将与某个精彩帧前、后相邻的预览帧也作为精彩帧。
这样,可以避免电子设备在识别预览帧中的精彩帧时,由于精彩帧对应的模板不够全面,或是精彩帧对应的文字描述的关键词不够全面,使得电子设备识别出的精彩帧数量过少导致对精彩帧对应拍照帧插帧的效果不佳,影响电子设备生成的视频的流畅性。
结合第一方面,在一些实施例中,电子设备利用预览流在显示屏上显示预览画面时还显示精彩抓拍按钮,电子设备从多张预览帧中识别出多张精彩帧之前,还包括:电子设备检测到作用于所述精彩抓拍按钮的操作。也即是说,电子设备可以接收并响应于用户作用于精彩抓拍按钮的操作,再对预览流中的精彩帧进行识别。
第二方面,本申请提供一种电子设备,该电子设备包括显示屏、存储器以及耦合于存储器的处理器;该显示屏用于显示界面,存储器存储有计算机程序,处理器执行上述计算机程序时使得电子设备实现上述第一方面任意一项所述的方法。
第三方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序或计算机指令,前述计算机程序或计算机指令被处理器执行以实现上述第一方面任意一项所述的方法。
第四方面,本申请实施例提供一种计算机程序产品,该计算机程序产品被处理器执行时,上述第一方面任意一项所述的方法将被实现。
第五方面,本申请实施例提供一种芯片,该芯片包括处理器和存储器,其中,该存储器用于存储计算机程序或计算机指令,该处理器用于执行所述存储器中存储的计算机程序或计算机指令,使得该芯片执行上述第一方面任一项所述的方法。
上述第二方面至第五方面提供的方案,用于实现或配合实现上述第一方面中对应提供的方法,因此可以与第一方面中对应的方法达到相同或相应的有益效果,此处不再进行赘述。
附图说明
图1是本申请实施例提供的电子设备100的架构示意图;
图2是本申请实施例提供的电子设备100的软件结构框图;
图3A是本申请实施例提供的一种拍摄方法的流程图;
图3B-图3C是本申请实施例提供的电子设备从预览流中识别出精彩帧,并生成精彩帧对应拍照帧的过程示意图;
图3D-图3F是本申请实施例提供的电子设备对拍照帧插帧的过程示意图;
图4是本申请实施例提供的一些电子设备识别精彩帧的方法流程图;
图5A-图5J是本申请实施例提供的拍摄方法涉及的一系列用户交互示意图。
具体实施方式
本申请以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括复数表达形式,除非其上下文中明确地有相反指示。还应当理解,本申请中使用的术语“和/或”是指并包含一个或多个所列出项目的任何或所有可能组合。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
日常生活中人们常会使用带有摄像头的电子设备拍摄照片以记录下精彩片段中的某一时刻。有时用户可能会觉得照片是静态的不够生动,希望电子设备能够在拍下高质量照片的同时,能够更加生动地重现上述精彩片段。
本申请实施例提供了拍摄方法及电子设备。电子设备可以通过预览流识别一个或多个精彩帧,然后确定精彩帧对应的原始图像。电子设备可以对原始图像进行处理生成图像质量更高的高清图像。然后,电子设备可以在高清图像中插入新的图像帧并生成视频。相比照片,该视频能够更加生动形象地呈现出被拍摄对象的一系列精彩瞬间,提高用户的拍摄体验。
下面首先介绍本申请实施例提供的电子设备100。
图1是本申请实施例提供的电子设备100的架构示意图。
电子设备100可以是搭载或者其它操作系统的便携式终端设备,例如手机、平板电脑、桌面型计算机、膝上型计算机、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本,以及蜂窝电话、个人数字助理(personal digital assistant,PDA)、增强现实(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备、人工智能(artificial intelligence,AI)设备、可穿戴式设备、车载设备、智能家居设备和/或智慧城市设备,等等。
如图1所示,电子设备100可以包括摄像头110、图像信号处理器(image signalprocessor,ISP)111、应用处理器(application processor,AP)112、缓冲存储器113、显示屏114、编码器115、编码器116和外部存储器117,这些部件通过一组或多组总线相耦合。上述总线可以是集成电路(inter-integrated circuit,I2C)总线、集成电路内置音频(inter-integrated circuit sound,I2S)总线、脉冲编码调制(pulse code modulation,PCM)总线、移动产业处理器接口(mobile industry processor interface,MIPI,等等。
摄像头110可包括:镜头(图中未示出)、感光传感器和柔性印刷电路板(flexibleprinted circuit board,FPCB)部分(图中未示出)。FPCB负责将摄像头110的其他组件,如感光传感器,与图像信号处理器(ISP)111连接起来,例如将感光传感器输出的原始数据传输到ISP。在拍照时,摄像头110的快门被打开,光线射入并照到感光传感器上。感光传感器将光信号转换为电信号,再通过模数转换(analog digital convert,ADC)进一步将电信号转换成数字信号,以传递给ISP处理。该数字信号的数据即摄像头采集的原始图像数据,其数据格式可例如是拜尔(bayer)排列格式。原始图像数据又被称为RAW图像。
ISP可用于对RAW图像进行一系列图像处理得到YUV帧或RGB帧。其中,这一系列图像处理可包括:自动曝光控制(auto exposure control,AEC)、自动增益控制(auto gaincontrol,AGC)、自动白平衡(auto white balance,AWB)、色彩校正、祛除坏点等等。ISP也可以集成于摄像头110内。
显示屏可用于显示摄像头采集的图像,例如展示预览图像(预览帧)。预览图像可以是ISP输出的YUV帧或RGB帧进一步通过下采样等算法得到的,其清晰度往往低于照片的清晰度,避免预览帧因清晰度太高而导致显示屏显示预览帧的时延较长。一系列预览图像(预览帧)按时间先后顺序排列形成预览流,基于预览流,显示屏可实时呈现摄像头采集到的画面。其中预览流需要送显才会被显示到显示屏上。送显是指把摄像头采集的预览图像推送到帧缓存(frame buffer,FB)中存放。帧缓存是一段存储空间,可以位于显存,也可以位于内存,用于存储显卡芯片处理过的或者将要提取的渲染数据。帧缓存的内容对应于显示屏上的界面显示,可以将其简单理解为显示屏上显示内容对应的缓存。也就是说修改帧缓存中的内容就是修改显示屏上显示的画面。
缓冲存储器113可用于缓存感光传感器输出的RAW图像。
编码器115可用于对ISP输出的YUV帧或RGB帧进行编码,得到照片。编码器115输出的照片的格式可以包括但不限于:联合图像专家组(Joint Photographic Experts Group,JPEG)、标签图像文件格式(Tag Image File Format,TIFF)等任一种格式。
编码器116可用于对ISP输出的YUV帧或RGB帧进行编码得到视频。编码器116输出的视频的格式可以包括但不限于:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。在一些实施例中,编码器115和编码器116可以是同一个编码器的不同编码单元。或者,编码器115和/或编码器116可以是集成在应用处理器中的编码单元。
应用处理器(AP)112可以耦合一个或多个随机存取存储器(random accessmemory,RAM)、一个或多个非易失性存储器(non-volatile memory,NVM)。随机存取存储器可以由应用处理器直接进行读写,可以用于存储操作系统或其他正在运行中的程序的可执行程序(例如机器指令),还可以用于存储用户及应用程序的数据等。非易失性存储器也可以存储可执行程序和存储用户及应用程序的数据等,可以提前加载到随机存取存储器中,用于应用处理器直接进行读写。应用处理器中也可以设置存储单元,该存储单元可以为高速缓冲存储单元,可用于保存应用处理器刚用过或循环使用的指令或数据。本申请实施例提供的拍摄方法的实现代码可存储在NVM中。在启动相机应用后,该代码可被加载到RAM中。这样,应用处理器可从RAM中直接读取该程序代码,实现本申请实施例提供的拍摄方法。
应用处理器112可用于从预览流中识别出多个精彩帧,并将精彩帧的索引发送给ISP,触发ISP从缓冲存储器中取出精彩帧对应的RAW图。应用处理器可以对上述RAW图进行处理生成精彩帧对应的拍照帧。拍照帧可以是ISP输出的YUV帧或RGB帧经过图像增强算法处理后得到的。拍照帧的分辨率高于精彩帧的分辨率,能够更好的呈现出精彩时刻的细节。应用处理器还可用于对ISP输出的精彩帧对应的拍照帧进行插帧处理,并进一步输出给编码器116,以触发编码器116对插帧后的多帧图像进行视频编码,得到视频。需要说明的是,视频是由多个图像帧组成的。视频中的一帧(Frame)图像呈现的是一幅静止的画面。一帧图像可以由多个像素组成。一帧图像的像素越多,分辨率就越高,图像越清晰,该图像占用的存储空间也就越大。由于应用处理器在生成视频时对拍照帧进行了插帧处理,因此上述视频能够呈现出更加连续的精彩画面;而且,由于应用处理器采用了清晰度较高的拍照帧生成视频,因此上述视频的清晰度很高。
此外,外部存储器117可以是NVM的一种,可用于保存照片、视频等图像文件。照片、视频可具体保存在图库应用程序可访问的路径下,这样用户打开图库便能查看该路径下的照片、视频。图库是一款管理照片、视频等图像文件的应用程序,又可以命名成相册。
图1示意的结构并不构成对电子设备100的具体限定,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。例如,电子设备还可以包括用于渲染的图形处理器(graphicsprocessingunit,GPU)。又例如,电子设备100还可以包括各种各样的传感器:压力传感器,距离传感器,接近光传感器,触摸传感器,环境光传感器等。其中,触摸传感器也可以称为“触控面板”,可以设置于显示屏。触摸传感器与显示屏可组成触摸屏,也称“触控屏”。触摸传感器用于检测作用于其上的触摸操作,该触摸操作可以是用户按下快门键的操作。触摸传感器检测到的触摸操作可以传递给应用处理器(AP),以确定触摸事件类型。
图2是本申请实施例的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将系统分为四层,从上至下分别为应用程序层,应用程序框架层,运行时(Runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,音乐,视频等应用程序(也可以称为应用)。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图2所示,应用程序框架层可以包括相机访问接口、窗口管理器,内容提供器,视图系统,电话管理器,资源管理器等。
相机访问接口可以用于为相机应用提供应用编程接口和编程框架。相机访问接口可以包括相机管理器,相机管理器可以用于实现上述实施例中电子设备生成视频的一个或多个方法。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话界面形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
运行时(Runtime)包括核心库和虚拟机。Runtime负责系统的调度和管理。
系统库包含两部分:一部分是编程语言(例如,java语言)需要调用的功能函数,另一部分是系统的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的编程文件(例如,java文件)执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),二维图形引擎(例如:SGL)、相机算法库等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了二维(2-Dimensional,2D)和三维(3-Dimensional,3D)图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现3D图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
相机算法库可以包含一个或多个图像或视频处理算法,例如相机算法库可以包括ISP对RAW图进行处理生成预览流、拍照帧时的一个或多个图像处理算法。另外,相机算法库还可以包括应用处理器从预览流中识别精彩帧的算法、应用处理器对精彩帧对应拍照帧插帧的算法等。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,相机驱动,音频驱动,传感器驱动。其中相机驱动可以用于驱动摄像头的传感器采集图像以及驱动ISP和应用处理器对图像进行处理。
在一些实施例中,当触摸传感器接收到触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸单击操作,该单击操作所对应的控件为相机应用图标的控件为例,相机应用调用应用框架层的相机访问接口,启动相机应用,进而通过调用内核层启动相机驱动,通过摄像头捕获RAW图。响应于用户操作,相机应用可以通过相机访问接口调用相机驱动,然后相机驱动可以驱动ISP或应用处理器实现上述相机算法库中的一个或多个算法。
基于上文介绍的电子设备100的软、硬件架构,下面介绍本申请实施例提供的拍摄方法。
图3A示出了本申请实施例提供的拍摄方法的流程。该方法可以包括:
S301、电子设备利用预览流在显示屏上显示预览画面,预览流包括多张预览帧。
电子设备100可以将预览帧送显,这样显示屏上会显示预览流对应的预览画面。电子设备100显示预览画面的方法可以参考图1所示实施例的介绍,这里不再赘述。由于显示屏上需要实时显示预览画面,因此预览流的分辨率较低。
S302、电子设备从多张预览帧中识别出多张精彩帧,该精彩帧中运动物体处于预设运动。
电子设备100可以依次读取预览流中的预览帧,然后识别预览流中的精彩帧。精彩帧是指图像内容较精彩的预览帧,例如图像内容中的被拍摄对象处于预设运动。上述被拍摄对象可以是运动中的物体。上述运动物体可以是人,则该预设运动可例如是运动员跃起投篮的运动、人吹生日蜡烛的运动。不限于人,运动物体也可以是动物、植物、甚至是无生命物体(例如窗帘、烟花)等,该预设运动可例如是猫跃起跳到桌子上的运动、芦苇草被强风吹的运动、烟花在空中绽放的运动,等等。
电子设备100可以通过识别预览帧中运动物体的关键点,或是识别预览帧图像内容的文字描述确定运动物体处于预设运动。电子设备100确定运动物体处于预设运动的具体方法可以参考后续实施例的介绍,这里先不展开。
S303、电子设备获取多张精彩帧各自对应的原始图像。
其中,原始图像即为感光传感器输出的RAW图像。精彩帧对应的原始图像是指用于生成该精彩帧的原始图像。电子设备100会标记每个RAW图像的索引,上述索引可以反应感光传感器输出RAW图像的时间顺序。电子设备100中存储的RAW图像的索引可以是图像传感器输出该RAW图像的时间戳。
电子设备100还会标记每个预览帧的索引,其中预览帧的索引与生成该预览帧的RAW图像的索引相对应。这样,ISP111可以根据精彩帧的索引从缓冲存储器113中取出该精彩帧对应的RAW图像。
S304、电子设备对多张精彩帧各自对应的原始图像处理,生成多张拍照帧。
电子设备100获取到精彩帧对应的RAW图像之后,可以对RAW图像处理生成多张拍照帧。电子设备100生成多张拍照帧的方法可以参考图1所示实施例的介绍,这里不再赘述。
S305、电子设备保存视频到图库,该视频包括多张拍照帧。
电子设备100生成多张拍照帧后,可以在多张拍照帧之间插入一张或多张图像帧。其中,电子设备100插入的图像帧可以是根据相邻两帧或多帧的图像内容生成的。电子设备生成上述图像帧的方法可以包括但不限于:复制相邻帧、混合相邻帧或是光流插帧法等等。在本申请文件中,电子设备在拍照帧之间插入的图像帧也可以称为插入帧。
以两个相邻帧A帧和B帧为例,复制相邻帧的插帧方法可以是指复制一个或多个A帧和/或一个或多个B帧,然后将复制的图像帧插入到A帧和B帧之间。混合相邻帧的插帧方法可以是为A帧分配A权重,为B帧分配B权重,然后A帧中各个像素乘上A权重,B帧中各个像素乘上B权重。接着将A帧中各个位置像素乘上权重后的结果与B帧对应位置像素乘上权重后的结果相加,得到要在A帧和B帧之间插入的图像帧各个位置的像素值。关于光流插帧法的介绍可以参考后续实施例的介绍,这里不再展开。
在一些实施例中,电子设备100可以确定精彩帧的精彩程度。当精彩帧的精彩程度较高时,电子设备100可以在该精彩帧对应拍照帧与其相邻拍照帧之间插入数量更多的图像帧。电子设备100确定精彩帧的精彩程度的方法可以参考后续实施例的介绍,这里先不展开。
电子设备在多张拍照帧之间插入一张或多张图像帧后,编码器116可以上述多张拍照帧和一张或多张图像帧处理,生成视频。电子设备100可以保存在图库应用程序可访问的路径下,这样用户打开图库便能查看该视频。
通过实施图3A所示的拍摄方法,电子设备100可以为用户拍摄下精彩视频。相较于静态的照片,视频能够更加生动、形象地再现被拍摄对象一系列的精彩瞬间。并且,电子设备100可以在用户预览时识别出精彩瞬间,无需用户手动触发拍摄,这样可以避免因用户反应延迟而错过这些精彩瞬间。最后,由于上述精彩视频由拍照帧生成,并且电子设备还在相邻拍照帧之间插入了新的图像帧,因此最终生成的精彩视频更加清晰、流畅。
图3B示例性示出了电子设备从预览流中识别出精彩帧,并生成精彩帧对应拍照帧的过程。
图3B中共包含三类标签:“拍照流”、“RAW图像”和“预览流”。为了便于理解,这里以“RAW图像”标签下的一个或多个方块代表感光传感器输出的一个或多个RAW图像,“RAW图像”标签下方块中的数字代表该RAW图像的索引。同样的,以“拍照流”标签下的一个或多个方块代表一个或多个拍照帧。“拍照流”标签下方块中的数字代表该拍照帧的索引。“预览流”标签下的一个或多个方块代表一个或多个预览帧。“预览流”标签下方块中的数字代表该预览帧的索引。其中,RAW图像的索引、预览帧的索引和拍照帧的索引是相互对应的。也就是说,索引为2的预览帧和索引为2的拍照帧是电子设备对索引为2的RAW图像进行处理后得到的。需要说明的是,电子设备中拍照帧、RAW图像、预览帧的索引可以是其它形式(例如时间戳),本申请实施例对此不作限制。
电子设备100通过预览流识别N个精彩帧可以包括但不限于:
1、电子设备100中的感光传感器输出P个RAW图像,P为正整数。
2、电子设备100对P个RAW图进行处理,生成P个预览帧。
电子设备100中的感光传感器经过曝光可以不断输出RAW图像。感光传感器共输出P个RAW图像,其中P为正整数。然后电子设备可以依次对P个RAW图像处理,生成P个预览帧。电子设备对RAW图像处理生成预览帧的方法可以参考图1所示实施例的介绍,这里不再赘述。
3、电子设备100确定P个预览帧中的N个精彩帧。
4、电子设备对N个精彩帧对应的RAW图像处理,生成精彩帧对应的拍照帧。
电子设备100可以通过预览流确定一个或多个精彩帧。假设索引为2到索引为P的N个预览帧确定为精彩帧,则电子设备可以取出与上述精彩帧对应的索引为2到索引为P的N个RAW图像,然后对上述N个RAW图像处理,生成精彩帧对应的拍照帧。
如图3C所示,假设预览流中索引为2的预览帧被精彩帧识别算法识别确定为精彩帧,则该索引为2的预览帧对应的RAW图像会被取出。电子设备可以对该RAW图像处理生成拍照帧。电子设备100对索引为2的预览帧进行处理后,可以继续读取索引为3的预览帧。然后电子设备100可以对索引为3的预览帧使用精彩帧识别算法进行识别。电子设备100可以对预览流中的预览帧依次使用精彩帧识别算法进行识别,直到预览流中不存在未使用精彩帧识别算法识别过的预览帧。需要说明的是,电子设备识别精彩帧,和将RAW图像转化成预览帧是同步进行的。也就是说,电子设备对预览流中的预览帧使用精彩帧识别算法进行识别时,还会有新的预览帧加入预览流。电子设备根据RAW图像生成拍照帧的方法可以参考前述实施例的介绍,这里不再赘述。
图3D示例性示出了电子设备对精彩帧对应拍照帧插帧的过程。图3D所示实施例可以看作图3B所示实施例中电子设备生成精彩帧对应拍照帧后,电子设备对拍照帧的进一步处理。
如图3D所示,电子设备100可以在相邻两个拍照帧中插入一个或多个图像帧。其中,电子设备100插入的图像帧可以是根据相邻拍照帧的图像内容生成的。例如,索引为2的拍照帧和索引为3的拍照帧之间插入的图像帧可以是由索引为2的拍照帧的图像内容和索引为3的拍照帧的图像内容生成的。
图3E示例性示出了电子设备使用光流插帧法插帧的过程。以图3D所示索引为2的拍照帧和索引为3的拍照帧为例。如图3E中的步骤1所示,电子设备100可以将索引为2的拍照帧和索引为3的拍照帧输入到神经网络模型A中,神经网络模型A可以输出从索引为2的拍照帧到索引为3的拍照帧的映射表。该映射表可以确定索引为2的拍照帧中的被拍摄对象在索引为3的拍照帧中所处的位置。这样,电子设备100可以根据映射表确定被拍摄对象在两拍照帧之间的运动轨迹(例如电子设备100可以确定被拍摄对象从位置A移动到了位置B)。其中,电子设备100是通过被拍摄对象在两拍照帧之间的像素移动确定被拍摄对象在相邻两拍照帧之间的运动轨迹的。
如图3E中的步骤2所示,电子设备100可以将索引为2的拍照帧、索引为3的拍照帧和上述映射表输入到神经网络模型B中。神经网络模型B可以根据相邻拍照帧和相邻拍照帧对应的映射表生成K1个新的图像帧,并将K1个新的图像帧插入到索引为2的拍照帧、索引为3的拍照帧之间。其中,被拍摄对象在新生成的图像帧中的位置处于该被拍摄对象在索引为2的拍照帧和索引为3的拍照帧之间的运动轨迹上。按照电子设备插入图像帧顺序,图像帧中的对象逐渐远离位置A、靠近位置B。
上述神经网络模型A和神经网络模型B可以是不同的神经网络模型。上述神经网络模型的类型可以包括但不限于卷积神经网络(convolutional neural networks,CNN)模型、循环神经网络(recurrentneuralnetwork,RNN)模型、长短期记忆网络(long short-term memory,LSTM)模型、深度神经网络(deepneuralnetwork,DNN)模型。
电子设备100在其它相邻帧中插入多张图像帧的方法可以参考上述电子设备100在索引为2的拍照帧和索引为3的拍照帧插入K1张图像帧的方法,这里不再赘述。
其中,电子设备在每两个相邻拍照帧之间插入的图像帧的数量可以都相同。如图3F所示,索引为2的拍照帧和索引为3的拍照帧是两个相邻拍照帧,索引为3的拍照帧和索引为4的拍照帧是两个相邻拍照帧,……,索引为P-1的拍照帧和索引为P的拍照帧是两个相邻拍照帧。索引为2的拍照帧和索引为3的拍照帧之间,索引为3的拍照帧和索引为4的拍照帧之间,……,索引为P-1的拍照帧和索引为P的拍照帧之间插入的图像帧的数量可以都是Q1,其中Q1是正整数。这样,后续电子设备将拍照帧和图像帧生成视频时,每两个相邻拍照帧在视频中间隔的时间长度都相等。例如,电子设备100在生成视频时可以将每一帧在视频中显示的时长设置为3毫秒。若电子设备100在每两个相邻拍照帧之间都插入30个图像帧,则视频中每两个拍照帧之间经过的时间都为90毫秒。
不限于此,电子设备在每两个相邻拍照帧之间插入的图像帧的数量可以不相同。例如,电子设备可以在索引为2的拍照帧和索引为3的拍照帧之间插入Q1张图像帧,在索引为3的拍照帧和索引为4的拍照帧之间插入Q2张图像帧。其中,Q1、Q2为正整数,Q2大于Q1。这样在电子设备根据拍照帧和在拍照帧中插入的图像帧生成的视频中,不同相邻拍照帧播放的时间长度可以不相等。例如,电子设备100在生成视频时可以将每一帧在视频中显示的时长设置为3毫秒。电子设备可以在索引为2的拍照帧和索引为3的拍照帧之间插入30个图像帧,而在索引为3的拍照帧和索引为4的拍照帧之间插入50个图像帧。这样电子设备100生成的视频中,从索引为2的拍照帧到索引为3的拍照帧共经过90毫秒,而从索引为3的拍照帧到索引为4的拍照帧共经过150毫秒。上述电子设备100在拍照帧中插入的图像帧的数量以及电子设备100生成的视频中每帧的播放时长仅为示例,不作为本申请实施例的限制。需要说明的是,电子设备通过光流插帧法时,在相邻拍照帧之间插入的图像帧数量越多,越能体现被拍摄对象在相邻拍照帧中的运动过程。当增加两相邻拍照帧之间插入的图像帧的数量时,视频中被拍摄对象在上述两相邻拍照帧之间的过渡就会更加流畅。电子设备100可以在不同相邻帧插入不同数量的图像帧,使视频达到不同的视觉效果。
在一些实施例中,电子设备100可以确定每个精彩帧的精彩程度。电子设备100可以在精彩程度比较高的精彩帧对应的拍照帧与其相邻拍照帧之间插入更多的图像帧。电子设备100确定精彩帧的精彩程度的方法可以参考后续实施例的介绍,这里先不展开。
在一些实施例中,电子设备100可以接收用户改变两个相邻拍照帧之间播放时长的操作。进而,电子设备100可以根据用户设置的播放时长确定两个拍照帧之间插入的图像帧的数量。示例性地,假设电子设备100生成的视频每帧播放3毫秒,电子设备100接收到用户指定从第A帧拍照帧到第A+1帧拍照帧共执行1秒钟的操作。进而,电子设备100可以确定在第A帧拍照帧和第A+1帧拍照帧之间需插入约333个图像帧。
图4示出了电子设备识别精彩帧的两种具体方法,下面对两种精彩帧识别方法分别阐述。
方法1:电子设备识别精彩帧的方法可以包括但不限于以下几步:
S401、电子设备从预览流中获取预览帧。
S402、电子设备识别预览帧中被拍摄对象的关键点。
在一些实施例中,电子设备100可以从预览流中获取一个或多个预览帧,进而识别预览帧中被拍摄对象的关键点。预览帧中可以存在多个对象,每个对象的类别也可以不同。其中,对象的类别可以是人、动物、植物、无生命物体中的一个或多个。
可选的,预览帧中被拍摄对象的关键点可以包括人或动物的骨骼点。电子设备100可以通过骨骼点识别算法确定预览帧中被拍摄对象的骨骼点。上述骨骼点可以包括但不限于:被拍摄对象的头部、颈部、肩部、手肘、手腕、腰部、膝盖和脚踝等部位。
可选的,预览帧中被拍摄对象的关键点还可以包括人或动物的面部关键点。上述面部关键点可以包括但不限于:被拍摄对象的眉毛、眼睛、鼻子、嘴巴等。
可选的,预览帧中被拍摄对象的关键点还可以包括无生命物体的关键点。示例性地,上述关键点可以包括但不限于:被拍摄对象轮廓上的一个或多个点等。
在一些实施例中,电子设备100可以将预览帧输入到神经网络模型C中,然后接收神经网络模型C输出的一个或多个关键点。
在一些实施例中,电子设备100可以接收用户对拍摄对象的选择操作,进而电子设备100可以响应于用户操作对预览帧中的特定对象进行识别。例如,电子设备100可以响应于用户将“人物”作为拍摄对象的操作,进而电子设备100可以识别预览帧中出现的一个或多个人物,然后识别每个人物的关键点。在另一些实施例中,电子设备100还可以通过注意力机制对预览帧中的多个对象进行筛选,从预览帧中被拍摄到的多个对象中确定用户可能最关注的对象。在后续步骤中电子设备100可以根据该对象的关键点确定一个或多个精彩帧,进而生成视频。
S403、电子设备将预览帧中对象的关键点与姿态模板中目标的关键点匹配。
S404、电子设备确定预览帧为精彩帧。
电子设备100中可以存储有一个或多个姿态模板,姿态模板中可以包括对象的一个或多个关键点。
在一些实施例中,电子设备100可以计算姿态模板中对象的关键点与预览帧中对象关键点的相似度。可选的,电子设备100可以存储有第一阈值,当电子设备计算出的模板姿态中对象的关键点与预览帧中对象关键点的相似度大于第一阈值时,电子设备100可以确定该预览帧为精彩帧。可选的,电子设备100中可以存储有第二阈值,当模板姿态中对象的关键点与预览帧中对象关键点的相似度大于第二阈值时,表明对象的运动完成度更高,该帧的精彩程度也较高。
在另一些实施例中,电子设备100可以通过机器学习的方法将模板姿态中对象的关键点与预览帧中对象关键点匹配。电子设备100可以将预览帧的特征输入到二分类器中。预览帧的特征可以包括预览帧的一个或多个关键点的参数。这里的二分类器(也可以称为二分类网络)可以为全连接网络,且该全连接网络的激活函数可包括sigmoid函数以及其它激活函数(如tanh函数、relu函数和softmax函数),全连接网络的损失函数可包括交叉熵(cross-entropy)损失函数以及其它损失函数(如合页损失函数、逻辑斯谛损失函数和指数损失函数)。其中,二分类器可以是由多个精彩帧的特征训练得到的。电子设备100可以在二分类器输出0时可确定预览帧不为精彩帧;或者二分类器输出1时可确定预览帧为精彩帧。
在一些实施例中,电子设备100可以将一个或多个姿态模板划分到不同的模板集合中,每个模板集合对应不同的拍摄场景。电子设备100可以接收用户对上述拍摄场景的选择操作,进而使用用户选中的拍摄场景对应的模板集合中的一个或多个姿态模板与预览帧匹配。可选的,上述拍摄场景还可以是电子设备100通过图像处理算法确定的。例如,电子设备100可以将预览帧输入到神经网络模型中,进而识别出该预览帧图像的拍摄场景。
在一些实施例中,姿态模板可以不在电子设备100中存储,而是存储在云服务器中。电子设备100可以从云服务器获取姿态模板,进而将预览帧中的被拍摄对象关键点与模板姿态中的关键点进行匹配。
在一些实施例中,电子设备100确定预览流中的两个预览帧为精彩帧时,可以将这两个预览帧之间的一帧或多帧也确定为精彩帧。在另一些实施例中,电子设备100可以在确定预览帧为精彩帧后,将该预览帧的前Y1帧和/或预览帧的后Y2帧作为精彩帧。上述Y1,Y2为任意正整数,Y1和Y2可以不相等。这样,电子设备100可以提高后续生成的视频的流畅性。
方法2:电子设备识别精彩帧的方法可以包括但不限于以下几步:
S411、电子设备从预览流中获取预览帧。
S412、电子设备获取预览帧图像内容的文字描述。
在一些实施例中,电子设备100可以从预览流中获取预览帧,然后获取预览帧图像内容的文字描述。例如,上述文字描述可以是“一只猫坐在椅子上”。
可选的,电子设备100可以存储用于从预览帧中提取图像内容文字描述的神经网络模型D。电子设备100可以将预览帧输入到神经网络模型D,上述神经网络模型D可以输出预览帧中图像内容的文字描述。神经网络模型D可以包括但不限于卷积神经网络(convolutional neural networks,CNN)模型、循环神经网络(recurrentneuralnetwork,RNN)模型、长短期记忆网络(long short-term memory,LSTM)模型、深度神经网络(deepneuralnetwork,DNN)模型、生成式预训练transformer(generativepre-trainingtransformer,GPT)大模型。
在一种可能的实现方式中,电子设备100中存储的神经网络模型D可以是由大模型经过蒸馏训练后得到的小模型。上述大模型是指规模大、参数量大、数据集庞大、架构复杂的神经网络模型。小模型则是指规模小、参数量小、数据集小、架构相对简单的神经网络模型。电子设备100可以通过小模型对预览帧进行处理,这样就可以在更短的时间内得到预览帧中图像内容的文字描述。
在另一种可能的实现方式中,上述神经网络模型D可以是存储在云服务器的,电子设备100可以将预览帧发送给云服务器,进而接收云服务器对预览帧处理后得到的文字描述。
S413、电子设备确定预览帧的文字描述中存在精彩帧对应的一个或多个标签。
S414、电子设备确定预览帧为精彩帧。
在一些实施例中,电子设备100可以存储精彩帧对应的一个或多个标签。进而电子设备100可以在预览帧A的文字描述中存在上述一个或多个标签时,确定预览帧A为精彩帧。示例性地,预览帧A的文字描述可以是“一个男孩把篮球投入篮筐”。电子设备100中存储精彩帧对应的标签可以包括“投入篮筐”。电子设备100可以确定预览帧A的文字描述中“投入篮筐”为精彩帧对应的标签,进而确定预览帧A为精彩帧。
可选的,电子设备100还可以将上述一个或多个标签划分到不同的集合中,每个标签集合对应于不同的精彩程度。例如,人的一次灌篮可以包括“跃起”、“跳到空中”、“投入篮筐”、“落下”等运动,相应的电子设备100可以存储有“跃起”、“跳到空中”、“投入篮筐”、“落下”标签。其中,“投入篮筐”标签可以属于精彩程度较高的标签集合,而“跃起”、“跳到空中”、“落下”可以属于精彩程度较低的标签集合。这样,电子设备100在确定预览帧A的文字描述中的“投入篮筐”为精彩帧对应的标签后,将预览帧A确定为精彩程度较高的精彩帧。
在一些实施例中,电子设备100确定预览帧A为精彩帧的标签可以是由用户确定的。例如电子设备100可以接收用户选择一个或多个标签的操作,进而在预览帧A的文字描述中包含用户选择的一个或多个标签时,确定预览帧A为精彩帧。
在一些实施例中,电子设备100可以存储用于确定预览帧精彩程度的神经网络模型E。电子设备100可以将预览帧的图像内容文字描述和预览帧输入到神经网络模型E中,上述神经网络模型E可以对预览帧的精彩程度进行打分。电子设备100可以存储有第三阈值和/或第四阈值。当神经网络模型E输出的预览帧的精彩程度分值大于第三阈值时,电子设备100可以确定该预览帧为精彩帧。当神经网络模型E输出的预览帧的精彩程度分值大于第四阈值时,电子设备100可以确定该预览帧的精彩程度较高。可选的,上述神经网络模型可以是多模态模型。
在另一些实施例中,电子设备100可以将一个或多个标签划分到不同的标签集合中,每个标签集合对应于不同的拍摄场景。电子设备100可以接收用户对拍摄场景的选择操作,进而使用拍摄场景对应的标签集合对预览帧的文字描述进行匹配。示例性地,上述拍摄场景可以包括:运动场景、生日场景、烟花场景等等。其中,运动场景对应的标签可以包括但不限于:跳跃、投篮、起飞等等。在一种可能的实现方式中,上述拍摄场景还可以是电子设备100使用图像处理算法识别出来的。
在一些实施例中,电子设备100确定预览帧为精彩帧后,还可以将预览帧的前Y1帧和/或预览帧的后Y2帧作为精彩帧。上述Y1,Y2为任意正整数,Y1和Y2可以不相等。这样,当电子设备100根据预览帧的文本描述确定精彩帧时,可以避免电子设备100确定的多个精彩帧不连续,不能完整反应被拍摄对象完整运动过程的情况。以电子设备100拍摄人的灌篮场景为例,人的一次灌篮可以包括“跃起”、“跳到空中”、“投入篮筐”、“落下”等运动,但是电子设备100中存储的精彩帧对应的标签可能只包含“投入篮筐”标签。如果仅根据“投入篮筐”标签确定精彩帧,电子设备100确定的精彩帧可能遗漏人在跃起、跳到空中、落下时的画面。这样,电子设备100得到的精彩帧不够连续,会导致后续生成的视频流畅性比较低。因此电子设备100确定预览帧的文字描述中包含“投入篮筐”后,可以将预览帧的前Y1帧和/或后Y2帧作为精彩帧。这样,电子设备100可以确保最后确定的多个精彩帧中,能够包含人在跃起、跳到空中、投入篮筐、落下时的画面。
在另一些实施例中,电子设备100还可以将两个精彩帧之间的预览帧确定为精彩帧。以电子设备100拍摄人的灌篮场景为例,电子设备100中存储的精彩帧对应的标签可能包含“跃起”、“投入篮筐”、“落下”。如果仅根据上述三个标签确定精彩帧,电子设备100确定的精彩帧可能会遗漏人在跃起后,跳到空中时的画面。电子设备可以确定预览帧A的文字描述中包含“投入篮筐”标签,确定预览帧B的文字描述中包含“跃起”标签后,可以将预览帧B到预览帧的一个或多个预览帧确定为精彩帧。这样,电子设备100可以确保在最后确定的多个精彩帧中,不会遗漏人跳到空中时的画面。
下面介绍本申请实施例提供的电子设备生成视频的场景。
图5A-图5J示例性示出了本申请实施例提供的拍摄方法涉及的一系列用户交互(user interface,UI)示意图。其中:
图5A示例性示出了电子设备100上的主屏幕(Home screen)界面500。如图5A所示,主屏幕界面可以包括一个或多个应用程序的桌面图标,其中可以包括相机应用的桌面图标501。
电子设备100可以检测到作用于图标501上的用户操作,例如点击操作。响应于该操作,电子设备100可以启动相机应用,并显示如图5B所示拍照预览界面510。拍照预览界面510可以包括预览窗511、菜单栏512、精彩抓拍按钮513、快门按钮514和回看控件515。其中,预览窗511可以用于显示预览图像,例如人打高尔夫球的预览图像。菜单栏512可以包含一个或多个拍摄模式选项,例如“夜景”、“拍照”、“录像”。精彩抓拍按钮513可以用于启动精彩抓拍功能。一旦用户启动精彩抓拍功能,电子设备100便会执行本申请实施例提供的拍摄方法,从预览流中识别出精彩帧,对精彩帧对应的拍照帧进行插帧进而生成视频。快门按钮514用于拍摄照片。回看控件515用于打开图库应用程序,查看存储在电子设备中的照片或视频。其中回看控件515可以显示电子设备最近保存的照片或视频。
电子设备100可以检测到作用于精彩抓拍按钮513上的用户操作,例如点击操作。响应于该操作,电子设备100可以显示如图5C所示的对话框516。对话框516中可包括一个或多个拍摄场景选项,例如“体育运动”选项517、“笑脸”选项。其中,拍摄场景选项与精彩帧类型对应。电子设备100可以根据用户选中的拍摄场景选项,确定精彩帧的识别方式。
如图5C中所示,用户选择的是拍摄场景是“体育运动”选项517,对此,电子设备100具体可以基于体育运动相关的精彩帧识别算法开始从预览流中识别出精彩帧。例如,电子设备100可以从一个或多个姿态模板中选择出体育运动对应的姿态模板对预览帧进行匹配(图4所示方法1)。或者,电子设备可以从一个或多个标签中选择体育运动相关的标签对预览帧的文本描述进行匹配。同理,当用户选中“笑脸”时,电子设备100可以选择笑脸对应的姿态模板,或是笑脸相关的标签对预览帧进行匹配。图中所示的拍摄场景仅作为示例,不作为本申请实施例的限制。
电子设备100可以检测到用户选择“体育运动”选项517的操作,响应于该操作,电子设备100可以关闭对话框516,并显示如图5D所示的提示框518。提示框518用于提示用户精彩抓拍功能已经开启。
如图5E中(a)、(b)、(c)、(d)所示,电子设备识别到预览流中的精彩帧后会生成精彩帧对应的照片,并将照片保存在图库中。回看控件515会依次显示精彩抓拍功能抓拍到的照片。如图5E中(d)所述,电子设备100可以检测到作用于回看控件515的用户操作,例如点击操作。响应于该操作,电子设备100可以打开图库界面520。如图5F所示,图库界面520可以显示一个或多个照片,照片对应的勾选框,以及生成视频按钮526。
照片的左下角可以显示有“精彩抓拍”的图标,表明该照片是由精彩抓拍功能抓拍到的。例如,照片521可以是图5E中(a)所示实施例中电子设备100抓拍到的;照片522可以是图5E中(b)所示实施例中电子设备100抓拍到的;照片523可以是图5E中(c)所示实施例中电子设备100抓拍到的;照片524可以是图5E中(d)所示实施例中电子设备100抓拍到的。
生成视频按钮526用于电子设备100使用被选中的照片生成视频。
如图5G所示,电子设备100可以检测到用户选中照片521、照片522、照片523和照片524的操作。响应于该操作,照片对应的勾选框中会显示对号,表明该照片被选中。电子设备100可以检测到用户点击生成视频按钮526的操作,响应于该操作,电子设备100可以使用被选中的照片521、照片522、照片523和照片524生成视频。可选的,电子设备100除了使用由精彩抓拍功能拍摄到的照片生成视频,还可以使用由用户点击快门按钮得到的照片生成视频。
在一些实施例中,电子设备100还可以记录用户选中照片的顺序,确定照片对应拍照帧在视频中的时间顺序。
如图5H所示,响应于用户单击生成视频按钮526的操作,电子设备100可以显示视频编辑界面530。视频编辑界面530中可以包括:视频预览窗531、工具栏532、帧设置区域533、时长编辑框534和完成按钮535。视频预览窗531用于预览电子设备100根据拍照帧生成的视频。
工具栏532可以包括一个或多个功能控件,该功能控件用于改变视频预览窗531中视频的播放情况。工具栏532中的功能控件可以用于快进播放、回退播放、暂停播放、开始播放视频预览窗531中的视频,或是调整视频的播放进度。
帧设置区域533可以显示两个相邻的照片。图5H所示帧设置区域533可以显示有照片521和照片522,以及从照片521指向照片522的箭头。
时长编辑框534可以接收用户改变相邻帧时长的操作,这样电子设备100可以根据时长编辑框534中的时长改变相邻帧之间插入的图像帧的数量。电子设备100改变相邻帧时长的方法可以参考前述实施例的介绍,这里不再赘述。如图5H所示,时长编辑框534可以用于设置视频从照片521对应拍照帧到照片522对应拍照帧的时长,上述时长可以为2秒。其中,时长编辑框534中初始状态下相邻帧的时长可以是由电子设备100根据照片521对应拍照帧和照片522对应拍照帧的精彩程度确定的。电子设备100根据精彩帧的精彩程度确定相邻精彩帧之间播放时长的方法可以参考前述实施例的介绍,这里不再赘述。
完成按钮535用于在电子设备100中存储根据照片对应拍照帧生成的视频。
电子设备100可以检测到用户向左滑动帧设置区域533的操作,响应于操作,电子设备100可以改变时长编辑框534能够控制的相邻帧。如图5I所示,帧设置区域533可以显示照片522和照片523,以及从照片522指向照片523的箭头。相应的,时长编辑框534可以用于设置视频从照片522对应拍照帧到照片523对应拍照帧的时长,上述时长可以为1秒。
响应于用户触摸单击完成按钮535的操作,电子设备100可以存储根据拍照帧生成的视频。如图5J所示,电子设备100可以显示用户界面540。用户界面540可以用于播放电子设备100存储的根据照片对应拍照帧生成的视频。
电子设备需要从照片521、照片522、照片523和照片524中提取对应的拍照帧,进而对拍照帧进行插帧,进而生成视频。电子设备100对拍照帧插帧并生成视频的方法可以参考前述实施例的介绍,这里不再赘述。
可以理解的是,电子设备100可以从预览流识别一个或多个精彩帧,由于预览帧的分辨率较低,电子设备100确定精彩帧的速度也较快。这样,电子设备100可以在用户将摄像头对准目标场景时,实时地从预览流确定精彩帧。电子设备100可以生成精彩帧对应的拍照帧,并存储拍照帧,这样用户无需自己按快门就可以获得一张或多张精彩照片。电子设备100可以接收用户选择精彩照片的操作,这样电子设备100可以根据用户选择的精彩照片对应的拍照帧生成图像帧。并且,电子设备100还可以响应于用户操作改变两个精彩照片对应的拍照帧之间插入的图像帧的数量。这样,用户可以自定义视频中出现的精彩帧,以及两个精彩帧对应拍照帧之间过渡的时长,提高用户的使用体验。最后,电子设备100可以根据精彩帧对应的拍照帧生成视频,由于拍照帧的图像质量较高,用户得到的视频中每一帧图像质量都较高。用户可能会发现相比直接拍摄精彩片段的视频,电子设备100生成的精彩片段的视频更加生动、清晰。
在一些实施例中,图5C所示的实施例是可选的。电子设备100可以对拍摄场景进行识别,这样可以减少用户操作,提高用户的使用体验。
在一些实施例中,图5F-图5G所示的实施例是可选的。这样,在图5E所示实施例中电子设备100用户不需要手动选择用于生成视频的照片。
在一些实施例中,图5H-图5I所示的实施例是可选的。这样,在图5G所示的实施例中电子设备100接收到用户触摸单击生成视频按钮526的操作后,可以直接保存视频,而不需要用户调整每两个照片对应拍照帧之间的播放时长。
在一些实施例中,图5F-图5I所示的实施例是可选的。电子设备100在通过预览流识别精彩帧后,可以直接根据精彩帧生成视频。这样,用户只需要把摄像头对准目标场景就可以直接得到电子设备100生成的精彩帧视频,减少用户操作。电子设备可以直接使用拍照帧生成视频,而不需要生成拍照帧对应的照片。
在本申请实施例中描述的各个用户界面仅为示例界面,并不对本申请方案构成限定。在其它实施例中,用户界面可以采用不同的界面布局,可以包括更多或更少的控件,可以增加或减少其它功能选项,只要基于本申请提供的同一发明思想,都在本申请保护范围内。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
上述实施例中所用,根据上下文,术语“当…时”可以被解释为意思是“如果…”或“在…后”或“响应于确定…”或“响应于检测到…”。类似地,根据上下文,短语“在确定…时”或“如果检测到(所陈述的条件或事件)”可以被解释为意思是“如果确定…”或“响应于确定…”或“在检测到(所陈述的条件或事件)时”或“响应于检测到(所陈述的条件或事件)”。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘)等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
Claims (14)
1.一种拍摄方法,所述方法应用于电子设备,所述电子设备包括摄像头,其特征在于,所述方法包括:
所述电子设备利用预览流在显示屏上显示预览画面,所述预览流包括多张预览帧;
所述电子设备从所述多张预览帧中识别出多张精彩帧,所述精彩帧中运动物体处于预设运动;
所述电子设备获取多张精彩帧各自对应的原始图像;
所述电子设备对所述多张精彩帧各自对应的原始图像处理,生成多张拍照帧,所述拍照帧的分辨率大于所述预览帧的分辨率;
所述电子设备保存视频到图库,所述视频包括所述多张拍照帧。
2.根据权利要求1所述的方法,其特征在于,所述视频还包括所述多张拍照帧之间的一张或多张插入帧,在连续两个拍照帧之间的插入帧中,所述运动物体所处的位置落在第一运动轨迹上,所述第一运动轨迹是所述运动物体在所述连续两个拍照帧中的像素移动形成的运动轨迹。
3.根据权利要求2所述的方法,其特征在于,每两个相邻拍照帧之间的插入帧的数量相同。
4.根据权利要求2所述的方法,其特征在于,所述多张拍照帧包括相邻的第一拍照帧和第二拍照帧、相邻的第三拍照帧和第四拍照帧,所述第一拍照帧和所述第二拍照帧之间插入K1张插入帧,所述第三拍照帧和所述第四拍照帧之间插入K2张插入帧,其中K1、K2为正整数,K1小于K2。
5.根据权利要求4所述的方法,其特征在于,所述第三拍照帧和所述第四拍照帧的精彩程度高于所述第一拍照帧和所述第二拍照帧的精彩程度。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述电子设备从所述多张预览帧中识别出多张精彩帧,包括:
所述电子设备识别所述多张预览帧中所述运动物体的关键点,所述运动物体的关键点用于表示所述运动物体的姿态;
所述电子设备根据所述运动物体的关键点识别多张精彩帧,所述精彩帧中所述运动物体的姿态与第一模板匹配。
7.根据权利要求6所述的方法,其特征在于,所述第一模板是由用户选择的。
8.根据权利要求6所述的方法,其特征在于,所述第一模板是所述电子设备基于第一拍摄场景从多个模板中选择的,所述多个模板各自对应不同的拍摄场景,所述第一拍摄场景是所述预览画面中呈现的拍摄场景。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述电子设备从所述多张预览帧中识别出多张精彩帧,包括:
所述电子设备确定所述多张预览帧各自的文字描述,所述文字描述用于描述所述预览帧表达的内容;
所述电子设备根据所述文字描述从多张预览帧中选择出多张精彩帧,所述多张精彩帧的所述文字描述中存在第一关键词,所述第一关键词用于描述所述预设运动。
10.根据权利要求1-9任一项所述的方法,其特征在于,所述电子设备将两张所述精彩帧之间的预览帧也作为精彩帧。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述电子设备将所述精彩帧相邻的前Y1张预览帧和/或后Y2张预览帧也作为精彩帧,其中,Y1和Y2为正整数。
12.根据权利要求1-9任一项所述的方法,其特征在于,所述电子设备利用预览流在显示屏上显示预览画面时还显示精彩抓拍按钮,所述电子设备从所述多张预览帧中识别出多张精彩帧之前,所述电子设备检测到作用于所述精彩抓拍按钮的操作。
13.一种电子设备,其特征在于,所述电子设备包括:显示屏、摄像头、存储器以及耦合于所述存储器的处理器;所述显示屏用于显示界面,所述摄像头用于拍摄图像,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时使得所述电子设备实现如权利要求1至12中任一项所述的方法。
14.一种计算机可读存储介质,包括计算机指令,其特征在于,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1至12中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748245.1A CN117692762A (zh) | 2023-06-21 | 2023-06-21 | 拍摄方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748245.1A CN117692762A (zh) | 2023-06-21 | 2023-06-21 | 拍摄方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117692762A true CN117692762A (zh) | 2024-03-12 |
Family
ID=90125200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310748245.1A Pending CN117692762A (zh) | 2023-06-21 | 2023-06-21 | 拍摄方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117692762A (zh) |
-
2023
- 2023-06-21 CN CN202310748245.1A patent/CN117692762A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113810587B (zh) | 一种图像处理方法及装置 | |
CN113453040B (zh) | 短视频的生成方法、装置、相关设备及介质 | |
CN112532865B (zh) | 慢动作视频拍摄方法及电子设备 | |
CN111612873B (zh) | Gif图片生成方法、装置及电子设备 | |
CN115002340B (zh) | 一种视频处理方法和电子设备 | |
CN115689963B (zh) | 一种图像处理方法及电子设备 | |
CN113536866A (zh) | 一种人物追踪显示方法和电子设备 | |
CN114926351A (zh) | 图像处理方法、电子设备以及计算机存储介质 | |
EP4109879A1 (en) | Image color retention method and device | |
WO2022206605A1 (zh) | 确定目标对象的方法、拍摄方法和装置 | |
WO2023160170A1 (zh) | 拍摄方法和电子设备 | |
US20240171701A1 (en) | Image obtaining method and electronic device | |
CN117692762A (zh) | 拍摄方法及电子设备 | |
CN115587938A (zh) | 视频畸变校正方法及相关设备 | |
CN117097985B (zh) | 对焦方法、电子设备及计算机可读存储介质 | |
CN114697530A (zh) | 一种智能取景推荐的拍照方法及装置 | |
US20240031655A1 (en) | Video Playback Method, Terminal Device, Apparatus, System, and Storage Medium | |
CN116828099B (zh) | 一种拍摄方法、介质和电子设备 | |
EP4199492A1 (en) | Video processing method and electronic device | |
CN116033261B (zh) | 一种视频处理方法、电子设备、存储介质和芯片 | |
WO2022228010A1 (zh) | 一种生成封面的方法及电子设备 | |
CN115170441B (zh) | 一种图像处理方法及电子设备 | |
WO2022143230A1 (zh) | 一种确定跟踪目标的方法及电子设备 | |
WO2023072113A1 (zh) | 显示方法及电子设备 | |
CN115623319A (zh) | 一种拍摄方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |