CN111010611A

CN111010611A - 电子相册的获取方法、装置、计算机设备和存储介质

Info

Publication number: CN111010611A
Application number: CN201911221603.3A
Authority: CN
Inventors: 吴丹; 刘貂
Original assignee: Reach Best Technology Co Ltd
Current assignee: Reach Best Technology Co Ltd; Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2019-12-03
Filing date: 2019-12-03
Publication date: 2020-04-14

Abstract

本申请涉及一种电子相册的获取方法、装置、计算机设备和存储介质。所述方法包括：响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，所述候选图像集合具有对应的主题特征；响应于实施于所述候选图像集合的图集选取指令，确定对应目标图像合集；根据所述目标图像合集的主题特征，获取对应的目标音频；根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。采用本方法能够提高电子相册的制作效率。

Description

电子相册的获取方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种电子相册的获取方法、装置、计算机设备和存储介质。

背景技术

随着数码时代的到来，拍照手机、数码相机等数码影像产品日益普及，人们习惯于使用数码照片或视频来记录日常或节日。所以分享照片或视频就成了极为重要且日常的行为。

电子音乐相册，能帮助人们更好的分享且生动地展示出照片或视频，在今天也变得越来越流行。然而目前的电子相册制作软件，用户往往需要手动选取大量照片或视频并为其搭配相应的背景音乐，操作较为繁琐。

因此，现有的电子相册制作存在效率不高的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够解决相关技术中电子相册制作效率不高的电子相册的获取方法、装置、计算机设备和存储介质。

一种电子相册的获取方法，所述方法包括：

响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，所述候选图像集合具有对应的主题特征；

响应于实施于所述候选图像集合的图集选取指令，确定对应目标图像合集；

根据所述目标图像合集的主题特征，获取对应的目标音频；

根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

在其中一个实施例中，所述响应于用户触发的电子相册获取操作，对待分类图像进行分类，确定多个候选图像集合，包括：获取待分类图像；所述待分类图像至少包括静态图像和视频图像其中之一；确定所述待分类图像的图像属性信息；所述图像属性信息至少包括人物特征信息、场景特征信息和拍摄信息其中之一；根据所述图像属性信息，对所述待分类图像进行分类，得到所述候选图像集合，并确定每个所述候选图像集合对应的主题特征。

在其中一个实施例中，所述根据所述图像属性信息，对所述待分类图像进行分类，得到所述候选图像集合，包括：根据所述图像属性信息，获取预设的向量特征库；根据所述向量特征库，获取所述待分类图像的图像属性信息对应的图像属性向量；根据所述待分类图像的图像属性向量，对所述待分类图像进行分类，得到所述候选图像合集；其中，每个所述候选图像集合中，任意两个所述图像的图像属性向量之间的向量距离小于预设的向量距离阈值。

在其中一个实施例中，所述根据所述图像属性信息，获取预设的向量特征库，包括：根据所述图像属性信息中的人物特征信息，生成所述人物特征信息对应的人物向量特征库；其中，所述人物特征信息至少包括人物表情特征、人物五官特征、人物肤色特征、人物肢体特征其中之一；根据所述图像属性信息中的场景特征信息，生成所述场景特征信息对应的场景向量特征库；其中，所述场景特征信息至少包括室内外类型特征、季节类型特征、场景景物特征其中之一；根据所述图像属性信息中的拍摄信息，生成所述拍摄信息对应的拍摄信息向量特征库；其中，所述拍摄信息至少包括拍摄时间、拍摄地点其中之一；根据所述人物向量特征库、所述场景向量特征库和所述拍摄信息向量特征库中的至少一种，构建所述预设的向量特征库。

在其中一个实施例中，所述确定每个所述候选图像集合对应的主题特征，包括：获取所述候选图像合集中的各个图像所对应的图像属性信息；其中，每个图像所对应的图像属性信息具有多个子主题特征；确定每个所述候选图像合集中的各个所述子主题特征的出现频率；根据每个所述候选图像合集中的各个所述子主题特征的出现频率，确定每个所述候选图像合集对应的主题特征。

在其中一个实施例中，所述确定所述待分类图像的图像属性信息，包括：通过图像识别模型对所述待分类图像进行处理，确定所述待分类图像的图像属性信息；其中，所述图像识别模型是根据采集的图像识别训练样本，基于预设的神经网络训练获取的，用于对输入的图像进行处理，得到对应的所述图像属性信息；所述图像识别训练样本包括所述输入的图像和与所述输入的图像对应的图像属性信息；所述图像属性信息包括所述人物特征信息和所述场景特征信息中的至少一种。

在其中一个实施例中，所述根据所述目标图像合集的主题特征，获取对应的目标音频，包括：根据所述目标图像合集的主题特征，获取多个候选推荐音频并展示；其中，所述候选推荐音频的音频属性信息与所述目标图像合集的主题特征相匹配；所述音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；响应于实施于所述候选推荐音频的音频选取指令，确定对应的所述目标音频。

在其中一个实施例中，所述根据所述目标图像合集的主题特征，获取多个候选推荐音频，包括：通过配乐推荐模型对所述目标图像合集的主题特征进行处理，确定所述主题特征的主题特征对应的配乐分类；其中，所述配乐推荐模型是根据采集的配乐推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的所述配乐分类；所述配乐推荐训练样本包括所述输入的主题特征与所述输入的主题特征对应的配乐分类；所述配乐分类具有对应的所述音频属性信息；根据所述配乐分类，在预设的配乐库中确定所述多个候选推荐音频。

在其中一个实施例中，所述根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册，包括：获取与所述目标图像合集的主题特征对应的目标相册模板；根据所述目标相册模板，对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册。

在其中一个实施例中，所述获取与所述目标图像合集的主题特征对应的目标相册模板，包括：根据所述目标图像合集的主题特征，获取多个候选推荐模板并展示；其中，所述候选推荐模板的模板属性信息与所述目标图像合集的主题特征相匹配；所述模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；响应于实施于所述候选推荐模板的模板选取指令，确定对应的所述目标相册模板。

在其中一个实施例中，所述根据所述目标图像合集的主题特征，获取多个候选推荐模板，包括：通过模板推荐模型对所述目标图像合集的主题特征进行处理，确定所述主题特征的主题特征对应的相册模板分类；其中，所述模板推荐模型是根据采集的模板推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的所述相册模板分类；所述模板推荐训练样本包括所述输入的主题特征与所述输入的主题特征对应的相册模板分类；所述相册模板分类具有对应的所述模板属性信息；根据所述相册模板分类，在预设的模板库中确定所述多个候选推荐模板。

在其中一个实施例中，所述根据所述目标相册模板，对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册，包括：对所述目标音频进行音频波形分析，确定所述目标音频中的音频节拍；从所述目标图像合集中，确定与每个所述音频节拍对应的图像，得到对应的图像合成次序；根据所述目标相册模板以及所述图像合成次序，将所述目标图像集合与所述目标音频合成，生成所述电子相册。

在其中一个实施例中，所述目标音频具有多个信号帧，所述对所述目标音频进行音频波形分析，确定所述目标音频中的音频节拍，包括：获取当前信号帧的频谱能量，以及，获取在所述目标音频中且在所述当前信号帧之前的信号帧的平均频谱能量；确定所述当前信号帧的频谱能量与所述平均频谱能量之间的能量比值；当所述能量比值大于预设的比值阈值时，将所述当前信号帧作为所述目标音频的候选节拍；对所述候选节拍进行筛选，确定所述目标音频中的音频节拍。

在其中一个实施例中，所述对所述候选节拍进行筛选，确定所述目标音频中的音频节拍，包括：获取所述候选节拍在所述目标音频中的节拍时间点；根据所述节拍时间点，确定所述候选节拍在所述目标音频中的节拍类型；其中，所述节拍类型至少包括随机节拍和平均节拍其中之一；当所述节拍类型为所述随机节拍时，按照所述候选节拍的频谱能量，对所述候选节拍进行排序，得到排序后的候选节拍，并在所述排序后的候选节拍中，按序确定所述目标音频中的音频节拍；当所述节拍类型为所述平均节拍时，按照预设的时间间隔在所述候选节拍中，确定所述目标音频中的音频节拍。

一种电子相册的获取方法，所述方法包括：

根据所述目标图像合集的主题特征，向服务器发送音频获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的目标音频；

在其中一个实施例中，所述向服务器发送音频获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的目标音频，包括：向所述服务器发送音频获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的多个候选推荐音频并展示；其中，所述候选推荐音频的音频属性信息与所述目标图像合集的主题特征相匹配；所述音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；响应于实施于所述候选推荐音频的音频选取指令，确定对应的所述目标音频。

在其中一个实施例中，所述根据所述目标图像合集的主题特征和所述目标音频，对所述目标图像合集中的图像进行合成，生成与目标图像合集的主题特征相适配的电子相册，包括：获取与所述目标图像合集的主题特征对应的目标相册模板；根据所述目标相册模板，对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册。

在其中一个实施例中，所述获取与所述目标图像合集的主题特征对应的目标相册模板，包括：向所述服务器发送模板获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的多个候选推荐模板并展示；其中，所述候选推荐模板的模板属性信息与所述目标图像合集的主题特征相匹配；所述模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；响应于实施于所述候选推荐模板的模板选取指令，确定对应的所述目标相册模板。

一种电子相册的获取方法，所述方法包括：

接收客户端的音频获取请求；所述音频获取请求为所述客户端根据目标图像合集的主题特征得到的；所述目标图像合集为所述客户端响应于实施于候选图像集合的图集选取指令确定的；所述候选图像集合为所述客户端响应于电子相册获取操作指令，对待分类图像进行分类得到的；所述候选图像集合具有对应的主题特征；

根据所述音频获取请求，获取并返回与所述目标图像合集的主题特征对应的目标音频至所述客户端；所述目标音频用于供所述客户端根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

在其中一个实施例中，所述根据所述音频获取请求，获取并返回与所述目标图像合集的主题特征对应的目标音频至所述客户端，包括：响应所述音频获取请求，在预设的配乐库中获取与所述目标图像合集的主题特征对应的多个候选推荐音频；其中，所述候选推荐音频的音频属性信息与所述目标图像合集的主题特征相匹配；所述音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；发送所述多个候选推荐音频至所述客户端；所述候选推荐音频用于供所述客户端确定所述目标音频。

在其中一个实施例中，所述响应所述音频获取请求，在预设的配乐库中获取与所述目标图像合集的主题特征对应的多个候选推荐音频，包括：通过配乐推荐模型对所述目标图像合集的主题特征进行处理，确定所述主题特征的主题特征对应的配乐分类；其中，所述配乐推荐模型是根据采集的配乐推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的所述配乐分类；所述配乐推荐训练样本包括所述输入的主题特征与所述输入的主题特征对应的配乐分类；所述配乐分类具有对应的所述音频属性信息；根据所述配乐分类，在所述配乐库中确定所述多个候选推荐音频。

在其中一个实施例中，还包括：接收所述客户端的模板获取请求；响应所述模板获取请求，在预设的模板库中获取与所述目标图像合集的主题特征对应的多个候选推荐模板；其中，所述候选推荐模板的模板属性信息与所述目标图像合集的主题特征相匹配；所述模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；发送所述多个候选推荐模板至所述客户端；所述候选推荐模板用于供所述客户端确定目标相册模板；所述目标相册模板用于供所述客户端对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册。

在其中一个实施例中，所述响应所述模板获取请求，在预设的模板库中获取与所述目标图像合集的主题特征对应的多个候选推荐模板，包括：通过模板推荐模型对所述目标图像合集的主题特征进行处理，确定所述主题特征的主题特征对应的相册模板分类；其中，所述模板推荐模型是根据采集的模板推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的所述相册模板分类；所述模板推荐训练样本包括所述输入的主题特征与所述输入的主题特征对应的相册模板分类；所述相册模板分类具有对应的所述模板属性信息；根据所述相册模板分类，在所述配乐库中确定所述多个候选推荐音频。

一种电子相册的获取装置，所述装置包括：

第一分类模块，用于响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，所述候选图像集合具有对应的主题特征；

第一响应模块，用于响应于实施于所述候选图像集合的图集选取指令，确定对应目标图像合集；

第一音频获取模块，用于根据所述目标图像合集的主题特征，获取对应的目标音频；

第一相册获取模块，用于根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

一种电子相册的获取装置，所述装置包括：

第二分类模块，用于响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，所述候选图像集合具有对应的主题特征；

第二响应模块，用于响应于实施于所述候选图像集合的图集选取指令，确定对应目标图像合集；

第二音频获取模块，用于根据所述目标图像合集的主题特征，向服务器发送音频获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的目标音频；

第二相册获取模块，用于根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

一种电子相册的获取装置，所述装置包括：

接收模块，用于接收客户端的音频获取请求；所述音频获取请求为所述客户端根据目标图像合集的主题特征得到的；所述目标图像合集为所述客户端响应于实施于候选图像集合的图集选取指令确定的；所述候选图像集合为所述客户端响应于电子相册获取操作指令，对待分类图像进行分类得到的；所述候选图像集合具有对应的主题特征；

发送模块，用于根据所述音频获取请求，获取并返回与所述目标图像合集的主题特征对应的目标音频至所述客户端；所述目标音频用于供所述客户端根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时以下步骤：

根据所述目标图像合集的主题特征，获取对应的目标音频；

一种客户端，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现以下步骤：

一种服务器，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现以下步骤：

一种电子相册的获取系统，包括如上述的客户端，以及上述的服务器。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

根据所述目标图像合集的主题特征，获取对应的目标音频；

上述一种电子相册的获取方法、装置、计算机设备和存储介质，通过响应于用户的电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；并响应于用户实施于候选图像集合的图集选取指令，确定对应目标图像合集；然后，根据目标图像合集的主题特征，获取对应的目标音频；最后，根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册从而实现自动组织照片或视频的展示形式并添加背景音乐，高效地生成满足用户分享需求的电子相册，减少了用户在制作电子相册过程中的操作步骤，提高了用户制作电子相册的效率。

附图说明

图1为一个实施例中一种电子相册的获取方法的应用环境图；

图2为一个实施例中一种电子相册的获取的流程示意图；

图3为一个实施例中一种电子相册的获取方法中的图像合成次序的示意图；

图4为另一个实施例中一种电子相册的生成方法的流程示意图；

图5为另一个实施例中一种电子相册的获取方法的应用环境图；

图6为另一个实施例中一种电子相册的获取方法的流程示意图；

图7为一个实施例中一种电子相册的获取方法的示意图；

图8为一个实施例中一种图像自动筛选组合的流程示意图；

图9为一个实施例中一种电子相册的获取装置的结构框图；

图10为另一个实施例中一种电子相册的获取装置的结构框图；

图11为一个实施例中一种电子相册的获取装置的服务器的结构框图；

图12为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

图1为一个实施例中一种电子相册的获取方法的应用场景图。参照图1，第一客户端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。

如图2所示，在一个实施例中，提供了一种电子相册的获取方法。本实施例主要以该方法应用于上述图1中的第一客户端110来举例说明。参照图2，该电子相册的获取方法具体包括如下步骤：

步骤210，响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示。其中，候选图像集合具有对应的主题特征。其中，主题特征可以是指候选图像集合中各个图像同属的场景主题的特征。举例来说，场景主题可以是某节假日，如春节、国庆、周末等，也可以是某活动，如运动会、毕业典礼、生日会等、还可以是某地点，如城市A、国家B、C公寓、D公园等。

具体实现中，当用户需要制作电子相册进行分享时，用户可以通过在第一客户端110的显示界面中点击电子制作按钮，此时第一客户端110响应于该用户的电子相册获取操作指令，开始对储存在第一客户端110本地的待分类图像进行分类，获取多个候选图像集合并展示，以供用户对多个候选图像集合进行选取。具体来说，第一客户端110响应于该用户的电子相册获取操作指令后，第一客户端110首先判断是否第一客户端110具有本地相册访问权限，当客户端110具有本地相册访问权限时，开始对储存在第一客户端110本地的图像进行扫描，获取第一客户端110本地的照片、视频、动态图等待分类图像；当第一客户端110不具有相册访问权限时，第一客户端110则会生成提示弹窗，用于提示用户授予第一客户端110相册访问权限，然后，第一客户端110对上述的图像进行编码、压缩等处理对待分类图像按照不同的场景主题进行分类，得到多个候选图像合集。

步骤220，响应于实施于候选图像集合的图集选取指令，确定对应目标图像合集。

具体实现中，当第一客户端110在显示界面上展示上述的多个候选图像合集后，用户在多个候选图像合集中选取至少一个的图像合集作为制作电子相册的图像素材；具体地，第一客户端110可以响应于用户实施于候选图像集合的图集选取指令，在多个候选图像集合中确定对应目标图像合集；将目标图像合集作为制作电子相册的图像素材。

步骤230，根据目标图像合集的主题特征，获取对应的目标音频。

具体实现中，当第一客户端110确定用户选取的目标图像合集后，第一客户端110可以根据目标图像合集的主题特征，获取对应的目标音频。例如，当用户选择的目标图像合集的主题特征为春节时，第一客户端110可以将获取如音乐名为《恭喜发财》、《恭喜恭喜》、《欢乐新年到》等曲风与春节有关的音乐，作为与目标图像合集的主题特征对应的目标音频。

步骤240，根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册。

具体实现中，当第一客户端110获取到目标音频后，第一客户端110可以根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册。具体来说，第一客户端110可以按照目标音频的音乐打点和目标图像合集的主题特征，对目标图像合集中的图像的展示顺序、展示方式、展示时长、图像色调等进行调整，并添加相应的视频片头、视频片尾、视频滤镜等，重新编排并合成与目标图像合集的主题特征相匹配电子相册。

上述一种电子相册的获取方法，通过响应于用户的电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；并响应于用户实施于候选图像集合的图集选取指令，确定对应目标图像合集；然后，根据目标图像合集的主题特征，获取对应的目标音频；最后，根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册从而实现自动组织照片或视频的展示形式并添加背景音乐，高效地生成满足用户分享需求的电子相册，减少了用户在制作电子相册过程中的操作步骤，提高了用户制作电子相册的效率。

在另一个实施例中，响应于用户触发的电子相册获取操作，对待分类图像进行分类，确定多个候选图像集合，包括：获取待分类图像；确定待分类图像的图像属性信息；根据图像属性信息，对待分类图像进行分类，得到候选图像集合，并确定每个候选图像集合对应的主题特征。其中，待分类图像至少包括静态图像和视频图像其中之一。其中，图像属性信息至少包括人物特征信息、场景特征信息和拍摄信息其中之一。

具体实现中，当第一客户端110在响应于用户触发的电子相册获取操作，对待分类图像进行分类，确定多个候选图像集合的过程中，具体包括：第一客户端110获取待分类图像；确定待分类图像的图像属性信息；具体来说，第一客户端110可以对待分类图像进行识别，进而确定待分类图像的图像属性信息；其中，图像属性信息至少包括人物特征信息、场景特征信息和拍摄信息其中之一。然后，第一客户端110根据图像属性信息，对待分类图像进行分类，得到候选图像集合，并确定每个候选图像集合对应的主题特征。

本实施例的技术方案，通过获取待分类图像；确定待分类图像的图像属性信息；然后，根据图像属性信息，提前对待分类图像进行分类，得到多个具有对应的主题特征的候选图像集合进而供用户进行选取，避免用户在制作电子相册的过程中需要反复挑选大量照片或视频，减少了用户在制作电子相册过程中的操作负担，提高了用户制作电子相册的效率。

在另一个实施例中，根据图像属性信息，对待分类图像进行分类，得到候选图像集合，包括：根据图像属性信息，获取预设的向量特征库；根据向量特征库，获取待分类图像的图像属性信息对应的图像属性向量；根据待分类图像的图像属性向量，对待分类图像进行分类，得到候选图像合集；其中，每个候选图像集合中，任意两个图像的图像属性向量之间的向量距离小于预设的向量距离阈值。

具体实现中，第一客户端110在根据图像属性信息，对待分类图像进行分类，得到候选图像集合的过程中，具体包括：第一客户端110根据图像属性信息，获取预设的向量特征库；然后，第一客户端110根据向量特征库，获取待分类图像的图像属性信息对应的图像属性向量；具体来说，待分类图像的图像属性信息具有多个子图像属性；第一客户端110根据向量特征库，获取待分类图像的多个子图像属性对应的多个子图像属性向量；然后，第一客户端110汇集各个子图像属性向量，得到与待分类图像的图像属性信息对应的图像属性向量。

然后，第一客户端110根据待分类图像的图像属性向量，对待分类图像进行分类，得到候选图像合集；其中，每个候选图像集合中，任意两个图像的图像属性向量之间的向量距离小于预设的向量距离阈值。具体地，第一客户端110通过计算任意两个图像的图像属性向量之间的向量距离，当该向量距离小于预设的向量距离阈值时，则确定两个图像为同一类图像。实际应用中，向量距离可以是指两个图像的图像属性向量之间的欧氏距离或余弦距离。

本实施例的技术方案，在根据图像属性信息，对待分类图像进行分类的过程中，通过在预设的特征向量库中获取待分类图像的图像属性信息对应的图像属性向量；并通过计算任意两个图像的图像属性向量之间的向量距离，从而可以实现按照待分类图像的图像属性向量，准确地对待分类图像进行分类，使得到候选图像合集中的图像均具有相似的主题特征，从而避免用户在制作电子相册的过程中需要反复挑选大量照片或视频，减少了用户在制作电子相册过程中的操作负担，提高了用户制作电子相册的效率。

在另一个实施例中，根据图像属性信息，获取预设的向量特征库，包括：根据图像属性信息中的人物特征信息，生成人物特征信息对应的人物向量特征库；根据图像属性信息中的场景特征信息，生成场景特征信息对应的场景向量特征库；根据图像属性信息中的拍摄信息，生成拍摄信息对应的拍摄信息向量特征库；根据人物向量特征库、场景向量特征库和拍摄信息向量特征库中的至少一种，构建预设的向量特征库。其中，人物特征信息至少包括人物表情特征、人物五官特征、人物肤色特征、人物肢体特征其中之一；其中，场景特征信息至少包括室内外类型特征、季节类型特征、场景景物特征其中之一；其中，拍摄信息至少包括拍摄时间、拍摄地点其中之一；

具体实现中，第一客户端110在根据图像属性信息，获取预设的向量特征库的过程中，具体包括：第一客户端110可以根据图像属性信息中的人物特征信息，生成人物特征信息对应的人物向量特征库；第一客户端110还可以根据图像属性信息中的场景特征信息，生成场景特征信息对应的场景向量特征库；第一客户端110还可以根据图像属性信息中的拍摄信息，生成拍摄信息对应的拍摄信息向量特征库；最后，第一客户端110根据人物向量特征库、场景向量特征库和拍摄信息向量特征库中的至少一种，构建预设的向量特征库。

例如，第一客户端110在根据图像属性信息中的拍摄信息，生成拍摄信息对应的拍摄信息向量特征库的过程中，以拍摄地点为例，第一客户端110可以将所有图片的拍摄地点汇集在一起，并构建关于拍摄地点的拍摄信息向量特征库为{北京，上海，西安，梧州}；如此，当获取拍摄地点在北京拍摄的照片的图像属性向量时，则该照片对应构建的拍摄地点的向量是[1,0,0,0,0]；另外，拍摄地点还可以进一步细化到比如市政地理区域或者具体的地点，例如E公园，F电影院等，构建向量特征库的方式也类似，对应的图片只在其所在的地点取1，其他取0来构建属性向量。

需要说明的是，第一客户端110在根据图像属性信息中的人物特征信息，生成人物特征信息对应的人物向量特征库，以及，第一客户端110在根据图像属性信息中的场景特征信息，生成场景特征信息对应的场景向量特征库的具体方法与上述方法类似，在此不再赘述。

本实施例的技术方案，通过根据图像属性信息中的人物特征信息，生成人物特征信息对应的人物向量特征库；根据图像属性信息中的场景特征信息，生成场景特征信息对应的场景向量特征库；根据图像属性信息中的拍摄信息，生成拍摄信息对应的拍摄信息向量特征库；根据人物向量特征库、场景向量特征库和拍摄信息向量特征库中的至少一种，构建预设的向量特征库；使得该预设的向量特征库可以准确且全面地将图像中的各个图像属性转换为对应的图像属性向量，进而便于后续准确地对待分类图像进行分类，从而避免用户在制作电子相册的过程中需要反复挑选大量照片或视频，减少了用户在制作电子相册过程中的操作负担，提高了用户制作电子相册的效率。

在另一个实施例中，确定每个候选图像集合对应的主题特征，包括：获取候选图像合集中的各个图像所对应的图像属性信息；确定每个候选图像合集中的各个子主题特征的出现频率；根据每个候选图像合集中的各个子主题特征的出现频率，确定每个候选图像合集对应的主题特征。其中，每个图像所对应的图像属性信息具有多个子主题特征。

具体实现中，第一客户端110在确定每个候选图像集合对应的主题特征的过程中，具体包括第一客户端110获取候选图像合集中的各个图像所对应的图像属性信息；其中，每个图像所对应的图像属性信息具有多个子主题特征；然后，第一客户端110对各个子主题特征进行统计，确定每个候选图像合集中的各个子主题特征的出现频率；根据每个候选图像合集中的各个子主题特征的出现频率，确定每个候选图像合集对应的主题特征。具体来说，第一客户端110可以将候选图像合集中出现频率最高的子主题特征，作为该候选图像合集对应的主题特征。

举例来说，在J候选图像合集中包括G图像和H图像，其中，G图像具有“人民公园泳池会馆”、“打羽毛球”的子主题特征；H图像具有“人民公园泳池会馆”、“茶会”的子主题特征；可以看出，“人民公园泳池会馆”这一主题特征在J候选图像合集中的出现频率最高，因此，确定J候选图像合集对应的主题特征为“人民公园泳池会馆”。

本实施例的技术方案，通过获取候选图像合集中的各个图像所对应的图像属性信息；确定每个候选图像合集中的各个子主题特征的出现频率；根据每个候选图像合集中的各个子主题特征的出现频率，准确地确定各个候选图像合集所对应的主题特征，进而便于后续根据目标图像合集所对应的主题特征，准确地获取与目标图像合集的图片相适应的目标音频，减少了用户在制作电子相册过程中的选择配乐操作，提高了用户制作电子相册的效率。

在另一个实施例中，确定待分类图像的图像属性信息，包括：通过图像识别模型对待分类图像进行处理，确定待分类图像的图像属性信息；其中，图像识别模型是根据采集的图像识别训练样本，基于预设的神经网络训练获取的，用于对输入的图像进行处理，得到对应的图像属性信息；图像识别训练样本包括输入的图像和与输入的图像对应的图像属性信息。其中，图像属性信息包括人物特征信息和场景特征信息中的至少一种。

具体实现中，第一客户端110在确定待分类图像的图像属性信息的过程中，第一客户端110可以将待分类图像输入至图像识别模型中，通过图像识别模型对待分类图像进行处理，确定待分类图像的图像属性信息。其中，图像识别模型是根据采集的图像识别训练样本，基于预设的神经网络训练获取的。具体地，第一客户端110可以将图像识别训练样本包括输入的图像和与输入的图像对应的图像属性信息即标签，输入至预设的神经网络进行训练，得到图像识别模型，从而使用图像识别模型对输入的图像进行处理，得到对应的图像属性信息。

本实施例的技术方案，在确定待分类图像的图像属性信息的过程中，通过将待分类图像输入至基于神经网络的图像识别模型，可以快速且准确地识别出待分类图像对应的图像属性信息，进而便于后续对待分类图像进行准确分类，得到候选图像合集，避免用户在制作电子相册的过程中需要反复挑选大量照片或视频，提高了用户制作电子相册的效率。

在另一个实施例中，根据目标图像合集的主题特征，获取对应的目标音频，包括：根据目标图像合集的主题特征，获取多个候选推荐音频并展示；其中，候选推荐音频的音频属性信息与目标图像合集的主题特征相匹配；响应于实施于候选推荐音频的音频选取指令，确定对应的目标音频。其中，音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一。

具体实现中，第一客户端110在根据目标图像合集的主题特征，获取对应的目标音频的过程中，具体包括：第一客户端110根据目标图像合集的主题特征，获取多个候选推荐音频并在显示界面中进行展示，进而供用户对候选推荐音频进行选择自己喜欢的音频；其中，候选推荐音频的音频属性信息与目标图像合集的主题特征相匹配；音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；当用户在候选推荐音频中选出符合需求的目标音频时，第一客户端110响应于实施于候选推荐音频的音频选取指令，确定对应的目标音频。另外，第一客户端110也可以允许用户添加不在候选推荐音频内的音频，作为对应的目标音频。

本实施例的技术方案，通过根据目标图像合集的主题特征，为用户推荐多个与目标图像合集的主题特征相符合的候选推荐音频供用户进行选择，满足用户个性化的配乐需求，使得生成的电子相册可以满足用户的需求，避免重复制作多余的电子相册，提高了用户制作电子相册的效率。

在另一个实施例中，根据目标图像合集的主题特征，获取多个候选推荐音频，包括：通过配乐推荐模型对目标图像合集的主题特征进行处理，确定主题特征的主题特征对应的配乐分类；其中，配乐推荐模型是根据采集的配乐推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的配乐分类；配乐推荐训练样本包括输入的主题特征与输入的主题特征对应的配乐分类；配乐分类具有对应的音频属性信息；根据配乐分类，在预设的配乐库中确定多个候选推荐音频。

具体实现中，第一客户端110在根据目标图像合集的主题特征，获取多个候选推荐音频的过程中，第一客户端110可以将目标图像合集的主题特征输入至配乐推荐模型中，通过配乐推荐模型对目标图像合集的主题特征进行处理，确定与主题特征对应的配乐分类。其中，配乐推荐模型是根据采集的配乐推荐训练样本，基于预设的神经网络训练获取的。具体地，第一客户端110可以将配乐推荐训练样本包括输入的主题特征与输入的主题特征对应的配乐分类即标签，输入至预设的神经网络进行训练，得到配乐推荐模型，从而使用配乐推荐模型对输入的主题特征进行处理，得到对应的配乐分类。当第一客户端110确定与目标图像合集的主题特征对应的配乐分类后，第一客户端110根据配乐分类，在预设的配乐库中确定多个候选推荐音频。

本实施例的技术方案，在根据目标图像合集的主题特征，获取多个候选推荐音频的过程中，通过将目标图像合集的主题特征输入至配乐推荐模型，可以快速且准确地识别出目标图像合集的主题特征对应的配乐分类，并进而可以准确地在预设的配乐库中根据配乐分类确定多个候选推荐音频，避免用户在制作电子相册的过程中需要对大量的配乐进行挑选，提高了用户制作电子相册的效率。

在另一个实施例中，根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册，包括：获取与目标图像合集的主题特征对应的目标相册模板；根据目标相册模板，对目标图像合集中的图像以及目标音频进行合成，生成电子相册。

具体实现中，第一客户端110在根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册的过程中，具体包括：第一客户端110获取与目标图像合集的主题特征对应的目标相册模板；然后，第一客户端110根据目标相册模板，对目标图像合集中的图像以及目标音频进行合成，生成电子相册。具体来说，第一客户端110可以获取目标相册模板中预设的视频片头、视频片尾、视频滤镜、视频转场风格等，最后，对目标图像合集中的图像以及目标音频进行合成，生成电子相册。

本实施例的技术方案，通过获取与目标图像合集的主题特征对应的目标相册模板；然后，通过使用目标相册模板，可以快速地对目标图像合集中的图像以及目标音频进行合成，提高了用户制作电子相册的效率。

在另一个实施例中，获取与目标图像合集的主题特征对应的目标相册模板，包括：根据目标图像合集的主题特征，获取多个候选推荐模板并展示；其中，候选推荐模板的模板属性信息与目标图像合集的主题特征相匹配；模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；响应于实施于候选推荐模板的模板选取指令，确定对应的目标相册模板。

具体实现中，第一客户端110在获取与目标图像合集的主题特征对应的目标相册模板的过程中，具体包括：第一客户端110根据目标图像合集的主题特征，获取多个候选推荐模板并在显示界面中进行展示，进而供用户对候选推荐模板进行选择自己喜欢的模板；其中，候选推荐模板的模板属性信息与目标图像合集的主题特征相匹配；模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；当用户在候选推荐模板中选出符合需求的目标模板时，第一客户端110响应于实施于候选推荐模板的模板选取指令，确定对应的目标相册模板。

本实施例的技术方案，通过根据目标图像合集的主题特征，为用户推荐多个与目标图像合集的主题特征相符合的候选推荐模板供用户进行选择，满足用户对电子相册展示方式的个性化需求，使得生成的电子相册可以满足用户的需求，避免重复制作多余的电子相册，提高了用户制作电子相册的效率。

在另一个实施例中，根据所述目标图像合集的主题特征，获取多个候选推荐模板，包括：通过模板推荐模型对目标图像合集的主题特征进行处理，确定主题特征的主题特征对应的相册模板分类；其中，模板推荐模型是根据采集的模板推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的相册模板分类；模板推荐训练样本包括输入的主题特征与输入的主题特征对应的相册模板分类；相册模板分类具有对应的模板属性信息；根据相册模板分类，在预设的模板库中确定多个候选推荐模板。

具体实现中，第一客户端110在根据所述目标图像合集的主题特征，获取多个候选推荐模板的过程中，第一客户端110可以将目标图像合集的主题特征输入至模板推荐模型中，通过模板推荐模型对目标图像合集的主题特征进行处理，确定与主题特征对应的模板分类。其中，模板推荐模型是根据采集的模板推荐训练样本，基于预设的神经网络训练获取的。具体地，第一客户端110可以将模板推荐训练样本包括输入的主题特征与输入的主题特征对应的模板分类即标签，输入至预设的神经网络进行训练，得到模板推荐模型，从而使用模板推荐模型对输入的主题特征进行处理，得到对应的模板分类。当第一客户端110确定与目标图像合集的主题特征对应的模板分类后，第一客户端110根据根据相册模板分类，在预设的模板库中确定多个候选推荐模板。

本实施例的技术方案，在根据目标图像合集的主题特征，获取多个候选推荐模板的过程中，通过将目标图像合集的主题特征输入至模板推荐模型，可以快速且准确地确定出目标图像合集的主题特征对应的模板分类，并进而可以准确地在预设的模板库中根据配乐分类确定多个候选推荐模板供用户选择，避免用户在制作电子相册的过程中需要对大量的模板进行挑选，提高了用户制作电子相册的效率。

在另一个实施例中，对目标图像合集中的图像以及目标音频进行合成，生成电子相册，包括：对目标音频进行音频波形分析，确定目标音频中的音频节拍；从目标图像合集中，确定与每个音频节拍对应的图像，得到对应的图像合成次序；根据目标相册模板以及图像合成次序，将目标图像集合与目标音频合成，生成电子相册。

具体实现中，第一客户端110在对目标图像合集中的图像以及目标音频进行合成，生成电子相册的过程中，具体包括：第一客户端110对目标音频进行音频波形分析，确定目标音频中的音频节拍；然后，第一客户端110从目标图像合集中，确定与每个音频节拍对应的图像，得到对应的图像合成次序；具体地，第一客户端110从目标图像合集中，确定与每个音频节拍对应的图像，得到对应的图像合成次序的过程中，最后，第一客户端110根据目标相册模板以及图像合成次序，将目标图像集合与目标音频合成，生成电子相册。

其中，图3提供的一种图像合成次序的示意图，其中A线表示音乐的节拍打点，B线表示图像合成次序的转场节拍，图像转场点即为出现下一张图片或下一段视频的节点。通过曲线变速的方法，图像合成次序中的图像转场点的时间间隔与音乐节拍的间隔相同，即调整B1段时长等于A1段时长，调整B2段时长等于A2段时长，调整B3段时长等于A3段时长，调整B4段时长等于A4段时长，进而得到对应的图像合成次序。

本实施例的技术方案，通过对目标音频进行音频波形分析，确定目标音频中的音频节拍；从目标图像合集中，确定与每个音频节拍对应的图像，得到对应的图像合成次序；根据目标相册模板以及图像合成次序，将目标图像集合与目标音频合成，使生成的电子相册中的图像转场节拍与目标音频中的音频节拍相匹配，提高了电子相册的展示效果，避免用户重复制作效果不佳的电子相册，提高了用户制作电子相册的效率。

在另一个实施例中，目标音频具有多个信号帧，对目标音频进行音频波形分析，确定目标音频中的音频节拍，包括：获取当前信号帧的频谱能量，以及，获取在目标音频中且在当前信号帧之前的信号帧的平均频谱能量；确定当前信号帧的频谱能量与平均频谱能量之间的能量比值；当能量比值大于预设的比值阈值时，将当前信号帧作为目标音频的候选节拍；对候选节拍进行筛选，确定目标音频中的音频节拍。其中，目标音频具有多个信号帧。

具体实现中，客户端110在对目标音频进行音频波形分析，确定目标音频中的音频节拍的过程中，具体包括：客户端110采用滑动平均的方法，获取在目标音频中的当前信号帧的频谱能量，具体来说，客户端110可以将当前信号帧的音频波形信号转换为频域信号；客户端110可以将当前信号帧的频域信号的频谱能量进行累计，得到当前信号帧的频谱能量。然后，客户端110获取在目标音频中且在当前信号帧之前的信号帧的平均频谱能量；并计算当前信号帧的频谱能量与平均频谱能量之间的能量比值；然后，客户端110将能量比值与预设的比值阈值进行对比，当能量比值大于预设的比值阈值时，将当前信号帧作为目标音频的候选节拍；对候选节拍进行筛选，确定目标音频中的音频节拍。

例如，首先对音频波形信号转为频域信号：X(n)＝FFT(x(n))；

其中，x(n)为音频波形信号，FFT()为将信号转到频域；

然后，计算当前帧能量的绝对值：POW_X(n)＝sum(X(n)[k]^2),

其中，k是频率序号，sum()是累积一帧信号的频谱能量；

计算当前帧能量的相对值：POW_X0(n)＝POW_X(n)/POW_X_Average(n)；

其中：POW_X_Average(n+1)＝POW_X_Average(n)*a+POW_X(n)*(1-a)；

上述公式采用滑动平均的方法来计算短时平均能量。

其中，a是0-1之间的系数，由经验值获得。POW_X_Average(n)是第n帧的短时平均能量，POW_X(n)是第n帧的频谱能量。

以上是根据当前帧信号能量绝对值和短时平均能量的比值来计算当前帧是否有节拍的可能性，POW_X0(n)越大可能性越大，根据经验值设置一个门限，把超过门限的帧设置为节拍点。

本实施例的技术方案，通过获取当前信号帧的频谱能量，以及，获取在目标音频中且在当前信号帧之前的信号帧的平均频谱能量；然后，计算当前信号帧的频谱能量与平均频谱能量之间的能量比值；当能量比值大于预设的比值阈值时，将当前信号帧作为目标音频的候选节拍；对候选节拍进行筛选，确定目标音频中的音频节拍，可以准确地确定目标音频中的音频节拍，准确地使电子相册中的图像转场节拍与目标音频中的音频节拍相匹配，提高了电子相册的展示效果，避免用户重复制作效果不佳的电子相册，提高了用户制作电子相册的效率。

在另一个实施例中，对候选节拍进行筛选，确定目标音频中的音频节拍，包括：获取候选节拍在目标音频中的节拍时间点；根据节拍时间点，确定候选节拍在目标音频中的节拍类型；其中，节拍类型至少包括随机节拍和平均节拍其中之一；当节拍类型为随机节拍时，按照候选节拍的频谱能量，对候选节拍进行排序，得到排序后的候选节拍，并在排序后的候选节拍中，按序确定目标音频中的音频节拍；当节拍类型为平均节拍时，按照预设的时间间隔在候选节拍中，确定目标音频中的音频节拍。

具体实现中，客户端110对候选节拍进行筛选，确定目标音频中的音频节拍的过程中，具体包括：客户端110获取候选节拍在目标音频中的节拍时间点；根据节拍时间点，确定候选节拍在目标音频中的节拍类型；具体来说，把候选节拍的时间记录为Ti，候选节拍的能量相对值作为节拍强度记为Si，所有候选节拍存为一个图数组[Ti,Si],i＝0～N-1；N为候选节拍个数。其中，节拍类型至少包括随机节拍和平均节拍其中之一；当节拍类型为随机节拍时，按照候选节拍的频谱能量，对候选节拍进行从大到小排序，得到排序后的候选节拍，并在排序后的候选节拍中，确定目标音频中的音频节拍；具体地，可以从N个排序后的候选节拍中选择强度S较大的前M个节拍。当节拍类型为平均节拍时，按照预设的时间间隔在候选节拍中，确定目标音频中的音频节拍；其中，N为正整数。

本实施例的技术方案，通过获取候选节拍在目标音频中的节拍时间点；根据节拍时间点，确定候选节拍在目标音频中的节拍类型；并根据目标音频中的节拍类型，可以更为准确地确定目标音频中的音频节拍，准确地使电子相册中的图像转场节拍与目标音频中的音频节拍相匹配，提高了电子相册的展示效果，避免用户重复制作效果不佳的电子相册，提高了用户制作电子相册的效率。

在另一个实施例中，如图4所示，提供了一种电子相册的生成方法，包括以下步骤：步骤410，响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，所述候选图像集合具有对应的主题特征。步骤420，响应于实施于所述候选图像集合的图集选取指令，确定对应目标图像合集。步骤430，根据所述目标图像合集的主题特征，获取对应的目标音频。步骤440，对所述目标音频进行音频波形分析，确定所述目标音频中的音频节拍。步骤450，从所述目标图像合集中，确定与每个所述音频节拍对应的图像，得到对应的图像合成次序。步骤460，获取与所述目标图像合集的主题特征对应的目标相册模板。步骤470，根据所述目标相册模板以及所述图像合成次序，将所述目标图像集合与所述目标音频合成，生成所述电子相册。需要说明的是，上述步骤的具体限定可以参考上文对一种电子相册的获取方法的具体限定，在此不再赘述。本实施例的技术方案，可以高效地生成满足用户分享需求的电子相册，减少了用户在制作电子相册过程中的操作步骤，提高了用户制作电子相册的效率。本申请提供的电子相册的获取方法，还可以应用于如图5所示的应用环境中。如图5所示的电子相册的获取系统，包括第二客户端510和服务器520；其中，第二客户端510通过网络与服务器520通过网络进行通信。实际应用中，第二客户端510可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器520可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

如图6所示，在另一个实施例中，提供了一种电子相册的获取方法。本实施例主要以该方法应用于上述图5中的第二客户端510来举例说明。参照图6，该电子相册的获取方法具体包括如下步骤：

步骤610，响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，候选图像集合具有对应的主题特征。

具体实现中，当用户需要制作电子相册进行分享时，用户可以通过在第二客户端510的显示界面中点击电子制作按钮，此时第二客户端510响应于该用户的电子相册获取操作指令，开始对储存在第二客户端510本地的待分类图像进行分类，获取多个候选图像集合并展示，以供用户对多个候选图像集合进行选取。

步骤620，响应于实施于候选图像集合的图集选取指令，确定对应目标图像合集。具体实现中，第二客户端510响应于用户实施于候选图像集合的图集选取指令，在多个候选图像集合中确定对应目标图像合集；将目标图像合集作为制作电子相册的图像素材。

步骤630，根据目标图像合集的主题特征，向服务器发送音频获取请求，触发服务器返回与目标图像合集的主题特征对应的目标音频。具体实现中，第二客户端510根据目标图像合集的主题特征，向服务器520发送音频获取请求，触发服务器520返回与目标图像合集的主题特征对应的目标音频。

步骤640，根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册。具体实现中，当第二客户端510获取到服务器520的目标音频后，第二客户端510可以根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册。

上述一种电子相册的获取方法，通过响应于用户的电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；并响应于用户实施于候选图像集合的图集选取指令，确定对应目标图像合集；然后，根据目标图像合集的主题特征，向服务器发送音频获取请求，触发服务器返回与目标图像合集的主题特征对应的目标音频；最后，根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册从而实现自动组织照片或视频的展示形式并添加背景音乐，高效地生成满足用户分享需求的电子相册，减少了用户在制作电子相册过程中的操作步骤，提高了用户制作电子相册的效率。

在另一个实施例中，向服务器发送音频获取请求，触发服务器返回与目标图像合集的主题特征对应的目标音频，包括：向服务器发送音频获取请求，触发服务器返回与目标图像合集的主题特征对应的多个候选推荐音频并展示；其中，候选推荐音频的音频属性信息与目标图像合集的主题特征相匹配；音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；响应于实施于候选推荐音频的音频选取指令，确定对应的目标音频。

具体实现中，第二客户端510向服务器520发送音频获取请求，触发服务器520返回与目标图像合集的主题特征对应的目标音频的过程中，第二客户端510向服务器520发送音频获取请求，触发服务器520返回与目标图像合集的主题特征对应的多个候选推荐音频并展示；其中，候选推荐音频的音频属性信息与目标图像合集的主题特征相匹配；音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；响应于实施于候选推荐音频的音频选取指令，确定对应的目标音频。

本实施例的技术方案，通过向服务器发送音频获取请求，触发服务器返回与目标图像合集的主题特征对应的多个候选推荐音频并展示，为用户推荐多个与目标图像合集的主题特征相符合的候选推荐音频供用户进行选择，在降低客户端获取推荐配乐的处理负荷的同时，满足用户个性化的配乐需求，使得生成的电子相册可以满足用户的需求，避免重复制作多余的电子相册，提高了用户制作电子相册的效率。

在另一个实施例中，第二客户端510在根据目标图像合集的主题特征和目标音频，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册的过程中，具体包括：第二客户端510获取与目标图像合集的主题特征对应的目标相册模板；然后，第二客户端510根据目标相册模板，对目标图像合集中的图像以及目标音频进行合成，生成电子相册。具体来说，第二客户端510可以获取目标相册模板中预设的视频片头、视频片尾、视频滤镜、视频转场风格等，最后，对目标图像合集中的图像以及目标音频进行合成，生成电子相册。

本实施例的技术方案，通过获取与目标图像合集的主题特征对应的目标相册模板；通过使用目标相册模板，可以快速地对目标图像合集中的图像以及目标音频进行合成，提高了用户制作电子相册的效率。

在另一个实施例中，第二客户端510在获取与目标图像合集的主题特征对应的目标相册模板的过程中，具体包括：第二客户端510向服务器520发送模板获取请求，触发服务器520返回与目标图像合集的主题特征对应的多个候选推荐模板并展示；其中，候选推荐模板的模板属性信息与目标图像合集的主题特征相匹配；模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；第二客户端510响应于实施于候选推荐模板的模板选取指令，确定对应的目标相册模板。

本实施例的技术方案，通过根据目标图像合集的主题特征，为用户推荐多个与目标图像合集的主题特征相符合的候选推荐模板供用户进行选择，在降低客户端获取推荐相册模板的处理负荷的同时，满足用户对电子相册展示方式的个性化需求，使得生成的电子相册可以满足用户的需求，避免重复制作多余的电子相册，提高了用户制作电子相册的效率。

如图7所示，在另一个实施例中，提供了一种电子相册的获取方法。本实施例主要以该方法应用于上述图5中的服务器520来举例说明。参照图7，该电子相册的获取方法具体包括如下步骤：

步骤710，接收客户端的音频获取请求；音频获取请求为客户端根据目标图像合集的主题特征得到的；目标图像合集为客户端响应于实施于候选图像集合的图集选取指令确定的；候选图像集合为客户端响应于电子相册获取操作指令，对待分类图像进行分类得到的；候选图像集合具有对应的主题特征。具体实现中，服务器520接收来自第二客户端510的音频获取请求；音频获取请求为第二客户端510根据目标图像合集的主题特征得到的；目标图像合集为第二客户端510响应于实施于候选图像集合的图集选取指令确定的；候选图像集合为第二客户端510响应于电子相册获取操作指令，对待分类图像进行分类得到的。

步骤720，根据音频获取请求，获取并返回与目标图像合集的主题特征对应的目标音频至客户端；目标音频用于供客户端根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册。具体实现中，服务器520根据音频获取请求，获取并返回与目标图像合集的主题特征对应的目标音频至第二客户端510；目标音频用于供第二客户端510根据目标图像合集的主题特征，对目标图像合集中的图像以及目标音频进行合成，得到对应的电子相册。

上述一种电子相册的获取方法，可以高效地生成满足用户分享需求的电子相册，减少了用户在制作电子相册过程中的操作步骤，提高了用户制作电子相册的效率。

在另一个实施例中，服务器520根据音频获取请求，获取并返回与目标图像合集的主题特征对应的目标音频至客户端，包括：服务器520响应音频获取请求，在预设的配乐库中获取与目标图像合集的主题特征对应的多个候选推荐音频；其中，候选推荐音频的音频属性信息与目标图像合集的主题特征相匹配；音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；然后，服务器520发送多个候选推荐音频至第二客户端510；候选推荐音频用于供第二客户端510确定目标音频。

本实施例的技术方案，通过根据目标图像合集的主题特征，为用户推荐多个与目标图像合集的主题特征相符合的候选推荐音频供用户进行选择，满足用户个性化的配乐需求同时减少客户端的处理负荷，使得生成的电子相册可以满足用户的需求，避免重复制作多余的电子相册，提高了用户制作电子相册的效率。

在另一个实施例中，服务器510响应音频获取请求，在预设的配乐库中获取与目标图像合集的主题特征对应的多个候选推荐音频，包括：服务器510通过配乐推荐模型对目标图像合集的主题特征进行处理，确定主题特征的主题特征对应的配乐分类；其中，配乐推荐模型是根据采集的配乐推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的配乐分类；配乐推荐训练样本包括输入的主题特征与输入的主题特征对应的配乐分类；配乐分类具有对应的音频属性信息；然后服务器510在根据配乐分类，在配乐库中确定多个候选推荐音频。

本实施例的技术方案，在根据目标图像合集的主题特征，获取多个候选推荐音频的过程中，通过将目标图像合集的主题特征输入至配乐推荐模型，可以快速且准确地识别出目标图像合集的主题特征对应的配乐分类，并进而可以准确地在预设的配乐库中根据配乐分类确定多个候选推荐音频，避免用户在制作电子相册的过程中需要对大量的配乐进行挑选，同时减少客户端的处理负荷，提高了用户制作电子相册的效率。

在另一个实施例中，还包括：服务器520接收第二客户端510的模板获取请求；服务器520响应模板获取请求，在预设的模板库中获取与目标图像合集的主题特征对应的多个候选推荐模板；其中，候选推荐模板的模板属性信息与目标图像合集的主题特征相匹配；模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；服务器520发送多个候选推荐模板至第二客户端510；候选推荐模板用于供第二客户端510确定目标相册模板；目标相册模板用于供第二客户端510对目标图像合集中的图像以及目标音频进行合成，生成电子相册。

本实施例的技术方案，通过根据目标图像合集的主题特征，为用户推荐多个与目标图像合集的主题特征相符合的候选推荐模板供用户进行选择，满足用户对电子相册展示方式的个性化需求，使得生成的电子相册可以满足用户的需求，避免重复制作多余的电子相册，同时减少客户端的处理负荷，提高了用户制作电子相册的效率。

在另一个实施例中，服务器520通过模板推荐模型对目标图像合集的主题特征进行处理，确定主题特征的主题特征对应的相册模板分类；其中，模板推荐模型是根据采集的模板推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的相册模板分类；模板推荐训练样本包括输入的主题特征与输入的主题特征对应的相册模板分类；相册模板分类具有对应的模板属性信息；最后，服务器520根据相册模板分类，在配乐库中确定多个候选推荐音频。

本实施例的技术方案，在根据目标图像合集的主题特征，获取多个候选推荐模板的过程中，通过将目标图像合集的主题特征输入至模板推荐模型，可以快速且准确地确定出目标图像合集的主题特征对应的模板分类，并进而可以准确地在预设的模板库中根据配乐分类确定多个候选推荐模板供用户选择，避免用户在制作电子相册的过程中需要对大量的模板进行挑选，同时减少客户端的处理负荷，提高了用户制作电子相册的效率。

在另一个实施例中，提供了一种电子相册的获取系统，包括客户端和服务器；具体包括：

所述客户端，用于响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，所述候选图像集合具有对应的主题特征；所述客户端，还用于响应于实施于所述候选图像集合的图集选取指令，确定对应目标图像合集；所述客户端，还用于客户端根据所述目标图像合集的主题特征，向所述服务器发送音频获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的目标音频；

所述服务器，用于接收所述客户端的音频获取请求；还用于根据所述音频获取请求，获取并返回与所述目标图像合集的主题特征对应的目标音频至所述客户端；

所述客户端，用于接收所述服务器的目标音频；还用于根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

上述一种电子相册的获取系统，可以高效地生成满足用户分享需求的电子相册，减少了用户在制作电子相册过程中的操作步骤，提高了用户制作电子相册的效率。

应该理解的是，虽然图2和图4、图6和图7的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2和图4、图6和图7中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

为了便于本领域技术人员的理解，图8提供了一种图像自动筛选组合的流程示意图；如图8所示，当用户在第一客户端110的显示界面中点击制作按钮后，第一客户端110可以首先判断是否具有相册访问权限，当第一客户端110具有相册访问权限时，相册访问权限对用户的手机相册进行扫描，获取手机相册中的照片、视频、动态图等图像；当第一客户端110不具有相册访问权限时，第一客户端110则会生成提示弹窗，提示弹窗用于提示用户授予第一客户端110相册访问权限，然后，第一客户端110对上述的图像进行编码、压缩后，第一客户端110对上述的图像按照不同的场景主题进行分类，得到多个候选图像合集。再然后，第一客户端110显示用于供用户选取候选图像合集的页面。

在一个实施例中，如图9所示，提供了一种图像的生成装置，包括：

一种电子相册的获取装置，其特征在于，所述装置包括：

第一分类模块910，用于响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，所述候选图像集合具有对应的主题特征；

第一响应模块920，用于响应于实施于所述候选图像集合的图集选取指令，确定对应目标图像合集；

第一音频获取模块930，用于根据所述目标图像合集的主题特征，获取对应的目标音频；

第一相册获取模块940，用于根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

在其中一个实施例中，上述的第一分类模块910，具体用于获取待分类图像；所述待分类图像至少包括静态图像和视频图像其中之一；确定所述待分类图像的图像属性信息；所述图像属性信息至少包括人物特征信息、场景特征信息和拍摄信息其中之一；根据所述图像属性信息，对所述待分类图像进行分类，得到所述候选图像集合，并确定每个所述候选图像集合对应的主题特征。

在其中一个实施例中，上述的第一分类模块910，具体还用于根据所述图像属性信息，获取预设的向量特征库；根据所述向量特征库，获取所述待分类图像的图像属性信息对应的图像属性向量；根据所述待分类图像的图像属性向量，对所述待分类图像进行分类，得到所述候选图像合集；其中，每个所述候选图像集合中，任意两个所述图像的图像属性向量之间的向量距离小于预设的向量距离阈值。

在其中一个实施例中，上述的第一分类模块910，具体还用于根据所述图像属性信息中的人物特征信息，生成所述人物特征信息对应的人物向量特征库；其中，所述人物特征信息至少包括人物表情特征、人物五官特征、人物肤色特征、人物肢体特征其中之一；根据所述图像属性信息中的场景特征信息，生成所述场景特征信息对应的场景向量特征库；其中，所述场景特征信息至少包括室内外类型特征、季节类型特征、场景景物特征其中之一；根据所述图像属性信息中的拍摄信息，生成所述拍摄信息对应的拍摄信息向量特征库；其中，所述拍摄信息至少包括拍摄时间、拍摄地点其中之一；根据所述人物向量特征库、所述场景向量特征库和所述拍摄信息向量特征库中的至少一种，构建所述预设的向量特征库。

在其中一个实施例中，上述的第一分类模块910，具体还用于获取所述候选图像合集中的各个图像所对应的图像属性信息；其中，每个图像所对应的图像属性信息具有多个子主题特征；确定每个所述候选图像合集中的各个所述子主题特征的出现频率；根据每个所述候选图像合集中的各个所述子主题特征的出现频率，确定每个所述候选图像合集对应的主题特征。

在其中一个实施例中，上述的第一分类模块910，具体还用于通过图像识别模型对所述待分类图像进行处理，确定所述待分类图像的图像属性信息；其中，所述图像识别模型是根据采集的图像识别训练样本，基于预设的神经网络训练获取的，用于对输入的图像进行处理，得到对应的所述图像属性信息；所述图像识别训练样本包括所述输入的图像和与所述输入的图像对应的图像属性信息；所述图像属性信息包括所述人物特征信息和所述场景特征信息中的至少一种。

在其中一个实施例中，上述的第一音频获取模块930，具体用于根据所述目标图像合集的主题特征，获取多个候选推荐音频并展示；其中，所述候选推荐音频的音频属性信息与所述目标图像合集的主题特征相匹配；所述音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；响应于实施于所述候选推荐音频的音频选取指令，确定对应的所述目标音频。

在其中一个实施例中，上述的第一音频获取模块930，具体还用于通过配乐推荐模型对所述目标图像合集的主题特征进行处理，确定所述主题特征的主题特征对应的配乐分类；其中，所述配乐推荐模型是根据采集的配乐推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的所述配乐分类；所述配乐推荐训练样本包括所述输入的主题特征与所述输入的主题特征对应的配乐分类；所述配乐分类具有对应的所述音频属性信息；根据所述配乐分类，在预设的配乐库中确定所述多个候选推荐音频。

在其中一个实施例中，上述的第一相册获取模块940，具体用于获取与所述目标图像合集的主题特征对应的目标相册模板；根据所述目标相册模板，对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册。

在其中一个实施例中，上述的第一相册获取模块940，具体还用于根据所述目标图像合集的主题特征，获取多个候选推荐模板并展示；其中，所述候选推荐模板的模板属性信息与所述目标图像合集的主题特征相匹配；所述模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；响应于实施于所述候选推荐模板的模板选取指令，确定对应的所述目标相册模板。

在其中一个实施例中，上述的第一相册获取模块940，具体用于通过模板推荐模型对所述目标图像合集的主题特征进行处理，确定所述主题特征的主题特征对应的相册模板分类；其中，所述模板推荐模型是根据采集的模板推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的所述相册模板分类；所述模板推荐训练样本包括所述输入的主题特征与所述输入的主题特征对应的相册模板分类；所述相册模板分类具有对应的所述模板属性信息；根据所述相册模板分类，在预设的模板库中确定所述多个候选推荐模板。

在其中一个实施例中，上述的第一相册获取模块940，具体还用于对所述目标音频进行音频波形分析，确定所述目标音频中的音频节拍；从所述目标图像合集中，确定与每个所述音频节拍对应的图像，得到对应的图像合成次序；根据所述目标相册模板以及所述图像合成次序，将所述目标图像集合与所述目标音频合成，生成所述电子相册。

在其中一个实施例中，上述的第一相册获取模块940，具体还用于获取当前信号帧的频谱能量，以及，获取在所述目标音频中且在所述当前信号帧之前的信号帧的平均频谱能量；确定所述当前信号帧的频谱能量与所述平均频谱能量之间的能量比值；当所述能量比值大于预设的比值阈值时，将所述当前信号帧作为所述目标音频的候选节拍；对所述候选节拍进行筛选，确定所述目标音频中的音频节拍。

在其中一个实施例中，上述的第一相册获取模块940，具体还用于获取所述候选节拍在所述目标音频中的节拍时间点；根据所述节拍时间点，确定所述候选节拍在所述目标音频中的节拍类型；其中，所述节拍类型至少包括随机节拍和平均节拍其中之一；当所述节拍类型为所述随机节拍时，按照所述候选节拍的频谱能量，对所述候选节拍进行排序，得到排序后的候选节拍，并在所述排序后的候选节拍中，按序确定所述目标音频中的音频节拍；当所述节拍类型为所述平均节拍时，按照预设的时间间隔在所述候选节拍中，确定所述目标音频中的音频节拍。

在一个实施例中，如图10所示，提供了一种电子相册的获取装置，包括：

第二分类模块1010，用于响应于电子相册获取操作指令，对待分类图像进行分类，获取多个候选图像集合并展示；其中，所述候选图像集合具有对应的主题特征；

第二响应模块1020，用于响应于实施于所述候选图像集合的图集选取指令，确定对应目标图像合集；

第二音频获取模块1030，用于根据所述目标图像合集的主题特征，向服务器发送音频获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的目标音频；

第二相册获取模块1040，用于根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

在其中一个实施例中，上述的第二音频获取模块1030，具体用于向服务器发送音频获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的多个候选推荐音频并展示；其中，所述候选推荐音频的音频属性信息与所述目标图像合集的主题特征相匹配；所述音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；响应于实施于所述候选推荐音频的音频选取指令，确定对应的所述目标音频。

在其中一个实施例中，上述的第二相册获取模块1040，具体用于获取与所述目标图像合集的主题特征对应的目标相册模板；根据所述目标相册模板，对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册。

在其中一个实施例中，上述的第二相册获取模块1040，具体还用于向所述服务器发送模板获取请求，触发所述服务器返回与所述目标图像合集的主题特征对应的多个候选推荐模板并展示；其中，所述候选推荐模板的模板属性信息与所述目标图像合集的主题特征相匹配；所述模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；响应于实施于所述候选推荐模板的模板选取指令，确定对应的所述目标相册模板。

在一个实施例中，如图11所示，提供了一种电子相册的获取装置，包括：

接收模块1110，用于接收客户端的音频获取请求；所述音频获取请求为所述客户端根据目标图像合集的主题特征得到的；所述目标图像合集为所述客户端响应于实施于候选图像集合的图集选取指令确定的；所述候选图像集合为所述客户端响应于电子相册获取操作指令，对待分类图像进行分类得到的；所述候选图像集合具有对应的主题特征；

发送模块1120，用于根据所述音频获取请求，获取并返回与所述目标图像合集的主题特征对应的目标音频至所述客户端；所述目标音频用于供所述客户端根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册。

在其中一个实施例中，上述的发送模块1120，具体用于响应所述音频获取请求，在预设的配乐库中获取与所述目标图像合集的主题特征对应的多个候选推荐音频；其中，所述候选推荐音频的音频属性信息与所述目标图像合集的主题特征相匹配；所述音频属性信息至少包括音频名称、音频曲风、历史使用场景、历史使用频率其中之一；发送所述多个候选推荐音频至所述客户端；所述候选推荐音频用于供所述客户端确定所述目标音频。

在其中一个实施例中，上述的发送模块1120，具体还用于通过配乐推荐模型对所述目标图像合集的主题特征进行处理，确定所述主题特征的主题特征对应的配乐分类；其中，所述配乐推荐模型是根据采集的配乐推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的所述配乐分类；所述配乐推荐训练样本包括所述输入的主题特征与所述输入的主题特征对应的配乐分类；所述配乐分类具有对应的所述音频属性信息；根据所述配乐分类，在所述配乐库中确定所述多个候选推荐音频。

在其中一个实施例中，上述的电子相册的获取装置，还包括：第三模板请求接收模块，用于接收所述客户端的模板获取请求；第三模板请求响应模块，用于响应所述模板获取请求，在预设的模板库中获取与所述目标图像合集的主题特征对应的多个候选推荐模板；其中，所述候选推荐模板的模板属性信息与所述目标图像合集的主题特征相匹配；所述模板属性信息至少包括视频片头、视频片尾、视频滤镜、视频转场风格其中之一；第三模板发送模块，用于发送所述多个候选推荐模板至所述客户端；所述候选推荐模板用于供所述客户端确定目标相册模板；所述目标相册模板用于供所述客户端对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册。

在其中一个实施例中，上述的第三模板请求响应模块，具体用于通过模板推荐模型对所述目标图像合集的主题特征进行处理，确定所述主题特征的主题特征对应的相册模板分类；其中，所述模板推荐模型是根据采集的模板推荐训练样本，基于预设的神经网络训练获取的，用于对输入的主题特征进行处理，得到对应的所述相册模板分类；所述模板推荐训练样本包括所述输入的主题特征与所述输入的主题特征对应的相册模板分类；所述相册模板分类具有对应的所述模板属性信息；根据所述相册模板分类，在所述配乐库中确定所述多个候选推荐音频。

关于一种电子相册的获取装置的具体限定可以参见上文中对于一种图像的生成方法的限定，在此不再赘述。上述一种图像的生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现电子相册的获取方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图12中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述电子相册的获取方法的步骤。此处电子相册的获取方法的步骤可以是上述各个实施例的电子相册的获取方法中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述电子相册的获取方法的步骤。此处电子相册的获取方法的步骤可以是上述各个实施例的电子相册的获取方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种电子相册的获取方法，其特征在于，所述方法包括：

根据所述目标图像合集的主题特征，获取对应的目标音频；

2.根据权利要求1所述的方法，其特征在于，所述响应于用户触发的电子相册获取操作，对待分类图像进行分类，确定多个候选图像集合，包括：

获取待分类图像；所述待分类图像至少包括静态图像和视频图像其中之一；

确定所述待分类图像的图像属性信息；所述图像属性信息至少包括人物特征信息、场景特征信息和拍摄信息其中之一；

根据所述图像属性信息，对所述待分类图像进行分类，得到所述候选图像集合，并确定每个所述候选图像集合对应的主题特征。

3.根据权利要求2所述的方法，其特征在于，所述根据所述图像属性信息，对所述待分类图像进行分类，得到所述候选图像集合，包括：

根据所述图像属性信息，获取预设的向量特征库；

根据所述向量特征库，获取所述待分类图像的图像属性信息对应的图像属性向量；

根据所述待分类图像的图像属性向量，对所述待分类图像进行分类，得到所述候选图像合集；其中，每个所述候选图像集合中，任意两个所述图像的图像属性向量之间的向量距离小于预设的向量距离阈值。

4.根据权利要求1所述的方法，其特征在于，所述根据所述目标图像合集的主题特征，对所述目标图像合集中的图像以及所述目标音频进行合成，得到对应的所述电子相册，包括：

获取与所述目标图像合集的主题特征对应的目标相册模板；

根据所述目标相册模板，对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册。

5.根据权利要求4所述的方法，其特征在于，所述根据所述目标相册模板，对所述目标图像合集中的图像以及所述目标音频进行合成，生成所述电子相册，包括：

对所述目标音频进行音频波形分析，确定所述目标音频中的音频节拍；

从所述目标图像合集中，确定与每个所述音频节拍对应的图像，得到对应的图像合成次序；

根据所述目标相册模板以及所述图像合成次序，将所述目标图像集合与所述目标音频合成，生成所述电子相册。

6.一种电子相册的获取方法，其特征在于，所述方法包括：

7.一种电子相册的获取方法，其特征在于，所述方法包括：

8.一种电子相册的获取装置，其特征在于，所述装置包括：

9.一种电子相册的获取装置，其特征在于，所述装置包括：

10.一种电子相册的获取装置，其特征在于，所述装置包括：