WO2023009057A1

WO2023009057A1 - 音乐筛选方法、装置、设备、存储介质及程序产品

Info

Publication number: WO2023009057A1
Application number: PCT/SG2022/050298
Authority: WO
Inventors: 刘鼎; 靳潇杰; 王妍; 宫伟博
Original assignee: 脸萌有限公司
Priority date: 2021-07-26
Filing date: 2022-05-10
Publication date: 2023-02-02
Also published as: CN115687680A

Abstract

本申请实施例提供一种音乐筛选方法、装置、设备、存储介质及程序产品，该方法包括：获取至少一张图像和至少一个待选音乐；根据预先设定的 N 个图像分类标签，确定至少一张图像对应图像分类标签的分析结果，N 为大于或等于 1 的整数；根据至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息；根据分析结果和每个待选音乐的属性信息，在至少一个待选音乐中确定与至少一张图像匹配的目标音乐。本申请实施例提供的音乐筛选方法、装置、设备、存储介质及程序产品能够用于提高目标音乐与至少一张图像的匹配度。

Description

音乐筛选方法、装置、设备、存储介质及程序产品本申请的交叉引用本申请要求于 2021年 7月 26日提交的、申请号为 202110843309.7、名称为 “音乐筛选方法、装置、设备、存储介质及程序产品” 的中国专利申请的优先权，其全部内容通过引用并入本文。技术领域本申请涉及终端技术领域，尤其涉及一种音乐筛选方法、装置、设备、存储介质及程序产品。背景技术目前，在播放至少一张图像时，可以为至少一张图像配置与图像搭配的音乐，使得在依次显示至少一张图像的过程中，能够播放上述音乐。在相关技术中，用户通常根据喜好在至少一个待选音乐中，选择用户自己认为与图像搭配的目标音乐，并将目标音乐设置为与图像搭配的音乐。在上述相关技术中，用户通常根据喜好在至少一个待选音乐中，选择其认为与图像搭配的目标音乐，通常使得目标音乐与至少一张图像的匹配度较低。发明内容本申请实施例提供一种音乐筛选方法、装置、设备、存储介质及程序产品，用于提高目标音乐与至少一张图像的匹配度。第一方面，本申请实施例提供一种音乐筛选方法，包括：获取至少一张图像和至少一个待选音乐；根据预先设定的 N个图像分类标签，确定至少一张图像对应图像分类标签的分析结果， N为大于或等于 1 的整数；根据至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息；根据分析结果和每个待选音乐的属性信息，在至少一个待选音乐中确定与至少一张图像匹配的目标音乐。在一种可能的设计中，根据分析结果和每个待选音乐的属性信息，在至少一个待选音乐中确定与至少一张图像匹配的目标音乐，包括：根据分析结果和每个待选音乐的属性信息，确定至少一个待选音乐的目标评分；按照至少一个待选音乐的目标评分的大小顺序，对至少一个待选音乐进行排序，得到音乐序列；将音乐序列中排列在前的预设数量个待选音乐，确定为与至少一张图像匹配的目标音乐。在一种可能的设计中，根据分析结果和每个待选音乐的属性信息，确定至少一个待选音乐的目标评分，包括：针对每个待选音乐，根据分析结果和待选音乐的属性信息，确定待选音乐对应每个图像分类标签的第一评分；获取 N个图像分类标签各自对应的权重；根据待选音乐对应每个图像分类标签的第一评分、 N个图像分类标签各自对应的权重和待选音乐的初始评分，确定待选音乐的目标评分，待选音乐的初始评分包括在待选音乐的属性信息中。在一种可能的设计中， N个图像分类标签包括如下至少一种：图像情感、图像风格、或者图像主题；属性信息还包括待选音乐的 M个音乐分类标签， M为大于或等于 1的整数； M 个音乐分类标签包括如下至少一种：音乐曲风、音乐情感、或者音乐场景。在一种可能的设计中，分析结果为至少一张图像对应图像情感的情感分析结果，情感分析结果包括至少一个第一图像情感和至少一个第一图像情感的置信度；属性信息包括待选音乐的音乐情感，音乐情感包括至少一个第一音乐情感；根据情感分析结果和音乐情感，确定待选音乐对应图像情感的第一评分，包括：根据至少一个第一图像情感、至少一个第一图像情感的置信度和至少一个第一音乐情感，确定至少一个第一音乐情感对应图像情感的评分；将至少一个第一音乐情感对应图像情感的评分的和，与至少一个第一音乐情感的情感总数量之间的比值，确定为待选音乐对应图像情感的第一评分。在一种可能的设计中，根据至少一个第一图像情感、至少一个第一图像情感的置信度和至少一个第一音乐情感，确定至少一个第一音乐情感对应图像情感的评分，包括：步骤 1 : 获取至少一个第一音乐情感中的第 1个第一音乐情感；步骤 2: 获取至少一个第一图像情感中的第 j个第一图像情感；步骤 3: 在预先存储的相关列表中，查找第 1个第一音乐情感和第 j个第一图像情感对应的第 j个相关值；相关列表中包括多个第一音乐情感和第一图像情感对应的相关值；步骤 4: 将第 j个相关值和第 j个第一图像情感的置信度的乘积，与第 1个第一音乐情感对应第 j-1个第一图像情感的第 j-1个评分的和，确定为第 1个第一音乐情感对应第 j个第一图像情感的第 j个评分；将 J加 1，重复执行步骤 2、步骤 3、步骤 4, 直至』等于 Y时，得到第 1个第一音乐情感对应第 Y个第一图像情感的第 Y个评分；将第 Y个评分与至少一个第一图像情感的置信度之和的比值，确定为第 i个第一音乐情感对应图像情感的评分；

1取值为 1至 X之间的整数，』取值为 1至 Y之间的整数， X为至少一个第一音乐情感的情感总数量， Y为至少一个第一图像情感的情感总数量。在一种可能的设计中，分析结果为至少一张图像对应图像风格的风格分析结果，风格分析结果包括至少一个第一图像风格；属性信息中包括待选音乐的音乐情感和音乐曲风，音乐曲风中包括至少一个第一音乐曲风，音乐情感中包括至少一个第一音乐情感；根据风格分析结果、音乐情感和音乐曲风，确定待选音乐对应图像风格的第一评分，包括：根据至少一个第一图像风格、至少一个第一音乐曲风和预先存储的第一预设列表，确定音乐曲风对应图像风格的第三评分；第一预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐曲风；根据至少一个第一图像风格、至少一个第一音乐情感和预先存储的第二预设列表，确定音乐情感对应图像风格的第四评分；第二预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐情感；将第三评分和第四评分的和，确定为待选音乐对应图像风格的第一评分。在一种可能的设计中，根据至少一个第一图像风格、至少一个第一音乐曲风和预先存储的第一预设列表，确定音乐曲风对应图像风格的第三评分，包括：针对每个第一图像风格，在第一预设列表中查找第一图像风格对应的第一音乐曲风；若至少一个第一音乐曲风中存在查找到的第一图像风格对应的第一音乐曲风，则获取查找到的第一图像风格对应的第一音乐曲风的评分；将查找到的第一图像风格对应的第一音乐曲风的评分的和，确定为音乐曲风对应第一图像风格的评分；将音乐曲风对应每个第一图像风格的评分中的最大评分，确定为音乐曲风对应图像风格的第三评分。在一种可能的设计中，分析结果为至少一张图像对应图像主题的主题分析结果，主题分析结果包括至少一个第一图像主题；属性信息中包括待选音乐的音乐场景、音乐情感和音乐曲风，音乐场景中包括至少一个第一音乐场景，音乐情感中包括至少一个第一音乐情感，音乐曲风中包括至少一个第一音乐曲风；根据主题分析结果、音乐场景、音乐情感和音乐曲风，确定待选音乐对应图像主题的第一评分，包括：根据至少一个第一图像主题、至少一个第一音乐场景和预先存储的第三预设列表，确定音乐场景对应图像主题的第五评分；第三预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐场景；根据至少一个第一图像主题、至少一个第一音乐情感和预先存储的第四预设列表，确定音乐情感对应图像主题的第六评分；第四预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐情感；根据至少一个第一图像主题、至少一个第一音乐曲风和预先存储的第五预设列表，确定音乐曲风对应图像主题的第七评分; 第五预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐曲风；将第五评分、第六评分和第七评分的和，确定为待选音乐对应图像主题的第一评分。在一种可能的设计中，根据待选音乐对应图像分类标签的第一评分、 N个图像分类标签各自对应的权重和待选音乐的初始评分，确定待选音乐的目标评分，包括：针对每个图像分类标签，确定待选音乐对应图像分类标签的第一评分与图像分类标签对应的权重的乘积，得到图像分类标签对应的第一乘积；将 N个图像分类标签对应的第一乘积与待选音乐的初始评分的和，确定为待选音乐的目标评分。在一种可能的设计中，根据预先设定的 N个图像分类标签，确定至少一张图像对应图像分类标签的分析结果，包括：根据预先设定的 N个图像分类标签，分别通过 N个图像分类标签各自对应的图像分析模型，对至少一张图像进行分析处理，得到至少一张图像对应图像分类标签的分析结果； N个图像分类标签各自对应的图像分析模型为通过 N个图像分类标签各自对应的多个样本图像进行训练得到的。在一种可能的设计中，根据至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息，包括：通过预先训练的音乐匹配模型，分别对至少一张图像和每个待选音乐进行处理，得到每个待选音乐的属性信息，音乐匹配模型为采用多个样本图像和多个样本音乐进行训练得到的。在一种可能的设计中，获取至少一张图像，包括：从至少一个待处理的视频中获取至少一帧图像，并将至少一帧图像确定为至少一张图像；或者，从至少一个待处理的视频中获取至少一帧图像，将至少一帧图像和预先存储的图像，确定为至少一张图像。第二方面，本申请实施例提供一种音乐筛选装置，包括：包括：获取模块、第一确定模块、第二确定模块和第三确定模块；其中，获取模块，用于获取至少一张图像和至少一个待选音乐；第一确定模块，用于根据预先设定的 N个图像分类标签，确定至少一张图像对应图像分类标签的分析结果， N为大于或等于 1 的整数；第二确定模块，用于根据至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息；第三确定模块，用于根据分析结果和每个待选音乐的属性信息，在至少一个待选音乐中确定与至少一张图像匹配的目标音乐。在一种可能的设计中，第三确定模块具体用于：根据分析结果和每个待选音乐的属性信息，确定至少一个待选音乐的目标评分；按照至少一个待选音乐的目标评分的大小顺序，对至少一个待选音乐进行排序，得到音乐序列；将音乐序列中排列在前的预设数量个待选音乐，确定为与至少一张图像匹配的目标音乐。在一种可能的设计中，第三确定模块具体用于：针对每个待选音乐，根据分析结果和待选音乐的属性信息，确定待选音乐对应每个图像分类标签的第一评分；获取 N个图像分类标签各自对应的权重；根据待选音乐对应每个图像分类标签的第一评分、 N个图像分类标签各自对应的权重和待选音乐的初始评分，确定待选音乐的目标评分，待选音乐的初始评分包括在待选音乐的属性信息中。在一种可能的设计中， N个图像分类标签包括如下至少一种：图像情感、图像风格、或者图像主题；属性信息还包括待选音乐的 M个音乐分类标签， M为大于或等于 1的整数； M 个音乐分类标签包括如下至少一种：音乐曲风、音乐情感、或者音乐场景。在一种可能的设计中，分析结果为至少一张图像对应图像情感的情感分析结果，情感分析结果包括至少一个第一图像情感和至少一个第一图像情感的置信度；属性信息包括待选音乐的音乐情感，音乐情感包括至少一个第一音乐情感；第三确定模块具体用于：根据至少一个第一图像情感、至少一个第一图像情感的置信度和至少一个第一音乐情感，确定至少一个第一音乐情感对应图像情感的评分；将至少一个第一音乐情感对应图像情感的评分的和，与至少一个第一音乐情感的情感总数量之间的比值，确定为待选音乐对应图像情感的第一评分。在一种可能的设计中，第三确定模块具体用于：步骤 1 : 获取至少一个第一音乐情感中的第 1个第一音乐情感；步骤 2: 获取至少一个第一图像情感中的第 j个第一图像情感；步骤 3: 在预先存储的相关列表中，查找第 1个第一音乐情感和第 j个第一图像情感对应的第 j个相关值；相关列表中包括多个第一音乐情感和第一图像情感对应的相关值；步骤 4: 将第 j个相关值和第 j个第一图像情感的置信度的乘积，与第 1个第一音乐情感对应第 j-1个第一图像情感的第 j-1个评分的和，确定为第 1个第一音乐情感对应第 j个第一图像情感的第 j个评分；将 J加 1，重复执行步骤 2、步骤 3、步骤 4, 直至』等于 Y时，得到第 1个第一音乐情感对应第 Y个第一图像情感的第 Y个评分；将第 Y个评分与至少一个第一图像情感的置信度之和的比值，确定为第 i个第一音乐情感对应图像情感的评分；

1取值为 1至 X之间的整数，』取值为 1至 Y之间的整数， X为至少一个第一音乐情感的情感总数量， Y为至少一个第一图像情感的情感总数量。在一种可能的设计中，分析结果为至少一张图像对应图像风格的风格分析结果，风格分析结果包括至少一个第一图像风格；属性信息中包括待选音乐的音乐情感和音乐曲风，音乐曲风中包括至少一个第一音乐曲风，音乐情感中包括至少一个第一音乐情感；第三确定模块具体用于：根据至少一个第一图像风格、至少一个第一音乐曲风和预先存储的第一预设列表，确定音乐曲风对应图像风格的第三评分；第一预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐曲风；根据至少一个第一图像风格、至少一个第一音乐情感和预先存储的第二预设列表，确定音乐情感对应图像风格的第四评分；第二预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐情感；将第三评分和第四评分的和，确定为待选音乐对应图像风格的第一评分。在一种可能的设计中，第三确定模块具体用于：针对每个第一图像风格，在第一预设列表中查找第一图像风格对应的第一音乐曲风；若至少一个第一音乐曲风中存在查找到的第一图像风格对应的第一音乐曲风，则获取查找到的第一图像风格对应的第一音乐曲风的评分；将查找到的第一图像风格对应的第一音乐曲风的评分的和，确定为音乐曲风对应第一图像风格的评分；将音乐曲风对应每个第一图像风格的评分中的最大评分，确定为音乐曲风对应图像风格的第三评分。在一种可能的设计中，分析结果为至少一张图像对应图像主题的主题分析结果，主题分析结果包括至少一个第一图像主题；属性信息中包括待选音乐的音乐场景、音乐情感和音乐曲风，音乐场景中包括至少一个第一音乐场景，音乐情感中包括至少一个第一音乐情感，音乐曲风中包括至少一个第一音乐曲风；第三确定模块具体用于：根据至少一个第一图像主题、至少一个第一音乐场景和预先存储的第三预设列表，确定音乐场景对应图像主题的第五评分；第三预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐场景；根据至少一个第一图像主题、至少一个第一音乐情感和预先存储的第四预设列表，确定音乐情感对应图像主题的第六评分；第四预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐情感；根据至少一个第一图像主题、至少一个第一音乐曲风和预先存储的第五预设列表，确定音乐曲风对应图像主题的第七评分；第五预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐曲风；将第五评分、第六评分和第七评分的和，确定为待选音乐对应图像主题的第一评分。在一种可能的设计中，第三确定模块具体用于：针对每个图像分类标签，确定待选音乐对应图像分类标签的第一评分与图像分类标签对应的权重的乘积，得到图像分类标签对应的第一乘积；将 N个图像分类标签对应的第一乘积与待选音乐的初始评分的和，确定为待选音乐的目标评分。在一种可能的设计中，第一确定模块具体用于：根据预先设定的 N个图像分类标签，分别通过 N个图像分类标签各自对应的图像分析模型，对至少一张图像进行分析处理，得到至少一张图像对应图像分类标签的分析结果； N个图像分类标签各自对应的图像分析模型为通过 N个图像分类标签各自对应的多个样本图像进行训练得到的。在一种可能的设计中，第二确定模块具体用于：通过预先训练的音乐匹配模型，分别对至少一张图像和每个待选音乐进行处理，得到每个待选音乐的属性信息，音乐匹配模型为采用多个样本图像和多个样本音乐进行训练得到的。在一种可能的设计中，获取模块具体用于，包括：从至少一个待处理的视频中获取至少一帧图像，并将至少一帧图像确定为至少一张图像；或者，从至少一个待处理的视频中获取至少一帧图像，将至少一帧图像和预先存储的图像，确定为至少一张图像。第三方面，本申请实施例提供一种终端设备，包括：处理器和存储器；存储器存储计算机执行指令；处理器执行存储器存储的计算机执行指令，使得处理器执行上述第一方面中任一项的音乐筛选方法。第四方面，本申请实施例提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当计算机执行指令被处理器执行时实现上述第一方面中任一项的音乐筛选方法。第五方面，本申请实施例提供一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时实现上述第一方面中任一项的音乐筛选方法。第六方面，本申请实施例提供一种计算机程序，计算机程序被处理器执行时实现上述第一方面中任一项的音乐筛选方法。本申请实施例提供一种音乐筛选方法、装置、设备、存储介质及程序产品，该方法包括: 获取至少一张图像和至少一个待选音乐；根据预先设定的 N个图像分类标签，确定至少一张图像对应图像分类标签的分析结果， N为大于或等于 1 的整数；根据至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息；根据分析结果和每个待选音乐的属性信息，在至少一个待选音乐中确定与至少一张图像匹配的目标音乐。在上述方法汇总，参考根据分析结果和每个待选音乐的属性信息，确定与至少一张图像匹配的目标音乐，可以提高目标音乐与至少一张图像的匹配度，解决用户根据喜好在多个音乐中选择目标音乐时，使得选择出的目标音乐与该组图像的匹配度较低问题。附图说明为了更清楚地说明本申请或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。图 1为本申请实施例提供的音乐筛选方法的应用场景图；图 2为本申请实施例提供的音乐筛选方法的流程图；图 3为本申请实施例提供的确定目标评分的流程图；图 4为本申请实施例提供的确定待选音乐对应图像情感的第一评分的流程图；图 5为本申请实施例提供的确定待选音乐对应图像风格的第一评分的流程图；图 6为本申请实施例提供的确定待选音乐对应图像主题的第一评分的流程图；图 7为本申请实施例提供的确定相关列表的流程图；图 8为本申请实施例提供的音乐筛选方法的流程框图；图 9为本申请实施例提供的音乐筛选装置的结构示意图；图 10本申请实施例提供的终端设备的硬件示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请中的附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。下面结合图 1，对本申请实施例提供的音乐筛选方法的应用场景进行说明。图 1为本申请实施例提供的音乐筛选方法的应用场景图。如图 1所示，包括：至少一张图像和至少一个待选音乐。示例性的，至少一张图像中包括 5 张图像，至少一个待选音乐中包括 W 个音乐， W为大于或等于 1的整数。在相关技术中，用户根据喜好在至少一个待选音乐中，选择其认为与一组图像搭配的目标音乐，通常使得目标音乐与该组图像的匹配度较低。在本申请中，为了提高目标音乐与一组图像的匹配度，发明人想到根据至少一张图像和多个待选音乐确定每个待选音乐的属性信息，并通过对至少一张图像进行处理之后得到的分析结果和每个待选音乐的属性信息，在至少一个待选音乐中确定与至少一张图像匹配的目标音乐，从而提高目标音乐与该组图像的匹配度，解决用户根据喜好在至少一个待选音乐中选择目标音乐时，使得目标音乐与至少一张图像的匹配度较低问题。接着以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。图 2为本申请实施例提供的音乐筛选方法的流程图。如图 2所示，该方法包括：

S201、获取至少一张图像和至少一个待选音乐。本申请实施例的执行主体可以为终端设备，也可以为设置在终端设备中的音乐筛选装置。终端设备例如可以为智能手机、平板电脑、台式电脑等。音乐筛选装置可以通过软件和 /或硬件的结合来实现。软件包括但不限于安装在终端设备中的短视频播放应用程序。在一种可能的设计中，从至少一个待处理的视频中获取至少一帧图像；将至少一帧图像确定为至少一张图像。至少一个待处理的视频为预先存储在终端设备中的视频。上述至少一帧图像可以包括至少一个待处理的视频中的全部图像帧，也可以包括至少一个待处理的视频中的部分图像帧。可选地，当至少一帧图像包括至少一个待处理的视频中的部分图像帧时，可以按照预设帧数量，对至少一个待处理的视频进行跳帧筛选处理，得到至少一帧图像。示例性的，当至少一个待处理的视频包括图像帧 1、图像帧 2、图像帧 3、图像帧 4、图像帧 5 时，若预设帧数量为 1，则得到至少一帧图像包括图像帧 1、图像帧 3、图像帧 5。可选地，从至少一个待处理的视频中获取至少一帧图像之前，还可以包括：判断至少一个待处理的视频的大小是否大于预设阈值；若是，则按照预设帧数量，对至少一个待处理的视频进行跳帧筛选处理，得到至少一帧图像。在另一种可能的设计，从至少一个待处理的视频中获取至少一帧图像；将至少一帧图像和终端设备中预先存储的图像，确定为至少一张图像。在又一种可能的设计中，将预先存储在终端设备中的待处理图像，确定为至少一张图像。至少一个待选音乐可以预先缓存在终端设备中，也可以预先存储在与终端设备中的短视频播放应用程序对应的服务器中。若至少一个待选音乐存储在服务器中，则当终端设备需要获取至少一个待选音乐时，可以向服务器发送请求消息，以使服务器向终端设备发送至少一个待选音乐。在实际中，服务器或者终端设备还可以对至少一个待选音乐进行更新。示例性的，当终端设备缓存至少一个待选音乐、并对至少一个待选音乐进行更新时，记录终端设备的最近播放的音乐，并将最近播放的音乐添加至至少一个待选音乐中；或者，接收服务器发送的更新信息，更新信息中包括至少一个音乐，终端设备接收到至少一个音乐之后，将至少一个音乐添加至至少一个待选音乐中。

S202、根据预先设定的 N个图像分类标签，确定至少一张图像对应图像分类标签的分析结果。

N 为大于或等于 1的整数。 N个图像分类标签包括图像情感、图像风格、或者图像主题等中的任意至少一种。当 N等于 3时， 3个图像分类标签分别为图像情感、图像风格、图像主题。每个图像分类标签对应一个分析结果。示例性的，图像情感对应的分析结果为情感分析结果，图像风格对应的分析结果为风格分析结果，图像主题对应的分析结果为主题分析结果。在一种可能的设计中，根据预先设定的 N个图像分类标签，分别通过 N个图像分类标签各自对应的图像分析模型，对至少一张图像进行分析处理，得到至少一张图像对应图像分类标签的分析结果。 N个图像分类标签各自对应的图像分析模型为通过 N个图像分类标签各自对应的多个样本图像进行训练得到的。

N 个图像分类标签各自对应的多个样本图像可以相同，也可以不相同。示例性的，当 N个图像分类标签包括图像情感、图像风格和图像主题时，图像情感对应的图像分析模型为情感分析模型，图像风格对应的图像分析模型为风格分析模型，图像主题对应的图像分析模型为主题分析模型。进一步地，通过情感分析模型对至少一张图像进行分析处理，得到情感分析结果，通过风格分析模型对至少一张图像进行分析处理，得到风格分析结果，通过主题分析模型对至少一张图像进行分析处理，得到主题分析结果。上述 N个图像分类标签各自对应的图像分析模型可以为采用 N个图像分类标签各自对应的多个样本图像对相同的第一初始模型、或者不同的第一初始模型进行训练得到。第一初始模型可以为神经网络，还可以为其他机器学习模型，在此不再一一详述。相同的第一初始模型表示第一初始模型的结构相同，不同的第一初始模型表示第一初始模型的结构不同。在另一种可能的设计中，还根据预先设定的 N个图像分类标签，通过预先训练好的图像分析模型，对至少一张图像进行分析处理，得到至少一张图像对应图像分类标签的分析结果。预先训练好的图像分析模型为采用多个样本图像对第二初始模型进行训练得到的。第二初始模型也可以为神经网络，还可以为其他机器学习模型，在此不再一一详述。第二初始模型与第一初始模型不同。情感分析结果中可以包括至少一个第一图像情感。情感分析结果中还可以包括至少一个第一图像情感的置信度。例如，至少一个第一图像情感包括：图像情感 1、图像情感 2、图像情感 3等。风格分析结果中可以包括至少一个第一图像风格。例如，至少一个第一图像风格包括：图像风格 1、图像风格 2、图像风格 3、图像风格 4等。主题分析结果中可以包括至少一个第一图像主题。例如，至少一个第一图像主题包括：图像主题 1、图像主题 2等。

5203、根据至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息。在一种可能的设计中，通过预先训练的音乐匹配模型，分别对至少一张图像和每个待选音乐进行处理，得到每个待选音乐的属性信息。音乐匹配模型为采用多个样本图像和多个样本音乐对第三初始模型进行训练得到的。第三初始模型可以为神经网络，还可以为其他机器学习模型，在此不再一一详述。属性信息中包括每个待选音乐的初始评分。属性信息中还可以包括待选音乐的 M个音乐分类标签。 M为大于或等于 1的整数。

M 个音乐分类标签包括音乐曲风、音乐情感、或者音乐场景中的任意至少一种。音乐曲风中可以包括至少一个第一音乐曲风。例如，至少一个第一音乐曲风包括：音乐曲风 1、音乐曲风 2等。音乐情感中可以包括至少一个第一音乐情感。例如，至少一个第一音乐情感包括：音乐情感 1、音乐情感 2、音乐情感 3等。音乐场景中可以包括至少一个第一音乐场景。例如，至少一个第一音乐场景包括：音乐场景 1、音乐场景 2等。在另一种可能的设计中，可以通过预先设定的线上配乐算法，对至少一张图像和至少一个待选音乐进行处理，得到每个待选音乐的属性信息。对线上配乐算法的详细说明，可以参见相关技术此处不再赘述。在又一种可能的设计中，针对至少一个待选音乐中的每个待选音乐，获取待选音乐的 M个音乐分类标签；通过预设训练的模型，对待选音乐的 M个音乐分类标签和至少一张图像进行处理，得到待选音乐的属性信息。在此设计中，待选音乐的 M个音乐分类标签为预先存储在终端设备中的分类标签。

5204、根据分析结果和每个待选音乐的属性信息，在至少一个待选音乐中确定与至少一张图像匹配的目标音乐。在一种可能的设计中，根据分析结果和每个待选音乐的属性信息，确定至少一个待选音乐的目标评分；按照至少一个待选音乐的目标评分的大小顺序，对至少一个待选音乐进行排序，得到音乐序列；将音乐序列中排列在前的预设数量个待选音乐，确定为与至少一张图像匹配的目标音乐。具体的，对根据分析结果和每个待选音乐的属性信息，确定至少一个待选音乐的目标评分的详细说明，请参见图 3实施例，此处不再赘述。预设数量可以为 1、 2、 3等，此处不对预设数量进行限定。示例性的，至少一个待选音乐中包括音乐 1、音乐 2、音乐 3 , 若音乐 1的目标评分为 20、音乐 2的目标评分为 10、音乐 3的目标评分为 50, 则音乐序列为［音乐 3、音乐 1、音乐 2］。进一步地，当预设数量为 1时，将音乐 3确定为目标音乐。在另一种可能的设计中，根据每个待选音乐的属性信息，对至少一个待选音乐进行排序，得到初始序列；根据分析结果和每个待选音乐的属性信息，确定至少一个待选音乐的目标评分；根据至少一个待选音乐的目标评分，调整初始序列，得到音乐序列；将音乐序列中排列在前的预设数量个待选音乐，确定为与至少一张图像匹配的目标音乐。属性信息中包括待选音乐的初始评分。具体的，根据每个待选音乐的初始评分，对至少一个待选音乐进行排序，得到初始序列。示例性的，至少一个待选音乐中包括音乐 1、音乐 2、音乐 3 , 若音乐 1的初始评分为 15、音乐 2的初始评分为 20、音乐 3的初始评分为 25，则确定初始序列为［音乐 3, 音乐 2,音乐 1］。若音乐 1的目标评分为 20、音乐 2的目标评分为 10、音乐 3的目标评分为 50, 则对初始序列［音乐 3,音乐 2,音乐 1］进行调整，得到的音乐序列为［音乐 3,音乐 1,音乐 2］。进一步地，若音乐序列为［音乐 3,音乐 2,音乐 1］，则当预设数量为 1时，将音乐 3确定为目标音乐。在图 2实施例提供的音乐筛选方法中，根据预先设定的 N个图像分类标签，确定至少一张图像对应图像分类标签的分析结果，根据至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息，参考分析结果和每个待选音乐的属性信息，确定与至少一张图像匹配的目标音乐，可以提高目标音乐与至少一张图像的匹配度，解决用户根据喜好在至少一个待选音乐中选择目标音乐时，使得目标音乐与至少一张图像的匹配度较低问题。此外，在相关技术中，在用户根据喜好在至少一个待选音乐中选择目标音乐时，需要用户试听多个待选音乐，从而导致选择目标音乐的用户操作复杂，使得确定目标音乐的效率较低。而在本申请中，终端设备可以自行执行音乐筛选方法，确定目标音乐，无需用户试听多个待选音乐，简化用户操作，提高了确定目标音乐的的效率。进一步地，在本申请中，由于提高了确定目标音乐的的效率、以及目标音乐与至少一张图像的匹配度，因此可以提升用户体验。在上述图 2实施例的基础上，下面结合图 3 , 对根据分析结果和至少一个待选音乐的初始评分，确定至少一个待选音乐的目标评分的方法进行说明。具体的，请参见图 3。图 3为本申请实施例提供的确定目标评分的流程图。如图 3所示，该方法包括：

S301、针对每个待选音乐，根据分析结果和待选音乐的属性信息，确定待选音乐对应每个图像分类标签的第一评分。当分析结果为情感分析结果时，属性信息可以包括音乐场景、音乐情感和 /或音乐曲风。示例性的，当属性信息包括音乐情感时，针对每个待选音乐，根据情感分析结果和音乐情感，确定待选音乐对应图像情感的第一评分（Scorel）。具体的，对确定待选音乐对应图像情感的第一评分的方法说明，请参见图 4实施例，此处不再赘述。当分析结果为风格分析结果时，属性信息可以包括音乐场景、音乐情感和 /或音乐曲风。示例性的，当属性信息包括音乐情感和音乐曲风时，针对每个待选音乐，根据风格分析结果、音乐情感和音乐曲风，确定待选音乐对应图像风格的第一评分（Score2）。具体的，对确定待选音乐对应图像风格的第一评分的方法说明，请参见图 5 实施例，此处不再赘述。当分析结果为主题分析结果时，属性信息可以包括音乐场景、音乐情感和 /或音乐曲风。示例性的，当属性信息包括音乐场景、音乐情感和音乐曲风时，针对每个待选音乐，根据主题分析结果、音乐场景、音乐情感和音乐曲风，确定待选音乐对应图像主题的第一评分（S_COre3）。具体的，对确定待选音乐对应图像主题的第一评分的方法说明，请参见图 6实施例，此处不再赘述。

5302、获取 N个图像分类标签各自对应的权重。

N 个权重预先存储在终端设备中、或者上述服务器中。当 N个图像分类标签包括图像情感、图像风格和图像主题时，图像情感对应的权重为 W1，图像风格对应的权重为 W2，图像主题对应的权重为 W3。

5303、根据待选音乐对应每个图像分类标签的第一评分、 N个图像分类标签各自对应的权重和待选音乐的初始评分，确定待选音乐的目标评分。待选音乐的初始评分包括在待选音乐的属性信息中。在一种可能的设计中，针对每个图像分类标签，确定待选音乐对应图像分类标签的第一评分（示例性的， Scorel、 Score2、 Score3）与图像分类标签对应的权重（示例性的，相应的， Wl、 W2、 W3）的乘积，得到图像分类标签对应第一乘积；将 N个图像分类标签对应的第一乘积与待选音乐的初始评分的和，确定为待选音乐的目标评分。目标评分可以通过如下公式确定： S=ScoreO+Wl*Scorel+W2*Score2+W3*Score3 ; 其中， S为待选音乐的目标评分， ScoreO为待选音乐的初始评分。公式中的 Scorel、 Score2 和 /或 Score3可以等于 0。在图 3 实施例中，根据待选音乐对应每个图像分类标签的第一评分、 N个图像分类标签各自对应的权重和待选音乐的初始评分，确定待选音乐的目标评分，即在确定目标评分的过程中，参考了多个对应图像分类标签的第一评分，提高了确定目标评分的准确性。图 4为本申请实施例提供的确定待选音乐对应图像情感的第一评分的流程图。如图 4 所示，该方法包括：

5401、获取情感分析结果包括至少一个第一图像情感和至少一个第一图像情感的置信度，以及音乐情感包括至少一个第一音乐情感。

5402、获取至少一个第一音乐情感中的第 1个第一音乐情感。初始时， i等于 1。

5403、获取至少一个第一图像情感中的第 j个第一图像情感。初始时， j等于 1。 S404、在预先存储的相关列表中，查找第 1个第一音乐情感和第 j个第一图像情感对应的第 j个相关值。相关列表中包括多个第一音乐情感和第一图像情感对应的相关值。不例性的，相关列表具有如下表 1的格式。表 1

示例性的，第 1个第一音乐情感为音乐情感 1，第 j个第一图像情感为图像情感 2, 则第 i 个第一音乐情感和第 j个第一图像情感对应的第 j个相关值为 0.2。需要说明的是，针对每个第一音乐情感，该第一音乐情感分别和至少一个第一图像情感对应的相关值之和等于 1。示例性的，针对音乐情感 1，音乐情感 1分别和图像情感 1、图像情感 2、图像情感 3、等对应的相关值之和等于 1，即 0.15+0.2+0.1+ =1。在一种可能的设计中，第一音乐情感具有对应的音乐情感标识，第一图像情感具有对应的图像情感标识；可以获取至少一个第一音乐情感中的第 1个第一音乐情感的音乐情感标识；获取至少一个第一图像情感中的第 j个第一图像情感的图像情感标识；在预先存储的相关列表中，查找音乐情感标识和图像情感标识对应的第个相关值。相关列表中包括多个音乐情感标识和图像情感标识对应的相关值。此处，相关列表与上述表 1相似，此处不再赘述。可选地，在 S404之前，本申请提供的技术方案还可以包括：确定相关列表。对确定相关列表的详细说明，请参见图 7实施例。

5405、将第 j个相关值和第 j个第一图像情感的置信度的乘积，与第 i个第一音乐情感对应第』-1个第一图像情感的第』-1个评分的和，确定为第 1个第一音乐情感对应第 j个第一图像情感的第个评分。初始时，第 j-1个评分等于 0。

5406、判断』是否大于 Y。若否，则执行 S407，否则执行 S408。

Y 为至少一个第一图像情感的情感总数量。

5407、将 j加 1，重复执行 S403~S406。

5408、得到第 i个第一音乐情感对应第 Y个第一图像情感的第 Y个评分。

5409、将第 Y个评分与至少一个第一图像情感的置信度之和的比值，确定为第：个第一音乐情感对应图像情感的评分。在一种可能的设计中，在 S401之前、或者在 S401和 S402之间，还可以包括：构建评分列表。相应的，在 S410和 S411之间，还可以包括：在评分列表中存储第 1个第一音乐情感对应图像情感的评分。

5410、判断 1是否大于 X。若否，则执行 S411，否则执行 S412。

X 为至少一个第一音乐情感的情感总数量。

5411、将 1加 1，将 j设置为 1，重复执行 S402~S410。

5412、得到至少一个第一音乐情感对应图像情感的评分。示例性的， X等于 2时，即至少一个第一音乐情感包括音乐情感 1和音乐情感 2时，可以得到音乐情感 1对应图像情感的评分为 10、音乐情感 2对应图像情感的评分为 5。需要说明的是，上述 S402-S412为对根据至少一个第一图像情感、至少一个第一图像情感的置信度和至少一个第一音乐情感，确定至少一个第一音乐情感对应图像情感的评分的解释说明。

S413、将至少一个第一音乐情感对应图像情感的评分的和，与至少一个第一音乐情感的情感总数量之间的比值，确定为待选音乐对应图像情感的第一评分。进一步地，在 S412的基础上，至少一个第一音乐情感的情感总数量等于 2, 因此待选音乐对应图像情感的第一评分等于（10+5） 12=1.5 当构建评分列表，并在评分列表中存储至少一个第一音乐情感对应图像情感的评分时， S413还可以为：将评分列表中包括的所有评分的和与所有评分的总数量的比值，确定为待选音乐对应图像情感的第一评分。图 5为本申请实施例提供的确定待选音乐对应图像风格的第一评分的流程图。如图 5所示，该方法包括：

S501、根据至少一张图像对应图像风格的风格分析结果中包括的至少一个第一图像风格、待选音乐的属性信息中音乐曲风包括的至少一个第一音乐曲风、以及预先存储的第一预设列表，确定音乐曲风对应图像风格的第三评分。第一预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐曲风。示例性的，第一预设列表具有如下表 2所示的格式。表 2

在第一预设列表中，第一图像风格对应的第一音乐曲风的数量可以为多个，也可以为 1 个，还可以为 0个。 “NULL”表示在该位置处没有第一音乐曲风。第一预设列表中的每个第一音乐曲风具有对应的评分，当第一图像风格对应多个第一音乐曲风时，位于多个列中的第一音乐曲风对应的评分依次降低（指示第一图像风格与第一音乐曲风的匹配度依次降低）。示例性的，第一图像风格为图像风格 3时，位于第一列中的音乐曲风 1对应的评分较大，位于第二列中的音乐曲风 5对应的评分较小。 NULL对应的评分为 0。在一种可能的设计中，针对每个第一图像风格，在第一预设列表中查找第一图像风格对应的第一音乐曲风；若至少一个第一音乐曲风中存在查找到的第一图像风格对应的第一音乐曲风，则获取查找到的第一图像风格对应的第一音乐曲风的评分；将查找到的第一图像风格对应的第一音乐曲风的评分的和，确定为音乐曲风对应第一图像风格的评分；将音乐曲风对应每个第一图像风格的评分中的最大评分，确定为音乐曲风对应图像风格的第三评分。可选地，还可以将音乐曲风对应每个第一图像风格的评分的和，确定为音乐曲风对应图像风格的第三评分。示例性的，当至少一个第一图像风格包括图像风格 2和图像风格 3时，针对图像风格 2, 在第一预设列表中查找到图像风格 2对应的第一音乐曲风包括音乐曲风 4和音乐曲风 1，若至少一个第一音乐曲风包括音乐曲风 4、音乐曲风 1、音乐曲风 5、音乐曲风 2, 则确定至少一个第一音乐曲风包括图像风格 2对应的音乐曲风 4和音乐曲风 1，因此可以获取音乐曲风 4对应的评分、以及音乐曲风 1对应的评分，并将音乐曲风 4对应的评分、以及音乐曲风 1对应的评分的和，确定为音乐曲风对应图像风格 2的评分；针对图像风格 3, 在第一预设列表中查找到图像风格 3对应的第一音乐曲风包括音乐曲风 5,若至少一个第一音乐曲风包括音乐曲风 4、音乐曲风 1、音乐曲风 5、音乐曲风 2, 则确定至少一个第一音乐曲风包括图像风格 3对应的音乐曲风 5, 因此可以获取音乐曲风 5对应的评分，并将音乐曲风 5对应的评分，确定为音乐曲风对应图像风格 3的评分；进一步地，将音乐曲风对应图像风格 2的评分与音乐曲风对应图像风格 3的评分中的最大评分，确定为音乐曲风对应图像风格的第三评分。可选地，还可以将音乐曲风对应图像风格 2的评分与音乐曲风对应图像风格 3的评分的和，确定为音乐曲风对应图像风格的第三评分。

S502、根据至少一个第一图像风格、至少一个第一音乐情感和预先存储的第二预设列表，确定音乐情感对应图像风格的第四评分。第二预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐情感。示例性的，第二预设列表具有如下表 3所示的格式。表 3

在第二预设列表中，第一图像风格对应的第一音乐情感的数量可以为多个，也可以为 1 个，还可以为 0个。 “NULL”表示在该位置处没有第一音乐情感。第二预设列表中的每个第一音乐情感具有对应的评分，当第一图像风格对应多个第一音乐情感时，位于多个列中的第一音乐情感对应的评分依次降低（指示第一图像风格与第一音乐情感的匹配度依次降低）。示例性的，第一图像风格为图像风格 4时，位于第一列中的音乐曲风 5对应的评分较大，位于第二列中的 NULL对应的评分为 0。需要说明的是， S502的执行方法与 S501的执行方法相似，此处不再赘述 S502的执行过程。

S503、将第三评分和第四评分的和，确定为待选音乐对应图像风格的第一评分。图 6为本申请实施例提供的确定待选音乐对应图像主题的第一评分的流程图。如图 6所示，该方法包括：

S601、根据至少一张图像对应图像风格的主题分析结果中包括的至少一个第一图像主题、音乐场景中包括的至少一个第一音乐场景、以及预先存储的第三预设列表，确定音乐场景对应图像主题的第五评分。第三预设列表中包括多个第一图像主题和每个第一图像主题对应的第一音乐场景。示例性的，第三预设列表具有如下表 4所示的格式。表 4

在第三预设列表中，第一图像主题对应的第一音乐场景的数量可以为多个，也可以为 1 个，还可以为 0个。 “NULL”表示在该位置处没有第一音乐场景。第三预设列表中的每个第一音乐场景具有对应的评分，当第一图像主题对应的多个第一音乐场景时，位于多个列中的第一音乐场景对应的评分依次降低（指示第一图像主题与第一音乐场景的匹配度依次降低）。示例性的，第一图像主题为图像主题 2时，位于第一列中的音乐场景 3对应的评分较大，位于第二列中的音乐场景 2对应的评分较小。需要说明的是， S601的执行方法与 S501的执行方法相似，此处不再赘述 S601的执行过程。

S602、根据主题分析结果中包括的至少一个第一图像主题、音乐情感中包括的至少一个第一音乐情感、以及预先存储的第四预设列表，确定音乐情感对应图像主题的第六评分。第四预设列表中包括多个第一图像主题和每个第一图像主题对应的第一音乐情感。示例性的，第四预设列表具有如下表 5所示的格式。表 5

在第四预设列表中，第一图像主题对应的第一音乐情感的数量可以为多个，也可以为 1 个，还可以为 0个。 “NULL”表示在该位置处没有第一音乐情感。第四预设列表中的每个第一音乐情感具有对应的评分，当第一图像主题对应的多个第一音乐情感时，位于多个列中的第一音乐情感对应的评分依次降低（指示第一图像主题与第一音乐情感的匹配度依次降低）。示例性的，第一图像主题为图像主题 2时，位于第一列中的音乐曲风 3对应的评分较大，位于第二列中的音乐情感 2对应的评分较小。需要说明的是， S602的执行方法与 S501的执行方法相似，此处不再赘述 S602的执行过程。 S603、根据主题分析结果中包括的至少一个第一图像主题、音乐曲风中包括的至少一个第一音乐曲风、以及预先存储的第五预设列表，确定音乐曲风对应图像主题的第七评分。第五预设列表中包括多个第一图像主题和每个第一图像主题对应的第一音乐曲风。示例性的，第五预设列表具有如下表 6所示的格式。表 6

在第五预设列表中，第一图像主题对应的第一音乐曲风的数量可以为多个，也可以为 1 个，还可以为 0个。 “NULL”表示在该位置处没有第一音乐曲风。第五预设列表中的每个第一音乐曲风具有对应的评分，当第一图像主题对应的多个第一音乐曲风时，位于多个列中的第一音乐曲风对应的评分依次降低（指示第一图像主题与第一音乐曲风的匹配度依次降低）。示例性的，第一图像主题为图像主题 1时，位于第一列中的音乐曲风 1对应的评分较大，位于第二列中的 NULL对应的评分为 0。需要说明的是， S603的执行方法与 S501的执行方法相似，此处不再赘述 S603的执行过程。

S604、将第五评分、第六评分和第七评分的和，确定为待选音乐对应图像主题的第一评分。在上述图 4实施例的基础上，下面以相关列表中包括多个第一音乐情感和第一图像情感对应的相关值为例，结合图 7, 对确定相关列表的方法进行说明。图 7为本申请实施例提供的确定相关列表的流程图。如图 7所示，该方法包括：

5701、获取预先存储的视频历史数据，视频历史数据中包括多条历史记录，每条历史记录中包括第一图像情感和第一音乐情感。第一图像情感为至少一张历史图像的情感。第一音乐情感为至少一张历史图像的配乐的情感。

5702、统计多条历史记录中包括的不同的第一音乐情感的数量，得到第一总数量 V。

5703、统计多条历史记录中包括的不同的第一图像情感的数量，得到第二总数量 U。

5704、针对 V个第一音乐情感中的第 n个第一音乐情感和 U个第一图像情感中的第 m个第一图像情感，设置第 n个第一音乐情感和第 m个第一图像情感对应的第一记录条数等于 0。初始时， n、 m均等于 1。

5705、获取多条历史记录中的第 p个历史记录。

5706、判断第 p个历史记录是否包括第 n个第一音乐情感和第 m个第一图像情感。若是，则执行 S707〜 S709，否则执行 S710。

5707、更新第一记录条数，将第一记录条数加 1。

5708、判断 p是否大于多条历史记录的总条数。若是，则执行 S709，否则执行 S710。

5709、得到第 n个第一音乐情感和第 m个第一图像情感对应的第一记录条数。

5710、将 p加 1，重复执行 S705~S709。

5711、判断 m是否大于 U。若否，在执行 S712，若是，则执行 S713〜 S716。需要说明的是，在 S709之后执行 S711-S716

5712、将 m加 1，重复执行 S704~S711。

5713、得到第 n个第一音乐情感分别和 U个第一图像情感对应的第一记录条数；对第 n 个第一音乐情感分别和 U个第一图像情感对应的第一记录条数进行归一化处理，得到第 n个第一音乐情感分别和 U个第一图像情感对应的相关值，并在相关列表中相应位置写入第 n个第一音乐情感分别和 U个第一图像情感对应的相关值。具体的，确定第 n个第一音乐情感分别和 U个第一图像情感对应的第一记录条数的和值; 将目标音乐情感分别和 U个第一图像情感对应的第一记录条数与上述和值的比值，确定为第 n个第一音乐情感分别和 U个第一图像情感对应的相关值。

5714、判断 n是否大于 V。若否，则执行 S715，否则执行 S716。

5715、将 n加 1 , 将 m设置为 1, 重复执行 S704~S714。

5716、得到相关列表。需要说明的是，在根据图 7实施例所示的方法，得到相关列表之后，可以直接将得到的相关列表确定为图 4实施例中的相关列表，开发人员还手动调整得到相关列表中的相关值，并将手动调整之后的相关列表确定为图 4实施例中的相关列表。图 8为本申请实施例提供的音乐筛选方法的流程框图。如图 8所示，包括： N个图像分类标签各自对应的图像分析模型、音乐匹配模型。其中， N个图像分类标签各自对应的图像分析模型包括：图像分类标签 1 对应的图像分析模型、图像分类标签 2对应的图像分析模型、、图像分类标签 N对应的图像分析模型。

N 个图像分类标签各自对应的图像分析模型分别对至少一张图像进行分析处理，得到得到至少一张图像对应图像分类标签的分析结果。例如，通过图像分类标签 1 对应的图像分析模型对至少一张图像进行分析处理，得到至少一张图像对应图像分类标签的分析结果 1 ; 通过图像分类标签 2对应的图像分析模型对至少一张图像进行分析处理，得到至少一张图像对应图像分类标签的分析结果 2。音乐匹配模型对至少一张图像和至少一个待选音乐进行处理，得到每个待选音乐的属性信息。进一步地，参考 N个分析结果和每个待选音乐的属性信息，确定与至少一张图像匹配的目标音乐。图 9为本申请实施例提供的音乐筛选装置的结构示意图。如图 9所示，音乐筛选装置 10 包括：获取模块 11、第一确定模块 12、第二确定模块 13和第三确定模块 14; 其中，获取模块 11，用于获取至少一张图像和至少一个待选音乐；第一确定模块 12, 用于根据预先设定的 N个图像分类标签，确定至少一张图像对应图像分类标签的分析结果， N为大于或等于 1的整数；第二确定模块 13, 用于根据至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息；第三确定模块 14, 用于根据分析结果和每个待选音乐的属性信息，在至少一个待选音乐中确定与至少一张图像匹配的目标音乐。本申请实施例提供的音乐筛选装置 10可以执行上述音乐筛选，其实现原理以及有益效果类似，此处不再进行赘述。在一种可能的设计中，第三确定模块 14具体用于：根据分析结果和每个待选音乐的属性信息，确定至少一个待选音乐的目标评分；按照至少一个待选音乐的目标评分的大小顺序，对至少一个待选音乐进行排序，得到音乐序列；将音乐序列中排列在前的预设数量个待选音乐，确定为与至少一张图像匹配的目标音乐。在一种可能的设计中，第三确定模块 14具体用于：针对每个待选音乐，根据分析结果和待选音乐的属性信息，确定待选音乐对应每个图像分类标签的第一评分；获取 N个图像分类标签各自对应的权重；根据待选音乐对应每个图像分类标签的第一评分、 N个图像分类标签各自对应的权重和待选音乐的初始评分，确定待选音乐的目标评分，待选音乐的初始评分包括在待选音乐的属性信息中。在一种可能的设计中， N个图像分类标签包括如下至少一种：图像情感、图像风格、或者图像主题；属性信息还包括待选音乐的 M个音乐分类标签， M为大于或等于 1的整数； M 个音乐分类标签包括如下至少一种：音乐曲风、音乐情感、或者音乐场景。在一种可能的设计中，分析结果为至少一张图像对应图像情感的情感分析结果，情感分析结果包括至少一个第一图像情感和至少一个第一图像情感的置信度；属性信息包括待选音乐的音乐情感，音乐情感包括至少一个第一音乐情感；第三确定模块 14具体用于：根据至少一个第一图像情感、至少一个第一图像情感的置信度和至少一个第一音乐情感，确定至少一个第一音乐情感对应图像情感的评分；将至少一个第一音乐情感对应图像情感的评分的和，与至少一个第一音乐情感的情感总数量之间的比值，确定为待选音乐对应图像情感的第一评分。在一种可能的设计中，第三确定模块 14具体用于：步骤 1 : 获取至少一个第一音乐情感中的第 1个第一音乐情感；步骤 2: 获取至少一个第一图像情感中的第 j个第一图像情感；步骤 3: 在预先存储的相关列表中，查找第 1个第一音乐情感和第 j个第一图像情感对应的第 j个相关值；相关列表中包括多个第一音乐情感和第一图像情感对应的相关值；步骤 4: 将第 j个相关值和第 j个第一图像情感的置信度的乘积，与第 1个第一音乐情感对应第 j-1个第一图像情感的第 j-1个评分的和，确定为第 1个第一音乐情感对应第 j个第一图像情感的第 j个评分；将 J加 1，重复执行步骤 2、步骤 3、步骤 4, 直至』等于 Y时，得到第 1个第一音乐情感对应第 Y个第一图像情感的第 Y个评分；将第 Y个评分与至少一个第一图像情感的置信度之和的比值，确定为第 i个第一音乐情感对应图像情感的评分；

1取值为 1至 X之间的整数，』取值为 1至 Y之间的整数， X为至少一个第一音乐情感的情感总数量， Y为至少一个第一图像情感的情感总数量。在一种可能的设计中，分析结果为至少一张图像对应图像风格的风格分析结果，风格分析结果包括至少一个第一图像风格；属性信息中包括待选音乐的音乐情感和音乐曲风，音乐曲风中包括至少一个第一音乐曲风，音乐情感中包括至少一个第一音乐情感；第三确定模块 14具体用于：根据至少一个第一图像风格、至少一个第一音乐曲风和预先存储的第一预设列表，确定音乐曲风对应图像风格的第三评分；第一预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐曲风；根据至少一个第一图像风格、至少一个第一音乐情感和预先存储的第二预设列表，确定音乐情感对应图像风格的第四评分；第二预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐情感；将第三评分和第四评分的和，确定为待选音乐对应图像风格的第一评分。在一种可能的设计中，第三确定模块 14具体用于：针对每个第一图像风格，在第一预设列表中查找第一图像风格对应的第一音乐曲风；若至少一个第一音乐曲风中存在查找到的第一图像风格对应的第一音乐曲风，则获取查找到的第一图像风格对应的第一音乐曲风的评分; 将查找到的第一图像风格对应的第一音乐曲风的评分的和，确定为音乐曲风对应第一图像风格的评分；将音乐曲风对应每个第一图像风格的评分中的最大评分，确定为音乐曲风对应图像风格的第三评分。在一种可能的设计中，分析结果为至少一张图像对应图像主题的主题分析结果，主题分析结果包括至少一个第一图像主题；属性信息中包括待选音乐的音乐场景、音乐情感和音乐曲风，音乐场景中包括至少一个第一音乐场景，音乐情感中包括至少一个第一音乐情感，音乐曲风中包括至少一个第一音乐曲风；第三确定模块 14具体用于：根据至少一个第一图像主题、至少一个第一音乐场景和预先存储的第三预设列表，确定音乐场景对应图像主题的第五评分；第三预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐场景；根据至少一个第一图像主题、至少一个第一音乐情感和预先存储的第四预设列表，确定音乐情感对应图像主题的第六评分；第四预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐情感；根据至少一个第一图像主题、至少一个第一音乐曲风和预先存储的第五预设列表，确定音乐曲风对应图像主题的第七评分；第五预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐曲风；将第五评分、第六评分和第七评分的和，确定为待选音乐对应图像主题的第一评分。在一种可能的设计中，第三确定模块 14具体用于：针对每个图像分类标签，确定待选音乐对应图像分类标签的第一评分与图像分类标签对应的权重的乘积，得到图像分类标签对应的第一乘积；将 N个图像分类标签对应的第一乘积与待选音乐的初始评分的和，确定为待选音乐的目标评分。在一种可能的设计中，第一确定模块 11具体用于：根据预先设定的 N个图像分类标签，分别通过 N个图像分类标签各自对应的图像分析模型，对至少一张图像进行分析处理，得到至少一张图像对应图像分类标签的分析结果； N个图像分类标签各自对应的图像分析模型为通过 N个图像分类标签各自对应的多个样本图像进行训练得到的。在一种可能的设计中，第二确定模块 12具体用于：通过预先训练的音乐匹配模型，分别对至少一张图像和每个待选音乐进行处理，得到每个待选音乐的属性信息，音乐匹配模型为采用多个样本图像和多个样本音乐进行训练得到的。本申请实施例提供的音乐筛选装置 10可以执行上述道路状态检测，其实现原理以及有益效果类似，此处不再进行赘述。图 10本申请实施例提供的终端设备的硬件示意图。如图 10所示，终端设备 20可以包括: 收发器 21、存储器 22、处理器 23。收发器 21可以包括：发射器和 /或接收器。发射器还可称为发送器、发射机、发送端口或发送接口等类似描述。接收器还可称为接收器、接收机、接收端口或接收接口等类似描述。示例性地，收发器 21、存储器 22、处理器 23各部分之间通过总线 24相互连接。存储器 22用于存储计算机执行指令；处理器 23用于执行存储器 22存储的计算机执行指令，使得处理器 23执行上述音乐筛选方法。本申请实施例提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当计算机执行指令被处理器执行时实现上述任一方法实施例的音乐筛选方法。本申请实施例提供一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时实现上述任一方法实施例的音乐筛选方法。本申请实施例提供一种计算机程序，计算机程序被处理器执行时实现上述任一方法实施例的音乐筛选方法。实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一可读取存储器中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储器 (存储介质)包括：只读存储器 (read-only memory， ROM) 、随机存取存储器 (random access memory, RAM) 、快闪存储器、硬盘、固态硬盘、磁带 ( magnetic tape ) 、软盘 (floppy disk) 、光盘 (optical disc) 及其任意组合。本申请实施例是参照根据本申请实施例的方法、设备 (系统) 、和计算机程序产品的流程图和 /或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和 /或方框、以及流程图和 /或方框图中的流程和 /或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理单元以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理单元执行的指令产生用于实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的步骤。显然，本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。在本申请中，术语 “包括”及其变形可以指非限制性的包括；术语 “或”及其变形可以指 “和 /或” 。本本申请中术语 “第一”、 “第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。本申请中， “多个”是指两个或两个以上。 “和 /或” ，描述关联对象的关联关系，表不可以存在三种关系，例如， A和 /或 B，可以表不：单独存在 A，同时存在 A和 B，单独存在 B这三种情况。字符 “/”一般表示前后关联对象是一种 “或”的关系。例如， “A、 B或 C”或者 “A、 B和 /或 C”意味着 “以下任一个： A; B; C; A和 B; A和 C； B和 C; A、 B和 C” 。

Claims

权利要求书

1、一种音乐筛选方法，其特征在于，包括：获取至少一张图像和至少一个待选音乐；根据预先设定的 N个图像分类标签，确定所述至少一张图像对应图像分类标签的分析结果， N为大于或等于 1的整数；根据所述至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息；根据所述分析结果和所述每个待选音乐的属性信息，在所述至少一个待选音乐中确定与所述至少一张图像匹配的目标音乐。

2、根据权利要求 1所述的方法，其特征在于，所述根据所述分析结果和所述每个待选音乐的属性信息，在所述至少一个待选音乐中确定与所述至少一张图像匹配的目标音乐，包括：根据所述分析结果和所述每个待选音乐的属性信息，确定所述至少一个待选音乐的目标评分；按照所述至少一个待选音乐的目标评分的大小顺序，对所述至少一个待选音乐进行排序，得到音乐序列；将所述音乐序列中排列在前的预设数量个待选音乐，确定为与所述至少一张图像匹配的目标音乐。

3、根据权利要求 2所述的方法，其特征在于，所述根据所述分析结果和所述每个待选音乐的属性信息，确定所述至少一个待选音乐的目标评分，包括：针对每个待选音乐，根据所述分析结果和所述待选音乐的属性信息，确定待选音乐对应每个图像分类标签的第一评分；获取所述 N个图像分类标签各自对应的权重；根据所述待选音乐对应每个图像分类标签的第一评分、所述 N个图像分类标签各自对应的权重和所述待选音乐的初始评分，确定所述待选音乐的目标评分，所述待选音乐的初始评分包括在所述待选音乐的属性信息中。

4、根据权利要求 3所述的方法，其特征在于，所述 N个图像分类标签包括如下至少一种：图像情感、图像风格、或者图像主题；所述属性信息还包括待选音乐的 M个音乐分类标签， M为大于或等于 1的整数；所述 M个音乐分类标签包括如下至少一种：音乐曲风、音乐情感、或者音乐场景。

5、根据权利要求 4所述的方法，其特征在于，所述分析结果为所述至少一张图像对应所述图像情感的情感分析结果，所述情感分析结果包括至少一个第一图像情感和所述至少一个第一图像情感的置信度；所述属性信息包括待选音乐的音乐情感，所述音乐情感包括至少一个第一音乐情感；根据所述情感分析结果和所述音乐情感，确定所述待选音乐对应所述图像情感的第一评分，包括：根据所述至少一个第一图像情感、所述至少一个第一图像情感的置信度和所述至少一个第一音乐情感，确定所述至少一个第一音乐情感对应所述图像情感的评分；将所述至少一个第一音乐情感对应所述图像情感的评分的和，与所述至少一个第一音乐情感的情感总数量之间的比值，确定为所述待选音乐对应所述图像情感的第一评分。

6、根据权利要求 5所述的方法，其特征在于，所述根据所述至少一个第一图像情感、所述至少一个第一图像情感的置信度和所述至少一个第一音乐情感，确定所述至少一个第一音乐情感对应所述图像情感的评分，包括：步骤 1 : 获取所述至少一个第一音乐情感中的第 1个第一音乐情感；步骤 2: 获取所述至少一个第一图像情感中的第 j个第一图像情感；步骤 3 : 在预先存储的相关列表中，查找所述第 1个第一音乐情感和所述第』个第一图像情感对应的第 j个相关值；所述相关列表中包括多个第一音乐情感和第一图像情感对应的相关值；步骤 4: 将所述第 j个相关值和所述第 j个第一图像情感的置信度的乘积，与第：个第一音乐情感对应第 j-1个第一图像情感的第 j-1个评分的和，确定为第 1个第一音乐情感对应所述第 j个第一图像情感的第 j个评分；将』加 1，重复执行所述步骤 2、所述步骤 3、所述步骤 4, 直至 j等于 Y时，得到第 1个第一音乐情感对应第 Y个第一图像情感的第 Y个评分；将所述第 Y个评分与所述至少一个第一图像情感的置信度之和的比值，确定为所述第 1个第一音乐情感对应所述图像情感的评分；

1取值为 1至 X之间的整数，』取值为 1至 Y之间的整数， X为所述至少一个第一音乐情感的情感总数量， Y为所述至少一个第一图像情感的情感总数量。

7、根据权利要求 4所述的方法，其特征在于，所述分析结果为所述至少一张图像对应所述图像风格的风格分析结果，所述风格分析结果包括至少一个第一图像风格；所述属性信息中包括待选音乐的音乐情感和音乐曲风，所述音乐曲风中包括至少一个第一音乐曲风，所述音乐情感中包括至少一个第一音乐情感；根据所述风格分析结果、所述音乐情感和所述音乐曲风，确定所述待选音乐对应所述图像风格的第一评分，包括：根据所述至少一个第一图像风格、所述至少一个第一音乐曲风和预先存储的第一预设列表，确定所述音乐曲风对应所述图像风格的第三评分；所述第一预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐曲风；根据所述至少一个第一图像风格、所述至少一个第一音乐情感和预先存储的第二预设列表，确定所述音乐情感对应所述图像风格的第四评分；所述第二预设列表中包括多个第一图像风格和每个第一图像风格对应的第一音乐情感；将所述第三评分和所述第四评分的和，确定为所述待选音乐对应所述图像风格的第 — 评分。

8、根据权利要求 7所述的方法，其特征在于，所述根据所述至少一个第一图像风格、所述至少一个第一音乐曲风和预先存储的第一预设列表，确定所述音乐曲风对应所述图像风格的第三评分，包括：针对每个第一图像风格，在所述第一预设列表中查找所述第一图像风格对应的第一音乐曲风；若所述至少一个第一音乐曲风中存在查找到的所述第一图像风格对应的第一音乐曲风，则获取查找到的所述第一图像风格对应的第一音乐曲风的评分；将查找到的所述第一图像风格对应的第一音乐曲风的评分的和，确定为所述音乐曲风对应所述第一图像风格的评分；将所述音乐曲风对应所述每个第一图像风格的评分中的最大评分，确定为所述音乐曲风对应所述图像风格的第三评分。

9、根据权利要求 4所述的方法，其特征在于，所述分析结果为所述至少一张图像对应所述图像主题的主题分析结果，所述主题分析结果包括至少一个第一图像主题；所述属性信息中包括待选音乐的音乐场景、音乐情感和音乐曲风，所述音乐场景中包括至少一个第一音乐场景，所述音乐情感中包括至少一个第一音乐情感，所述音乐曲风中包括至少一个第一音乐曲风；根据所述主题分析结果、所述音乐场景、所述音乐情感和所述音乐曲风，确定所述待选音乐对应所述图像主题的第一评分，包括：根据所述至少一个第一图像主题、所述至少一个第一音乐场景和预先存储的第三预设列表，确定所述音乐场景对应所述图像主题的第五评分；所述第三预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐场景；根据所述至少一个第一图像主题、所述至少一个第一音乐情感和预先存储的第四预设列表，确定所述音乐情感对应所述图像主题的第六评分；所述第四预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐情感；根据所述至少一个第一图像主题、所述至少一个第一音乐曲风和预先存储的第五预设列表，确定所述音乐曲风对应所述图像主题的第七评分；所述第五预设列表中包括多个第一图像主题和每个第一图像风格对应的第一音乐曲风；将所述第五评分、所述第六评分和所述第七评分的和，确定为所述待选音乐对应所述图像主题的第一评分。

10、根据权利要求 3-9中任一项所述的方法，其特征在于，所述根据所述待选音乐对应每个图像分类标签的第一评分、所述 N个图像分类标签各自对应的权重和所述待选音乐的初始评分，确定所述待选音乐的目标评分，包括：针对每个图像分类标签，确定所述待选音乐对应每个图像分类标签的第一评分与图像分类标签对应的权重的乘积，得到图像分类标签对应的第一乘积；将 N个图像分类标签对应的第一乘积与所述待选音乐的初始评分的和，确定为所述待选音乐的目标评分。

11、根据权利要求 1-10中任一项所述的方法，其特征在于，所述根据预先设定的 N 个图像分类标签，确定所述至少一张图像对应图像分类标签的分析结果，包括：根据预先设定的所述 N个图像分类标签，分别通过所述 N个图像分类标签各自对应的图像分析模型，对所述至少一张图像进行分析处理，得到所述至少一张图像对应图像分类标签的分析结果；所述 N个图像分类标签各自对应的图像分析模型为通过所述 N个图像分类标签各自对应的多个样本图像进行训练得到的。

12、根据权利要求 1-11 中任一项所述的方法，其特征在于，所述根据所述至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息，包括：通过预先训练的音乐匹配模型，分别对所述至少一张图像和每个待选音乐进行处理，得到所述每个待选音乐的属性信息，所述音乐匹配模型为采用多个样本图像和多个样本音乐进行训练得到的。

13、根据权利要求 1-12中任一项所述的方法，其特征在于，所述获取至少一张图像，包括：从至少一个待处理的视频中获取至少一帧图像，并将所述至少一帧图像确定为所述至少一张图像；或者，从至少一个待处理的视频中获取至少一帧图像，将所述至少一帧图像和预先存储的图像，确定为所述至少一张图像。

14、一种音乐筛选装置，其特征在于，包括：获取模块、第一确定模块、第二确定模块和第三确定模块；其中，所述获取模块，用于获取至少一张图像和至少一个待选音乐；所述第一确定模块，用于根据预先设定的 N个图像分类标签，确定所述至少一张图像对应图像分类标签的分析结果， N为大于或等于 1的整数；所述第二确定模块，用于根据所述至少一张图像和至少一个待选音乐，确定每个待选音乐的属性信息；所述第三确定模块，用于根据所述分析结果和所述每个待选音乐的属性信息，在所述至少一个待选音乐中确定与所述至少一张图像匹配的目标音乐。

15、一种终端设备，其特征在于，包括：处理器和存储器；所述存储器存储计算机执行指令；所述处理器执行所述存储器存储的所述计算机执行指令，使得所述处理器执行上述权利要求 1-13中任一项所述的音乐筛选方法。

16、一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当所述计算机执行指令被处理器执行时实现上述权利要求 1-13中任一项所述的音乐筛选方法。

17、一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述权利要求 1-13中任一项所述的音乐筛选方法。

18、一种计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述权利要求 1-13中任一项所述的音乐筛选方法。