CN110010159B

CN110010159B - 声音相似度确定方法及装置

Info

Publication number: CN110010159B
Application number: CN201910262559.4A
Authority: CN
Inventors: 邓一雷; 苏裕贤; 江倩雯; 黄湘宇; 刘翠; 苏卓斌; 阮陈贵; 潘蕾; 吴芬芬
Original assignee: Guangzhou Kugou Computer Technology Co Ltd
Current assignee: Guangzhou Kugou Computer Technology Co Ltd
Priority date: 2019-04-02
Filing date: 2019-04-02
Publication date: 2021-12-10
Anticipated expiration: 2039-04-02
Also published as: CN110010159A

Abstract

本发明公开了一种声音相似度确定方法及装置，属于音频处理领域。方法包括：接收声音对比请求，声音对比请求携带用户的第一声音文件、用户选择的目标歌手的歌手名称和目标歌手的目标歌曲的歌曲名称；根据歌手名称和歌曲名称，获取目标歌手演唱目标歌曲的第二声音文件；分别对第一声音文件和第二声音文件进行多个维度的声音特征提取，得到第一声音文件的第一声音特征和第二声音文件的第二声音特征，第一声音特征和第二声音特征包含多个维度的声音特征；按照多个维度，对第一声音特征和第二声音特征进行对比，得到多个维度的声音相似度。本发明可以满足用户想要准确确定自己的声音与某个歌手演唱某首歌曲的声音的相似度的需求。

Description

声音相似度确定方法及装置

技术领域

本发明涉及音频处理领域，尤其涉及一种声音相似度确定方法及装置。

背景技术

声音相似度是指两个用户的声音的相似程度，对于演唱者演唱歌曲的场景，声音相似度指的是演唱者的演唱声音与歌手的原唱声音之间的相似度。

目前，相关技术一般是将用户的声音样本与所有歌手的声音模型进行匹配，分别确定演唱者与所有歌手的音色相似度，从所有歌手中找到与用户的音色最相近的几个歌手推荐给用户，无法满足用户想要准确确定自己的声音与某个歌手演唱某首歌曲的声音的相似度的需求。

发明内容

本发明实施例提供了一种声音相似度确定方法及装置，可以解决相关技术无法满足用户想要准确确定自己的声音与某个歌手演唱某首歌曲的声音的相似度的需求的问题。所述技术方案如下：

第一方面，提供一种声音相似度确定方法，包括：

接收声音对比请求，所述声音对比请求携带用户的第一声音文件、所述用户选择的目标歌手的歌手名称和所述目标歌手的目标歌曲的歌曲名称；

根据所述歌手名称和所述歌曲名称，获取所述目标歌手演唱所述目标歌曲的第二声音文件；

分别对所述第一声音文件和所述第二声音文件进行多个维度的声音特征提取，得到所述第一声音文件的第一声音特征和所述第二声音文件的第二声音特征，所述第一声音特征和所述第二声音特征包含所述多个维度的声音特征；

按照所述多个维度，对所述第一声音特征和所述第二声音特征进行对比，得到所述多个维度的声音相似度。

在一种可能实现方式中，所述分别对所述第一声音文件和所述第二声音文件进行多个维度的声音特征提取，得到所述第一声音文件的第一声音特征和所述第二声音文件的第二声音特征，包括：

分别对所述第一声音文件和所述第二声音文件进行人声分离，得到第一人声文件和第二人声文件；

分别对所述第一人声文件和所述第二人声文件进行多个维度的声音特征提取，得到所述第一声音特征和所述第二声音特征。

在一种可能实现方式中，所述按照所述多个维度，对所述第一声音特征和所述第二声音特征进行对比，得到所述多个维度的声音相似度之后，所述方法还包括：

根据所述多个维度的声音相似度，获取所述用户与所述目标歌手的声音相似度。

在一种可能实现方式中，所述根据所述多个维度的声音相似度，获取所述用户与所述目标歌手的声音相似度，包括：

将所述多个维度的声音相似度的平均值作为所述用户与所述目标歌手的声音相似度；或，

根据所述多个维度的权重，对所述多个维度的声音相似度进行加权求和，得到所述用户与所述目标歌手的声音相似度。

根据所述多个维度的声音相似度，生成声音相似度示意图，所述声音相似度示意图用于从多个维度展示所述用户与所述目标歌手的声音相似度。

在一种可能实现方式中，所述多个维度包括音色、节奏、音准、情感和气息。

在一种可能实现方式中，所述第一声音文件为所述用户演唱所述目标歌曲的声音文件，或者，所述第一声音文件为所述用户录制除所述目标歌曲以外的任一音频的声音文件。

第二方面，提供一种声音相似度确定装置，包括：

接收模块，用于接收声音对比请求，所述声音对比请求携带用户的第一声音文件、所述用户选择的目标歌手的歌手名称和所述目标歌手的目标歌曲的歌曲名称；

获取模块，用于根据所述歌手名称和所述歌曲名称，获取所述目标歌手演唱所述目标歌曲的第二声音文件；

提取模块，用于分别对所述第一声音文件和所述第二声音文件进行多个维度的声音特征提取，得到所述第一声音文件的第一声音特征和所述第二声音文件的第二声音特征，所述第一声音特征和所述第二声音特征包含所述多个维度的声音特征；

对比模块，用于按照所述多个维度，对所述第一声音特征和所述第二声音特征进行对比，得到所述多个维度的声音相似度。

在一种可能实现方式中，所述提取模块用于：

在一种可能实现方式中，所述获取模块还用于根据所述多个维度的声音相似度，获取所述用户与所述目标歌手的声音相似度。

在一种可能实现方式中，所述获取模块用于：

在一种可能实现方式中，所述装置还包括：

生成模块，用于根据所述多个维度的声音相似度，生成声音相似度示意图，所述声音相似度示意图用于从多个维度展示所述用户与所述目标歌手的声音相似度。

第三方面，提供了一种服务器，包括一个或多个处理器和一个或多个存储器；所述一个或多个存储器，用于存放计算机程序；所述一个或多个处理器，用于执行所述一个或多个存储器上所存放的计算机程序，实现第一方面或第一方面的任一种可能实现方式所述的方法步骤。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现第一方面或第一方面的任一种可能实现方式所述的方法步骤。

本发明实施例提供的技术方案带来的有益效果至少包括：

通过在接收到用户的声音对比请求时，根据声音对比请求中所指示的目标歌手和目标歌曲，获取目标歌手演唱该目标歌曲的第二声音文件，分别对声音对比请求中携带的第一声音文件和该第二声音文件进行多个维度的声音特征提取，然后按照多个维度进行声音特征的对比，得到用户与目标歌手在多个维度的声音相似度。上述方案用户可以直接选择歌手和歌曲进行定向声音特征对比，获取多个维度的声音相似度，使得用户可以通过多个维度观察到其与目标歌手的声音相似度，可以满足用户想要准确确定自己的声音与某个歌手演唱某首歌曲的声音的相似度的需求。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种声音相似度确定方法的流程图；

图2是本发明实施例提供的一种声音相似度确定方法的流程图；

图3是本发明实施例提供的一种声音相似度确定装置的结构示意图；

图4是本发明实施例提供的一种声音相似度确定装置的结构示意图；

图5是本发明实施例提供的一种服务器500的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明实施例提供的一种声音相似度确定方法的流程图。参见图1，该方法包括：

101、接收声音对比请求，该声音对比请求携带用户的第一声音文件、该用户选择的目标歌手的歌手名称和该目标歌手的目标歌曲的歌曲名称。

102、根据该歌手名称和该歌曲名称，获取该目标歌手演唱该目标歌曲的第二声音文件。

103、分别对该第一声音文件和该第二声音文件进行多个维度的声音特征提取，得到该第一声音文件的第一声音特征和该第二声音文件的第二声音特征，该第一声音特征和该第二声音特征包含该多个维度的声音特征。

104、按照该多个维度，对该第一声音特征和该第二声音特征进行对比，得到该多个维度的声音相似度。

本发明实施例提供的方法，通过在接收到用户的声音对比请求时，根据声音对比请求中所指示的目标歌手和目标歌曲，获取目标歌手演唱该目标歌曲的第二声音文件，分别对声音对比请求中携带的第一声音文件和该第二声音文件进行多个维度的声音特征提取，然后按照多个维度进行声音特征的对比，得到用户与目标歌手在多个维度的声音相似度。上述方案用户可以直接选择歌手和歌曲进行定向声音特征对比，获取多个维度的声音相似度，使得用户可以通过多个维度观察到其与目标歌手的声音相似度，可以满足用户想要准确确定自己的声音与某个歌手演唱某首歌曲的声音的相似度的需求。

在一种可能实现方式中，该分别对该第一声音文件和该第二声音文件进行多个维度的声音特征提取，得到该第一声音文件的第一声音特征和该第二声音文件的第二声音特征，包括：

分别对该第一声音文件和该第二声音文件进行人声分离，得到第一人声文件和第二人声文件；

分别对该第一人声文件和该第二人声文件进行多个维度的声音特征提取，得到该第一声音特征和该第二声音特征。

在一种可能实现方式中，该按照该多个维度，对该第一声音特征和该第二声音特征进行对比，得到该多个维度的声音相似度之后，该方法还包括：

根据该多个维度的声音相似度，获取该用户与该目标歌手的声音相似度。

在一种可能实现方式中，该根据该多个维度的声音相似度，获取该用户与该目标歌手的声音相似度，包括：

将该多个维度的声音相似度的平均值作为该用户与该目标歌手的声音相似度；或，

根据该多个维度的权重，对该多个维度的声音相似度进行加权求和，得到该用户与该目标歌手的声音相似度。

根据该多个维度的声音相似度，生成声音相似度示意图，该声音相似度示意图用于从多个维度展示该用户与该目标歌手的声音相似度。

在一种可能实现方式中，该多个维度包括音色、节奏、音准、情感和气息。

在一种可能实现方式中，该第一声音文件为该用户演唱该目标歌曲的声音文件，或者，该第一声音文件为该用户录制除该目标歌曲以外的任一音频的声音文件。

上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

图2是本发明实施例提供的一种声音相似度确定方法的流程图。该方法由服务器执行，参见图2，该方法包括：

201、接收声音对比请求，该声音对比请求携带用户的第一声音文件、该用户选择的目标歌手的歌手名称和该目标歌手的目标歌曲的歌曲名称。

其中，该用户为发起该声音对比请求的用户，目标歌手和目标歌曲为用户选择的想要进行声音对比的歌手和歌曲，第一声音文件通过对用户的声音进行录制得到。

本发明实施例中，该声音对比请求可以由用户所在终端发送给服务器，当服务器接收到该声音对比请求时，可以得知该用户想要将自己的声音与目标歌手演唱目标歌曲的声音进行对比。在一种可能实现方式中，该第一声音文件为该用户演唱该目标歌曲的声音文件，或者，该第一声音文件为该用户录制除该目标歌曲以外的任一音频的声音文件。

例如，用户在终端触发该声音对比请求的过程可以包括：用户在终端上选择某位歌手，当终端检测到对该歌手的选择操作时，终端可以显示该歌手的多首歌曲，用户可以从中选择某一首歌曲，当检测到对该歌曲的选择操作时，终端可以显示录制选项。用户可以点击该录制选项开始进行声音录制，如演唱该歌曲(不局限于演唱该歌曲的片段或演唱整首歌曲，也不局限于是带伴奏演唱还是不带伴奏演唱)，或录制任一音频(不局限于用户随便说一段话，或朗读一篇文章)。当检测到对该录制选项的点击操作时，终端可以开始采集用户的声音数据。当用户录制完毕时，可以再次点击该录制选项停止进行声音录制，当终端再次检测到对该录制选项的点击操作时，可以停止采集用户的声音数据，并基于该录制时间段内采集的声音数据生成声音文件，将该声音文件作为用户的第一声音文件，将该第一声音文件、目标歌手(用户选择的歌手)的歌手名称和目标歌曲(用户选择的歌曲)的歌曲名称携带在声音对比请求中发送给服务器。

可以理解的是，用户也可以在终端上直接选择歌曲，当检测到对该歌曲的选择操作时，终端可以将该歌曲作为目标歌曲，将演唱该歌曲的歌手作为目标歌手，执行后续声音录制过程。

202、根据该歌手名称和该歌曲名称，获取该目标歌手演唱该目标歌曲的第二声音文件。

本发明实施例中，服务器可以根据该歌手名称和该歌曲名称，从本地存储中获取该第二声音文件。例如，服务器可以维护一个数据库，该数据库可以采用歌手名称和歌曲名称作为索引，对各个歌手演唱各首歌曲的声音文件进行存储当服务器接收到终端发送的声音对比请求时，可以从该声音对比请求中获取目标歌手的歌手名称和目标歌曲的歌曲名称，然后服务器可以根据目标歌手的歌手名称和目标歌曲的歌曲名称，从数据库中查询到该目标歌手演唱该目标歌曲的歌词文件。

可以理解的是，该多个声音文件也可以存储在该服务器以外的其他设备，服务器可以根据该歌手名称和该歌曲名称，向该设备发送声音文件获取请求，由该设备向服务器返回该第二声音文件。

203、分别对该第一声音文件和该第二声音文件进行多个维度的声音特征提取，得到该第一声音文件的第一声音特征和该第二声音文件的第二声音特征，该第一声音特征和该第二声音特征包含多个维度的声音特征。

本发明实施例中，服务器可以采用声音特征提取算法，从多个维度，对第一声音文件进行声音特征提取，得到第一声音特征，对第二声音文件进行声音特征提取，得到第二声音特征。可以理解的是，服务器也可以采用多种声音特征提取算法，每种声音特征提取算法用于从至少一个维度，对声音文件进行声音特征提取，得到该维度的声音特征。

在一种可能实现方式中，该多个维度包括音色、节奏、音准、情感和气息。其中，音色是指声音在听觉上产生的某种属性，听音者能够据此判断两个以同样方式呈现、具有相同音高和响度的声音的不同。节奏是一种与韵律结伴而行的有规律的突变，音准是指歌唱和乐器演奏中所发的音高能与一定律制的音高相符。

在一种可能实现方式中，该步骤203可以包括：分别对该第一声音文件和该第二声音文件进行人声分离，得到第一人声文件和第二人声文件；分别对该第一人声文件和该第二人声文件进行多个维度的声音特征提取，得到该第一声音特征和该第二声音特征。

考虑到在用户的第一声音文件的录制过程中，可能会有背景音，如伴奏或环境中的其他杂音等，而在歌手的第二人声文件的录制过程中，往往会有伴奏，为了保证声音对比的准确性，服务器可以对第一声音文件和第二声音文件进行人声分离，得到第一人声文件和第二人声文件。然后，服务器可以对第一人声文件和第二人声文件进行多个维度的声音特征提取，得到用户的第一声音特征和目标歌手的第二声音特征，由于第一声音特征和第二声音特征是针对人声提取得到的，因而第一声音特征和第二声音特征可以分别表示用户和目标歌手的真实声音。

通过从声音中分离出人声，针对人声进行特征提取，从而可以进行人声比对，得到用户与目标歌手的声音相似度，由于人声才是用户和目标歌手的真实声音，这种人声比对的方式可以提高声音相似度结果的准确性和可靠性。

204、按照该多个维度，对该第一声音特征和该第二声音特征进行对比，得到该多个维度的声音相似度。

其中，声音相似度可以用一个数值来表示，该数值可以是一个百分数，如20％、80％、100％等，数值越大表示相似度越大，或者，该数值也可以是一个自然数，本发明实施例对相似度的具体表示形式不做限定。

本发明实施例中，第一声音特征和第二声音特征包含多个维度的声音特征，服务器可以分别从每个维度，对第一声音特征和第二声音特征进行对比，得到每个维度的声音相似度。具体地，服务器可以采用相似度算法，从每个维度，对第一声音特征和第二声音特征中该维度的声音特征进行相似度计算，得到用户与目标歌手在该维度的声音相似度，以此可以得到多个维度的声音相似度。

针对多个维度包括音色、节奏、音准、情感和气息的情况，服务器通过该步骤204可以得到用户与目标歌手的音色相似度、节奏相似度、音准相似度、情感相似度和气息相似度。

如果第一声音文件为用户演唱目标歌曲的声音文件，第二声音文件为目标歌手演唱目标歌曲的声音文件，则用户与目标歌手的音色相似度、节奏相似度、音准相似度、情感相似度和气息相似度可能是0到100％之间的任一数值。如果第一声音文件为用户录制除该目标歌曲以外的任一音频的声音文件，则用户与目标歌手的音色相似度可能是0到100％之间的任一数值，而节奏相似度、音准相似度、情感相似度和气息相似度则可能是0。

服务器还可以将该多个维度的声音相似度发送给用户所在终端，使得用户可以得知其与目标歌手在多个维度的声音相似度。

205、根据该多个维度的声音相似度，获取该用户与该目标歌手的声音相似度。

本发明实施例中，服务器在获取到多个维度的声音相似度后，可以根据该多个维度的声音相似度，计算一个综合的声音相似度。服务器还可以将该声音相似度发送给用户所在终端，使得用户可以得知其与目标歌手的声音相似度。

在一种可能实现方式中，该步骤205可以包括：将该多个维度的声音相似度的平均值作为该用户与该目标歌手的声音相似度；或，根据该多个维度的权重，对该多个维度的声音相似度进行加权求和，得到该用户与该目标歌手的声音相似度。

服务器可以直接对多个维度的声音相似度计算平均值，将计算结果作为用户与目标歌手综合的声音相似度。服务器也可以预先为多个维度设置对应的权重，按照权重对多个维度的声音相似度进行加权求和，将加权求和结果作为用户与目标歌手综合的声音相似度。其中，权重可以由服务器可以根据各个维度对声音影响的程度进行设置，如音色的权重可以大于其他维度的权重，本发明实施例对各个维度的权重大小不做限定。

通过在获取到用户与目标歌手的多个维度的声音相似度后，计算一个综合的声音相似度作为用户与目标歌手的声音相似度，由于考虑了多个维度，融合了多个维度的声音相似度，相比于单纯的音色对比得到的声音相似度，准确度更高。

206、根据该多个维度的声音相似度，生成声音相似度示意图，该声音相似度示意图用于从多个维度展示该用户与该目标歌手的声音相似度。

本发明实施例中，服务器在获取到多个维度的声音相似度后，可以生成便于用户直观观察的声音相似度示意图，例如，该声音相似度示意图的形式可以是雷达图，如多个维度为五个维度，则可以生成五维雷达图。服务器可以将该声音相似度示意图发送给用户所在终端，使得用户可以从多个维度观察其与目标歌手的声音相似度。

需要说明的是，步骤205和步骤206并不代表明确的先后顺序，也即是，服务器可以先执行步骤205，再执行步骤206，也可以先执行步骤206，再执行步骤205，本发明实施例对比不做限定。步骤205和步骤206为可选步骤，也即是，服务器也可以不执行该步骤205和步骤206。

图3是本发明实施例提供的一种声音相似度确定装置的结构示意图。参照图3，该装置包括：

接收模块301，用于接收声音对比请求，该声音对比请求携带用户的第一声音文件、该用户选择的目标歌手的歌手名称和该目标歌手的目标歌曲的歌曲名称；

获取模块302，用于根据该歌手名称和该歌曲名称，获取该目标歌手演唱该目标歌曲的第二声音文件；

提取模块303，用于分别对该第一声音文件和该第二声音文件进行多个维度的声音特征提取，得到该第一声音文件的第一声音特征和该第二声音文件的第二声音特征，该第一声音特征和该第二声音特征包含该多个维度的声音特征；

对比模块304，用于按照该多个维度，对该第一声音特征和该第二声音特征进行对比，得到该多个维度的声音相似度。

在一种可能实现方式中，该提取模块303用于：

在一种可能实现方式中，该获取模块还用于根据该多个维度的声音相似度，获取该用户与该目标歌手的声音相似度。

在一种可能实现方式中，该获取模块302用于：

在一种可能实现方式中，参见图4，该装置还包括：

生成模块305，用于根据该多个维度的声音相似度，生成声音相似度示意图，该声音相似度示意图用于从多个维度展示该用户与该目标歌手的声音相似度。

本发明实施例中，通过在接收到用户的声音对比请求时，根据声音对比请求中所指示的目标歌手和目标歌曲，获取目标歌手演唱该目标歌曲的第二声音文件，分别对声音对比请求中携带的第一声音文件和该第二声音文件进行多个维度的声音特征提取，然后按照多个维度进行声音特征的对比，得到用户与目标歌手在多个维度的声音相似度。上述方案用户可以直接选择歌手和歌曲进行定向声音特征对比，获取多个维度的声音相似度，使得用户可以通过多个维度观察到其与目标歌手的声音相似度，可以满足用户想要准确确定自己的声音与某个歌手演唱某首歌曲的声音的相似度的需求。

需要说明的是：上述实施例提供的声音相似度确定装置在确定声音相似度时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的声音相似度确定装置与声音相似度确定方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图5是本发明实施例提供的一种服务器500的结构示意图，该服务器500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processingunits，CPU)501和一个或一个以上的存储器502，其中，该存储器502中存储有至少一条指令，该至少一条指令由该处理器501加载并执行以实现上述各个方法实施例提供的方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种存储有计算机程序的计算机可读存储介质，例如存储有计算机程序的存储器，上述计算机程序被处理器执行时实现上述实施例中的声音相似度确定方法。例如，该计算机可读存储介质可以是只读内存(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory，RAM)、只读光盘(Compact Disc Read-OnlyMemory，CD-ROM)、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上该仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种声音相似度确定方法，其特征在于，应用于服务器，所述方法包括：

按照所述多个维度，对所述第一声音特征和所述第二声音特征进行对比，得到所述多个维度的声音相似度，并根据所述多个维度的声音相似度，生成声音相似度示意图，并将所述声音相似度示意图发送给用户的终端，所述声音相似度示意图用于从所述多个维度展示所述用户与所述目标歌手的声音相似度；

其中，所述声音对比请求通过所述终端执行以下步骤触发：

检测到对所述目标歌手的目标歌曲的选择操作后，显示录制选项；

当检测到对所述录制选项的点击操作时，采集用户的声音数据，当再次检测到对所述录制选项的点击操作时，停止采集用户的声音数据，并基于录制时间段内采集的声音数据生成所述第一声音文件；

将所述第一声音文件、所述目标歌手的歌手名称和所述目标歌曲的歌曲名称携带在所述声音对比请求中发送给所述服务器。

2.根据权利要求1所述的方法，其特征在于，所述分别对所述第一声音文件和所述第二声音文件进行多个维度的声音特征提取，得到所述第一声音文件的第一声音特征和所述第二声音文件的第二声音特征，包括：

3.根据权利要求1所述的方法，其特征在于，所述按照所述多个维度，对所述第一声音特征和所述第二声音特征进行对比，得到所述多个维度的声音相似度之后，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述多个维度的声音相似度，获取所述用户与所述目标歌手的声音相似度，包括：

5.根据权利要求1所述的方法，其特征在于，所述多个维度包括音色、节奏、音准、情感和气息。

6.根据权利要求1所述的方法，其特征在于，所述第一声音文件为所述用户演唱所述目标歌曲的声音文件，或者，所述第一声音文件为所述用户录制除所述目标歌曲以外的任一音频的声音文件。

7.一种声音相似度确定装置，其特征在于，所述装置包括：

对比模块，用于按照所述多个维度，对所述第一声音特征和所述第二声音特征进行对比，得到所述多个维度的声音相似度；

生成模块，用于根据所述多个维度的声音相似度，生成声音相似度示意图，所述声音相似度示意图用于从所述多个维度展示所述用户与所述目标歌手的声音相似度，并将所述声音相似度示意图发送给用户的终端；

其中，所述声音对比请求通过所述终端执行以下步骤触发：

将所述第一声音文件、所述目标歌手的歌手名称和所述目标歌曲的歌曲名称携带在所述声音对比请求中发送给服务器。

8.根据权利要求7所述的装置，其特征在于，所述提取模块用于：

9.根据权利要求7所述的装置，其特征在于，所述获取模块还用于根据所述多个维度的声音相似度，获取所述用户与所述目标歌手的声音相似度。

10.根据权利要求9所述的装置，其特征在于，所述获取模块用于：

11.根据权利要求7所述的装置，其特征在于，所述多个维度包括音色、节奏、音准、情感和气息。

12.根据权利要求7所述的装置，其特征在于，所述第一声音文件为所述用户演唱所述目标歌曲的声音文件，或者，所述第一声音文件为所述用户录制除所述目标歌曲以外的任一音频的声音文件。

13.一种服务器，其特征在于，包括一个或多个处理器和一个或多个存储器；所述一个或多个存储器，用于存放计算机程序；所述一个或多个处理器，用于执行所述一个或多个存储器上所存放的计算机程序，实现权利要求1-6任一项所述的方法步骤。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-6任一项所述的方法步骤。